캐시 기본 동작
캐시가 없는 경우
- 데이터가 변경되지 않았음에도 불구하고 요청할 때 마다 데이터를 다운로드 받아야한다.
- 이로 인해서 느린 사용자 경험을 가지게 된다.
캐시 적용
서버에서는 cache-control
속성을 사용해서 헤더에 캐시가 유효한 시간을 지정해 줄 수 있다.
HTTP/1.1 200 OK
Content-Type: image/jpeg
cache-control: max-age=60
Content-Length: 12345
ajfksdjfiewji234k2j39f32jlf9... //데이터 내용
- 캐시를 사용하면 지정 시간동안 똑같은 데이터에 대해서 네트워크를 사용하지 않을수 있다.
- 이는 네트워크 사용량을 줄이고, 빠른 사용자 경험을 제공한다.
cache-control
속성에서 지정한 시간이 지나면 사용할 수 없으므로, 서버에 다시 요청하면 데이터를 다시 조회하고, 캐시를 갱신하게 된다. → 데이터가 바뀌지 않았을 경우 효율적이지 않음!
검증 헤더와 조건부 요청
캐시 유효시간이 초과해서 서버에 다시 요청하면 두가지 상황이 있다.
- 서버에서 기존 데이터를 변경한 경우
- 서버에서 기존 데이터를 변경하지 않은 경우
2번의 경우에는 캐시 만료후에도 서버에서 데이터를 변경하지 않았기 때문에, 저장해 두었던 캐시를 재사용 할 수 있다. → 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 검증 헤더의 등장
검증 헤더 추가
- 검증헤더 : 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
Last-Modified
,ETag
검증 헤더는 Last-Modified
헤더에 마지막으로 수정된 날짜를 값으로 지정해준다.
HTTP/1.1 200 OK
Content-Type: image/jpeg
cache-control: max-age=60
Last-Modified: Sat, 29 Oct 2022 11:45:19 GMT
Content-Length: 35000
ajfksdjfiewji234k2j39f32jlf9...
조건부 요청 헤더(If-Modified-Since, Last-Modified)
- 검증 헤더로 조건에 따른 분기
If-Modified-Since
:Last-Modified
를 사용
이제 브라우저의 캐시가 만료된 경우, 서버에 데이터에 요청을 할때, 브라우저에 저장된 최종 수정일을 바탕으로 한 if-modified-since
헤더를 추가해서 요청한다.
GET /star.jpg
if-modified-since: Sat, 29 Oct 2022 11:45:19 GMT
서버는 if-modified-since
헤더를 이용해서 최종수정일을 비교하고, 동일하면 304 Not Modified를 내려준다. 이 경우, 서버는 헤더만 전송하고, 메시지 바디는 전송하지 않는다.
HTTP/1.1 304 Not Modified
Content-Type: image/jpeg
cache-control: max-age=60
Last-Modified: Sat, 29 Oct 2022 11:45:19 GMT
Content-Length: 35000
브라우저는 캐시에 저장된 데이터를 활용해서 출력해준다.
Last-Modified, If-Modified-Since의 단점
- 1초 미만 단위로 캐시 조정이 불가능
- 날짜 기반의 로직을 사용 → 데이터를 수정해서 날짜가 변경되었으나, 수정 결과가 이전과 같은경우 캐시유지가 되지 않는다.
- 서버에서 별도의 캐시 로직을 관리할 수 없다. → 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우
조건부 요청 헤더(ETag, If-None-Match)
ETag
를 사용하면 캐시용 데이터에 임의의 고유한 버전 이름을 지정한다. (예: ETag: “v1.0”, ETag: “a1b2c3”)
데이터가 변경될때, 이 이름을 바꾸여서 변경하게 되는데, ETag가 같으면 캐시를 유지하고, 다르면 서버가 다시 클라이언트로 데이터를 보내준다.
예시
HTTP/1.1 200 OK
Content-Type: image/jpeg
cache-control: max-age=60
ETag: "a1b2c3"
Content-Length: 12345
ajfksdjfiewji234k2j39f32jlf9...
클라이언트가 데이터를 처음 서버에 요청하는 경우, ETag 헤더와 같이 응답을 해준다.
GET /star.jpg
If-None-Match: "a1b2c3"
위에서 지정한 cache-control
시간이 초과 한 경우에 클라이언트가 서버에 요청할때 If-None-Match
헤더에 ETag 값이 지정되어 서버에 요청되게 되는데, 서버는 이를 비교하고, 값이 같은 경우에 304 Modified
응답을 주고, 클라이언트는 캐시를 재사용하게 된다.
ETag, If-None-Match 특징
- 단순하게, ETag값만 서버에 보내서 같으면 캐시사용, 다르면 다시 받는다.
- 캐시 제어 로직을 서버에서 완전히 관리할 수 있다.
- 서버는 베타 오픈기간인 3일간 파일이 변경되어도 ETag를 동일하게 유지하고, 애플리케이션 배포 주기에 맞추어 ETag를 모두 갱신한다.
캐시와 조건부 요청 헤더 정리
Cache-Control
캐시를 제어할때 사용하는 헤더이다.
Cache-Control: max-age
, 캐시 유효 시간, 초 단위Cache-Control: no-cache
, 데이터는 캐시해도 되지만, 항상 origin 서버에 검증하고 사용Cache-Control: no-store
, 민감한 데이터가 있으므로 저장하면 안됨. 메모리에서만 잠깐 사용
Pragma
캐시 제어(HTTP 1.0 하위 호환으로 현재는 잘 사용하지 않음)
Expires
캐시 만료일 지정(하위 호환).
- 예 - expires: Sat, 25 Jun 2021 23:50:00 GMT
- 캐시 만료일을 날짜로 지정
- 현재는 Cache-Control: max-age 권장.
프록시 캐시
미국에 origin서버가 있는 경우 한국에서 직접 origin서버와 통신하면 시간이 오래 걸리므로, 한국에 프록시 캐시서버를 두고, 클라이언트는 프록시 캐시서버로 요청하게 한다. 만약 프록시 캐시서버에 요청한 데이터가 존재하면 프록시 캐시서버에서 빠르게 데이터를 제공해 줄수 있다.
Cache-Control
Cache-Control: public
- 응답이 public 캐시에 저장되어도 됨
Cache-Control: private
- 응답이 현재 사용자만을 위한 것. 데이터가 private 캐시에 저장되어야 함(기본 값)
Cache-Control: s-maxage
- 프록시 캐시에만 적용되는 max-age 값
Age: 60 (HTTP 헤더)
- origin 서버에서 응답하고 프록시 캐시에 머무는 시간(초)
캐시 무효화
확실한 캐시 무효화 응답
웹브라우저가 임의로 데이터 또는 페이지를 캐싱하는 경우가 있는데, 캐싱되는것을 방지해야 하는 경우에 아래 헤더 전체를 넣어줘야 한다.
Cache-Control: no-cache, no-store, must-revalidate
Pragma: no-cache
no-cache
: 데이터는 캐시해도 되지만, 원 서버에 검증하고 사용
no-store
: 데이터에 민감한 정보가 있으므로 저장x
must-revalidate
: 캐시 만료후 최초 조회시 원 서버에 검증해야 함
Pragma: no-cache
: HTTP 1.0 호환을 위해서 사용
no-cache vs must-revalidate
캐시 만료후에 클라이언트가 서버에 요청을 보낸경우, 프록시 캐시 서버가 네트워크 장애로 origin 서버에 접근할 수 없는 경우에 프록시 캐시에 저장된 데이터를 보여줄 수도 있다.
must-revalidate
를 설정한 경우, origin 서버에 접근할 수 없는 경우 항상 오류가 발생하기 때문에, 캐시 데이터를 클라이언트로 내려주는 것을 방지 가능하다.
Reference
https://www.inflearn.com/course/http-웹-네트워크/dashboard