Encoding(인코딩)

HTTP 상에서 데이터를 전송할 때, 전송 효율(압축)이나 보안을 목적으로 데이터를 변환하는 기술로, 주로 두 가지 방식이 있다.

컨텐츠 인코딩(Content Encoding)

엔티티 본문(Body)을 압축하여 전송 시간을 단축하고 대역폭을 절약하기 위한 기능이다.

컨텐츠 인코딩은 아래의 과정을 거쳐 이루어진다.

요청 (클라이언트 -> 서버):
- Accept-Encoding 헤더를 통해 자신이 해독할 수 있는 압축 알고리즘 목록을 서버에 전달
- 예: Accept-Encoding: gzip, deflate, br
압축 및 응답 (서버 -> 클라이언트):
- 서버는 클라이언트가 지원하는 알고리즘 중 하나를 선택(또는 미선택)하여 본문을 압축
- Content-Encoding 헤더에 사용된 알고리즘을 명시
- 압축으로 인해 본문 크기가 변하므로 Content-Length 헤더를 재계산하거나 Transfer-Encoding: chunked 사용
- 예: Content-Encoding: br
복원 (클라이언트):
- 응답 헤더를 확인하고 해당 알고리즘으로 본문을 압축 해제하여 원본 데이터 획득

데이터가 네트워크를 통해 전송되는 방식 자체를 변경하여, 데이터가 전송되는 컨테이너의 구조를 바꾼다.

특징: 홉 간(Hop-by-Hop) 전송 방식. 즉, 클라이언트와 서버 사이의 프록시나 중계 서버마다 다르게 적용될 수 있음
주요 헤더:
- Transfer-Encoding: 전송에 사용된 인코딩 방식
- TE: 클라이언트가 수용 가능한 전송 인코딩 방식 (Accept-Transfer-Encoding의 역할)

과거에는 보안 목적 등으로도 사용하기도 했으나, 현재는 사실상 chunked 방식을 위해 존재한다.

메시지 본문을 일정 크기의 덩어리(Chunk)로 쪼개서 순차적으로 전송하는 전송 인코딩 방식이다.

HTTP/1.1의 지속 커넥션 환경에서는 하나의 TCP 연결로 여러 요청을 처리하므로, 서버는 어디가 메시지의 끝인지 명확히 알려줘야 한다.

정적 컨텐츠: 파일 크기가 고정되어 있으므로 Content-Length 헤더로 길이 명시
동적 컨텐츠: 서버가 데이터를 생성하면서 보내야 하므로, 전송 시작 시점에 전체 길이를 알 수 없음
- Content-Length를 사용할 수 없으므로 Chunked Encoding을 사용하여 스트리밍 전송 구현
- Transfer-Encoding: chunked 헤더를 통해 청크 인코딩 사용을 알림

청크 인코딩은 전체 크기를 알리는 대신, 각 덩어리의 크기를 먼저 보내고 데이터를 보낸다.

반복해서 보내는 청크들은 아래와 같은 형태로 구성된다.

클라이언트가 가지고 있는 구버전 페이지와 서버의 신버전 페이지 간의 변경된 부분(Delta)만 전송하여 트래픽을 최적화하는 기술이다.