Web/모든 개발자를 위한 HTTP 웹 기본 지식

HTTP 웹 기본 지식 - 1. 인터넷 네트워크 & URI와 웹브라우저 요청

PHM 2022. 5. 25. 10:11

인터넷 네트워크

1. IP( 인터넷 프로토콜 )

역할 

- 지정한 IP 주소에 데이터 전달

- 패킷이라는 통신 단위로 데이터 전달

 

한계

- 비연결성 : 패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷 전송

- 비신뢰성 : 중간에 패킷이 사라지거나 패킷이 순서대로 안올 때

- 프로그램 구분 : 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상일 때

 

2. TCP

인터넷 프로토콜 스택의 4계층

- 애플리케이션 계층 : HTTP, FTP

- 전송계층 : TCP, UDP

- 인터넷 계층 : IP

- 네트워크 인터페이스 계층

 

1. 프로그램이 Hello, world! 메세지 생성

2. SOCKET 라이브러리를 통해 OS계층에 전달

3. TCP 정보 생성, 메세지 데이터 포함

4. IP 패킷 생성, TCP 데이터 포함

 

TCP/IP 패킷 정보

- IP 패킷 : 출발지 IP, 목적지 IP 기타..

- TCP 패킷 : 출발지 PORT, 목적지 PORT, 전송제어, 순서, 검증 정보..

 

TCP 특징 ( 전송제어프로토콜 Transmission Control Protocol )

- 연결지향 - TCP 3way handshake ( 가상연결 )

- 데이터 전달 보증 ( 메시지 누락시 확인가능 )

- 순서 보장

- 신뢰할 수 있는 프로토콜 / 현재 대부분 TCP 사용

 

① TCP 3 way handshake

- SYN : 접속요청 / ACK : 요청수락

- 연결과정

      1. 클라이언트 → 서버 : SYN

      2. 서버 → 클라이언트 : ACK + SYN

      3. 클라이언트 → 서버 : ACK

      4. 데이터 전송

 

② 데이터 전달 보증

- 클라이언트 → 서버 : 데이터 전송

- 서버 → 클라이언트 : 데이터를 받았는지 못받았는지 응답

 

③ 순서 보장

- 클라이언트 → 서버 : 패킷1, 패킷2, 패킷3 순서로 전송

- 서버 → 클라이언트 : 잘못된 순서부터 다시 보내라

 

UDP 특징 ( 사용자 데이터그램 프로토콜 User Datagram Protocol )

- 하얀 도화지에 비유 ( 기능이 거의 없음 ) 

- 연결지향 - TCP 3way handshake X

- 데이터 전달 보증 X

- 순서 보장 X

- 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름

- 정리 : IP와 거의 같다 + PORT + 체크섬 정도만 추가 / 애플리케이션에서 추가 작업 필요

 

* 체크섬 : 검증데이터

 

PORT

- 같은 IP 내에서 프로세스 구분

- 여러 패킷들을 구분하기 위한 것

- 서버안에 돌아가는 애플리케이션을 구분지어준다.

- 0 ~ 65535 할당 가능

- 0 ~ 1023 : 잘 알려진 포트, 사용하지 않는 것이 좋음

                 FTP-20,21 / TELNET-23 / HTTP-80 / HTTPS-443

 

DNS ( 도메인 네임 시스템 Domain Name System )

- IP는 기억하기 어렵다 / IP는 변경될 수 있다.

- DNS 서버에서 도메인 명을 IP 주소로 변환

작동원리

     1. 클라이언트 → DNS서버 : 도메인명 접속

     2. DNS서버 → 클라이언트 : IP주소 응답

     3. 클라이언트 → 서버 : IP주소로 접속


URI와 웹 브라우저 요청 흐름

URI ( Uniform Resource Identifier )

- 리소스를 식별하는 통합된 방법

- "URI는 로케이터(locator) , 이름(name) 또는 둘 다 추가로 분류될 수 있다."

- 단어 뜻

  ㆍ Uniform : 리소스 식별하는 통일된 방식

  ㆍ Resource : 자원, URI로 식별할 수 있는 모든 것 (제한 없음)

  ㆍ Identifier : 다른 항목과 구분하는데 필요한 정보

- URL( Uniform Resource Locator ) : 리소스의 위치 지정

   URN( Uniform Resource Name ) : 리소스의 이름 부여

- 위치는 변할 수 있지만, 이름은 변하지 않는다.

- URN이름만으로 실제 리소스를 찾을 수 있는 방법이 보편화 되지 않음

 

URL 전체 문법

- scheme://[userinfo@]host[:port][/path][?query][#fragment]

- https://www.google.com:443/search?q=hello&hl=ko 

  ㆍ프로토콜( https )

  ㆍ호스트명( www.google.com  )

  ㆍ포트번호( 443 )

  ㆍ패스 ( /search )

  ㆍ쿼리 파라미터 ( q=hello&hl=ko )

 

① scheme

- 주로 프로토콜이 사용

- 프로토콜 : 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙, ex) http, https, ftp 등등

- http는 80포트, https는 443포트를 주로 사용, 포트는 생략 가능

- https는 http에 보안추가 ( HTTP Secure )

 

② userinfo

- URL에 사용자정보를 포함해서 인증

- 거의 사용하지 않음

 

③ host

- 호스트명

- 도메인명 또는 IP주소를 직접 사용가능

 

④ port

- 포트 ( PORT ), 접속 포트

- 일반적으로 생략, 생략시 http는 80, https는 443

 

⑤ path

- 리소스 경로(path), 계층적 구조

 

⑥ query

- key=value 형태

- ?로 시작, &로 추가 기능 ex) keyA=valueA&keyB=valueB

- query parameter, query string 등으로 불림, 웹서버에 제공하는 파라미터, 문자형태

 

⑦fragment

- html 내부 북마크 등에 사용

- 서버에 전송하는 정보아님

 

웹브라우저 요청 흐름

0. 도메인주소로 DNS 조회 → IP와 PORT를 찾아냄 (목적지)

1. 웹 브라우저가 HTTP 메세지 생성

2. SOCKET 라이브러리를 통해 전달

    ㆍ TCP/IP 연결 ( IP, PORT )

    ㆍ 데이터 전달

3. TCP/IP 패킷 생성, HTTP 메세지 포함

4. 요청패킷전달 → 도착 시 TCP/IP 패킷을 버리고 HTTP 메세지 해석

5. 서버에서 HTTP 응답메시지 생성 후 응답패킷 전달

6. 웹브라우저 HTML렌더링

 

 

 

출처 : 인프런 김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식

https://www.inflearn.com/course/http-%EC%9B%B9-%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC