終極解密輸入網(wǎng)址按回車到底發(fā)生了什么
詳解輸入網(wǎng)址點擊回車,后臺到底發(fā)生了什么。透析 HTTP 協(xié)議與 TCP 連接之間的千絲萬縷的關系。掌握為何是三次握手四次揮手?time_wait 存在的意義是什么?全面圖解重點問題,再也不用擔心面試問這個問題。
大致流程
URL 解析,解析 http 協(xié)議、端口、資源地址。
DNS 查詢:首先查詢本地 host,再訪問 DNS 服務器將 域名解析成 ip 地址。
建立 TCP 連接。
服務器收到請求后處理,并且構造響應返回給客戶端。
客戶端接收 HTTP 報文響應。
渲染頁面,最后有可能會四次揮手斷開連接,也可能不會而是復用連接。
重點來了:
如何理解 TCP 的三次握手與四次揮手?每次握手客戶端與服務端是怎樣的狀態(tài)?
為何揮手會出現(xiàn) 2MSL,遇到大量 Socket 處在 TIME_WAIT 或者 CLOSE_WAIT 狀態(tài)是什么問題?
三次握手與四次揮手的過程是怎樣的?
HTTP 的報文格式又是怎樣的?
?
URL 解析
url 遵守的規(guī)則是這個樣子
scheme://host.domain:port/path/filename
每個名詞的含義如下解釋:
scheme 定義應用層協(xié)議類型,比如 http、https、 ftp 等;
host 定義域主機(http 的默認主機是 www);
domain ?定義因特網(wǎng)域名,比如 segmentfault.com;
port 主機的端口,http 默認是 80, https 默認是 443;
path 服務器上的資源路徑;
filename - 定義文檔/資源的名稱;
?
DNS 查詢
瀏覽器不能直接通過域名找到服務器,只能通過 IP 地址。
那瀏覽器是如何通過域名查詢到我們輸入的 url 對應的 IP 呢?
瀏覽器緩存:按照一定頻率緩存 DNS 數(shù)據(jù)。
操作系統(tǒng)緩存:如果瀏覽器緩存好啊不到記錄則去操作系統(tǒng)中找。
路由緩存:路由器 DNS 緩存。
ISP 的 DNS 服務器:ISP 是互聯(lián)網(wǎng)服務提供商(Internet Service Provider)的簡稱,ISP 有專門的 DNS 服務器應對 DNS 查詢請求。
根服務器:ISP 的 DNS 服務器還找不到的話,它就會向根服務器發(fā)出請求,進行遞歸查詢(DNS 服務器先問根域名服務器.com 域名服務器的 IP 地址,然后再問 .baidu 域名服務器,依次類推)
?
TCP 連接建立與斷開
通過域名解析出 IP 地址以后就要建立 TCP/IP 連接了。
TCP/IP 分為四層,每一層都會加上一個頭部再發(fā)送給下一層。到了接收方后,對應的每一層則把對應層的頭部解析拆除,丟上上一層,跟發(fā)送端的過程反過來。

應用層:發(fā)送 HTTP 請求
瀏覽器從地址欄得到服務器 IP,接著構造一個 HTTP 報文,其中包括:
請求行包含請求方法、URL、協(xié)議版本 請求報頭(Request Header):由 “關鍵字: 值”對組成,每行一對,關鍵字與值使用英文 “:” 分割 請求體:請求參數(shù),并不是所有的請求有又請求參數(shù)。一般 get 參數(shù) 的格式 name=tom&password=1234&realName=tomson,也可以將參數(shù)放在 body 里面。
傳輸層:TCP 傳輸報文
網(wǎng)絡層:IP 協(xié)議查詢 MAC 地址
鏈路層:以太網(wǎng)協(xié)議
標頭:數(shù)據(jù)包的發(fā)送者、接受者、數(shù)據(jù)類型 數(shù)據(jù):數(shù)據(jù)包具體內容
Mac 地址
三次握手

四次揮手
其實是客戶端在發(fā)送 [FIN] 報文的時候順帶發(fā)了一個 [ACK] 確認上次傳輸確認。 接著服務端通過 80 端口響應了 [ACK] ,然后立馬響應 [FIN, ACK] 表示數(shù)據(jù)傳輸完了,可以關閉連接。 最后瀏覽器通過 13743 端口 發(fā)送 [ACK] 包給服務端,客服端與服務端連接就關閉了。


SYN_SENT - 客戶端發(fā)起第 1 次握手后,連接狀態(tài)為 SYN_SENT ,等待服務端內核進行應答,如果服務端來不及處理(例如服務端的 backlog 隊列已滿)就可以看到這種狀態(tài)的連接。 ESTABLISHED - 表示連接處于正常狀態(tài),可以進行數(shù)據(jù)傳送。客戶端收到服務器回復的 SYN+ACK 后,對服務端的 SYN 單獨回復(第 3 次握手),連接建立完成,進入 ESTABLISHED 狀態(tài)。服務端程序收到第 3 次握手包后,也進入 ESTABLISHED 狀態(tài)。 FIN_WAIT_1 - 客戶端發(fā)送了關閉連接的 FIN 報文后,等待服務端回復 ACK 確認。 FIN_WAIT_2 - 表示我方已關閉連接,正在等待服務端關閉??蛻舳税l(fā)了關閉連接的 FIN 報文后,服務器發(fā)回 ACK 應答,但是沒進行關閉,就會處于這種狀態(tài)。 TIME_WAIT - 雙方都正常關閉連接后,客戶端會維持 TIME_WAIT 一段時間,以確保最后一個 ACK 能成功發(fā)送到服務器端。停留時長為 2 倍的 MSL (報文最大生存時間),Linux 下大約是 60 秒。所以在一個頻繁建立短連接的服務器上通常可以看到成千上萬的 TIME_WAIT 連接。
LISTEN - 表示當前程序正在監(jiān)聽某個端口時。 SYN_RCVD - 服務端收到第 1 次握手后,進入 SYN_RCVD 狀態(tài),并回復一個 SYN+ACK(第 2 次握手),再等待對方確認。 ESTABLISHED - 表示連接處于正常狀態(tài),可以進行數(shù)據(jù)傳送。完成 TCP3 次握手后,連接建立完成,進入 ESTABLISHED 狀態(tài)。 CLOSE_WAIT - 表示客戶端已經(jīng)關閉連接,但是本地還沒關閉,正在等待本地關閉。有時客戶端程序已經(jīng)退出了,但服務端程序由于異?;?BUG 沒有調用 close()函數(shù)對連接進行關閉,那在服務器這個連接就會一直處于 CLOSE_WAIT 狀態(tài),而在客戶機已經(jīng)不存在這個連接了。 LAST_ACK - 表示正在等待客戶端對服務端的關閉請求進行最終確認。
可靠地實現(xiàn) TCP 全雙工連接的終止 在進行關閉連接四路握手協(xié)議時,最后的 ACK 是由主動關閉端發(fā)出的,如果這個最終的 ACK 丟失,服務器將重發(fā)最終的 FIN,因此客戶端必須維護狀態(tài)信息允 許它重發(fā)最終的 ACK。如 果不維持這個狀態(tài)信息,那么客戶端將響應 RST 分節(jié),服務器將此分節(jié)解釋成一個錯誤( 在 java 中會拋出 connection reset 的 SocketException)。因而,要實現(xiàn) TCP 全雙工連接的正常終 止,必須處理終止序列四個分節(jié)中任何一個分節(jié)的丟失情況,主動關閉 的客戶端必須維持狀 態(tài)信息進入 TIME_WAIT 狀態(tài)。 允許老的重復分節(jié)在網(wǎng)絡中消逝 TCP 分節(jié)可能由于路由器異常而“迷途”,在迷途期間,TCP 發(fā)送端可能因確認超時而重發(fā)這個 分節(jié),迷途的分節(jié)在路由器修復后也會被送到最終目的地,這個 原來的迷途分節(jié)就稱為 lost duplicate。在關閉一個 TCP 連接后,馬上又重新建立起一個相同的 IP 地址和端口之間的 TCP 連接,后一個連接被稱為前一個連接的化身 ( incarnation),那么有可能出現(xiàn)這種情況,前一 個連接的迷途重復分組在前一個連接終止后出現(xiàn),從而被誤解成從屬于新的化身。為了避免 這個情 況,TCP 不允許處于 TIME_WAIT 狀態(tài)的連接啟動一個新的化身,因為 TIME_WAIT 狀 態(tài)持續(xù) 2MSL,就可以保證當成功建立一個 TCP 連接的時 候,來自連接先前化身的重復分組已 經(jīng)在網(wǎng)絡中消逝。
保證 TCP 協(xié)議的全雙工連接能夠可靠關閉; 保證這次連接的重復數(shù)據(jù)段從網(wǎng)絡中消失,防止端口被重用時可能產(chǎn)生數(shù)據(jù)混淆;
?
服務器處理請求并響應 HTTP 報文

起始行(Start Line):描述請求或者響應的基本信息。 Header:使用 key-value 的形式詳細說明報文信息。 空行。 消息正文(Entity):傳輸?shù)臄?shù)據(jù),圖片、視頻、文本等都可以。


GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。GET / HTTP/1.1 翻譯成文字大概就是:“hello,服務器,我要請求根目錄下的默認文件使用的是 HTTP 1.1 協(xié)議版本”。header 字段不區(qū)分大小寫,通常是首字母大寫; 字段名不允許有空格,可以使用 “-”,不能使用 “_”; 字段名必須緊接著 “:”,不能有空格,但是 “:” 后面可以有空格。 字段名順序沒有意義;
?
瀏覽器接收響應并渲染數(shù)據(jù)
根據(jù) HTML 解析 DOM 樹; 根據(jù) CSS 解析出 CSS 規(guī)則樹; 結合 DOM 樹與 CSS 規(guī)則樹,生成渲染樹; 根據(jù)生成的渲染樹計算每個節(jié)點的信息; 根據(jù)節(jié)點信息繪制畫面展示給用戶。

有道無術,術可成;有術無道,止于術
歡迎大家關注Java之道公眾號
好文章,我在看??
