正確的頭信設置HTTP頭部信息有助于搜索引擎判斷網(wǎng)頁(yè)及提升網(wǎng)站訪(fǎng)問(wèn)速度,本文為多篇“HTTP請求頭相關(guān)文章”及《HTTP權威指南》一書(shū)的基礎技術(shù)閱讀后個(gè)人匯總整理版,以便于理解。知識
通常HTTP消息包括客戶(hù)機向服務(wù)器的頭信??請求消息和服務(wù)器向客(′▽?zhuān)?戶(hù)機的響應消息???ke)戶(hù)端向服務(wù)器發(fā)送一個(gè)請求,基礎技術(shù)請求頭包含請求的知識方法、URI、頭信協(xié)議版本、基礎技術(shù)以(?_?;)及包含請求修飾符、知識客戶(hù)信息和內容的頭信類(lèi)似于MIME的消息結構。服務(wù)器以一個(gè)狀態(tài)行作為響應,基礎技術(shù)相應的知識內容包括消息協(xié)議的版本,成功或者錯誤編碼加上包含服務(wù)器信息、頭信實(shí)體元信息以及可能的基礎技術(shù)實(shí)體內容。
Http協(xié)議定義了很多與服務(wù)器交互的知識方法,最基本的有4種,分別是GET、POST、PUT、DELETE。一個(gè)URL地址用于描述一個(gè)網(wǎng)絡(luò )上的資源,而HTTP中的G??ET、POST、PUT、 DELETE就對應著(zhù)對這個(gè)資源的??查、改、增、刪4個(gè)操作,我們最常見(jiàn)的就是GET和POST了。GET一般用于獲取/查詢(xún)資源信息,而POST一般用于更新資源信息。
HTTP頭信息解讀HTTP的頭域包括通用頭、請求頭、響應頭和實(shí)體頭四個(gè)部分。每個(gè)頭域由一個(gè)域名,冒號(:)和域值三部分組成。
通用頭部是客戶(hù)端和服務(wù)器都可以使用的頭部,可以在客戶(hù)端、服務(wù)器和其他應??用程序之間提供一些非常有用的通用功能,如Date頭部。
請求頭部是請求報文特有的,它們?yōu)榉?wù)器提供了一些額外信息,比如客戶(hù)端希望接收什么類(lèi)型的數據(′▽?zhuān)?,如Accept頭部。
響應(′?`*)頭部便于客戶(hù)端提供信息,比如,客服端在與哪種類(lèi)型的服務(wù)器進(jìn)行交互,如Server頭部。??
實(shí)體頭部指的是用于應對實(shí)體主體部分的頭部,比如,可以用實(shí)體頭部來(lái)說(shuō)明實(shí)體主體部分的數據類(lèi)型,如Content??-Type頭部。
HTTP通用頭通用頭域包含請求和響應消息都支持的頭域,通用頭域包含緩存頭部Cache-Control、Pragma及信息性頭部Connection、Da??te、Transfer-Encoding、Update、Via。
Cache-ControlCache-Control指定請求和響應┐(′ー`)┌遵循的緩存機??制。在請求消息或響應消息中設置 Cache-Control并不會(huì )修改另一個(gè)消息處理過(guò)程中的緩存處理過(guò)程。請求時(shí)的緩存指令包括no-cache、no-store、max-age、 max-stale、min-fresh、only-if-cached,響應消息中的指令包括public、private、no-cache、no- stor??e、no-transform、must??-revalidate、proxy-revalidate、max-age。各個(gè)消息中的指令含義如下:
no-cache:指示請求或響應消息不能緩存,實(shí)際上是可以存儲在本地緩存區中的,只是在與原始服務(wù)器進(jìn)行新鮮度ˉ\_(ツ)_/ˉ驗證之前,緩存不能(′?`)將其提供給客戶(hù)端使用。
no-store:緩存應該盡快從存儲器中刪除文檔的所有痕跡,因(??ヮ?)?*:???為其中可能會(huì )包含敏感信息。
max-age:緩存無(wú)法返回緩存時(shí)間長(cháng)于max-age規定秒的文檔,若不超規定秒(T_T)瀏覽器將不會(huì )發(fā)送對應的請求到服務(wù)器,數據由緩存直接返回;超過(guò)這一時(shí)間段才進(jìn)一步由服務(wù)器決定是返回新數據還是仍由緩存提供。若(′ω`*)同時(shí)還發(fā)送了max-stale指令,則使用期可能會(huì )超過(guò)其過(guò)期時(shí)間。
min-fresh:至少(shao)在未來(lái)規定秒內文檔要保持新鮮(╯‵□′)╯,接受其新鮮生(′_`)命期大于其當前 Age 跟 min-fresh 值之和的緩存對象。
max-stale:指示客戶(hù)端可以接收過(guò)期響應消息,如果指定max-stale消息的值,那么客戶(hù)端可以接收過(guò)期但在指定值之內的響應消息。
only-if-cached:只有當緩存中有副本存在時(shí),客戶(hù)端才會(huì )獲得一份(′ω`)副本。
Public?:指示響應可被任何緩存區緩存,可以用緩存(cun)內容回應任何用戶(hù)。
Private:指示對于單個(gè)用戶(hù)的整個(gè)或部分響應消息,不能被共享緩存處理,只能用緩存內容回應先前請求該內容的那個(gè)用戶(hù)。
PragmaPragma頭域用來(lái)包含實(shí)現特定的指令,最常用的是Pragma:no-cache。在HTTP/1.1協(xié)議中,它的含義和Cache- Control:no-cache相同。
ConnectionConnection表示是否需要持久連接。如果Servlet看到這里的值為“Keeヾ(^-^)ノp-Alive”,或者看到請求使用的是HTTP 1.1(H??TTP 1.1默認進(jìn)行持久連接),它就可以利用持久連接的優(yōu)ヾ(^-^)ノ點(diǎn),當頁(yè)面包含多個(gè)???元素時(shí)(例如Applet,圖片),顯著(zhù)地減少下載所需要的時(shí)間。要實(shí)現這一點(diǎn),Servlet需要在應答中發(fā)送一個(gè)Content-Length頭,最簡(jiǎn)單的實(shí)現方法是:先把內容寫(xiě)入ByteArrayOutpヽ(′▽?zhuān)?ノutSt??ream,然后在正式寫(xiě)出內(nei)容之前計算它的大小。
Close:告訴WEB服務(wù)器或者(zhe)代理服務(wù)器,在完成本次請求的響應后,斷開(kāi)連(lian)接,不要等待本次連接的后續請求了。(′?ω?`)
Keepalive:告訴WEB服務(wù)器或者代理服務(wù)器,在完成本次請求的響應后,保持連接,等待本次連接的后續請求。
Keep-??Alive:如果瀏覽器請求保持連接,則該頭部表明希望 WEB 服務(wù)器保持連接多長(cháng)時(shí)間(秒),如Keep-┐(′д`)┌Alive:300。
DateDate頭域表示消息發(fā)送??的時(shí)間,服務(wù)器響應中要包含這個(gè)頭部,因為緩存在評估響應的新鮮度時(shí)要用到,其時(shí)間的描述格式由RFC822定義。例如,Date:Mon, 31 Dec 2001 04:25:57 GMT。Date描述的時(shí)間表示世界標準時(shí),換算成本地時(shí)間,需要知道用戶(hù)所(????)在的時(shí)(shi)區。
Transfer-EncodingWEB 服務(wù)器表明自己對本響應消息體(不是消息體里面的對象)作了怎樣(′▽?zhuān)?)的編碼,比如是否分塊(chunked),例如:Transfer-Enco??ding: chunkヾ(′▽?zhuān)??ed
Upgrade它可以指定另一種可能完全不同的協(xié)議,如HTTP/1.1客戶(hù)端可以向服務(wù)器發(fā)送一條H(?⊿?)TTP/1.0請求,其中包含值為“HTTP/1.1”的Update頭部,這樣客戶(hù)端就(jiu)可以測試一下服務(wù)器是否也使用HTTP/1.1了。
Via列出從客戶(hù)端到 OCS 或者相反方向的響應經(jīng)過(guò)了哪些代理服務(wù)器,他們用什么協(xié)議(和版本)發(fā)送的請求。
當客戶(hù)端請求到達第一個(gè)代理服務(wù)器時(shí),該服務(wù)器會(huì )在自己發(fā)出的請求里面添加 Via 頭部,并填上自己的相關(guān)信息,當下一個(gè)代理服務(wù)器 收到第一個(gè)代理服務(wù)器的請求時(shí),會(huì )在自己發(fā)出的請求里面復制前一個(gè)代理服務(wù)器的請求的Via頭部,并把自己的相?關(guān)信息加到后面,以此類(lèi)推,當 OCS 收到最后一個(gè)代理服務(wù)器的請求時(shí),檢查 Vi??a 頭部,就??知道該請求所經(jīng)過(guò)的路由。例如:Via:1.0 236-81.D0( ?ω?)7071953.sina.com.cn:80 (squid/2.6.STABLE13)
HTTP請求頭請求頭用于說(shuō)明是誰(shuí)或什么在發(fā)送請求、請求源于何處,或者客戶(hù)端的喜好及能??力。服務(wù)器可以根據請求頭部給出(chu)的客戶(hù)端信息,試著(zhù)為客戶(hù)端提供更好的響應。請求頭域可能包含下列字段Accept、Accept-Char(′?`)set、Accept- Encoding、Accept-Language、Authorization、From、Host、If-Modified-Since、If-Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、Max-For??wards、Proxy-Authorization、Range、Referer、User-Agent。對請求頭域的擴展要求通訊雙方都支持,如果存在不支持的請求頭域,一般將會(huì )作為實(shí)體頭域處理。
Accept告訴WEB服務(wù)器自己接受什么介質(zhì)類(lèi)型,*/* 表示任何類(lèi)型,typ??e/* 表示該類(lèi)型下的所有子類(lèi)型,type/sub-type。
Accept-Charset瀏覽器告訴服務(wù)器自己能(′_ゝ`)接收的字符集。
Accept-Encoding瀏覽器申明自己接收的編碼方法,通常(chang)指定壓縮方法,是否支持壓縮,支持什么壓縮方法(gzip(′▽?zhuān)?,deflate)。
Accept-Language瀏覽器申明自己接收的語(yǔ)言。語(yǔ)言跟字符集的區別:中文是語(yǔ)言,中(′?_?`)文(wen)有多種字符集,比如big5,gb2312,gbk等等。
Authorization當客戶(hù)端接收到來(lái)自WEB服務(wù)器的 WWW-Authen??ticat??e 響應時(shí),用該頭(tou)部來(lái)回應自己的身份驗證信息給WEB服務(wù)器(′▽?zhuān)?)。
If-Match如果對象的 ETag 沒(méi)有改變,其實(shí)也就意味著(zhù)對象沒(méi)有改變,才執行請求的動(dòng)作,獲取文檔。
If-None-Match??如果請求的對象在該頭??部指定的時(shí)間之后修改了,才執行請求的動(dòng)(dong)作(比如返回對象),否則返回代碼304,告訴瀏覽器該對象沒(méi)有修改。例如:If-Modified-Since:Thu, 10 Apr 2008 09:14:42 GMT
If-Unmodified-Since如果請求的對象在該(′ω`)頭部指定的時(shí)間之后沒(méi)修改過(guò),才執行請求的動(dòng)作(比如返回對象)。
If-Range瀏覽器告訴 WEB 服務(wù)器,如果我請求的對象沒(méi)有改變,就把我??缺少的部分???給我,如果對象改變了,就把整個(gè)對象給我。瀏覽器通過(guò)發(fā)送請求對象的ETag 或者自己所知道的最后修改時(shí)(shi)間給 WEB 服務(wù)器,讓其判斷對象是否改變了??偸歉?Range 頭部一起使用。
Range瀏覽器(比如 Flashget 多線(xiàn)程下載時(shí))告訴 WEB 服務(wù)器自己想取對象的哪部分。例??如:Range: bytes=1173546
Proxy-Authenticate代理服務(wù)器響應瀏覽器,要求其提供代理身份驗證信息。
Proxy-Authorizヽ(′ー`)ノation瀏覽器響應代理服務(wù)器的身份驗證請求,提供自己的身份信息。
Host客戶(hù)端指定自己想訪(fǎng)問(wèn)的WEB服務(wù)器的域名/IP 地址和端口號。如Host:rss.sina.com.cn
Referer瀏覽器表明自己的身份(是哪種瀏覽器)。例(′?_?`)如:User-Agent:Mozilla/5.0 (Windows??; U; Windows NT 5.1; zh-CN;rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14
HTTP響應頭響應頭??向客戶(hù)端提供一些(xie)額外信息,比如誰(shuí)在發(fā)送響應、響應??者??的功能,甚至與響應相關(guān)的一些特殊指令。這些頭部有助于客戶(hù)端處理響應,并在(′_ゝ`)將來(lái)發(fā)起更(geng)好的請求。響應頭域包含Age、Location(′?`)、Proxy-Aヾ(?■_■)ノuthenticate、Public、Retry- After、Server、Vary、Warning、WWW-Authenticate。對響應頭域的擴展要求通訊雙方都支持,如果存在不支持ˉ\_(ツ)_/ˉ的響應(ying)頭域,一般將會(huì )作為實(shí)體頭域處理。
Age當代理服務(wù)器用自己緩存的實(shí)體??去響應請求時(shí),用該??頭部表明該實(shí)體從產(chǎn)生到現在經(jīng)過(guò)多長(cháng)時(shí)間了。
ServerWEB 服務(wù)器表明自己是什么軟件及版本等信息。例如:Server:Apache/2.0.61 (Un??ix)
Accept-RangesWEB服務(wù)(wu)器表┐(′д`)┌明自己是否接受獲??取其某個(gè)實(shí)體的一部分(比如文件的一部分)的請求。b┐(′?`)┌ytes:表示接受,none:表示不接受。
Vary實(shí)體頭部提供了有關(guān)實(shí)體及其內容的大量信息,從有關(guān)對象類(lèi)型的信息,到能夠對資源使用的各種有效的請求方法??傊?,實(shí)體頭部可以告知接收者它在對什么進(jìn)行處理。請求消息和響應消息都可以包含實(shí)體信息,實(shí)體信息一般由實(shí)體頭域和實(shí)體組成。實(shí)體頭域包含關(guān)于實(shí)體的原信息,實(shí)體頭包括信息性頭部Allow、Location,內容頭部Content-Base、Content-Encoding、Content-Languag(′?_?`)e、Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type,緩存頭部Etag、Expires、Last-Modified、extension-header。
Allow服務(wù)器支持哪些請求方法(如GET、POST等)。
Location表示客戶(hù)應當到哪里去提取文檔,用于將接收端定位到資源的位?置(URL)上(shang)。Location通常不是直接設置的,而是通過(guò)HttpServletResponse的sendRedirect方法,該方法同時(shí)設置狀態(tài)代碼為302。
Content-Base解析主體中的相對URL時(shí)使用的基礎URL。
Content-EncodingWEB(/ω\) 服務(wù)器告訴瀏覽器理解主體時(shí)最適宜使用的自然語(yǔ)言。
Content-Len(??-)?gthWEB服務(wù)器告訴瀏覽器自己響應的對象的長(cháng)度或尺寸,例如:Cont??ent-Length:(′;д;`) 26012
Content-Location資ヽ(′▽?zhuān)?ノ源實(shí)際所處的位置。
Content-MD5主體的MD5校驗和。
Content-Range實(shí)體頭用于指定整個(gè)實(shí)體中的一部分的插入位置,他也指示了?整個(gè)實(shí)體的長(cháng)度。在服務(wù)器向客戶(hù)返回一個(gè)部分響應,它必須描述響應覆蓋的范圍和整個(gè)實(shí)體長(cháng)度(′▽?zhuān)?)。一般格式: Content-Range:bytes-unitSPfirst-byte-pos-last-byte-pos??/entity-legth??。例如,傳送頭500個(gè)字節次字段的形式:Conte??nt-Range:bytes???0- 499/1234如果一個(gè)http消息包含此節(例如,對范圍請求的響應或對一系列( ?° ?? ?°)范圍的重疊請求)??,Content-Range表示傳送的范圍,Content-Length表示實(shí)際傳送的字節(jie)數。
Content-Type就是一個(gè)對象(比如URL)的標志值,就一個(gè)對象而言,比如一個(gè)html文件,如果被修改了,其Eヽ(′ー`)ノtag也會(huì )別修改,所以,ETag的作用跟L??ast-Modified的作用差不多,主要供WEB服務(wù)器判斷一個(gè)對象是否??改變了。比如前一次請求某個(gè)html文件時(shí),獲得了其 ETag,當這次又請求這個(gè)文件時(shí),瀏覽器就會(huì )(hui)把ヾ(?■_■)ノ先前獲得ETa??g值發(fā)送給WEB服務(wù)器,然后WEB服務(wù)器會(huì )把這個(gè)ETag跟該文件的當前ETag進(jìn)行對比,然后就知道這個(gè)文件有沒(méi)有改變了。
ExpiresWEB服務(wù)器表明該實(shí)??體將在什么時(shí)候過(guò)(′?`*)期,對于過(guò)期了的對象(xiang),只有在跟WEB服務(wù)器驗證了其有效性后┐(′?`)┌,才能用來(lái)響應客戶(hù)請求。是 HT(′?_?`)TP/1.0 的頭部。例如:Expires:Sat, 23 May 2009 10:02:1??2 GMT
Last-Modified