您現在所在位置: 主頁(yè) > SEO內容優(yōu)化
【谷歌seo學(xué)習】利用服務(wù)器日志分析seo
更新時(shí)間:2026-05-05 00:11:31
本文將教您如何利用站點(diǎn)服務(wù)器日志作為SEO分析工具,谷歌以更好地了解搜索引擎機(′ω`)器(⊙_⊙)人與站點(diǎn)的學(xué)習利交互方??式。在本文中??,用服我們將只關(guān)注Google的日志Googlebot和Googlebot Smartphone。因此,分析從現在開(kāi)始,谷歌每當提到機器人時(shí),學(xué)習利是用服在指Google。(本教程??適用于百度)
同樣值得注意的日志是,服務(wù)器日志通常(chang)也包含其他交互數據,分析但是谷歌我們在這里只(zhi)涉及搜索引擎機器人流量。
什么是學(xué)習利服務(wù)器日志文件?簡(jiǎn)而言之,服務(wù)器日志文件是用服服務(wù)器自動(dòng)生成的記錄,列出了搜索引擎機器人與其中包含的日志(zhi)頁(yè)面/資源(???)的每次交互。簡(jiǎn)而言之,分析每次漫游器請求服務(wù)器上的頁(yè)面時(shí),都會(huì )創(chuàng )建一個(gè)日志項,其中顯示了各種數據點(diǎn),例如:
請求了哪種資源?(HTML,JavaScript等)
使用什么方法?(獲取或發(fā)布)
該請求何時(shí)發(fā)生?
請求的響應代碼是什么?(200、301、404、500等)
還有最重(zhong)要的數據點(diǎn)…* drumroll * …哪個(gè)搜索ヽ(′ー`)ノ引擎機器??人發(fā)出了請求以及發(fā)出了多少請求?。℅ooglebot,Googlebot Smartphone,Bingbot,Baidu等)
為什么(╬?益?)機器人抓取(╯°□°)╯︵ ┻━┻如此重要?能夠一目了然地確定機器人在一段時(shí)間內正在請求哪些??頁(yè)面,這使(′ω`)我們能夠識別潛在的“問(wèn)題”頁(yè)面。
什么是“問(wèn)題”頁(yè)面?我將這些頁(yè)面定義為在一個(gè)特定的時(shí)間范圍內(至少一個(gè)月或三個(gè)月)幾乎沒(méi)有機器人請求的頁(yè)面。為了進(jìn)行衡量,假設在一個(gè)月內任何具ヽ(′?`)ノ有10個(gè)或更少的漫游器請求的頁(yè)面都是潛在的“問(wèn)題”頁(yè)面。由于這是一個(gè)可縮放的比例,??請根據網(wǎng)站大?。ɡ?,小于10,小于30,小于50等)隨意從此數字開(kāi)始并繼續進(jìn)入(╬?益?)(ru)列表。
機器人流量低的原因有哪些?跨多個(gè)頁(yè)面的內容稀少或重復,導致漫游器在(zai)請求頁(yè)面時(shí)沒(méi)有那么緊迫性或重要性。
缺少指向頁(yè)面的內部/外部鏈接,從而使機器人找到它們的途徑少得多。
頁(yè)面根本沒(méi)有被拾??取和索引。
如果在索引頁(yè)面上更新頁(yè)面內容,則刷新后的內容可能需要更長(cháng)的時(shí)間才能被檢索和建立索引,意味著(zhù)網(wǎng)站的訪(fǎng)問(wèn)者可能會(huì )看到過(guò)時(shí)的內容。
話(huà)雖這么說(shuō),重要的(de)是要注意,具有低漫游器流量的頁(yè)面并不總是引起人們關(guān)注的。這只是為了幫助識別潛在???問(wèn)題頁(yè)面的晴雨表,并不保證實(shí)際上有任何錯誤。
網(wǎng)站大小如何影響機器ヽ(′ー`)ノ人爬行?大型 – 如果大型網(wǎng)站包含1000多個(gè)頁(yè)面,則機器人可能會(huì )遇到一個(gè)問(wèn)題,即通過(guò)自然的爬網(wǎng)進(jìn)度持續到達較深的頁(yè)面。這些可能是將與日志文件一起審核的??頁(yè)面,以確定重要性和優(yōu)先級。
中小型網(wǎng)站 – 對于中型網(wǎng)站和小型網(wǎng)(′?`)站而言,其網(wǎng)頁(yè)大(da)約少于500頁(yè),因此漫游器應該能夠毫無(wú)問(wèn)題地抓取大部分頁(yè)面。在這種情況下,您可能正在審核日志文件,以查找邏輯上應更頻繁地進(jìn)行爬網(wǎng)的頁(yè)面。
利用服務(wù)器日志分析seo1.訪(fǎng)問(wèn)網(wǎng)站的服務(wù)器日志
獲得對站點(diǎn)日志文件的訪(fǎng)問(wèn)權限并將之解析后,開(kāi)始審核潛在的“問(wèn)題”頁(yè)面。(我將使用Screaming Frog的Log Analyzer工具進(jìn)行此特定演練)
就最佳做法而言,需要審核至少一個(gè)月的數據,以準確描繪出網(wǎng)站上機器人活動(dòng)的狀態(tài)。要分析的數據量實(shí)際上取決于站點(diǎn)的大小,(′_ゝ`)頁(yè)面越多,將擁有(you)更多的“ヾ(?■_■)ノ事件”,這實(shí)ヽ(′▽?zhuān)?ノ際上會(huì )減慢導入速度。
2.驗證機器人
開(kāi)始導入過(guò)(guo)程后,將出現一個(gè)框,詢(xún)問(wèn)您是否要在導入時(shí)“驗證”機器人。該過(guò)程實(shí)質(zhì)上涉及對向服務(wù)器發(fā)出請求的每個(gè)漫游器的IP地址執行反向DNS查找,以識別假機器人。(當然??(ran),也可以利用nslooku??p命令符進(jìn)行識別IP)
3.篩選和過(guò)濾
接下來(lái)導出數據(ju),以便更(geng)好地過(guò)濾和處理數據,在“行”列上方的左側找ヽ(′ー`)ノ到導出按鈕。
4.審核數據
數據導出到Excel電子表格后,可以通過(guò)Googlebot和Googlebot Smartphone過(guò)濾數據,將請求數量最多的頁(yè)面(╯‵□′)╯過(guò)濾到數量最少的頁(yè)面將隔離潛在的“問(wèn)題”頁(yè)面。
如下所示,網(wǎng)站上有很多頁(yè)面,在一(??ヮ?)?*:???個(gè)月的時(shí)間里,它們僅收到一個(gè)Googlebot請求!這可能(′?ω?`)是一┐(′д`)┌個(gè)問(wèn)題,但是我們需要進(jìn)一步調查。
編譯好要分析的頁(yè)面列表后,就該重新討論前面有關(guān)機器人流量低的可能原因的部分。
結論
服務(wù)器日志文件為我們提供了搜索引擎機器人如何與特定網(wǎng)站交互的視圖,為進(jìn)一步的seo優(yōu)化提供了必要的信息,以更好地了解機器(?????)人為何會(huì )忽略網(wǎng)站上的某些頁(yè)面以及如何進(jìn)行最(zui)佳優(yōu)化。
熱門(mén)文章

