在本篇文章中,我們將介紹什么是可少可行日志文件,它們?yōu)楹稳绱酥匾?,法用方?strong dir="rtl">要尋找的好網(wǎng)內容以及使用哪些工具。最后??,可少可行我將提供8種可行的法用方法方法來(lái)分析。
服務(wù)器日志是由服務(wù)器自動(dòng)創(chuàng )建和維護的日志文件(或多個(gè)文件),由它執行的可少可行活動(dòng)列表組成(cheng)。(°□°)
出于SEO的法用方法目的,我們關(guān)注一個(gè)Web服務(wù)器日志,好網(wǎng)其中包含來(lái)自人類(lèi)和機器人的可少可行網(wǎng)站頁(yè)面請求的歷史記錄。有時(shí)也稱(chēng)為訪(fǎng)問(wèn)日志,法用方法原始數據如下(xia)所示:
是好網(wǎng)的,起初數據看上去有點(diǎn)令人不知所措,可少可行令人困惑,法用方法所以讓我們分解一下,更仔細地看ˉ\_(ツ)_/ˉ一下“命中”。
每個(gè)服務(wù)器??在記錄命中方面都有本質(zhì)上的不同,但是它們通常會(huì )提供類(lèi)似的信息,這些信息被組織成字段。
對于每次匹配,我們都會(huì )獲得關(guān)鍵信息,例如日期和時(shí)??間,請求的URI的響應代碼(在本例中為404)以及請求來(lái)自的用戶(hù)代理(在本例中(′?`)為Googlebot) )。您可以想象,日志文件每天由成千上萬(wàn)的點(diǎn)擊數組成,每當用戶(hù)或漫游器到達您的網(wǎng)站時(shí),就會(huì )為請求的每個(gè)頁(yè)面記錄許多點(diǎn)擊數-包括圖像,CSS和呈現該文件所需的任何其他文件。
所以您知道什么是日志文件,但是為什么值得花時(shí)間分析它們?
好吧,事實(shí)是,只有一個(gè)真實(shí)的記錄可以說(shuō)明搜索引擎(例如Googlebot)如何處理您的網(wǎng)站。那就是通過(guò)查看網(wǎng)站的服務(wù)器日志文件。
站長(cháng)工具,第三方爬蟲(chóng)和搜索操作員不會(huì )全面了解搜索引擎如何與網(wǎng)站互動(dòng)。只有訪(fǎng)問(wèn)日志文件可以為我們提供此信息。
日志文件分析為我們提供了大量有用的見(jiàn)解,包括使我們能夠:
我將帶您完成在日志文件分析期間可以執行的一些任務(wù),并向您展示它們??如何為(wei)您提供可操作的網(wǎng)站見(jiàn)解。
對于這種類(lèi)型的分析,您需要來(lái)自您域的所有Web服務(wù)器的原始訪(fǎng)問(wèn)日志,而沒(méi)有應用任何過(guò)濾或(???)修改。理想情況下,您需要大量數據才能使分析有價(jià)值。值得多少天/周取決于站點(diǎn)的大小和權限以及所產(chǎn)生的流量。對于某些站點(diǎn),一周可能就足夠了,對于某些站點(diǎn),您可能需要一個(gè)月或更長(cháng)時(shí)間的數據。
您的Web開(kāi)發(fā)人員應該能夠為您發(fā)送這些文件。值得一問(wèn),在它們發(fā)送給您之前,日志是否包含來(lái)自多個(gè)域和協(xié)議的請求,以及這些請求是否包含在此日志中。因為否則,將阻止您正確識別請求。您??將無(wú)法分辨對http://www.example.com/和:/??/example.com/的請求之間的區別。在這種情況下,您應(ying)該要求開(kāi)發(fā)人員更新日志配置,以在將來(lái)包含此信息。
如果您是Excel專(zhuān)家,那么本指南對于幫助您使用Excel格式化和分析日志文件非常有(you)用(yong)。我們??使用Screaming Frog日志文件分析(′ω`*)器,其友好的用戶(hù)界面使您可以快速,輕松地發(fā)現任??何問(wèn)題???(盡管可以說(shuō),您獲得的深度或自由度與使用Excel所獲得的不一樣)。我將為您介紹的所有示例都是使用Scre(′?ω?`)aming Frog日志文件分??析器完成的。 其他一些工具是Splunk和GamutLogViewer。
首先,什么是抓取(′_`)預算?綜合爬網(wǎng)率和爬網(wǎng)需(xu)求,我們將爬??網(wǎng)預算定義為搜索引擎蜘蛛或機器人可以并且想要爬網(wǎng)的數量( ?ヮ?)。
本質(zhì)上,它是搜索引擎每次訪(fǎng)問(wèn)( ???)您的網(wǎng)站時(shí)將爬網(wǎng)的頁(yè)面數,并關(guān)聯(lián)到域的權重,并與通過(guò)網(wǎng)站的鏈接資源成比例。
對于日志文件分析而言,至關(guān)重要的是,有時(shí)爬網(wǎng)預算可能會(huì )浪費在無(wú)關(guān)的頁(yè)面??上。如果您有新內??容要編制索引,但沒(méi)有預算,那么搜索引擎將不會(huì )為新內容編制索引。這就是為什么要通過(guò)日志文件分(fen)析來(lái)監視爬網(wǎng)預算的支出原因。
有許多低附加值的URL會(huì )對網(wǎng)站的爬網(wǎng)和索引產(chǎn)生負面影響。低附加值URL可以屬于以下類(lèi)別:
浪費諸如此類(lèi)頁(yè)面上的服務(wù)器資源會(huì )浪費實(shí)際具有價(jià)值的頁(yè)面的爬網(wǎng)活動(dòng),這可能??會(huì )導致在站點(diǎn)上發(fā)現良好內容的時(shí)間大大延遲。
例如,查看這些日志文件,我們發(fā)??現一個(gè)不正確的主題被非常頻繁地訪(fǎng)問(wèn),這個(gè)問(wèn)題很明顯!
在查看每個(gè)頁(yè)面獲得的事件數量時(shí),請問(wèn)(wen)自己搜索引擎是否應該爬網(wǎng)這些URL –您通常會(huì )(′▽?zhuān)?)找到答案是否定的。因此,優(yōu)化您的抓取預算將有助于搜索引擎抓取您的網(wǎng)站上最重要的(de)頁(yè)面并將其編入索引。您可以通過(guò)多種方式來(lái)執行此操作,例??如通過(guò)文件阻止包含某些模式的URL,從而避免對URL進(jìn)??行爬網(wǎng)。
我們已經(jīng)介紹了為什么對搜索引擎來(lái)說(shuō)重要的是不要在低價(jià)值網(wǎng)頁(yè)上浪費抓取預算。硬幣的另(′ω`)一面是檢??查您對高價(jià)值網(wǎng)頁(yè)的重視程度。如果按事件數排序日志文件并按HTML過(guò)濾,則可以看到訪(fǎng)問(wèn)量最大的頁(yè)面。
如果說(shuō)最重要的URL應該進(jìn)行最大程度的爬網(wǎng),可能有點(diǎn)過(guò)分簡(jiǎn)單了-但是,如果您是潛在客戶(hù)網(wǎng)站,則希望您的主頁(yè),關(guān)鍵服務(wù)頁(yè)面和文章內容出現在其中??。
作為電子商務(wù)網(wǎng)站,您希望您的主頁(yè),類(lèi)別頁(yè)面和關(guān)鍵產(chǎn)品頁(yè)面顯??示在其中。如果您看到不再銷(xiāo)售的舊產(chǎn)品(′▽?zhuān)?)頁(yè)面并且這些結果中最重要的類(lèi)別頁(yè)面為零,則說(shuō)明存在問(wèn)題。
堅持使用日志分析工具,這很容易執行。(°o°)我們知道對外貿易中Googヽ(′▽?zhuān)?/le是主要的搜索引擎,因此確保Googlebot Smartphone和Googlebot定期訪(fǎng)問(wèn)您的網(wǎng)站是您的首要任務(wù)。
我們可以通過(guò)搜索引擎bot過(guò)濾日志文件ヽ(′ー`)ノ數據。
過(guò)濾后,您可以查看每個(gè)所需的搜索引擎機器人正在記錄的事(shi)件數。希望您會(huì )看到Googlebot Smartphone或Googlebot最常訪(fǎng)問(wèn)您的網(wǎng)站。
使用Screa??ming Frog日(ri)志文件分析器,您可以快速發(fā)現錯誤狀態(tài)碼,并且由于它們是按爬網(wǎng)頻率排序的,因此您還可以查看哪些是最可能要修復的URL。
要查看此數據,您可以在“響應代碼”標簽下過(guò)濾此信息(′▽?zhuān)?
在一個(gè)項目中,命中率最高的前15個(gè)頁(yè)面中有重定向,不正確的(′ω`)302(臨時(shí))重定向,頁(yè)面上沒(méi)有內容的頁(yè)面以及一些404和軟404。
如果您只看最后的響應代碼,而沒(méi)有發(fā)現異常錯誤或4xxs和5xxs中的任何尖峰,則可以在那里進(jìn)行技術(shù)檢查。但是,您可以在(zai)日志文件分析器中使用過(guò)濾器來(lái)僅詳細查看“不一致”的響應。
原因很多,您的URL可能會(huì )遇到??不一致(′_ゝ`)的響應代碼。例如:
一旦掌握了日志文件分析中的這些信息,就可以創(chuàng )建行動(dòng)計劃來(lái)修復這些錯誤。
我們知道到第一個(gè)字節的時(shí)間(TTFB),到最后一個(gè)字節的時(shí)間(TTLB)??以及到整個(gè)頁(yè)面加載的時(shí)間都會(huì )影響您的網(wǎng)??站的爬網(wǎng)方式。尤其是TTFB,這是使您的網(wǎng)站快速有效地爬網(wǎng)的關(guān)鍵。頁(yè)面速度也是排名因(yin)素,我們可以看到快速網(wǎng)站對您的性(xing)能至關(guān)重要。
要查看最大的頁(yè)面,請對“平均字節數”列進(jìn)行排序。
在這里,我們可以看到PDF構成了網(wǎng)站上最大的頁(yè)面。優(yōu)化它們并減小它們的大??小是一個(gè)很好的起點(diǎn)(T_T)。如果您看到此處顯示特定頁(yè)面,則可能需要單獨查看它們。
盡管頁(yè)面的大小可以很好地指示頁(yè)面變慢,但這并不是全部。您可以有一個(gè)很大的頁(yè)面,但是它仍然(ran)可以快速加載。排序“平均響應時(shí)間”列,您可以看到響應時(shí)間(jian)最慢的網(wǎng)址。
與您在此處看到的所有數據一樣,您可以按HTML,JavaScript,圖像,CSS等進(jìn)行篩選,這對于審核非常有用。
也許您的目標(????)是減少網(wǎng)站對Ja(′ω`)vaScript的依賴(lài),并希望找出最大的罪魁禍首?;蛘吣??CSS可以簡(jiǎn)化,并且需要數據來(lái)備份它。您的網(wǎng)站可能會(huì )以蝸牛的速度加載,并且按圖像進(jìn)行過(guò)濾向您表明,提供下一代格式應該是優(yōu)先事項。
該日志文件分析器的(de)另一個(gè)重要功能是能夠導入網(wǎng)站的爬網(wǎng)。這確實(shí)很容易實(shí)現,并為您提供了更多從日志文件中進(jìn)行(xing)分析的靈活性。只需將爬網(wǎng)拖放到如下所示的“導入的URL數據”中即可。
完成后,您可以進(jìn)行進(jìn)一步的分析。
確保在下拉菜單“( ?ヮ?)與URL數據匹配”中進(jìn)行選擇,然后將相關(guān)列拖動(dòng)到視圖中。在這里,我們可以對爬網(wǎng)深度和鏈接對您網(wǎng)站的爬網(wǎng)頻率的影響進(jìn)行批量分析。
例如,如果您的“重要”頁(yè)??面不經(jīng)常被抓取,并且發(fā)現它們的鏈接很少,并且抓取深度大于3,這很可能就是為什么您的頁(yè)面沒(méi)有被抓取太多的原因。相反,如果(guo)您有一個(gè)頁(yè)面被大量爬網(wǎng),并且不確定為什么,請查看頁(yè)面在您網(wǎng)站中的位置。鏈接在哪里?距根有多遠?對此進(jìn)行分析可以(???)向您表明搜索引擎喜歡您的。最終,該技術(shù)可以幫助您確定層次結構和站點(diǎn)結構中的任何問(wèn)題。
最后,通過(guò)導入爬網(wǎng)數據,發(fā)現孤立頁(yè)面很容易。孤兒頁(yè)面可以定義為搜索引擎知道并且正在爬網(wǎng)但未在您的網(wǎng)站內部進(jìn)行鏈接的頁(yè)面。
最終,您需要查看找到的孤立URL,并作出判斷來(lái)處理它們。
這就是我們對日志文件分析和8個(gè)可操作任務(wù)的簡(jiǎn)短介紹,您可以立即使用Screaming Frog日志文件分析器開(kāi)始。在Exc(╯°□°)╯︵ ┻━┻el和上述其他工??具(以及其他工具)中,您還可以做更多的工作。
您如何進(jìn)行日志文??件分析?您認??為哪種??工具最有效?我們的SEO團隊很想知道,??在下面發(fā)表??評論吧!
1.監控網(wǎng)站速度
當您的網(wǎng)站加載時(shí)間越長(cháng)時(shí),那么潛在客戶(hù)就越有可能轉移到另一個(gè)網(wǎng)站中。若是要提高此速度,就得需要使用精益編碼和移動(dòng)優(yōu)化的內(′?_?`)容布局。加載緩慢的(de)網(wǎng)站可以將潛在合法客戶(hù)提高3??8%。
2.使用相關(guān)關(guān)鍵字
相關(guān)關(guān)鍵字可以增加獲得更多流量的機會(huì )。高質(zhì)量的標題和描述將(′_`)吸引用戶(hù),并使您的網(wǎng)站在搜索結果中看起來(lái)更好。如果網(wǎng)頁(yè)標題和說(shuō)明優(yōu)化不當,抓取工具會(huì )努力抓取您的網(wǎng)站。標(biao)題和標簽也是一站式SEO的重要組成部分。網(wǎng)站的每(mei)個(gè)頁(yè)面都應包含多個(gè)標(′?ω?`)題標簽,其中最重要的是H1標簽。
1.產(chǎn)品和服務(wù)的結構化┐(′ー`)┌數據
通過(guò)向產(chǎn)品和服務(wù)頁(yè)面添加架構標記,??您可以為客戶(hù)提供與其需求相關(guān)的結構化數據,它還可以提高品牌認知度和點(diǎn)擊率。給網(wǎng)站添加架構有兩種方法:1.使用免費工具;2.聘(╯‵□′)╯請SEO公司。
2.專(zhuān)注于正確的關(guān)鍵字
在產(chǎn)品頁(yè)面上使用架構可以幫助百度了解其價(jià)格和庫存狀況。除此之外它還可以提高您網(wǎng)站的內容質(zhì)量。向百度提供結構化數據可以為您的產(chǎn)品帶來(lái)更多的 SERP 空間。
1.與類(lèi)似的產(chǎn)業(yè)/企業(yè)交換鏈接。
鏈接建設應該是一個(gè)互惠的過(guò)程,與志同道合的營(yíng)銷(xiāo)人員交換鏈接可以相互受益。這是發(fā)展業(yè)務(wù)和網(wǎng)絡(luò )的??好方法。它還為新想法和向其他成功人??士學(xué)習提供了一個(gè)發(fā)聲板。您還可以向市場(chǎng)中的其他營(yíng)銷(xiāo)人員尋求建議和建議。
2.增加指向反向鏈接的數量。
鏈接對于實(shí)現更高的SEO排名非常重要。此外擁有更多來(lái)自?xún)?yōu)質(zhì)網(wǎng)站的反向鏈接將提高您網(wǎng)站的聲譽(yù)和排名(T_T)(ming)。因此投資您的??鏈接建設策略對于您的在線(xiàn)營(yíng)銷(xiāo)策略至(′;д;`)關(guān)重要。
1.相關(guān)關(guān)鍵字:
關(guān)鍵字支持您的主要關(guān)鍵字并將語(yǔ)境化(′?`*)。例如,如果您的企業(yè)銷(xiāo)售SEO服務(wù),您可能還希望成為SEO咨詢(xún)公(gong)司或代理商。相關(guān)(′;ω;`)關(guān)鍵字的含義應該相同,但可能會(huì )使用不同的詞語(yǔ)。
2.錨文本:
在網(wǎng)站上使(shi)用錨文本。錨文本是鏈接的文本部分,用戶(hù)可以單擊以轉到內部頁(yè)面。SEO檢查錨文本以了解網(wǎng)站的內容。理想情況下,文本與其鏈接到的頁(yè)面相關(guān)。
1.確保您的頁(yè)面相互鏈(⊙_⊙)接。
通過(guò)創(chuàng )建支柱頁(yè)面和中心頁(yè)面,增加您的網(wǎng)站在眾多擁有競爭性質(zhì)的關(guān)鍵字中排名靠前的可能性。這使得SEO更容易抓取你的網(wǎng)站并找到新頁(yè)面。這很重要,因為百度很難將整個(gè)網(wǎng)站編入索引。
2.使用相關(guān)的內部鏈接。
首先確保內部鏈接與網(wǎng)站的內容相關(guān),并且傳入鏈接上的錨文本也能被百度使用;其次確保內部鏈接一致并包含相關(guān)關(guān)鍵字。
1.網(wǎng)站適??合移動(dòng)設備,這是提高SEO排名的有效方法。
如果有嚴重問(wèn)題,此工具會(huì )通知您。并且還會(huì )列出可能損害您的移動(dòng)友好性的因素。
版權聲明:本文內容由互聯(lián)網(wǎng)用戶(hù)自發(fā)貢獻,該文觀(guān)點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(°o°),不承擔相關(guān)法律責任。如發(fā)現本站有涉嫌抄襲侵權/違法違規的內容, 請發(fā)送郵件至 [email protected] 舉報,一經(jīng)查實(shí),本站將立(li)刻刪除。