遇到百度網(wǎng)站抓取異常怎么辦
大綱如下:
1、遇到異常抓取異常是百度辦什么?百度抓取異常又是什么?
2、百度抓取異常的網(wǎng)站原因有哪些?
3、網(wǎng)站抓取異常的遇到異常原因有哪些?
4、百度抓取異常對網(wǎng)站有什么影響?百度辦
5、網(wǎng)站出現抓取異常的網(wǎng)站解決方法
抓取異常是什么?百度抓取異常又是什么?
所謂抓取異常,就是遇到異常指搜索引擎蜘蛛無(wú)法抓取網(wǎng)站頁(yè)面,網(wǎng)站出現的百度辦抓取異常就是抓取異常,具體原因是網(wǎng)站什么下面會(huì )講到。
百度抓取異常是遇到異常什么?簡(jiǎn)單理解就是百度的蜘蛛(baiduspider)無(wú)法正常抓取,就是百度辦百度抓取異常。如上圖,網(wǎng)站來(lái)源網(wǎng)上。遇到異常9月3號,百度辦百度蜘蛛來(lái)抓取時(shí),網(wǎng)站抓取時(shí)連ヽ(′?`)ノ接超時(shí)2次。
百度抓取異常的原因有哪些?
百度抓取異常的原原因主要分兩大類(lèi),一是網(wǎng)站異常,二是鏈接異常。在哪里看呢,在百度搜索資(′▽?zhuān)?源平臺(https://ziyuan.baidu.com)你添加后數據統計—抓取異常那里,如下圖。
網(wǎng)站異常原因:
1、dns異常
當百度蜘蛛(Baiduspider)無(wú)法解析您網(wǎng)站的IP時(shí),會(huì )出現DNS異常。??可能是您的 網(wǎng)站IP地址錯誤 ,或(huo)者 域名服務(wù)商把Baiduspider封禁了 。
可以(yi)用WHOIS或者host查詢(xún)自己網(wǎng)站IP地址是否正確而且可以解析,如果不正確或無(wú)法解析,與域名注冊商聯(lián)系,更新網(wǎng)站IP地址。
抓取請求連接超時(shí),可能原因是: 服務(wù)器過(guò)載 或 網(wǎng)絡(luò )不(bu)穩定。
3( ?ヮ?)、抓取超??時(shí)
抓取請求連接建立后,下載頁(yè)面速度 過(guò)慢 ,導致超時(shí)??赡茉蚍?wù)器過(guò)載, 帶寬不足 。
4、連接錯誤
無(wú)法連接或者連接建立后對方服務(wù)器拒絕。
鏈接異常原因:
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是403。
2、找不到頁(yè)面
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是404。
3、服務(wù)器錯誤
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是5XX
4、其他錯誤
爬蟲(chóng)發(fā)起抓取,httpcode返回碼是4XX,不包括??403和404。
關(guān)于上面提到的403、(′?_?`)404、4XX、5XX等,其實(shí)都是網(wǎng)站HTTP狀態(tài)碼,如果不清楚同學(xué),可以看這一篇: 白楊SEO:S??EO入門(mén)學(xué)習之搜索引擎(百度)蜘蛛與網(wǎng)站HTTP狀態(tài)碼 ,再學(xué)習一下。(◎_◎;)
網(wǎng)站抓取異常的原因有哪些?
網(wǎng)站抓取異常的原因主要有以(yi)下五個(gè)方面:??
1、服務(wù)器異常
服務(wù)器連接異常最大的可能是網(wǎng)站服務(wù)器過(guò)( ???)大,超負荷運轉,通過(guò)檢查瀏覽器輸入你的域(yu)名是否正常訪(fǎng)問(wèn)。服務(wù)器異常會(huì )導致蜘蛛無(wú)法連接網(wǎng)站服務(wù)器,導致出現抓取失敗。
2、域名過(guò)期
域名過(guò)期網(wǎng)站肯定不能訪(fǎng)問(wèn),域名解析就??會(huì )失效了。如果存在這類(lèi)情況,你可以與你域名注冊商聯(lián)系解決,看是否被搶注,還是可以續費回來(lái)。
3、網(wǎng)絡(luò )運營(yíng)商異常
如果是因為電信或聯(lián)通網(wǎng)絡(luò )運營(yíng)商出現問(wèn)題,與網(wǎng)絡(luò )服務(wù)運營(yíng)商聯(lián)??系或者購買(mǎi)CDN服務(wù)。
3、robots.txt文件設置問(wèn)題
robots.txt的功效主要是一些不重要的文件屏蔽掉告訴搜索引擎這些些頁(yè)面可以不抓取,但也可能會(huì )存在把重要的頁(yè)面也給屏蔽了,可以檢查下ヽ(′ー`)ノrobots文件設置。
關(guān)于ROBOTS.TXT,可以看我之前寫(xiě)的這篇里面有寫(xiě)到(′ω`):
白楊SEO:新人學(xué)習SEO常遇到的15個(gè)SEO術(shù)語(yǔ),建議收(°ロ°) !藏
4、死鏈接因素
原本正常的鏈接后來(lái)失效了就是死鏈接,死鏈(′ω`*)接發(fā)送請求時(shí),服務(wù)器返回404錯誤頁(yè)面。 死鏈的處理方案可以通過(guò)百度站長(cháng)平臺提交死鏈文件。
5、網(wǎng)站被??掛馬
網(wǎng)站被掛馬,要查詢(xún)掛馬文件在哪里并刪除?;謴途W(wǎng)站,更改登錄名和密碼,??安全密保要從新設置,防止下(xia)次被掛馬。如果找不到,建議直接更換整個(gè)建站程序,換一個(gè)程序。
百度抓取異常對網(wǎng)站有什么影響?
如果網(wǎng)站上存在大量?jì)热葜┲霟o(wú)法正常抓取,百度搜索引擎會(huì )認為網(wǎng)站給用戶(hù)的??體驗上有缺陷( 訪(fǎng)問(wèn)網(wǎng)站的用戶(hù)沒(méi)有得到想要的東西,用戶(hù)的體驗感就會(huì )下降 )降低對網(wǎng)站的評價(jià)。
如何解決呢,繼續往下看(kan)。
網(wǎng)站出現抓取異常的解決方法
1、出現5XX類(lèi)型錯誤情況(′▽?zhuān)?
出現這些情況,并不是網(wǎng)站本身向搜索引擎說(shuō)自己5XX問(wèn)題,有時(shí)打開(kāi)還是正常的(de),那么站長(cháng)后臺的為什么會(huì )顯示這個(gè)錯誤呢?
2、抓取出現DNS錯誤情況(′?`*)
如果是域名的DNS問(wèn)題,(′?_?`)那么白楊SEO建議更換DSN。因為有些DSN出現了這個(gè)問(wèn)題,它后面還有可能出現。
如果要換,就要換大一點(diǎn)的DNS服務(wù)商,比如阿里云收購的萬(wàn)網(wǎng)就不錯,畢竟大公司,穩定性還可以的(′ω`)。
3、出現抓取超時(shí)問(wèn)題
現在做SEO排名??已經(jīng)到了用戶(hù)為王時(shí)代,用戶(hù)如果不能在第一時(shí)間打開(kāi)你網(wǎng)站的頁(yè)面,那么就會(huì )跳到其??他網(wǎng)站上去。而搜索引擎蜘蛛呢,一樣的。如果無(wú)法第一時(shí)間抓取,就會(huì )出現抓取超時(shí)問(wèn)題。
(1)、在??不影響圖片質(zhì)量的情況下,對大的圖片進(jìn)行壓縮哈;
(2)、減少比如網(wǎng)站的JS腳本文件類(lèi)型的使用,或者把一些JS進(jìn)行合并(bing);跟技術(shù)說(shuō)清楚。??
(3)、整個(gè)網(wǎng)站頁(yè)面長(cháng)(′▽?zhuān)?)度進(jìn)行控制,尤其是你的網(wǎng)站??首頁(yè)。很多人網(wǎng)站首頁(yè)做了十來(lái)屏,一般用戶(hù)最多下拉三到五屏。越長(cháng),整個(gè)(′_`)加載就ヾ(′ω`)?會(huì )越久。
(4)、網(wǎng)頁(yè)的內鏈數量,一般一個(gè)頁(yè)面互相之間的內鏈數量建議不要超過(guò)500條哦,其實(shí)越多,蜘蛛都會(huì )去往下爬取,小網(wǎng)站基本沒(méi)這個(gè)問(wèn)題。
總之,百度抓取網(wǎng)站異常(′?`)這個(gè)問(wèn)題,建議建站時(shí)找成熟的程序建站,同時(shí),找像阿里云這樣的大的服務(wù)商。不要總想著(zhù)省錢(qián),淘寶隨便幾百建個(gè)站,找個(gè)不知名服務(wù)商,其實(shí)這樣得不嘗失的。
文章來(lái)源:白楊seo
來(lái)源地址:https://www.baiyangseo.com/blog/222.html





