做網(wǎng)站優(yōu)化,重點(diǎn)往往不是蛛屯做網(wǎng)站優(yōu)蜘蛛”我們覺(jué)得”而是“搜索引擎覺(jué)得”,所以除了要產(chǎn)出大量?jì)?yōu)質(zhì)內容(rong)外??,規避還要清除不利于搜索引擎理解(⊙_⊙)我們網(wǎng)站的陷阱障礙,比如蜘蛛陷阱:flash、問(wèn)題圖片、化蜘化們js調用、蛛屯做網(wǎng)(╯°□°)╯站優(yōu)蜘蛛session ID.各種跳轉、規避frame框架、陷阱必須登錄、問(wèn)題導航欄(╥_╥)js、化蜘化們必??須使用cookies等。蛛屯做網(wǎng)站優(yōu)蜘蛛下面就由我們一起看一下具體情況和解決方案。規避
蜘蛛陷阱??介紹
1、陷(′_`)阱JS腳本
JS在網(wǎng)(?Д?)站建設中有著(zhù)舉足輕重的問(wèn)題作用,因為它能為網(wǎng)站實(shí)現很多酷炫的效果,但是依舊擺脫不了不利于蜘蛛爬取的問(wèn)題,而且網(wǎng)站有(you)太多的JS還會(huì )影響嚴重影響網(wǎng)站的加載速度。
解決辦法:對于某些排名毫無(wú)意義的頁(yè)面??,用JS( ?ω?)腳本阻止蜘蛛對它的抓取,由于集中權重
2、Flash模塊
Flash模塊確實(shí)給人的視覺(jué)效果非常棒的體驗,但蜘蛛難以識別flash內容,所以過(guò)多的flash會(huì )影響,搜索引擎對網(wǎng)站相關(guān)性的判斷。
3、frame框架結構
解決辦法:??用DIV+css或者Ajax代替frame吧
4、Session ID
網(wǎng)站采用Se(′_`)ssion ID做用戶(hù)跟蹤訪(fǎng)問(wèn),會(huì )導致蜘蛛訪(fǎng)問(wèn)這種網(wǎng)站的時(shí)(??ヮ?)?*:???候,即使訪(fǎng)問(wèn)的是(′?_?`)同一個(gè)頁(yè)面,也會(huì )出現不一樣的ID,??根本就很難判斷出哪個(gè)url才是主要頁(yè)面,甚至還會(huì )誤判為網(wǎng)站有大量頁(yè)面(mian)存在重復的內容,導致網(wǎng)站降權。
解決辦法:技術(shù)處理,把session id保存在persistent cookie中(通過(guò)設置session的最大有效時(shí)間??),然后在新窗口讀出上一個(gè)窗口的session id。
5、帶各種參數的動(dòng)態(tài)UR(′ω`*)L
網(wǎng)站動(dòng)態(tài)的URL越多,網(wǎng)站越會(huì )誤導搜索引擎,如果設置不當也會(huì )造成搜索引擎判斷不清(′?`*)到底哪個(gè)是正規的頁(yè)面(原理上跟SessionID相似),而且動(dòng)態(tài)URL也是不利于蜘蛛抓取的,我們應該避免,建( ?ヮ?)議站長(cháng)手上的網(wǎng)站都要??做一下靜態(tài)化,并且屏蔽掉那些異常參數的url。
解決辦法:做好網(wǎng)站URL規范化處理,避免動(dòng)態(tài)參數過(guò)多。
6、登錄限制或強制使用cookie
有登錄限制的內容,對于搜索引擎來(lái)說(shuō)它即不會(huì )注冊也不會(huì )登錄,這樣的內容蜘??蛛是發(fā)現不了的;(╬?益?)同樣強制使用Cookies只能造成搜索引擎蜘蛛無(wú)法正常??訪(fǎng)問(wèn)。
建議:詳情頁(yè)
7、異常跳轉
雜七雜八的跳轉,常用于一般灰帽或黑帽,做采用變相引流。常見(jiàn)的例如:JS跳轉、Flash跳轉、302ヽ(′ー`)ノ跳轉等。而至于301跳轉是受搜索引擎推薦和認可的,(T_T)所以不包括在列。
解決辦法:白帽seo盡量少用,否則會(huì )被當做作弊手段。
最后,有些網(wǎng)站為了跟用戶(hù)交流就時(shí)不時(shí)的強出很多聊天窗(′_`)口,這些(T_T)往往會(huì )降低用戶(hù)體驗,而且這些聊天窗口搜索引擎也無(wú)法識別的,所以盡量不用。
我們從(cong)事網(wǎng)站優(yōu)化的過(guò)程??(╯°□°)╯中,尤其是現在收入對于網(wǎng)站而言是非常重要的網(wǎng)站,只有有了比較不錯的收錄(′ω`)之后,才有可能會(huì )取得不錯的排名,因此在網(wǎng)站設計的時(shí)候,我們就要盡可能的讓??蜘蛛能夠獲取到網(wǎng)站的全部?jì)热菪畔?,如果說(shuō)在網(wǎng)站的程序上,或者說(shuō)是設計上出現了蜘蛛陷阱,就會(huì )導致蜘蛛無(wú)法獲取站點(diǎn)(dian)的內容。
有些朋友為了網(wǎng)站好看、炫酷等等,但是卻導致了蜘蛛抓取困難,這在一定程度上就形式了蜘蛛陷阱,那么具體有哪些(xie)情況會(huì )出現這種蜘蛛陷阱(O_O)呢?
一、JS
有些朋友為了讓網(wǎng)站吸引用戶(hù)的眼球,就把??導航、??網(wǎng)站的首??頁(yè)界面(mian)等等都使用了大量的JS腳本??,這對于蜘蛛抓取也是不利的。對于這一點(diǎn)可能存在一定的爭議,問(wèn)題在于到底要不要把它劃到蜘蛛陷阱這一塊。
JS在網(wǎng)站建設中ヾ(′ω`)?有著(zhù)舉足輕重的作用,因為它能為網(wǎng)站實(shí)現很多酷炫的效果,但是它ヾ(′?`)?依舊擺脫不了不利于蜘蛛爬取的問(wèn)題,就這一點(diǎn)來(lái)說(shuō)它可以算是蜘蛛陷阱,(′?`)但是它也可(′▽?zhuān)?)以用在網(wǎng)站的其他方面對咱們做SEO的還是有所幫助的,比如為了避免網(wǎng)站權重的分散,不想讓一些對網(wǎng)站排名毫無(wú)意義的頁(yè)面被收錄,我們就可以用JS腳本阻止蜘蛛對該頁(yè)面的抓取,而就這一點(diǎn)來(lái)說(shuō)??它又是我們(′?ω?`)做網(wǎng)站優(yōu)化的??好幫手,所以對于JS腳本(′▽?zhuān)?)這一點(diǎn)還是全憑自己且用且拿捏吧!
二、框架結構
框架結構里面的html通常情況下是可以被蜘蛛抓取的,但是一般情況下這里面的內容不是完整的,導致的結果就是搜索引擎無(wú)法判斷框架里面的內容到底是主框架還是框架調用(yong)的文件。
框架結構就目前來(lái)說(shuō)算的上是網(wǎng)站建設界的老(lao)古董了,業(yè)界在剛開(kāi)始建設網(wǎng)站的時(shí)(T_T)候會(huì )用框架結構來(lái)設計相關(guān)的頁(yè)面,在當時(shí)來(lái)講的確提供了不少方便,但在現如今建站愈來(lái)愈簡(jiǎn)單智能的時(shí)代,框架結構逐漸落伍并且非常不利于蜘蛛爬取網(wǎng)站的內容,所以框架結構是被逼成了蜘蛛陷阱,老實(shí)講這(O_O)不能怪它,可是也不(bu)得不怪它,這同時(shí)也驗證了一句話(huà):落后就要挨打。
三、有過(guò)多的flash
不得不說(shuō)Flas??h能為我們的網(wǎng)站增色不??少,恰到好處的Flash能夠讓我們的網(wǎng)站看起來(lái)高端大氣上檔次,但是不要因為它有這些優(yōu)點(diǎn)我們就可以濫用,不管什么地??方都去整個(gè)Flash什么的,那樣只會(huì )適得其反,之所以這么說(shuō)是由于搜索引擎對Flash的抓取很不理想,偶爾用到幾乎沒(méi)什么影響,但是如果你的整個(gè)首頁(yè)就只用了一個(gè)超大的Flash亦或是頁(yè)??面上面到處都是Flash,這就變成了蜘蛛陷阱。雖然搜索引擎一直在竭盡全力攻克這??方面抓取的難題,但到目前為止效果還是不怎么好,所以我們也只能主動(dòng)避開(kāi)這些問(wèn)題。
目前的flash也是蜘蛛難以識別的,這對于搜索引擎來(lái)說(shuō)也是一種看不懂的東西,那么及時(shí)再好的視覺(jué)效果,也會(huì )讓搜索引擎無(wú)法判斷對應??的??相關(guān)性。
四、┐(′?`)┌Session ID
Session ID用戶(hù)跟蹤訪(fǎng)問(wèn),造成的現象就是用戶(hù)每訪(fǎng)問(wèn)一個(gè)頁(yè)面,就會(huì )出??現不一樣的Session ID,也就是說(shuō)訪(fǎng)問(wèn)同樣的頁(yè)面,但是出現不一樣的ID,這就造成了大量重復性的內容,也不利搜索引擎優(yōu)化的。
五、異常跳轉
網(wǎng)站的跳轉方法多種多樣,常見(jiàn)的例如:JS跳轉、Flash跳轉、302跳ˉ\_(ツ)_/ˉ轉等,而301跳轉要單獨來(lái)說(shuō),因為它是搜索引擎推薦和認可的跳轉形式,它主要用在網(wǎng)站域名更改后將此域名指向彼域名,并且還可以將老域名的權重全部繼承給新域名。除此之外的雜七雜八的跳轉對搜索引擎來(lái)說(shuō)都是不友好的,因為跳轉本身就不利于蜘蛛的爬取,這也就是所謂的蜘蛛陷阱了。
普通情況下是不會(huì )做??出這樣的操作,一般灰帽或黑帽的朋友比較喜歡這種操作,采用變相引流的方法,讓頁(yè)面跳來(lái)跳去,但是實(shí)際上等于欺騙搜索引擎和用戶(hù)。
六、動(dòng)態(tài)URL
動(dòng)態(tài)URL目前對于搜索引擎來(lái)說(shuō)還是說(shuō)可以識別的,但是如果大量的動(dòng)態(tài)URL是不利于蜘蛛抓取的,時(shí)間長(cháng),也不利于優(yōu)化。
搜索引擎比較喜歡靜態(tài)網(wǎng)站,所以很多的動(dòng)態(tài)網(wǎng)站都會(huì )使用偽靜態(tài)設置。動(dòng)態(tài)U??RL通俗的解釋就是網(wǎng)站鏈接中帶有各種參數、等號、問(wèn)號或者其它符┐(′?`)┌號??而長(cháng)度還很長(cháng)的鏈接,對于那些有密集恐懼癥的朋友來(lái)說(shuō)這絕對是不(′▽?zhuān)?)能容忍的,恰巧的是蜘蛛也(′▽?zhuān)?患有這種癥狀(哈哈哈),其實(shí)最根本的原因還是動(dòng)態(tài)URL不利于蜘蛛的爬取。
有登錄限制的內容,對于搜索引擎來(lái)說(shuō)它即不會(huì )注冊也?不會(huì )登錄,這(zhe)樣的內容蜘蛛是發(fā)現不了的。
目前很(hen)少有網(wǎng)站采用這種限制了,為了想讓用戶(hù)記住網(wǎng)站、登錄信息、跟蹤訪(fǎng)問(wèn)路徑等等情況,強制使用cookies等,造成的結果就是沒(méi)有啟用c(╯°□°)╯ookies的用戶(hù)就訪(fǎng)問(wèn)不了,會(huì )提示頁(yè)面無(wú)法正常顯示,或者蜘蛛無(wú)法(fa)正常訪(fǎng)問(wèn)識別等ヾ(′?`)?情況。
九、很多彈出式聊天窗口