您的當前位置: 首頁(yè) > AI運營(yíng)推廣
發(fā)布時(shí)間:2026-05-05 06:15:34 瀏覽:6458 次
通過(guò)《SEO新手入門(mén)系列2022(二):SEO 101》這篇文章已經(jīng)簡(jiǎn)單的搜索什搜索引介紹了什么是SEO,和搜索引擎,引擎原理這一篇文章來(lái)詳細的工作概述介紹下搜索引擎的工作原理,搜索引擎的擎工工作順序大致是:抓取網(wǎng)頁(yè)(Crawing),建立索引(Inde??xing),作原排名顯??示(Ranking)。搜索什搜索引
就像在前一篇文章提到的引擎原理,搜索引擎就是工作概述一個(gè)問(wèn)答??機器,他們去挖掘,擎工理解,作原組織網(wǎng)上能發(fā)現(xian)的搜索什搜??索引任何信息,然后把他們以相關(guān)的引擎原理方式組織起(qi)來(lái),再返回給使用者,工作概述為了能把你的擎工網(wǎng)站展現給用戶(hù)之前,最重要的作原一件事就是你的網(wǎng)站能夠被搜索引擎發(fā)現 ,否則在SE??PRs(搜索引擎結果頁(yè))是不會(huì )有你網(wǎng)站信息的。
搜索引擎是怎么工作的?就如SEO小也開(kāi)頭說(shuō)的,搜索引擎想把網(wǎng)站信息提供給用戶(hù),需要完成三個(gè)主要任務(wù):
爬取網(wǎng)站(Crawing)會(huì )有很多蜘蛛程序,順著(zhù)URL一個(gè)網(wǎng)站一個(gè)網(wǎng)站的爬取網(wǎng)站內容。
創(chuàng )建索引(Indexing)對蜘蛛爬取的內容進(jìn)行分類(lèi),創(chuàng )建相關(guān)??索引,并儲存在數據庫中。
建立排名(Ranking)為可能的問(wèn)題建立相關(guān)性排名,??相關(guān)性最高的內容排在靠前(╬?益?)的位(wei)置。
當然其中的技術(shù)實(shí)現是非常復雜的,作一名SEO新人,可能占時(shí)不需要深究這些問(wèn)題,SEO小也在大學(xué)畢業(yè)的時(shí)候,作的畢業(yè)設計就是搜索引擎,當然那時(shí)候是使用第三方的索引分詞庫,我們大(╬?益?)部分時(shí)間只要配置規則就可以,更深入的內容我會(huì )另寫(xiě)些篇文章來(lái)分享。
搜索引擎抓?。–rawing)搜索引擎要想把相關(guān)內容┐(′д`)┌展示給用戶(hù),第一步做的就是派出他的小弟——搜索引擎爬蟲(chóng)(蜘蛛),他們會(huì )不停的抓取互聯(lián)網(wǎng)上新的內容,或者更新數據庫中舊的內容,內容的形式多種多樣,有可能是網(wǎng)頁(yè),PDF文件,MP3音頻文件,什么形式都有,但是他們都是通過(guò)URL去找到這些內容的。
搜索引擎一開(kāi)始會(huì )有一些種子URL,這些URL都是一些質(zhì)量比較高的鏈接地址,而且蜘蛛們就會(huì )順著(zhù)這些地址不斷ヽ(′▽?zhuān)?ノ的(de)往下??抓取,在┐(′?`)┌這個(gè)過(guò)程中,新發(fā)現的鏈接又會(huì )被作為新一輪爬取任務(wù)的種子URL,直到?jīng)]有??新的鏈接可以爬取。
搜索引擎索引(??Indexing)用戶(hù)在搜索引擎輸入框輸入他的關(guān)鍵詞,搜索(′?_?`)引擎會(huì )用驚人的效率在他龐大的索引數據庫中找到相關(guān)的內容,并按內容的相關(guān)性和一些其它的參數來(lái)對內容進(jìn)(T_T)行排序,這個(gè)過(guò)程就是搜索引擎排名,靠前的內容,在搜索引擎看來(lái)就是和用戶(hù)的問(wèn)題相關(guān)性越高的回答。
如果我們不想讓搜索引擎把一些內容展示給用戶(hù),這也是可以辦到的,但是大多數情況下我們不會(huì )這么做,搜索引擎優(yōu)化的目的就是為了讓用戶(hù)看到我們,并能讓搜索引擎優(yōu)先展示我們想給用戶(hù)看的內容。
搜索引擎能找到你么?就像前面說(shuō)(╯°□°)╯︵ ┻━┻的,如果要讓自己的網(wǎng)站出現在SERPs中,那前提就是讓網(wǎng)站被搜索引擎蜘蛛爬取和索引,如果你已經(jīng)有了網(wǎng)站,你可以使用site命令來(lái)查看自己網(wǎng)站被收錄的情況,就拿SEO小也為例,在谷歌搜索框輸入site:www.8848seo.cn你可以看到如下類(lèi)似的結??果:
可以看到SEO小也已經(jīng)有13???5個(gè)網(wǎng)頁(yè)已經(jīng)被谷歌收錄( ???),這個(gè)結果??是經(jīng)常會(huì )變動(dòng)的,能看到一個(gè)(ge)大概的數據,并不是特別的精準,(′?_?`)還有很多沒(méi)有顯示的網(wǎng)頁(yè),用一些關(guān)鍵詞也是能搜索到。如果想看更精準的結果,??可以使用Google Search Console在收錄功能中查看,這就相當于我們百度的站長(cháng)平臺,但是SEO小也個(gè)人覺(jué)得比百度站長(cháng)的作用要大的??多,所以SEO小也一般只??會(huì )看GSC的數據,很少去看百度站長(cháng)平臺的數據,以后也會(huì )專(zhuān)門(mén)寫(xiě)幾篇文章來(lái)介紹。
如果你使用site命令找不到網(wǎng)站的收錄,那有可能是下??面幾種原因:
網(wǎng)站沒(méi)有??外部導(dao)入鏈接,可以到一些平臺發(fā)一些外鏈。
網(wǎng)站目錄結構太深,太復雜,讓搜索引擎爬蟲(chóng)抓取的效率太低。
網(wǎng)站可能包含一些阻止搜索引擎爬蟲(chóng)的??代碼,如noindex,nofol(′;ω;`)low
網(wǎng)站可能被搜索引擎處罰,因為一些作弊(′Д` )或者垃圾廣告等。
我們有時(shí)候把精力太多的放在如何讓搜索引擎抓取內容,卻忽略如何不讓搜索引擎不要爬取一些內容,比如說(shuō)一些重復的頁(yè)面,一些搜索參數,還有比如說(shuō)公司的聯(lián)系方式,留言等,這些內容被收錄ヽ(′?`)ノ意義并不大,而且還會(huì )讓搜索引擎不知道具體哪個(gè)界面是你最想展示給(gei)用(yong)戶(hù)的,所以這時(shí)候我們就要告訴搜索引擎,哪些資源他不要花時(shí)間去爬取,這就要robots.txt文件出場(chǎng)了,這篇SEO教程先到這。
