SEO必看 ,搜索搜索搜索引擎的引擎優(yōu)(′ω`*)化引擎工作原理及優(yōu)化
一、搜索引擎工作原理
搜索引擎的本原工作分為三個(gè)階段,即爬行,搜索搜索索引和檢索
1.爬行
搜索引擎具有網(wǎng)絡(luò )爬蟲(chóng)或蜘蛛來(lái)執行爬網(wǎng),引擎優(yōu)化引擎每次抓取工具訪(fǎng)問(wèn)(wen)網(wǎng)頁(yè)時(shí),本原它都會(huì )復制該網(wǎng)頁(yè)并將其網(wǎng)址添加到索引中。搜索搜索
在“蜘蛛”抓取網(wǎng)頁(yè)內容,引擎優(yōu)化引擎提煉關(guān)鍵詞的本原這個(gè)過(guò)程中,就存在一個(gè)問(wèn)題:“蜘蛛”能否看懂。搜索搜索如(ru)果網(wǎng)站內容是引擎優(yōu)化引擎 flash 和 js,那么它是本原看不懂的。
相(xiang)應的搜索搜索,如果網(wǎng)站內容是引擎優(yōu)化引擎它的語(yǔ)言,那么它便能看懂,本原它(ta)的語(yǔ)言即 SEO
2.索引
此階段,爬網(wǎng)程序會(huì )創(chuàng )建搜索引擎的索引。索引就像一本巨大的書(shū),其中包含爬蟲(chóng)找到的每個(gè)網(wǎng)頁(yè)的副本。如果任何網(wǎng)頁(yè)發(fā)生更改,則抓取工具會(huì )使用新(xin)內容更新圖書(shū)
這是搜索引擎以特定順序提供最有用和最相關(guān)答案的最后階段。
二、SEO 簡(jiǎn)介
1.S??EO 的分類(lèi)
A.白帽 SEO:起(qi)到了改??良和規范網(wǎng)站設計的(??-)?作用,使網(wǎng)站對搜索引擎和用戶(hù)更加友好,并從搜索引擎中獲取合理的流量
B.黑帽 SE??O:利用和放大搜索引擎政策缺陷來(lái)獲取更多用戶(hù)的訪(fǎng)問(wèn)量
2.白帽 SEO 的使用
a.對網(wǎng)站的標題、關(guān)鍵字、描述精心┐(′д`)┌設置,反映網(wǎng)站的定位,讓搜索引擎明白網(wǎng)站是做什么的;
b.網(wǎng)??站內容優(yōu)化:內容與關(guān)鍵字的對應,增加關(guān)鍵字的密度;
c.在網(wǎng)(//ω//)站上合理設置?? Robot.t??xt 文件;
d.生成針對搜索引擎友好的網(wǎng)站地圖;
e.增加外部鏈接,到各個(gè)網(wǎng)站上宣傳;
三、SEO 優(yōu)化
通過(guò)網(wǎng)站的結構布局設計和網(wǎng)頁(yè)代碼優(yōu)化,使前端頁(yè)面既能讓瀏覽器用戶(hù)能夠看懂,也能讓“蜘蛛”看懂。
1??.網(wǎng)站結構布局優(yōu)化
A.控制首頁(yè)鏈接數量
B.扁平化的目錄層次
盡量讓“蜘蛛”只跳轉3次,就能到達(da)網(wǎng)站內的任何一個(gè)內頁(yè)
C.導航優(yōu)化
導航應該盡量采用文字方式,也可以搭配圖片導航,但<img>標簽務(wù)必添加“alt”和“title”屬性,告訴搜索引擎導航的定位
對用戶(hù)而言,可??以讓用戶(hù)了解當前所處的位置,形成更好??的位置感,(?_?;)并方便用戶(hù)操作;
對蜘蛛而言,能夠清楚的了解網(wǎng)站結構(?⊿?),同時(shí)還增加了大量的內部鏈接,方便抓取,降低跳出率。
a.頁(yè)面頭部:logo 及主導航,以及用戶(hù)的信息
b.頁(yè)面主體:左邊面包屑導航及正文;右??邊放熱門(mén)文章及相關(guān)文章,既增強了頁(yè)面相關(guān)性,也增強頁(yè)面的權重
c.頁(yè)面底部:版權信息和友情鏈接
注意:分頁(yè)導航推薦寫(xiě)法:“1 2 3 4 5 6 7 8 9 10 下拉框/輸入框”,這樣“蜘蛛”能夠根據相應頁(yè)碼直接跳轉,下拉框直接選擇頁(yè)面跳轉
E.控制頁(yè)面ヾ(′▽?zhuān)??(mian)的大小
一個(gè)頁(yè)面最好不要超過(guò)100k,太大,頁(yè)面加載速度慢,用戶(hù)體驗不好,并且一旦超時(shí),“蜘蛛”也會(huì )離開(kāi)。
2.網(wǎng)頁(yè)代碼優(yōu)化
a.<title>
b.<meta keywords>
c.<meta desc??ription>
網(wǎng)頁(yè)描述,高度概括網(wǎng)頁(yè)內容的關(guān)鍵(???)詞,每個(gè)頁(yè)面也要有所不同
d.標簽語(yǔ)義化
比如:h??1-h6是用于標題類(lèi)的,<nav>標簽是用來(lái)設置頁(yè)面主導航的等
e(//ω//).<a>標簽
頁(yè)內鏈接,要加“title??” 屬性加以說(shuō)明,讓訪(fǎng)客(ke)和 “蜘蛛” 知道;
外部鏈接,鏈接到其他網(wǎng)站的,則需要加上 el="nofollow" 屬性,避免“蜘蛛”爬了外部鏈接之后,就不回了
f.正文標題要用 <h1> 標簽
“蜘蛛” 認為它最重要,若不喜歡<h1>的默認樣式可以通過(guò)CSS設置
g.<br>
只用于文本??內容的換行
h.<caption&(′?ω?`)gt;
表格應該使用 <caption> 表格標題標簽
i.<img> 應使用 “alt” 屬性加以說(shuō)明
j.<strong> 和 <em> : 需要強調時(shí)使用
<strong>標簽在搜索引擎中能突出關(guān)鍵詞
<em>標簽強調效果僅次于 <??;strong>
而 <b>、??<(′?ω?`);i>標簽: 只是用于顯示效果時(shí)使用,在 SEO 中不起效果
k.避免使用 和 ©
空格符 應用 CSS 進(jìn)行設置
版權符 © 可以直(zhi)接使用輸入法打“©”
l.少用 iframe 框架,因為“蜘蛛??”一般不會(huì )讀取其中的內容
m.少用 display: none;?
淺談搜索引擎的工作原理
前面2期介紹SEO的時(shí)候就講到了關(guān)于SEO的??基本定義,這里再次簡(jiǎn)單回顧下吧!
SEO(′ω`)(搜索引擎優(yōu)化)
SEO(搜索引擎優(yōu)化)通常定義為??:在了解搜索引擎的工(′?`)作原理基礎上,對網(wǎng)站進(jìn)行內外調整優(yōu)化,提??高網(wǎng)站關(guān)鍵詞排名,獲得更多流量,達成網(wǎng)站的營(yíng)銷(xiāo)目(╬?益?)的。通過(guò)這一定義,我們可以看到,做SEO首先需要知道我們(′?`)搜索引擎的工作原理是怎樣的,只有搞清楚它的原理,我們才可以本著(zhù)這一原理進(jìn)行做后期優(yōu)化工作。這就是今天這一期重點(diǎn)和大家分享的話(huà)題:搜索引擎的工作原理!
由于搜索引擎這一塊的專(zhuān)業(yè)知識涉及很廣,可以單獨作為一門(mén)學(xué)科來(lái)系統化學(xué)習的,所以建議新手剛開(kāi)始學(xué)SEO的時(shí)候可以先多學(xué)習下搜索引擎這一塊知識哦,也可以自己買(mǎi)本搜索引擎原理的書(shū)籍看看也行,只有理解了搜索引擎的工作原理后,我們對后(′?`)期優(yōu)化工作才有了明??確的方向!
搜索引擎的工作原理
首先搜索引擎的工(◎_◎;)作原理大體上分為三個(gè)階段:
- 爬行與抓取:搜索引擎蜘蛛(Spider)通過(guò)跟蹤鏈接發(fā)現和訪(fǎng)問(wèn)頁(yè)面(′?_?`),然后讀取HTML代碼,存入數據庫中;
- 預處理:搜索引擎蜘蛛抓取來(lái)的頁(yè)面數據進(jìn)行文字提取,中文分詞,索引(正向索引),倒排索引等,以備后面排名和展現;
- 排名:通過(guò)一定的搜???索相關(guān)性計算,按照一定格式生成搜索結果頁(yè)面。
搜索引擎的工作原理
針對這三個(gè)階段詳細說(shuō)下搜索引擎的工作原理:
爬行與抓取
1、跟蹤鏈接:一般是深度優(yōu)先和廣度優(yōu)先??兩種跟??蹤方式,如圖所示:
深度優(yōu)先跟蹤鏈接
廣度優(yōu)先跟蹤鏈接
理論上,無(wú)論是哪種跟蹤方式,只要給蜘蛛足夠多( ?° ?? ?°)時(shí)間,都能爬完(??-)?整個(gè)互聯(lián)網(wǎng)上的鏈??接,但實(shí)際上,蜘蛛的寬帶??資源和時(shí)間都是非常有限的,不可能爬完所有的鏈接,最多只能爬行和收錄一小部分,所以我們做SEO工作就需要主動(dòng)吸引蜘蛛來(lái)爬行和收錄我們的頁(yè)面。
2、吸引蜘蛛:哪些頁(yè)面可以吸引到蜘蛛呢?符合以下幾點(diǎn)就足以(yi)。
- 第一,網(wǎng)站和頁(yè)面權重。權重越高,蜘蛛就越喜歡,尤其是老網(wǎng)站,質(zhì)量高的網(wǎng)站;
- 第二,頁(yè)面更新頻率。蜘蛛喜歡新鮮事物,所以網(wǎng)站這一塊也需要經(jīng)常多跟新;
- 第三,導入鏈接。無(wú)論是外鏈還是內鏈,只要多給蜘蛛爬行頁(yè)面的路徑,頁(yè)面收錄率和排名會(huì )更高;
- 第四,與首頁(yè)點(diǎn)擊距離(′▽?zhuān)?)。一般網(wǎng)站首頁(yè)權重最高,所以頁(yè)面里首頁(yè)的點(diǎn)擊距離越近,爬行和收錄機會(huì )更高;
- 第五,URL結構。首先符合靜態(tài)化最好,其次URL越短,層次越少,蜘蛛爬行的機會(huì )就更大些,頁(yè)面收錄機會(huì )也就更大。
預處理
這里所說(shuō)的預處(chu)理包括:提取文字,中文分詞,去停止詞ヽ(′?`)ノ,消除噪聲,去重,正向索引,倒排索引,鏈接關(guān)系計算,特殊文件處理以及質(zhì)量判斷等等,由于內容過(guò)多,這里不多做詳細說(shuō)明,主要講下正向索引和倒排索引這兩塊核心內容,有些書(shū)籍把??預處理這一階段定義為索引,其實(shí)也是說(shuō)明了正向索引和倒排索引的重點(diǎn),首??先看下面示(shi)意圖:
正(zheng)向索引結構
倒排索引結構
進(jìn)行預處理過(guò)后,尤其是倒排索引處理之后,然后對用戶(hù)搜索詞處理以及相應的文件匹配,得出初始文件的子集,這里的初始文件子集并不能直接用于排名??(ming),還要進(jìn)行相關(guān)性計算,排名過(guò)濾( ?ヮ?)和調整,最終??顯示出頁(yè)面的排??名結果。這里的相關(guān)性計算(suan),主要是根據關(guān)鍵詞常用程度、詞頻和密度、關(guān)(guan)鍵詞位置及形式、關(guān)鍵詞距離、鏈接分析及頁(yè)面權重等來(lái)得出頁(yè)面的內容是否和用戶(hù)??搜索的詞高度相關(guān)。
好了,關(guān)于搜索引擎的工作原理大致上就說(shuō)這么多了,其實(shí)還有很多詳細地方?jīng)]有具體說(shuō)到,由于涉及過(guò)廣,大家可以多了解下搜索引擎這一塊的內容,可以借助相關(guān)書(shū)籍來(lái)系統學(xué)習這(′▽?zhuān)?一塊的內容哦!(′▽?zhuān)?)本期的SEO分享就到這里了,大家有任何問(wèn)題和想法都可以在評論下方留言咨詢(xún)哦!


網(wǎng)站二維碼
導航
電話(huà)
短信
咨詢(xún)
地圖
分享