前面我們眾騰網(wǎng)絡(luò)分享了《搜索引擎工作原理之預(yù)處理和索引與鏈接關(guān)系的計(jì)算》,當(dāng)搜索引擎蜘蛛爬行和抓取網(wǎng)頁(yè)之后,會(huì)對(duì)得到的網(wǎng)頁(yè)進(jìn)行一系列的預(yù)處理,最后得到關(guān)于網(wǎng)頁(yè)的反向索引集合,這時(shí)搜索引擎就可以根據(jù)用戶輸入的搜索詞對(duì)網(wǎng)頁(yè)做出排名了。
當(dāng)然,從用戶輸入搜索詞到搜索引擎展示出相關(guān)的網(wǎng)頁(yè)排名結(jié)果,中間還要經(jīng)過(guò)相當(dāng)復(fù)雜的計(jì)算過(guò)程!
搜索引擎會(huì)對(duì)用戶輸入的搜索詞進(jìn)行分詞處理和去噪,如果對(duì)分詞處理和去噪還不是很了解的小伙伴,大家可以到《參考搜索引擎工作原理:預(yù)處理這篇文章》,這里就不多做介紹了,當(dāng)搜索引擎分詞和去噪完畢之后,會(huì)得到幾個(gè)關(guān)鍵詞,然后按照這幾個(gè)關(guān)鍵詞的邏輯“與”關(guān)系到反向索引集合中去進(jìn)行匹配,比如網(wǎng)友輸入“桂林網(wǎng)站建設(shè)”最后會(huì)被搜索引擎分詞成“桂林”,“網(wǎng)站”,“建設(shè)”這三個(gè)關(guān)鍵詞,然后再去爬行和抓取的網(wǎng)頁(yè)反向索引庫(kù)中查找同時(shí)包含這三個(gè)關(guān)鍵詞的頁(yè)面,因?yàn)檫@樣得到的網(wǎng)頁(yè)相關(guān)性更高。
當(dāng)搜索引擎得到這些網(wǎng)頁(yè)之后會(huì)發(fā)現(xiàn),這些網(wǎng)頁(yè)的數(shù)量是相當(dāng)龐大的,而用于展示在用戶面前的搜索結(jié)果頁(yè)面不超過(guò)1000個(gè),百度也只展示了760個(gè)頁(yè)面,所以搜索引擎會(huì)對(duì)這些頁(yè)面進(jìn)行相關(guān)性之外的計(jì)算,其中影響較大的一個(gè)因素就是網(wǎng)頁(yè)的權(quán)重,根據(jù)網(wǎng)頁(yè)權(quán)重的高低排序會(huì)篩選出一批頁(yè)面,至于篩選出多少頁(yè)面,這里不得而知,但肯定大于1000個(gè)頁(yè)面。
在選出這些權(quán)重較高相關(guān)性較強(qiáng)的頁(yè)面之后,接下來(lái)搜索引擎會(huì)對(duì)這些頁(yè)面進(jìn)行更加細(xì)微的相關(guān)性計(jì)算,這個(gè)過(guò)程也是我們seoer更為關(guān)心的一個(gè)過(guò)程,因?yàn)檫@個(gè)過(guò)程中的很多因素是我們這些seoer可以控制的。
關(guān)鍵詞的常見(jiàn)指數(shù),比如用戶搜索“桂林旅游”,經(jīng)過(guò)搜索引擎分詞可以分成“桂林”,“旅游”,我們可以很明顯的看出“旅游”這個(gè)詞在我們生活中經(jīng)常會(huì)出現(xiàn),而“桂林”就出現(xiàn)的比較少了,針對(duì)都包含“桂林”和“旅游”關(guān)鍵詞的兩個(gè)頁(yè)面,顯然在標(biāo)題中出現(xiàn)關(guān)鍵詞“桂林”比內(nèi)容中出現(xiàn)“桂林”的相關(guān)性更強(qiáng)。
關(guān)鍵詞的頻率及密度,這個(gè)比較好理解,如果關(guān)鍵詞在頁(yè)面中的出現(xiàn)的頻率很高,密度也很大(這里不考慮關(guān)鍵詞的堆砌),那么這個(gè)頁(yè)面和這個(gè)關(guān)鍵詞的相關(guān)性很強(qiáng)。
關(guān)鍵詞的位置和表現(xiàn)形式,就像在上面說(shuō)的搜索引擎工作原理:索引與鏈接關(guān)系的計(jì)算這篇文章中提到的,關(guān)鍵詞的位置和表現(xiàn)形式都會(huì)被列入相關(guān)性計(jì)算中,比如一些標(biāo)題標(biāo)簽的使用,文字加粗和顏色變化,H1標(biāo)簽等。
關(guān)鍵詞是否完整匹配,如果關(guān)鍵詞能夠完整匹配用戶的搜索詞,則相關(guān)性高,即使沒(méi)能完整匹配,但是關(guān)鍵詞之間距離很短,這樣也會(huì)被認(rèn)為相關(guān)性較高。
錨文本和權(quán)重,頁(yè)面的權(quán)重對(duì)關(guān)鍵詞的相關(guān)性影響非常大,而錨文本的重要性與頁(yè)面的權(quán)重幾乎相當(dāng),如果錨文本的錨點(diǎn)采用的是用戶搜索的關(guān)鍵詞,那么這個(gè)錨文本會(huì)給這個(gè)關(guān)鍵詞帶來(lái)很大的鏈接權(quán)重,包括錨文本周圍的文字也需要重點(diǎn)布局。
經(jīng)過(guò)以上這些關(guān)于頁(yè)面與關(guān)鍵詞之間相關(guān)性計(jì)算之后,網(wǎng)頁(yè)的排名結(jié)果頁(yè)就浮出水面了,接下來(lái)的工作就是搜索引擎調(diào)用頁(yè)面的標(biāo)題,頁(yè)面描述,網(wǎng)址,快照等數(shù)據(jù)顯示在搜索結(jié)果頁(yè)面中。
我們通過(guò)幾篇文章介紹了搜索引擎的工作原理,要想做好網(wǎng)站優(yōu)化,理解搜索引擎的工作原理還是非常重要的,這樣我們的優(yōu)化才會(huì)更有目的性,希望能對(duì)大家有所幫助!