5年SEO實戰大牛干貨分享:算法解讀之動態索引對SEO的幫助

  上一篇文章講到倒排索引的靜態索引,那這篇文章我們來聊聊動態索引。因為一旦索引建立好后,那么就能投入到用戶的查詢請求系統中。  實際上在互聯網中每時每秒都有大量的

  上一篇文章講到倒排索引的靜態索引,那這篇文章我們來聊聊動態索引。因為一旦索引建立好后,那么就能投入到用戶的查詢請求系統中。

  實際上在互聯網中每時每秒都有大量的頁面生成,為了滿足用戶的不同需求,必須要加入最新的文檔返回給用戶,比如:小明,在百度上查詢了“今日南京天氣預報”,如果按照靜態索引的話,返回的信息就不是最新的,可能是今天以前的天氣預報信息。從用戶的體驗上來說并不是很好,那么動態索引就很好的解決了這一問題。

  在原始的靜態索引庫搭建好之后,源源不斷的會有新的文檔加入進來,同時在原先的文檔索引中可能會被刪除或者內容被更改。比如:在視頻軟件客戶端上看某個電視劇或者是電影,視頻軟件會一邊下載一邊播放,當觀看一個新的視頻時,緩存庫中會有該視頻的緩存文件,搜索引擎也是一樣的,需要及時的將新的文件納入到緩存庫中。刪除該視頻的緩存也是實時可以看得見的,大多數搜索引擎也是類似于這樣的動態場景。

  那么搜索引擎具體是怎么實現這種動態索引的呢?老規矩我們先來了解一下名詞概念:

  1、倒排索引:這其實是單詞對應文檔的一種存儲形式。

  2、臨時索引:也是一種存儲形式,和倒排索引不同的是,比如有新的文檔加入到系統中,實時的對文檔進行分析,并加入到臨時的索引的存儲形式中。

  3、已刪除文檔列表:這個很好理解就是用來存儲被刪除文檔的對應ID后,所形成的一個ID列表。PS,如果一篇文檔的內容被更改了,搜索引擎就會認為不存在舊的文檔了,會將它刪除掉,然后在系統里增加新的文檔,通過這樣的方式來實現對內容更改的支持。

  當搜索引擎發現了一個新的文檔時(互聯網上的所有文件叫做文檔,比如jpg,txt,js等等這些都是文檔),都會把它放到臨時的緩存索引庫中。當有文檔被刪除或者更改之后,會把它放在刪除隊列,抓取更新后的文檔信息,通過臨時的緩存索引庫中,來實現一個動態的索引。

  舉個例子:一個用戶在百度搜索某個查詢詞的時候(等于是向搜索引擎發送了一個請求),搜索引擎會在自己的倒排索引庫中和臨時緩存索引庫中,找到與用戶查詢詞相關的文檔集合,同時將兩個庫中的文檔集合進行篩選整合,最后得出相關的文檔,并在搜索結果頁上返回這些文檔集合。

  在實際中,網站所在的服務器資源是有限的,隨著時間的推移,越來越多的文檔被加入到這個系統中,臨時緩存索引庫的內存也會被消耗,可能在最初分配給臨時緩存索引庫的內存已經不能夠滿足現在的要求了。搜索引擎通過4種更新的策略完美的解決了這個問題,分別是:完全重建策略再合并策略原地更新策略混合策略,這些就不再深度講解了。

  實戰中的應用,通過上面的結論,當我們的網站文章頁面被收錄后,排名不是很理想,那這個時候是刪除這個頁面,然后重新寫一個新的關于這個詞的文章嗎?

  并不是,正確的做法應該是修改原網頁的內容,讓這個頁面豐富度更加的完善(比如圖文并茂、文章的排版布局、重點的話語加粗、加入時間戳、分享插件、評論等等),然后在百度站長平臺上提交了鏈接并且投訴這個網頁的快照。刪除這個頁面不好么?也可以,但刪除URL并不是首選,因為刪除這個頁面后就變成了死鏈接。

  而針對死鏈接,這里有兩種情況:一班的seo從業者如果細節做的不到位的話,就不會管它了,任憑網站上存在死鏈接,這其實對于蜘蛛的友好度不利,也會導致網站的整體分值下降,對網站的排名非常的不利。那么二班的seo從業者可以很好的利用相關工具(比如:尖叫青蛙綠蝸牛等等工具)抓取網站的死鏈接,并且提交到百度站長平臺上面,但是搜索引擎的更新并不是很及時而且有時候即使收錄了也會放出來,舉個例子:網站雙收錄后,做了301跳轉也要1-3個月才能生效,所以在原網頁上修改是最好的選擇,這次分享就到這里,歡迎在評論區留言。

360好搜比百度好

  本文5年SEO實戰大牛干貨分享:算法解讀之動態索引對SEO的幫助由SEO講師團隊原創編輯,我們專注于SEO培訓,所以專業。


發表評論

欧美性交电影