百度搜索Spider3.0升級(jí)對(duì)站點(diǎn)有什么好處
近期百度搜索最大的動(dòng)作應(yīng)該就是百度Spider3.0升級(jí)了,簡(jiǎn)單的概括下升級(jí)的特點(diǎn)就是:抓取更實(shí)時(shí),收錄效率更快,對(duì)原創(chuàng)優(yōu)質(zhì)內(nèi)容更青睞。
此次升級(jí)是把當(dāng)前離線、全量計(jì)算為主的系統(tǒng),改造成實(shí)時(shí)、增量計(jì)算的全實(shí)時(shí)調(diào)度系統(tǒng),萬億規(guī)模的數(shù)據(jù)進(jìn)行實(shí)時(shí)讀寫,可以收錄90%的網(wǎng)頁,速度提升80%!
『抓取、建庫更快—提交的內(nèi)容更容易被抓取』
鏈接發(fā)現(xiàn)方面:如今sipder每天發(fā)現(xiàn)的新鏈接在500億左右的量級(jí),說明啥?你的站點(diǎn)內(nèi)容越來越容易被Spider發(fā)現(xiàn)和抓取,而在百度站長平臺(tái)提交鏈接是最為高效的,但是百度工程師建議站長,不要過度提交鏈接,尤其是低質(zhì)鏈接,這樣才能達(dá)到更好更及時(shí)的收錄效果。
鏈接抓取和建庫方面,開發(fā)了更強(qiáng)大的機(jī)器學(xué)習(xí)模型,來進(jìn)行鏈接的質(zhì)量預(yù)測(cè),對(duì)庫中所有的鏈接進(jìn)行全局排序,對(duì)有價(jià)值鏈接的召回率提高95%!索引展現(xiàn)時(shí)效性提升,原來是10天左右,現(xiàn)在提升40%~80%不等!我們都知道,搜索引擎從用戶搜索到最終搜索結(jié)果展現(xiàn)的步驟是:抓取、建庫、排序、展現(xiàn),抓取和建庫速度大幅提升意味著站點(diǎn)的內(nèi)容可以比原來更快的展現(xiàn)給最終搜索用戶。
『死鏈處理更及時(shí)—被黑低質(zhì)頁面全屏蔽』
在死鏈處理方面,Spider3.0啟用了全新的死鏈識(shí)別模型,能識(shí)別協(xié)議死鏈,以及大多數(shù)內(nèi)容死鏈、跳轉(zhuǎn)死鏈等低質(zhì)網(wǎng)頁,簡(jiǎn)單點(diǎn)說就是在之前的版本,站點(diǎn)通過站長平臺(tái)提交死鏈,處理速度可能非常慢,甚至快照在一段時(shí)間內(nèi)仍然存在,但是Spider3.0更新后,大約幾天內(nèi)就可以處理掉了。當(dāng)然,如果你要追求最佳處理效果,協(xié)議死鏈?zhǔn)亲詈玫倪x擇。
『時(shí)效性內(nèi)容更多—有內(nèi)容站點(diǎn)的更多機(jī)遇』
在對(duì)時(shí)效性頁面收錄方面,在之前的2.0搜索時(shí)代,很多中小站長寫出的高質(zhì)量文章,一旦被高權(quán)重的站點(diǎn)轉(zhuǎn)載, 那么幾乎自己的原創(chuàng)文章還不如大站轉(zhuǎn)載后來的流量多,而在3.0時(shí)代,這樣的情況將大有好轉(zhuǎn),配合使用百度的主動(dòng)提交等鏈接提交方式,文章發(fā)布后第一時(shí)間 提交給百度,那么一旦被收錄,哪怕其他的大站轉(zhuǎn)載了你的文章,你的文章在搜索結(jié)果中仍然排名更好。這樣,更多的高質(zhì)量內(nèi)容展示給搜索用戶,就是一個(gè)更加健康的互聯(lián)網(wǎng)生態(tài)。
關(guān)于時(shí)效性方面,我們現(xiàn)在其實(shí)可以自己搜索某個(gè)關(guān)鍵詞,在搜索結(jié)果中可以發(fā)現(xiàn),收錄時(shí)間越近的排名會(huì)越靠前,當(dāng)然主要集中在新聞?lì)惖奈恼?,這就是時(shí)效性,這就對(duì)站點(diǎn)的更新頻率提出了更高的要求,當(dāng)然排名不可能簡(jiǎn)單的跟發(fā)布時(shí)間有關(guān),還有很多維度,但是針對(duì)新聞?lì)惖奈恼拢S時(shí)跟進(jìn)新聞的進(jìn)度很重要。
在這我們不得不再提一下百度站長平臺(tái)鏈接提交中的主動(dòng)推送功能,要想時(shí)效性頁面更好的被百度收錄,主動(dòng)推送功能時(shí)效性內(nèi)容提交的是唯一的入口!
『鏈接提交更好用—站點(diǎn)提交鏈接會(huì)更易收錄』
主動(dòng)推送通過工具原理是什么呢?主動(dòng)推送工具獲取16個(gè)英文數(shù)字組合的字符串,制作數(shù)據(jù)推送接口,實(shí)現(xiàn)最快速度的數(shù)據(jù)推送。該功能自開放半年來參與提交站點(diǎn)近10W,日提交數(shù)據(jù)5000W,提交數(shù)據(jù)平均被抓取時(shí)間早于爬蟲發(fā)現(xiàn)時(shí)間4個(gè)小時(shí);提交數(shù)據(jù)當(dāng)天收錄量60%--100%,這說明,大多數(shù)站點(diǎn)使用此功能收效都是不錯(cuò)的。