北京網(wǎng)站設(shè)計(jì)
公司
丁丁貓:昨天,一個(gè)百度不正常的一天,很多的網(wǎng)站百度快照不更新了,還是保留在24日的快照。今天百度對(duì)有些網(wǎng)站的收錄發(fā)展了一些變化,有部分網(wǎng)站的收錄減少到只有幾頁(yè)。那么百度為何收錄頁(yè)面有放棄呢?是什么原因?qū)е轮挥械膯?wèn)題出現(xiàn)呢?
頁(yè)面收錄后消失的方式有兩種:第一種是收錄后第二天即從百度消失;第二種是收錄一段時(shí)間后從百度消失。
第一種情況比較好解釋?zhuān)@種情況往往出現(xiàn)在采集站,由于采集來(lái)的內(nèi)容相似性比較高,百度收錄后會(huì)對(duì)比比較后扔掉一些質(zhì)量較差的網(wǎng)站頁(yè)面,也就是權(quán)重較低的網(wǎng)站頁(yè)面。除此之外
服務(wù)器原因還有同
服務(wù)網(wǎng)站被K也會(huì)出現(xiàn)這樣的問(wèn)題。
第二種情況是今天要說(shuō)的重點(diǎn),站長(zhǎng)朋友在用站長(zhǎng)工具查詢自己網(wǎng)站的時(shí)候會(huì)經(jīng)常發(fā)現(xiàn)網(wǎng)站的百度收錄數(shù)量減少,但是網(wǎng)站每天都會(huì)收錄新的頁(yè)面為什么反而會(huì)減少呢,下邊來(lái)詳細(xì)講解這個(gè)情況的原因。
既然說(shuō)到百度收錄頁(yè)面變化我們就先說(shuō)說(shuō)百度收錄頁(yè)面的原理,百度收錄共有4步:爬行和抓取——索引——搜索詞處理——排序,經(jīng)過(guò)這四步后在我們搜索的時(shí)候搜索引擎將這些展現(xiàn)在我們面前。我們能夠控制的是爬行和抓取,做外鏈不但可以增加網(wǎng)站權(quán)重而且可以增加百度蜘蛛爬行次數(shù),次數(shù)越多自然抓取的幾率也就更高。之后是百度根據(jù)抓取的頁(yè)面里關(guān)鍵詞出現(xiàn)的位置、字體、顏色、加粗、斜體等相關(guān)信息做相應(yīng)記錄,然后是進(jìn)行分詞處理,最后是排序,對(duì)搜索詞處理后,搜索引擎程序便開(kāi)始工作,從索引數(shù)據(jù)庫(kù)中找出所有包含搜索詞的網(wǎng)頁(yè),并且根據(jù)排名算法計(jì)算出哪些網(wǎng)頁(yè)應(yīng)該排在前面,然后按照一定格式返回到“搜索”頁(yè)面。
百度收錄頁(yè)面也就是抓取網(wǎng)站的頁(yè)面,百度會(huì)根據(jù)自己的一套策略來(lái)分辨這個(gè)頁(yè)面對(duì)用戶是否有用,并且對(duì)其評(píng)分,每爬取一次會(huì)做一次評(píng)分,當(dāng)分?jǐn)?shù)達(dá)到要求了百度就會(huì)收錄,其中評(píng)分受網(wǎng)站權(quán)重的影響比較大,這也就是網(wǎng)站權(quán)重高的網(wǎng)站頁(yè)面比較容易收錄,就像A5站長(zhǎng)網(wǎng),你發(fā)文章之后幾分鐘就會(huì)被百度收錄,這就是網(wǎng)站賦予新頁(yè)面的權(quán)重讓其快速收錄。如果一個(gè)站權(quán)重不是很高,當(dāng)頁(yè)面鏈接出現(xiàn)在首頁(yè)的時(shí)候,傳遞給頁(yè)面的權(quán)重比較多,百度評(píng)分滿足收錄要求對(duì)其收錄了,由于網(wǎng)站不斷更新,等頁(yè)面離開(kāi)網(wǎng)站首頁(yè)后權(quán)重降低,評(píng)分無(wú)法滿足百度收錄要求,這樣收錄頁(yè)面就會(huì)從百度消失,由于網(wǎng)站權(quán)重是不斷提升的,頁(yè)面的權(quán)重也會(huì)得到提升,最后滿足收錄評(píng)分要求被重新收錄,這就是網(wǎng)站的百度收錄數(shù)量會(huì)出現(xiàn)S型波動(dòng)變化的原因。
轉(zhuǎn)發(fā)請(qǐng)注明:丁丁貓