北京網(wǎng)站建設(shè)
公司丁丁貓:PR是PageRank的縮寫。Google PR理論是所有基于鏈接的搜索引擎理論中最有名的。SEO人員可能不清楚本節(jié)介紹的其它鏈接理論,但不可能不知道PR。
PR是Google創(chuàng)始人之一拉里佩奇發(fā)明的,用于表示頁(yè)面重要性的概念。用最簡(jiǎn)單的話說(shuō)就是,反向鏈接蘧多的頁(yè)面就是越重要的頁(yè)面,因此PR值也就越高。
Google PR有點(diǎn)類似于科技文獻(xiàn)中互相引用的概念,被其它文獻(xiàn)引用較多的文獻(xiàn),很可能就是比較重要的文獻(xiàn)。
1.PR的概念和計(jì)算
我們可以把互聯(lián)網(wǎng)理解為由結(jié)點(diǎn)及鏈接組成的有向圖,頁(yè)面就是一個(gè)個(gè)結(jié)點(diǎn),頁(yè)面之間的有向鏈接傳遞著頁(yè)面的重要性。一個(gè)鏈接傳遞的PR值決定于導(dǎo)入鏈接所在頁(yè)面的PR值,發(fā)出鏈接的頁(yè)面本身的PR值,以及發(fā)出鏈接頁(yè)面上的導(dǎo)出鏈接數(shù)目。
PR值計(jì)算公式是:PR(A)=(1-d)+d(PR(t1)/C(t1)+...+PR(tn)/C(tn))
A代表頁(yè)面A。
PR(A)則代表頁(yè)面A的PR值。
d為阻尼指數(shù)。通常認(rèn)為d=0.85。
t1...tn代表鏈接向頁(yè)面A的頁(yè)面t1到tn。
C代表頁(yè)面上的導(dǎo)出鏈接數(shù)目。C(t1)即為頁(yè)面t1上的導(dǎo)出鏈接數(shù)目。
從概念及計(jì)算公式都可以看到,計(jì)算PR值必須使用迭代計(jì)算。頁(yè)面A的PR值取決于鏈接向A的頁(yè)面t1至tn頁(yè)面的PR值,而t1至tn頁(yè)面的PR值又取決于其它頁(yè)面的PR值,其中很可能還包含頁(yè)面A。所以PR需要多次迭代才能得到。計(jì)算時(shí)先給所有頁(yè)面設(shè)定一個(gè)初始值,經(jīng)過(guò)一定次數(shù)的迭代計(jì)算后,各個(gè)頁(yè)面的PR值將趨于穩(wěn)定。研究證明,無(wú)論初始值怎么選取,經(jīng)過(guò)迭代計(jì)算的最終PR值不會(huì)受到影響。
2.PR的兩個(gè)比喻模型
關(guān)于PR有兩個(gè)著名的比喻。一個(gè)比喻是投票。鏈接就像民主投票一樣,A頁(yè)面鏈接到B頁(yè)面,就意味著A頁(yè)面對(duì)B頁(yè)面投了票,使得B頁(yè)面的重要性提高。同時(shí),A頁(yè)面本身的PR值決定了A所能投出去的投票力,PR值越高的頁(yè)面,投出的票也更重要。在這個(gè)意義上,傳統(tǒng)基于關(guān)鍵詞匹配的算法是看頁(yè)面自己說(shuō)頁(yè)面內(nèi)容是什么,基于鏈接的PR則是看別人怎么評(píng)價(jià)一個(gè)頁(yè)面。
第二個(gè)比喻是隨機(jī)沖浪比喻。假設(shè)一個(gè)訪問(wèn)者從一個(gè)頁(yè)面開(kāi)始,不停地隨機(jī)點(diǎn)擊鏈接,訪問(wèn)下一個(gè)頁(yè)面,有時(shí)候這個(gè)用戶感到無(wú)聊了,不再點(diǎn)擊鏈接,就隨機(jī)跳到了另外一個(gè)網(wǎng)址,再次開(kāi)始不停地向下點(diǎn)擊。所謂PR值,也就是一個(gè)頁(yè)面在這種隨機(jī)沖浪訪問(wèn)中被訪問(wèn)到的概率。一個(gè)頁(yè)面導(dǎo)入鏈接越多,被訪問(wèn)到的概率越高,因此PR值也越高。
阻尼系數(shù)也與隨機(jī)沖浪有關(guān)。(1-d)=0.15實(shí)際上就是用戶感到無(wú)聊,停止點(diǎn)擊,隨機(jī)跳到新URL的概率。
3.工具條PR
真正的用于排名計(jì)算的Google PR值我們是無(wú)法知道的,我們所能看到的只是Google工具條PR值。需要清楚的是,工具條PR值并不是真實(shí)PR值的精確反映。真實(shí)PR值是一個(gè)準(zhǔn)確的、大于0.15、沒(méi)有上限的數(shù)字,工具條上顯示的PR值已經(jīng)簡(jiǎn)化為0-10這11個(gè)數(shù)字,是一個(gè)整數(shù),也就是說(shuō)PR值最小的近似為0,最大的近擬為10。實(shí)際上每一個(gè)工具條PR值代表的是很大一個(gè)范圍,工具條PR5代表的頁(yè)面真實(shí)PR值可能相關(guān)很多倍。
真正的PR值是不間斷計(jì)算更新中的,工具條PR只是某一個(gè)時(shí)間點(diǎn)上真實(shí)PR值的快照輸出。工具條PR幾個(gè)月才更新一次。
工具條PR與反向鏈接數(shù)目呈對(duì)數(shù)關(guān)系,而不是線性關(guān)系。也就是說(shuō)如果從PR1到PR2需要外部鏈接是100個(gè),從PR2到PR3則需要大致1000個(gè),PR5到PR6需要的外部鏈接則更多。所以PR值越高的網(wǎng)站想提升一級(jí)所要付出的時(shí)間和努力比PR值比較低的網(wǎng)站提升一級(jí)要多得多。
4.關(guān)于PR的幾個(gè)誤解
PR的英文全稱是PageRank。這個(gè)名稱來(lái)源于發(fā)明人佩奇(Page)的名字,巧合的是Page在英文中也是頁(yè)面的意思。所以準(zhǔn)確地說(shuō)PageRank這個(gè)名字應(yīng)該翻譯為佩奇級(jí)別,而不是頁(yè)面級(jí)別。不過(guò)約定俗成,再加上巧妙的一語(yǔ)雙關(guān),大家都把PR稱為頁(yè)面級(jí)別。
PR值只與鏈接有關(guān)。經(jīng)常有站長(zhǎng)詢問(wèn),他的網(wǎng)站做了挺長(zhǎng)時(shí)間,內(nèi)容也全是原創(chuàng)的,怎么PR還是零呢?其實(shí)PR與站長(zhǎng)是否認(rèn)真、做站多少時(shí)間、內(nèi)容是否原創(chuàng)都沒(méi)有直接關(guān)系,有反向鏈接就有PR,沒(méi)有反向鏈接就沒(méi)有PR。一個(gè)高質(zhì)量的原創(chuàng)網(wǎng)站,一般來(lái)說(shuō)自然會(huì)吸引到比較多的外部鏈接,所以會(huì)間接提高PR值,但這并不是必然的。
5.pr的意思義
Google工程師說(shuō)過(guò)很多次,Google PR現(xiàn)在已經(jīng)是一個(gè)被過(guò)度宣傳的概念,其實(shí)PR只是Google排名算法的200多個(gè)因素之一,而且重要性已經(jīng)下降很多,SEO人員完全不必太執(zhí)著于PR值的提高。
當(dāng)然,PR還是google排名算法中的重要因素之一。除了直接影響排名,PR的重要性還體現(xiàn)在下面幾點(diǎn)。
(1)網(wǎng)站收錄深度和總頁(yè)面數(shù)。搜索引擎蜘蛛爬行時(shí)間及數(shù)據(jù)庫(kù)的空間都是有限的。Google希望盡量?jī)?yōu)先收錄重要性高的頁(yè)面,所以PR值越高的網(wǎng)站就能被收錄更多頁(yè)面,蜘蛛爬行內(nèi)頁(yè)的嘗試也更高。對(duì)大中型網(wǎng)站來(lái)說(shuō),首頁(yè)P(yáng)R值是帶動(dòng)網(wǎng)站收錄的重要因素之一。
(2)更新頻率。PR值越高的網(wǎng)站,搜索引擎蜘蛛訪問(wèn)行就越頻繁,網(wǎng)站上出現(xiàn)新頁(yè)面或舊頁(yè)面上內(nèi)容更新時(shí),都能更快速地被收錄。由于網(wǎng)站新頁(yè)面通常都會(huì)在現(xiàn)有頁(yè)面上出現(xiàn)鏈接,因此更新頻率高也就意味著被發(fā)現(xiàn)的速度快。
(3)重復(fù)內(nèi)容判定。當(dāng)Google在不同網(wǎng)站上發(fā)現(xiàn)完全相同的內(nèi)容時(shí),會(huì)選出一個(gè)作為原創(chuàng),其它作為轉(zhuǎn)載或抄襲。用戶搜索相關(guān)關(guān)鍵詞時(shí),被判斷為原創(chuàng)的那個(gè)版本會(huì)排在前面。而判斷哪個(gè)版本為原創(chuàng)時(shí),PR值也是重要因素之一。這也就是為什么那些權(quán)重高、PR值高的大網(wǎng)站,轉(zhuǎn)載小網(wǎng)站內(nèi)容卻經(jīng)常被當(dāng)做原創(chuàng)的原因。
(4)排名初始子集的選擇。前面介紹排名過(guò)程時(shí)提到,搜索引擎日期選 出所有與關(guān)鍵詞匹配的文件后,不可能對(duì)所有文件進(jìn)行相關(guān)性計(jì)算,因?yàn)榉祷氐奈募赡苡袔装偃f(wàn)、幾千萬(wàn),搜索引擎需要從中挑選 出一個(gè)初始子集,再做相關(guān)性計(jì)算。初始子集的選擇顯然與關(guān)鍵詞相關(guān)度無(wú)關(guān),而只能從頁(yè)面的重要程度著手,PR值就是與關(guān)鍵詞無(wú)關(guān)的重要度指標(biāo)。
現(xiàn)在的PR算法與當(dāng)初拉里佩奇?zhèn)骼械拿枋鱿啾瓤隙ㄓ辛烁倪M(jìn)和變化。一個(gè)可以到的現(xiàn)象是,PR算法應(yīng)該已經(jīng)排除了一部分Google認(rèn)為可疑或者無(wú)效的鏈接,比如付費(fèi)鏈接、博客和論壇中的垃圾鏈接等。所以有時(shí)候我們會(huì)看到一個(gè)頁(yè)面有PR6甚至7的鏈接,應(yīng)該氫被鏈接的頁(yè)面帶到PR5或PR4,所以很可能Google已經(jīng)把一部分它認(rèn)為可疑的鏈接排除在PR計(jì)算之外。
PR專利發(fā)明人是拉里佩奇,專得所有人是斯坦福大學(xué),Google公司擁有永久性排他使用權(quán)。雖然PR是Google熱土有專利使用權(quán)的算法,但其它所有主流搜索引擎也都有類似算法,只不過(guò)不稱為PR而已。
轉(zhuǎn)發(fā)請(qǐng)注明:丁丁貓