0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

啥是佩奇排名算法?通過動畫來理解進行計算的具體流程

電子工程師 ? 來源:lq ? 2019-01-28 09:44 ? 次閱讀

佩奇排名介紹

佩奇排名是根據(jù)頁面之間的鏈接結(jié)構計算頁面的值的一種算法。下面我們通過動畫來理解進行計算的具體流程。

假設一個正方形表示一個 WEB 頁面,一個箭頭表示一個頁面之間的鏈接。

此圖表明下面 3 頁包含指向上面 1 頁的鏈接

在佩奇排名算法中,網(wǎng)頁指向的鏈接越多,頁面被確定為越重要。

因此,在這里,確定首頁最重要。

確定首頁最重要

實際上,每個頁面的重要性都是通過計算來量化的。

基本的計算方法思想

1.未鏈接的頁面分數(shù)為 1

未鏈接的頁面分數(shù)為 1

2.有鏈接的頁面得分為正在鏈接的頁面的總得分

有鏈接的頁面得分為正在鏈接的頁面的總得分

3.當有多個網(wǎng)頁的鏈接時,鏈接分數(shù)均勻分布

鏈接分數(shù)均勻分布

4.來自高度鏈接網(wǎng)頁的鏈接具有很高的價值

該圖中心頁面有三個獨立頁面指向它的鏈接,所以它的分數(shù)是 3 。

首頁有一個很大的分數(shù),因為鏈接是從分數(shù)為 3 的頁面指向它的。

在動畫中的六個頁面中,判斷最上面的頁面是最重要的頁面----這是佩奇排名的基本思想。

基本的計算方法思想的循環(huán)問題

如果按照順序來計算每個頁面的分數(shù)時,那么就會出現(xiàn)問題:以這種方式計算,它將無限循環(huán),并且在循環(huán)中的頁面得分在任何地方都會很高。

循環(huán)的問題可以通過“隨機游走模型”的計算方法來解決。

隨機游走模型

以小豬佩奇瀏覽網(wǎng)頁為例。

小豬佩奇開始訪問「五分鐘學算法」中有趣的頁面,那么從這個左下角頁面開始。

它們跟隨一個鏈接并移動到另外的一個頁面,看了一些之后,發(fā)現(xiàn)不敢興趣了,這樣就停止了瀏覽。

然后,又一天,它在小吳的推薦下,在完全不同的頁面進行瀏覽,跟隨一個鏈接并移動到另外的一個頁面,一旦失去興趣就停止瀏覽。

像這樣,重復從某個頁面開始瀏覽,移動幾頁后便停止的操作,如果從互聯(lián)網(wǎng)空間一側(cè)進行觀察,就像網(wǎng)頁瀏覽的人:重復移動頁面幾次后傳送到一個完全不同的頁面。

量化隨機游走模型

假設1 - α代表選擇當前頁面中的一個鏈接的概率。

α代表該人將傳送到其他頁面的概率。

現(xiàn)在用隨機游走模型 處理上述的循環(huán)問題。

如果總頁面訪問次數(shù)達到1000次之后,使用百分比進行表示:那么這個值就表示“在某個時間點查看頁面的概率”。

更實用的計算方法

如圖所示,現(xiàn)在來嘗試計算復雜的鏈接網(wǎng)絡中每個頁面的分數(shù)。

現(xiàn)在均勻設置分數(shù),使總分加起來為 1 。而后根據(jù)網(wǎng)頁瀏覽者的移動,來計算每個頁面的概率。

移動 n次時出現(xiàn)在 A 中的概率表示未PAn,移動 n 次時出現(xiàn)在 B 中的概率表示未PBn。

舉一個例子,在移動 1 次之后求在 A 的概率PA 1。

在 C 選擇移動的概率是1-α。

其中,移動到 A 的一種場景是,C 中的佩奇選擇了移動而不是傳送。另外,這里選擇了 A 而不是 B 作為目的地。

并且,根據(jù)上面的當有多個網(wǎng)頁的鏈接時,鏈接分數(shù)均勻分布這條規(guī)則,從 A 或 B 選擇 A 的概率是 0.5 。

因此,從 C 移動到 A 的概率是PC0 ?? (1-α) ?? 0.5。

A 被選為傳送目標的概率是 0.25

A 被選為傳送目標的概率是 0.25 ,根據(jù)前面的理論:在 A、B、C、D 中小佩奇選擇傳送的概率為α。因此,通過傳送移動到 A 的概率為α ?? 0.25。 所以,移動一次后在 A 的概率為 PA1 = PC0 ?? ( 1 - α ) ?? 0.5 + α ?? 0.25

其中PC0 = 0.25,α = 0.15,代入計算后PA1 = 0.14375。

這樣,通過計算后 B 、 C 、D 頁的概率也更新了。

B 、 C 、D 頁的概率也更新了

上面在移動 1 次之后這四個頁面的概率更新情況,根據(jù)上述相同的方法計算 2 次后小佩奇瀏覽在每個頁面的概率。

移動 2 次后

同樣的,經(jīng)過大量的移動,在每個頁面上的概率逐漸趨于固定值。當數(shù)值固定是,計算也就完成了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Web
    Web
    +關注

    關注

    2

    文章

    1266

    瀏覽量

    69566
  • 算法
    +關注

    關注

    23

    文章

    4623

    瀏覽量

    93104
  • 計算方法
    +關注

    關注

    0

    文章

    16

    瀏覽量

    10257

原文標題:你知道“啥是佩奇”,卻不一定了解佩奇排名算法

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    算法加速的概念、意義、流程和應用

    運算通常需要高并行度或?qū)iT邏輯。算法加速就是把這些計算密集、規(guī)律性高的部分從通用 CPU 中“提取”出來,交給一個專門設計的硬件模塊完成。 類比:如果把 CPU 想象成一位“通才”工人,什么都能做但速度有限;那么
    的頭像 發(fā)表于 01-15 09:34 ?48次閱讀

    PCBA貼片代工全解析:一站式服務流程大揭秘

    了解PCBA貼片代工的流程不僅可以提升采購效率,還有助于確保最終產(chǎn)品的質(zhì)量。下面我們將詳細介紹PCBA貼片代工的具體流程,以便更好地理解其重要性和執(zhí)行方式。 PCBA貼片代工的
    的頭像 發(fā)表于 11-07 09:32 ?199次閱讀

    如何提高云計算的性能和效率

    的利用率。 使用最小化等待時間算法、最小化響應時間算法或最小化資源消耗算法分配資源。 負載均衡 : 通過分布
    的頭像 發(fā)表于 10-24 09:23 ?584次閱讀

    為什么FPGA屬于硬件,還需要搞算法?

    。 ? 在線課程,現(xiàn)在有很多免費的在線課程。 2. 實踐項目 ? 從簡單的邏輯電路開始,如加法器、計數(shù)器等,通過編寫代碼實現(xiàn)鞏固所學知識。 ? 參與開源項目或者在網(wǎng)上找一些實際的項目案例進行模仿
    發(fā)表于 09-09 16:54

    如何理解計算?

    據(jù)的安全性。 **高性能計算:**云計算平臺提供高性能的計算資源,用于處理復雜的科學和工程計算任務。用戶可以使用云平臺
    發(fā)表于 08-16 17:02

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術依賴于多種先進的AI
    的頭像 發(fā)表于 07-24 12:46 ?1002次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領域的核心任務之一,旨在使計算機能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機硬件的發(fā)展和深度學習技術的突破,圖像識別算法
    的頭像 發(fā)表于 07-16 11:12 ?689次閱讀

    【《計算》閱讀體驗】量子計算

    希爾伯特空間,希爾特空間是完備的內(nèi)積空間,是有限維歐幾里得空間的推廣。 多伊也是最早提出量子算法證明,相對于經(jīng)典算法,量子算法更快的人他
    發(fā)表于 07-13 22:15

    bp神經(jīng)網(wǎng)絡算法的基本流程包括哪些

    BP神經(jīng)網(wǎng)絡算法,即反向傳播神經(jīng)網(wǎng)絡算法,是一種常用的多層前饋神經(jīng)網(wǎng)絡訓練算法。它通過反向傳播誤差調(diào)整網(wǎng)絡的權重和偏置,從而實現(xiàn)對輸入數(shù)據(jù)
    的頭像 發(fā)表于 07-04 09:47 ?704次閱讀

    BP神經(jīng)網(wǎng)絡算法的基本流程包括

    BP神經(jīng)網(wǎng)絡算法,即反向傳播(Backpropagation)神經(jīng)網(wǎng)絡算法,是一種多層前饋神經(jīng)網(wǎng)絡,通過反向傳播誤差訓練網(wǎng)絡權重。BP神經(jīng)網(wǎng)絡算法
    的頭像 發(fā)表于 07-03 09:52 ?549次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習算法原理,包括線性回歸、邏輯回歸、支持向量機
    的頭像 發(fā)表于 07-02 11:25 ?1209次閱讀

    通過視頻幀提取及批量取模轉(zhuǎn)換實現(xiàn)基于STC32的點陣LED動畫播放

    通過視頻幀提取及批量取模轉(zhuǎn)換實現(xiàn)基于STC32的點陣LED動畫播放
    的頭像 發(fā)表于 06-27 02:16 ?406次閱讀
    <b class='flag-5'>通過</b>視頻幀提取及批量取模轉(zhuǎn)換實現(xiàn)基于STC32的點陣LED<b class='flag-5'>動畫</b>播放

    OpenHarmony實戰(zhàn)開發(fā)-如何實現(xiàn)組件動畫。

    ArkUI為組件提供了通用的屬性動畫和轉(zhuǎn)場動畫能力的同時,還為一些組件提供了默認的動畫效果。例如,List的滑動動效,Button的點擊動效,是組件自帶的默認動畫效果。在組件默認
    的頭像 發(fā)表于 04-28 15:49 ?652次閱讀
    OpenHarmony實戰(zhàn)開發(fā)-如何實現(xiàn)組件<b class='flag-5'>動畫</b>。

    插座TS15-W(15A) 4個 這型號怎么理解?現(xiàn)在的代替型號是?

    插座TS15-W(15A)4個這型號怎么理解?現(xiàn)在的代替型號是
    發(fā)表于 04-16 10:50

    看一下通過采用HPC方法解決汽車行業(yè)工程挑戰(zhàn)的兩個具體實例

    大家可能都知道,將Ansys解決方案與高性能計算(HPC)相結(jié)合,可帶來巨大的投資回報(ROI)。接下來,讓我們來看一下通過采用HPC方法解決汽車行業(yè)工程挑戰(zhàn)的兩個具體實例。
    的頭像 發(fā)表于 03-12 14:29 ?612次閱讀