0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖機(jī)器學(xué)習(xí)入門:基本概念介紹

穎脈Imgtec ? 2024-05-16 08:27 ? 次閱讀

機(jī)器學(xué)習(xí)(Graph Machine Learning,簡(jiǎn)稱Graph ML)是機(jī)器學(xué)習(xí)的一個(gè)分支,專注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中,數(shù)據(jù)以圖的形式表示,其中的節(jié)點(diǎn)(或頂點(diǎn))表示實(shí)體,邊(或鏈接)表示實(shí)體之間的關(guān)系。

本篇文章將從基礎(chǔ)開始介紹什么是圖,我們?nèi)绾蚊枋龊捅硎舅鼈?,以及它們的屬性是什么?/p>

圖論是在18世紀(jì)由歐拉引入的,用來(lái)解決著名的柯尼斯堡大橋問題:是否有可能只穿過(guò)七座橋中的每座橋一次。

0ed00a16-131b-11ef-9118-92fbcf53809c.jpg


什么是圖?如何定義它?

圖就是一組相互連接的對(duì)象。

一個(gè)圖有一組結(jié)點(diǎn)N和邊E, n是頂點(diǎn)的數(shù)目,m是邊的數(shù)目。連接的兩個(gè)節(jié)點(diǎn)被定義為相鄰(節(jié)點(diǎn)1相鄰或鄰接4)。當(dāng)我們稱網(wǎng)絡(luò)的大小N時(shí),通常指的是節(jié)點(diǎn)的數(shù)量(鏈路或邊的數(shù)量通常稱為L(zhǎng))。

0ee7971c-131b-11ef-9118-92fbcf53809c.jpg

有向與無(wú)向

圖可以是無(wú)向圖或有向圖:

無(wú)向圖:邊是無(wú)向的,關(guān)系是對(duì)稱的。畫邊的順序并不重要。

有向圖:邊是有向的(也稱為有向圖),頂點(diǎn)之間的邊可以有方向,可以用箭頭表示(也稱為弧線)。

0efdf430-131b-11ef-9118-92fbcf53809c.jpg

圖的基本性質(zhì)

對(duì)于一個(gè)節(jié)點(diǎn),我們可以將節(jié)點(diǎn)度(k)定義為與節(jié)點(diǎn)相鄰的邊,對(duì)于一個(gè)圖,我們可以計(jì)算無(wú)向圖的平均度k:

0f1fd7c6-131b-11ef-9118-92fbcf53809c.jpg

在有向網(wǎng)絡(luò)中,定義了一個(gè)節(jié)點(diǎn)的入度(指指向該節(jié)點(diǎn)的邊)和出度(指離開該節(jié)點(diǎn)的邊),節(jié)點(diǎn)的總度是兩者的和。我們稱source節(jié)點(diǎn)為沒有入度的節(jié)點(diǎn),稱sink節(jié)點(diǎn)為沒有出度的節(jié)點(diǎn)。

我們可以計(jì)算平均度為:

0f410e6e-131b-11ef-9118-92fbcf53809c.jpg

這里的

0f647e76-131b-11ef-9118-92fbcf53809c.jpg

0f79d1e0-131b-11ef-9118-92fbcf53809c.jpg

鄰接矩陣是表示圖的另一種方式,其中行和列表示圖節(jié)點(diǎn),交集表示一個(gè)節(jié)點(diǎn)的兩個(gè)節(jié)點(diǎn)之間是否存在鏈接。鄰接矩陣的大小是n x n(頂點(diǎn)數(shù))。如果Aij是節(jié)點(diǎn)i和j之間的鏈接,則Aij為1,否則為0,對(duì)于無(wú)向圖,矩陣是對(duì)稱的??梢钥吹皆诰仃嚨膶?duì)角線上沒有1意味著沒有自環(huán)(節(jié)點(diǎn)與自身相連)

0f920e72-131b-11ef-9118-92fbcf53809c.jpg

對(duì)于一個(gè)節(jié)點(diǎn) i 計(jì)算一個(gè)節(jié)點(diǎn)的邊(或它的度),沿著行或列求和:

0fa38030-131b-11ef-9118-92fbcf53809c.jpg

無(wú)向圖中的總邊數(shù)是每個(gè)節(jié)點(diǎn)的度之和(也可以是鄰接矩陣中的值之和):

0fbecc64-131b-11ef-9118-92fbcf53809c.jpg

因?yàn)樵跓o(wú)向圖中,你要計(jì)算兩次邊(由于鄰接矩陣是對(duì)稱的,要計(jì)算兩次相同的邊),所以除以2

對(duì)于有向圖,可以表示兩個(gè)不同的鄰接矩陣,一個(gè)表示入度,一個(gè)表示出度

0fda4eda-131b-11ef-9118-92fbcf53809c.jpg

對(duì)于一個(gè)節(jié)點(diǎn),總邊數(shù)是入度和出度之和:

0fefe196-131b-11ef-9118-92fbcf53809c.jpg

我們計(jì)算一個(gè)節(jié)點(diǎn)的入度和出度以及總邊數(shù):

100b13a8-131b-11ef-9118-92fbcf53809c.jpg

102c0810-131b-11ef-9118-92fbcf53809c.jpg

由于線性代數(shù)和圖論之間存在聯(lián)系,所以可以對(duì)鄰接矩陣應(yīng)用不同的操作。如果轉(zhuǎn)置一個(gè)無(wú)向圖的鄰接矩陣,圖是沒有改變的因?yàn)槭菍?duì)稱的,但如果轉(zhuǎn)置一個(gè)有向圖的鄰接矩陣,邊則進(jìn)行了方向的轉(zhuǎn)換。

104ab832-131b-11ef-9118-92fbcf53809c.jpg

這些矩陣非常是稀疏的,因?yàn)槔碚撋弦粋€(gè)節(jié)點(diǎn)是可以連接到所有其他節(jié)點(diǎn),但這在現(xiàn)實(shí)生活中基本上不會(huì)發(fā)生。當(dāng)所有節(jié)點(diǎn)都與其他節(jié)點(diǎn)相連時(shí),我們稱之為完全圖。完全圖通常用于理解圖論中的一些復(fù)雜問題(連通性例子等)。

106f84be-131b-11ef-9118-92fbcf53809c.jpg

圖的最大密度是一個(gè)完全圖中可能關(guān)系的總數(shù)。實(shí)際密度是測(cè)量無(wú)向非完全圖的密度:

10874fea-131b-11ef-9118-92fbcf53809c.jpg

理論上來(lái)說(shuō)在社交網(wǎng)絡(luò)中,每個(gè)人都可以連接到每個(gè)人,但這并沒有發(fā)生。所以最終得到一個(gè) 70 億行和 70 億列的鄰接矩陣,其中大多數(shù)條目為零(因?yàn)榉浅O∈?。為什么要說(shuō)這個(gè)呢?因?yàn)椴皇撬械?a target="_blank">算法都能很好地處理稀疏矩陣。

除了鄰接矩陣,我們還可以將圖表示為一個(gè)邊的列表:

10a056a2-131b-11ef-9118-92fbcf53809c.jpg

但是這種方法對(duì)于機(jī)器學(xué)習(xí)分析是有問題的,所以就出現(xiàn)了一種常用的方法:鄰接表,因?yàn)猷徑颖韺?duì)大型和稀疏的節(jié)點(diǎn)很有用,它允許快速檢索節(jié)點(diǎn)的鄰居。

10c77e62-131b-11ef-9118-92fbcf53809c.jpg

加權(quán)圖

圖邊還可以增加權(quán)值,邊并不都是相同的,比如在交通圖中,為了選擇兩個(gè)節(jié)點(diǎn)之間的最佳路徑,我們將考慮表示時(shí)間或交通的權(quán)重。

10deecc8-131b-11ef-9118-92fbcf53809c.jpg

自循環(huán)

圖的節(jié)點(diǎn)是可以連接到自己的,所以必須在計(jì)算總邊數(shù)時(shí)添加自循環(huán)

10f605ca-131b-11ef-9118-92fbcf53809c.jpg

1117e7c6-131b-11ef-9118-92fbcf53809c.jpg

你也可以有一個(gè)多圖,一個(gè)對(duì)節(jié)點(diǎn)有多條邊


多重圖

含有平行邊的圖稱為多重圖,或者說(shuō)一個(gè)對(duì)節(jié)點(diǎn)有多條邊

11369e14-131b-11ef-9118-92fbcf53809c.jpg

上面就是一些常見的圖和表示方式,我們來(lái)做一個(gè)匯總

1154a076-131b-11ef-9118-92fbcf53809c.jpg

圖的另一個(gè)重要參數(shù)是連接性(連通性)。每個(gè)節(jié)點(diǎn)都能被所有其他節(jié)點(diǎn)到達(dá)嗎?連通圖是指所有頂點(diǎn)都可以通過(guò)一條路徑連接起來(lái)的圖。不連通圖是指有兩個(gè)或多個(gè)連通分量的圖

11735642-131b-11ef-9118-92fbcf53809c.jpg

最大的隔離的節(jié)點(diǎn)子集被稱為“孤島”(island)。知道圖是連通的還是不連通的是很重要的,有些算法很難處理不連通的圖。

這可以在鄰接矩陣中顯示,其中不同的組件被寫成對(duì)角線塊(非零元素被限制在平方矩陣中)。我們稱連接兩個(gè)“孤島”的鏈接“橋”(bridge)

118dc4be-131b-11ef-9118-92fbcf53809c.jpg

如果圖很小,這種視覺檢查很容易,但對(duì)于一個(gè)大圖,檢查連通性是非常有挑戰(zhàn)的。


雙部圖

我們上面所看到的圖稱為單部圖,其中只有一種類型的節(jié)點(diǎn)和一種類型的關(guān)系

雙部圖是一種將節(jié)點(diǎn)劃分為兩個(gè)不相交集合(通常稱為 U 和 V)的圖。這些集合是獨(dú)立的,U 集合中的每個(gè)節(jié)點(diǎn)都與 V 集合中的某個(gè)節(jié)點(diǎn)相連(每個(gè)鏈接只能連接一個(gè)集合中的節(jié)點(diǎn)到另一個(gè)集合中的節(jié)點(diǎn))。因此,雙部圖是一種不存在 U-U 連接和 V-V 連接的圖。有許多這樣的例子:作者到論文(作者位于 U 集合,并且他們與他們撰寫的論文即 V 集合相連)、演員(U)和他們參演的電影(V)、用戶和產(chǎn)品、食譜和配料等。另一個(gè)例子是疾病網(wǎng)絡(luò),其中包括一組疾病和一組基因,只有包含已知會(huì)導(dǎo)致或影響該疾病的突變的基因才與該疾病相連。另一個(gè)例子是匹配,雙部圖可用于約會(huì)應(yīng)用程序。對(duì)于一個(gè)有兩組節(jié)點(diǎn)的雙部圖(U 有 m 個(gè)節(jié)點(diǎn),V 有 n 個(gè)節(jié)點(diǎn)),可能的邊的總數(shù)是 m*n,節(jié)點(diǎn)的總數(shù)是 m + n。

11b0bb4a-131b-11ef-9118-92fbcf53809c.jpg

雙部圖可以折疊成兩個(gè)單獨(dú)的網(wǎng)絡(luò),U 的投影和 V 的投影。在 U 的投影中,如果兩個(gè)節(jié)點(diǎn)連接到同一個(gè) V 節(jié)點(diǎn),則它們相連(V 投影的原理相同)。

11c20de6-131b-11ef-9118-92fbcf53809c.jpg

如果需要,我們也可以構(gòu)建一個(gè)三部圖??偟膩?lái)說(shuō),你可以擁有超過(guò)三種類型的節(jié)點(diǎn),通常我們講的是 k-部圖。這種類型的圖擴(kuò)展了我們對(duì)雙部圖的看法。


異構(gòu)圖

異構(gòu)圖(也稱異質(zhì)圖)是一種具有不同類型的節(jié)點(diǎn)和邊的圖。

11d831c0-131b-11ef-9118-92fbcf53809c.jpg


平面圖

如果一幅圖可以繪制成沒有任何邊相交的形式(對(duì)于圖來(lái)說(shuō),如果可以以這種方式繪制,它被稱為平面表示),則可以將其視為平面圖。即使繪制時(shí)邊相交,圖也可以是平面的??催@個(gè)例子,這幅圖可以重新繪制成平面表示。

1200e160-131b-11ef-9118-92fbcf53809c.jpg

為什么知道我們是否可以有平面表示很有用?最常用的一個(gè)例子是繪制電路版,要保證電路不會(huì)相交。

循環(huán)圖與非循環(huán)圖

線路 (walk) 是節(jié)點(diǎn)的交替序列(u-v 的線路是從 u 開始并在 v 結(jié)束的節(jié)點(diǎn)序列)。路徑(path)是序列中節(jié)點(diǎn)各不相同的線路(u-x-v 是一條路徑,但 u-x-u-x-v 是線路但不是路徑)。循環(huán)圖是路徑開始和結(jié)束于同一節(jié)點(diǎn)的圖,因?yàn)椴煌乃惴ǘ加醒h(huán)問題(所以有時(shí)需要通過(guò)切斷一些連接將循環(huán)圖轉(zhuǎn)換為非循環(huán)圖)。我們可以將前饋神經(jīng)網(wǎng)絡(luò)定義為有向無(wú)環(huán)圖(DAG),因?yàn)镈AG 總是有一個(gè)結(jié)束點(diǎn)(也稱為葉子節(jié)點(diǎn))。

1211fe8c-131b-11ef-9118-92fbcf53809c.jpg


總結(jié)

在本文中,我們介紹了什么是圖及其主要屬性,盡管圖看起來(lái)很簡(jiǎn)單,但可以實(shí)現(xiàn)無(wú)限的變化。圖是節(jié)點(diǎn)和邊的集合;它沒有順序,沒有開始也沒有結(jié)束。我們可以通過(guò)它們定義不同類型的概念和數(shù)據(jù)。圖還可以簡(jiǎn)潔地描述數(shù)據(jù)的許多屬性,并為我們提供關(guān)于不同主題之間關(guān)系的信息。例如,我們可以為節(jié)點(diǎn)和邊分配權(quán)重和屬性。在以后的文章中,我們將討論如何在這些網(wǎng)絡(luò)中使用算法(以及如何表示它們)。

作者:Salvatore Raieli

來(lái)源:DeepHub IMBA

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269107
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47279

    瀏覽量

    238510
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8418

    瀏覽量

    132646
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

    Learning,簡(jiǎn)稱ML)是人工智能的一個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測(cè)或決策。自然語(yǔ)言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)?b class='flag-5'>機(jī)器
    的頭像 發(fā)表于 12-05 15:21 ?483次閱讀

    Linux應(yīng)用編程的基本概念

    Linux應(yīng)用編程涉及到在Linux環(huán)境下開發(fā)和運(yùn)行應(yīng)用程序的一系列概念。以下是一些涵蓋Linux應(yīng)用編程的基本概念。
    的頭像 發(fā)表于 10-24 17:19 ?233次閱讀

    X電容和Y電容的基本概念

    在電子電路中,電容器是一種至關(guān)重要的元件,它用于儲(chǔ)存電荷并在電路中釋放能量。而在眾多的電容器中,X電容和Y電容作為安規(guī)電容,因其特定的應(yīng)用場(chǎng)景和安全性能而受到廣泛關(guān)注。本文將對(duì)X電容和Y電容的基本概念、工作原理、應(yīng)用場(chǎng)景以及選擇和維護(hù)等方面進(jìn)行詳細(xì)介紹。
    的頭像 發(fā)表于 10-21 16:43 ?2008次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    的交織中不斷成長(zhǎng)。 讀者對(duì)這本書的評(píng)價(jià)普遍很高。他們稱贊作者用通俗易懂的語(yǔ)言將復(fù)雜的概念解釋得透徹清晰,即使是初學(xué)者也能輕松入門。同時(shí),書中豐富的案例和詳細(xì)的步驟指導(dǎo)也讓讀者快速積累經(jīng)驗(yàn),提高實(shí)戰(zhàn)技能。甚至有讀者表示,這本書已經(jīng)成為時(shí)間序列分析、
    發(fā)表于 08-12 11:28

    AI入門之深度學(xué)習(xí)基本概念

    1、什么是深度學(xué)習(xí) 1.1、機(jī)器學(xué)習(xí) ?? ? 1:計(jì)算機(jī)有效工作的常用方法:程序員編寫規(guī)則(程序),計(jì)算機(jī)遵循這些規(guī)則將輸入數(shù)據(jù)轉(zhuǎn)換為適當(dāng)?shù)拇鸢?。這一方法被稱為符號(hào)主義人工智能,適
    的頭像 發(fā)表于 08-08 11:24 ?1946次閱讀
    AI<b class='flag-5'>入門</b>之深度<b class='flag-5'>學(xué)習(xí)</b>:<b class='flag-5'>基本概念</b>篇

    BP網(wǎng)絡(luò)的基本概念和訓(xùn)練原理

    )的多層前饋神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)自1985年提出以來(lái),因其強(qiáng)大的學(xué)習(xí)和適應(yīng)能力,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別等領(lǐng)域得到了廣泛應(yīng)用。以下將對(duì)BP網(wǎng)絡(luò)的基本概念、訓(xùn)練原理及其優(yōu)缺點(diǎn)進(jìn)行詳細(xì)
    的頭像 發(fā)表于 07-19 17:24 ?1626次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本概念、原理及特點(diǎn)

    基本概念、原理、特點(diǎn)以及在不同領(lǐng)域的應(yīng)用情況。 一、卷積神經(jīng)網(wǎng)絡(luò)的基本概念 卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)算法,它由多層卷積層和池化層堆疊而成。卷積層負(fù)責(zé)提取圖像中的局部特征,而池化層則負(fù)責(zé)降低特征的空間維度,同時(shí)增加對(duì)圖像位移的
    的頭像 發(fā)表于 07-11 14:38 ?1059次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理和特征工程的基本概念出發(fā),詳細(xì)探討這兩個(gè)步驟的具體內(nèi)容、方法及其在
    的頭像 發(fā)表于 07-09 15:57 ?420次閱讀

    遷移學(xué)習(xí)基本概念和實(shí)現(xiàn)方法

    遷移學(xué)習(xí)(Transfer Learning)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要概念,其核心思想是利用在一個(gè)任務(wù)或領(lǐng)域中學(xué)到的知識(shí)來(lái)加速或改進(jìn)另一個(gè)相關(guān)任務(wù)或領(lǐng)域的
    的頭像 發(fā)表于 07-04 17:30 ?1667次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)的基本概念

    循環(huán)神經(jīng)網(wǎng)絡(luò)的基本概念、循環(huán)機(jī)制、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元(GRU)等方面進(jìn)行介紹。 循環(huán)神經(jīng)網(wǎng)絡(luò)的基本概念 循環(huán)神經(jīng)網(wǎng)絡(luò)是一種時(shí)間序列模型,其基本思想是將序列數(shù)據(jù)中的每個(gè)元素(例如,單詞、時(shí)間點(diǎn)等)作為輸入,通
    的頭像 發(fā)表于 07-04 14:31 ?688次閱讀

    組合邏輯控制器的基本概念、實(shí)現(xiàn)原理及設(shè)計(jì)方法

    廣泛應(yīng)用于計(jì)算機(jī)、通信、控制等領(lǐng)域。 本文將詳細(xì)介紹組合邏輯控制器的基本概念、實(shí)現(xiàn)原理、設(shè)計(jì)方法、應(yīng)用場(chǎng)景等方面的內(nèi)容,以幫助讀者全面了解組合邏輯控制器。 基本概念 1.1 組合邏輯 組合邏輯(Combinatorial Log
    的頭像 發(fā)表于 06-30 10:26 ?2082次閱讀

    串口通信的基本概念

    串口通信(Serial Communications)的基本概念可以歸納為以下幾個(gè)方面:
    的頭像 發(fā)表于 06-12 09:28 ?650次閱讀
    串口通信的<b class='flag-5'>基本概念</b>

    斬波器的基本概念和工作原理

    各種電子設(shè)備對(duì)電源的需求。本文將詳細(xì)介紹斬波器的基本概念、工作原理及其應(yīng)用,以期為讀者提供全面的了解和認(rèn)識(shí)。
    的頭像 發(fā)表于 05-24 16:08 ?3147次閱讀

    萬(wàn)用表的基本概念及結(jié)構(gòu)組成

    在電子測(cè)試領(lǐng)域,萬(wàn)用表被譽(yù)為“全能戰(zhàn)士”。其強(qiáng)大的功能和廣泛的應(yīng)用使其成為電子工程師、維修人員和技術(shù)人員不可或缺的測(cè)量工具。本文將詳細(xì)介紹萬(wàn)用表的基本概念、結(jié)構(gòu)組成以及應(yīng)用,帶您領(lǐng)略萬(wàn)用表的獨(dú)特魅力。
    的頭像 發(fā)表于 05-10 15:05 ?1557次閱讀

    電源路徑的基本概念

    電源路徑是指電流從電源到負(fù)載的傳輸路徑。在電路中,電源是提供電能的設(shè)備,而負(fù)載則是消耗電能的設(shè)備。電源路徑的穩(wěn)定性和效率對(duì)電路的性能和可靠性有著重要的影響。本文將介紹電源路徑的基本概念。 下圖展示了
    的頭像 發(fā)表于 01-18 15:39 ?828次閱讀
    電源路徑的<b class='flag-5'>基本概念</b>