簡單介紹一下計算機是怎么實現(xiàn)加法和乘法的

前言

這篇文章的主要內(nèi)容是，解讀 AlphaTensor 這篇論文的主要思想，如何通過強化學習來探索發(fā)現(xiàn)更高效的矩陣乘算法。

1、二進制加法和乘法

這一節(jié)簡單介紹一下計算機是怎么實現(xiàn)加法和乘法的。

以 2 + 5 和 2 * 5 為例。

我們知道數(shù)字在計算機中是以二進制形式表示的。

整數(shù)2的二進制表示為：0010

整數(shù)5的二進制表示為：0101

1.1、二進制加法

二進制加法很簡單，也就是兩個二進制數(shù)按位相加，如下圖所示：

當然具體到硬件實現(xiàn)其實是包含了異或運算和與運算，具體細節(jié)可以閱讀文末參考的資料。

1.2、二進制乘法

二進制乘法其實也是通過二進制加法來實現(xiàn)的，如下圖所示：

乘法在硬件上的實現(xiàn)本質(zhì)是移位相加。

對于二進制數(shù)來說乘數(shù)和被乘數(shù)的每一位非0即1。

所以相當于乘數(shù)中的每一位從低位到高位，分別和被乘數(shù)的每一位進行與運算并產(chǎn)生其相應(yīng)的局部乘積，再將這些局部乘積左移一位與上次的和相加。

從乘數(shù)的最低位開始：

若為1，則復(fù)制被乘數(shù)，并左移一位與上一次的和相加;

若為0，則直接將0左移一位與上一次的和相加；

如此循環(huán)至乘數(shù)的最高位。

從二進制乘法的實現(xiàn)也可以看出來，加法比乘法操作要快。

1.3、用加法替換乘法的簡單例子

上面這個公式相信大家都很熟悉了，式子兩邊是等價的

左邊包含了2次乘法和1次加法（減法也可以看成加法）

右邊則包含了1次乘法和2次加法

可以看到通過數(shù)學上的等價變換，增加了加法的次數(shù)同時減少了乘法的次數(shù)。

2、矩陣乘算法

對于兩個大小分別為 Q x R 和 R x P 的矩陣相乘，通用的實現(xiàn)就需要 Q * P * R 次乘法操作（輸出矩陣大小 Q x P，總共 Q * P 個元素，每個元素計算需要 R 次乘法操作）。

根據(jù)前面 1.2內(nèi)容可知，乘法比加法慢，所以如果能減少的乘法次數(shù)就能有效加速矩陣乘的運算。

2.1、通用矩陣乘算法

首先來看一下通用的矩陣乘算法:

如上圖所示，兩個大小為2x2矩陣做乘法，總共需要8次乘法和4次加法。

2.2、Strassen 矩陣乘算法

上圖所示即為 Strassen 矩陣乘算法，和通用矩陣乘算法不一樣的地方是，引入了7個中間變量 m，只有在計算這7個中間變量才會用到乘法。

簡單用 c1 驗證一下：

可以看到 Strassen 算法總共包含7次乘法和18次加法，通過數(shù)學上的等價變換減少了1次乘法同時增加了14次加法。

3、AlphaTensor 核心思想解讀

3.1、將矩陣乘表示為3維張量

首先來看下論文中的一張圖

圖中下方是3維張量，每個立方體表示3維張量一個坐標點。

其中張量每個位置的值只能是 0 或者 1，透明的立方體表示 0，紫色的立方體表示 1。

現(xiàn)在將圖簡化一下，以[a,b,c]這樣的維度順序，將張量以維度a平攤開，這樣更容易理解：

這個3維張量怎么理解呢？

比如對于 c1，我們知道 c1 的計算需要用到 a1,a2,b1,b3，對應(yīng)到3維張量就是：

而從上圖可知，對于兩個 2 x 2 的矩陣相乘，3維張量大小為 4 x 4 x 4。

一般的，對于兩個 n x n 的矩陣相乘，3維張量大小為 n^2 x n^2 x n^2。

更一般的，對于兩個 n x m 和 m x p 的矩陣相乘，3維張量大小為 n*m x m*p x n*p。

然后論文中為了簡化理解，都是以 n x n 矩陣乘來講解的，論文中以

表示 n x n 矩陣乘的3維張量，下文中為了方便寫作以 Tn 來表示。

3.2、3維張量分解

然后論文中提出了一個假設(shè)：

如果能將3維張量 Tn 分解為 R 個秩1的3維張量（R rank-one terms）的和的話，那么對于任意的 n x n 矩陣乘計算就只需要 R 次乘法。

如上圖公式所示，就是表示的這個分解，其中的

就表示的一個秩1的3維張量，是由 u^(r) 、 v^(r) 和 ?w^(r) 這3個一維向量做外積得到的。

這具體怎么什么理解呢？我們回去看一下 Strassen 矩陣乘算法：

上圖左邊就是 Strassen 矩陣乘算法的計算過程，右邊的 U，V 和 W 3個矩陣，各自分別對應(yīng)左邊 U -> a， V -> b 和 W -> m。

具體又怎么理解這三個矩陣呢？

我們在圖上加一些標注來解釋，其中 U ， V 和 W 矩陣每一列從左到右按順序，就對應(yīng)上文提到的，u^(r) 、 v^(r) 和 ?w^(r) 這3個一維向量。

然后矩陣 U 每一列和 [a1,a2,a3,a4] 做內(nèi)積，矩陣 V 每一列和 [b1,b2,b3,b4] 做內(nèi)積，然后內(nèi)積結(jié)果相乘就得到 [m1,m2,m3,m4,m5,m6,m7]了。

最后矩陣 W 每一行和 [m1,m2,m3,m4,m5,m6,m7] 做內(nèi)積就得到 [c1,c2,c3,c4]。

接著再看一下的 U，V 和 W 這三個矩陣第一列的外積結(jié)果

如下圖所示：

可以看到 U，V 和 W 三個矩陣每一列對應(yīng)的外積的結(jié)果就是一個3維張量，那么這些3維張量全部加起來就會得到 Tn 么？下面我們來驗證一下：

可以看到這些外積的結(jié)果全部加起來就恰好等于 Tn：
?

所以也就證實了開頭的假設(shè):

如果能將表示矩陣乘的3維張量 Tn 分解為 R 個秩1的3維張量（R rank-one terms）的和，那么對于任意的 n x n 矩陣乘計算就只需要 R 次乘法。

因此也就很自然的可以想到，如果能找到更優(yōu)的張量分解，也就是讓 R 更小的話，那么就相當于找到乘法次數(shù)更小的矩陣乘算法了。

通過強化學習探索更優(yōu)的3維張量分解

將探索3維張量分解過程變成游戲

論文中是采用了強化學習這個框架，來探索對3維張量Tn的更優(yōu)的分解。強化學習的環(huán)境是一個單玩家的游戲（a single-player game, TensorGame）。

首先定義這個游戲進行 t 步之后的狀態(tài)為 St：

然后初始狀態(tài) S0 就設(shè)置為要分解的3維張量 Tn：
?

對于游戲中的每一步t，玩家（就是本論文提出的 AlphaTensor）會根據(jù)當前的狀態(tài)選擇下一步的行動，也就是通過生成新的三個一維向量從而得到新的秩1張量：
?

接著更新狀態(tài) St減去這個秩1張量：

?

玩家的目標就是，讓最終狀態(tài) St=0同時盡量的減少游戲的步數(shù)。

當?shù)竭_最終狀態(tài) St=0 之后，也就找到了3維張量Tn的一個分解了：
?

還有些細節(jié)是，對于玩家每一步的選擇都是給一個 -1 的分數(shù)獎勵，其實也很容易理解，也就是玩的步數(shù)越多，獎勵越低，從而鼓勵玩家用更少的步數(shù)完成游戲。

而且對于一維向量的生成，也做了限制
?

就是生成這些一維向量的值，只限定在比如 [?2,??1,?0,?1,?2] 這5個離散值之內(nèi)。

AlphaTensor 簡要解讀

論文中是怎么說的，在游戲過程中玩家 AlphaTensor 是通過一個深度神經(jīng)網(wǎng)絡(luò)來指導蒙特卡洛樹搜索（MonteCarlo tree search）。關(guān)于這個蒙特卡洛樹搜索，我不是很了解這里就不做解讀了，有興趣的讀者可以閱讀文末參考資料。

首先看下深渡神經(jīng)網(wǎng)絡(luò)部分：
?

深度神經(jīng)網(wǎng)絡(luò)的輸入是當前的狀態(tài) St也就是需要分解的張量（上圖中的最右邊的粉紅色立方體）。輸出包含兩個部分，分別是 Policy head 和 Value head。

其中 Policy head 的輸出是對于當前狀態(tài)可以采取的潛在下一步行動，也就是一維向量(u(t),?v(t),?w(t)) 的候選分布，然后通過采樣得到下一步的行動。

然后 Value head 應(yīng)該是對于給定的當前的狀態(tài) St ，估計游戲完成之后的最終獎勵分數(shù)的分布。

接下來簡要解讀一下整個游戲的流程，還有深度神經(jīng)網(wǎng)絡(luò)是如何訓練的：

先看流程圖的上方 Ac ting 那個方框內(nèi)，表示的是用訓練好的網(wǎng)絡(luò)做推理玩游戲的過程。

可以看到最左邊綠色的立方體，也就是待分解的3維張量 Tn變換到粉紅色立方體，論文中提到是作了基的變換，但是這塊感覺如果不是去復(fù)現(xiàn)就不用了解的那么深入，而且我也沒去細看這塊就跳過吧。

然后從最初待分解的 Tn 開始，輸入到神經(jīng)網(wǎng)絡(luò)，通過蒙特卡洛樹搜索得到秩1張量，然后減去該張量之后，繼續(xù)將相減的結(jié)果輸入到網(wǎng)路中，繼續(xù)這個過程直到張量相減的結(jié)果為0。

將游戲過程記錄下來，就是流程圖最右邊的 Played game。

然后流程圖下方的 Learning 方框表示的就是訓練過程，訓練數(shù)據(jù)有兩個部分，一個是已經(jīng)玩過的游戲記錄 Played games buffer 還有就是通過人工生成的數(shù)據(jù)。

人工怎么生成訓練數(shù)據(jù)呢？

論文中提到，盡管張量分解是個 NP-hard 的問題，給定一個 Tn 要找其分解很難。但是我們可以反過來用秩1張量來構(gòu)造出一個待分解的張量嘛！簡單來說就是采樣R個秩1張量，然后加起來就能的到分解的張量了。

因為對于強化學習這塊我不是了解的并不深入，所以也就只能作粗淺的解讀。

實驗結(jié)果

最后看一下實驗結(jié)果

表格最左邊一列表示矩陣乘的規(guī)模，最右邊三列表示矩陣乘算法乘法次數(shù)。

第一列表示目前為止，數(shù)學家找到的最優(yōu)乘法次數(shù)。

第2和3列就是 AlphaTensor 找到的最優(yōu)乘法次數(shù)。

可以看到其中有5個規(guī)模，AlphaTensor 能找到更優(yōu)的乘法次數(shù)（標紅的部分）：

兩個 4 x 4 和 4 x 4 的矩陣乘，AlphaTensor 搜索出47次乘法；

兩個 5 x 5 和 5 x 5 的矩陣乘，AlphaTensor 搜索出96次乘法；

兩個 3 x 4 和 4 x 5 的矩陣乘，AlphaTensor 搜索出47次乘法；

兩個 4 x 4 和 4 x 5 的矩陣乘，AlphaTensor 搜索出63次乘法；

兩個 4 x 5 和 5 x 5 的矩陣乘，AlphaTensor 搜索出76次乘法；

審核編輯：劉清

閱讀全文

神經(jīng)網(wǎng)絡(luò)(97481) 神經(jīng)網(wǎng)絡(luò)(97481)
二進制(40970) 二進制(40970)
計算機(82752) 計算機(82752)

計算機題庫系統(tǒng)的設(shè)計與實現(xiàn)

【作者】：趙正道;【來源】：《黑龍江畜牧獸醫(yī)職業(yè)學院學報》2009年01期【摘要】：在全國高校計算機二級考試中,VF占有很大的分值,特別是表單的操作更是重中之重,學生掌握的效果不是很好,所以開發(fā)了一

2010-04-24 09:25:25

計算機組成與設(shè)計

計算機組成與設(shè)計 計算機組成與設(shè)計是計算機科學中最基礎(chǔ)的課程之一，它主要闡述了計算機的組成原理和設(shè)計方法。隨著計算機技術(shù)的快速發(fā)展，計算機組成與設(shè)計也日益成為了計算機科學的熱門課程。本文將介紹計算機

2023-08-17 12:37:31

323

fpga實現(xiàn)加法和減法運算的方法是什么

FPGA實現(xiàn)加法和減法運算非常簡單，實現(xiàn)乘法和除法可以用IP，那實現(xiàn)對數(shù)和指數(shù)運算該用什么呢？

2023-08-05 09:37:05

468

聊聊計算機的部分構(gòu)成

計算機，是最聰明的人做出的最偉大的發(fā)明之一。絕大多數(shù)人的能力，終身無法超越計算機了。類比一下 計算機的cpu,

2023-05-26 10:58:36

219

51單片機與計算機進行通信的實現(xiàn)方法

首先我們先來了解一下51單片機與計算機進行通信的實現(xiàn)方法。先來看一個實現(xiàn)這個功能的基本電路。

2023-05-24 14:50:00

781

計算機網(wǎng)絡(luò)硬件的組成

之前我們學習了計算機網(wǎng)絡(luò)的分類，本節(jié)課我們學習一下計算機網(wǎng)絡(luò)硬件都有哪些元素組成。首先我們來看一下計算機網(wǎng)絡(luò)的傳輸介質(zhì)，分為有線和無線兩種。有線傳輸介質(zhì)包括：

2023-05-18 16:21:55

760

本節(jié)課我們來學習計算機網(wǎng)絡(luò)及其分類，那我們是計算機網(wǎng)絡(luò)呢？我們先看一下計算機網(wǎng)絡(luò)的概念。計算機網(wǎng)絡(luò)是由地理位置分散的、具有獨立功能的多臺計算機，利用通信設(shè)備和傳輸介質(zhì)互相連接，并配以相應(yīng)的網(wǎng)絡(luò)協(xié)議和網(wǎng)絡(luò)軟件，以實現(xiàn)**數(shù)據(jù)通信和資源共享**的計算機系統(tǒng)。

2023-05-18 15:56:11

822

計算機通信的特點

計算機網(wǎng)絡(luò)通信的一個顯著特點是“間歇性、突發(fā)性”；網(wǎng)絡(luò)通信是通過網(wǎng)絡(luò)將各個孤立的設(shè)備進行連接，通過信息交換實現(xiàn)人與人，人與計算機，計算機與計算機之間的通信，網(wǎng)絡(luò)協(xié)議就是網(wǎng)絡(luò)之間溝通、交流的橋梁，只有相同網(wǎng)絡(luò)協(xié)議的計算機才能進行信息的溝通與交流。

2023-05-09 16:58:28

304

計算機通信的簡單概念

計算機通信指的是在兩個或多個計算機之間進行數(shù)據(jù)傳輸和信息交換的過程。計算機通信可以分為點對點通信和廣播通信兩種模式。在點對點通信模式下，數(shù)據(jù)從一個計算機直接傳輸?shù)搅?b style="color: red">一個計算機，非常適合于一對一的交流。

2023-05-09 16:48:14

524

淺析計算機系統(tǒng)的組成

近年來，隨著 PC（ Personal Computer，個人電腦）在家庭中的廣泛普及， 計算機對我們的生活產(chǎn)生了深遠的影響。如今，不僅是 PC，與我們生活息息相關(guān)的手機、平板等也廣泛應(yīng)用了計算機。通過此文來介紹一下計算機系統(tǒng)的構(gòu)成要素及其功能。

2023-05-09 15:57:52

393

計算機的基本是由什么組成？（下）

這是一個很常識性但非常重要的問題，`馮.諾依曼計算機`也叫`存儲程序 計算機`，其中“存儲程序”的概念是指 **將指令以二進制代碼的形式事先輸入計算機的主存儲器** ，然后按其在存儲器中的首地址執(zhí)行程序的第一條指令，以后就按該程序的規(guī)定順序執(zhí)行其他指令，直至程序執(zhí)行結(jié)束。

2023-02-01 15:11:26

405

計算機架構(gòu)及組成

? 計算機架構(gòu) (computer architecture) ：在計算機工程中，計算機體系結(jié)構(gòu)是描述計算機系統(tǒng)功能，組織和實現(xiàn)的一組規(guī)則和方法。它主要包括指令集、內(nèi)存管理、I/O 和總線結(jié)構(gòu)

2022-12-03 18:18:13

3642

計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用

本文將介紹計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用，對任何聽說過計算機視覺但不確定它是什么以及如何應(yīng)用的人，本文是了解計算機視覺這一復(fù)雜問題的便捷途徑。

2022-11-08 10:10:35

826

CPCI計算機

Compacc 是基于PICMG 標準的工業(yè)用嵌入式計算機總線標準。蘇州惠普聯(lián)電子有限公司的CompactPCI 產(chǎn)品群是基于CPCI標準的嵌入式計算機的產(chǎn)品系列，它的商業(yè)化應(yīng)用及發(fā)展取決于國際插件式計算機，設(shè)備及其他硬件軟件的廣泛應(yīng)用。

2022-04-22 09:47:55

計算機控制系統(tǒng)的三種分類方法

計算機控制系統(tǒng)就是利用計算機來實現(xiàn)工業(yè)過程自動控制的系統(tǒng)，被廣泛應(yīng)用于生產(chǎn)過程、機械裝置、交通工具、機器人、實驗裝置、儀器儀表等各個領(lǐng)域。接下來簡單介紹一下計算機控制系統(tǒng)的分類方法。

2022-01-27 15:19:07

11425

計算機的主要分類及特點

計算機是是現(xiàn)代一種用于高速計算的電子計算機器，能自動執(zhí)行的程序的機器工，計算機的組成原理分輸入、處理、輸出三步實現(xiàn)。接下來簡單介紹計算機的主要分類及主要特點。

2022-01-20 14:50:46

13927

計算機組成原理、數(shù)字邏輯之加法器詳解

加法器的實現(xiàn)在解釋這個半加法器之前，要明白計算機其實就是靠簡單電路集成起來的復(fù)雜電路而已，而構(gòu)成這些復(fù)雜電路最簡單的邏輯電路就是“與”、“或”、“非”。而在他們的基礎(chǔ)之上進行組合，...

2021-11-11 12:06:03

計算機的組成、用途及主要分類

計算機俗稱電腦，是用于高速計算的電子計算機器，在日常生活中有著非常廣泛的應(yīng)用。接下來給大家簡單介紹一下計算機的組成、用途及主要分類。

2021-10-02 16:22:00

8979

計算機為什么要使用補碼

，增加了計算的時間，能不能用加法器實現(xiàn)減法器的功能？這個實現(xiàn)的過程就用到了補碼。 計算機為什么使用補碼？采用補碼可以簡化計算機硬件電路設(shè)計的復(fù)雜度。對于有符號數(shù)，內(nèi)存要區(qū)分符號位和數(shù)值位，要是能把符號位和數(shù)值位

2021-09-12 16:06:43

5873

mips是指計算機的什么_mips計算公式

mips是指計算機的“運算速度”。計算機的運算速度通常是指每秒鐘所能執(zhí)行加法指令數(shù)目，常用百萬次/秒（Million Instructions Per Second，MIPS）來表示。

2021-05-26 15:57:54

40276

簡單闡述一下計算機視覺的幾大任務(wù)！

計算機視覺的幾大任務(wù) 3025748808_702 在周一, 04/01/2019 - 09:36 提交 計算機視覺的幾大任務(wù)：目標跟蹤、圖像和視頻的生成這里有一些比較常見的計算機視覺

2021-03-24 15:16:04

5805

計算機網(wǎng)絡(luò)的定義_計算機網(wǎng)絡(luò)的分類

計算機網(wǎng)絡(luò)的最簡單理解是：將一些相互連接的、以共享資源為目的的、獨立自治的計算機的集合。

2020-10-16 15:40:00

6576

如何使用FPGA總結(jié)設(shè)計CPU和計算機

為了讓更多的人能夠迅速掌握用FPGA自己設(shè)計CPU 和制作計算機的方法，推動我國計算機科學向深層次發(fā)展，本文特一般性介紹一下設(shè)計需要掌握的基本知識和設(shè)計制作計算機的一般過程。

2020-08-13 17:43:00

計算機視覺常用算法_計算機視覺有哪些分類

本文主要介紹了計算機視覺常用算法及計算機視覺的分類。

2020-07-30 17:34:53

12571

晶體管計算機的誕生及優(yōu)缺點

、學習帶來很多方便。今天，小編要為大家介紹一種特殊的計算機，叫做晶體管計算機，也就是第二代電子計算機。下面，小編就為大家詳細的介紹一下晶體管計算機的誕生，以及它的優(yōu)點和缺點。

2020-03-08 17:22:39

17043

大話計算機教程之狂想計算機PDF電子書免費下載

在游歷完整個計算機世界之后，我們站在計算機世界的外面，以創(chuàng)造者視角來重新審視一下這個世界的基本運行原理，深刻欣賞和體會計算機世界，或許會對理解現(xiàn)實世界有所幫助。

2019-12-03 16:44:41

118

如何實現(xiàn)一個四輸入乘法器的設(shè)計

乘法器（multiplier）是一種完成兩個互不相關(guān)的模擬信號相乘作用的電子器件。它可以將兩個二進制數(shù)相乘，它是由更基本的加法器組成的。乘法器可以通過使用一系列計算機算數(shù)技術(shù)來實現(xiàn)。

2019-11-28 07:06:00

2848

硬件乘法器是什么？

硬件乘法器是現(xiàn)代計算機中必不可少的一部分，其基礎(chǔ)是加法器結(jié)構(gòu)。

2018-05-11 10:52:45

8312

電子管計算機是第幾代_電子管計算機如何存儲數(shù)據(jù)

本文首先闡述了電子管計算機是屬于第一代計算機，其次介紹了電子管計算機基本參數(shù)以及存儲數(shù)據(jù)的方式，最后介紹了電子管計算機的作用。

2018-05-08 14:59:53

40758

量子計算機的優(yōu)點_量子計算機的應(yīng)用_量子計算機的未來應(yīng)用

量子計算機是一類遵循量子力學規(guī)律進行高速數(shù)學和邏輯運算、存儲及處理量子信息的物理裝置。當某個裝置處理和計算的是量子信息，運行的是量子算法時，它就是量子計算機。量子計算機的概念源于對可逆計算機的研究。研究可逆計算機的目的是為了解決計算機中的能耗問題。

2017-11-28 18:10:33

10955