RDMA高性能實(shí)踐之軟硬件融合設(shè)計(jì)思路

王璞博士，達(dá)坦科技（DatenLord）聯(lián)合創(chuàng)始人。王璞博士擁有多年云計(jì)算領(lǐng)域的經(jīng)驗(yàn)，擅長(zhǎng)分布式計(jì)算、海量數(shù)據(jù)處理、大規(guī)模機(jī)器學(xué)習(xí)。曾供職Google美國(guó)總部，負(fù)責(zé)Google廣告部門(mén)海量數(shù)據(jù)處理平臺(tái)開(kāi)發(fā)。2014年回國(guó)創(chuàng)業(yè)，創(chuàng)立數(shù)人云，專(zhuān)注容器技術(shù)在國(guó)內(nèi)的落地和推廣。2018年，數(shù)人云被收購(gòu)。2020年，創(chuàng)立達(dá)坦科技（DatenLord），致力打造新一代云原生存儲(chǔ)平臺(tái)，專(zhuān)注解決企業(yè)級(jí)客戶在跨云、跨數(shù)據(jù)中心方面的異構(gòu)存儲(chǔ)、數(shù)據(jù)統(tǒng)一訪問(wèn)需求。王璞擁有美國(guó)George Mason大學(xué)計(jì)算機(jī)博士學(xué)位，北大計(jì)算機(jī)專(zhuān)業(yè)碩士學(xué)位和北航力學(xué)專(zhuān)業(yè)學(xué)士學(xué)位。王璞發(fā)表數(shù)十篇論文，被引用累計(jì)上千次，并擁有多項(xiàng)云計(jì)算專(zhuān)利、軟著。王璞于2020年評(píng)選為騰訊云TVP。

?采用軟硬件融合的方式解決混合云場(chǎng)景下遠(yuǎn)程數(shù)據(jù)訪問(wèn)的性能問(wèn)題

?軟硬件分層思想以及軟硬件融合對(duì)系統(tǒng)設(shè)計(jì)帶來(lái)的挑戰(zhàn)

?引入計(jì)算模型概念，以及做軟硬件設(shè)計(jì)時(shí)需要考慮的點(diǎn)

?并行計(jì)算模型給軟硬件系統(tǒng)帶來(lái)性能的提升，介紹常見(jiàn)的并行計(jì)算模型

?介紹幾種常見(jiàn)的并行計(jì)算模型的硬件架構(gòu)

?軟硬件在并行場(chǎng)景下遇到的幾類(lèi)協(xié)作與沖突問(wèn)題以及解決方法

?基于 RDMA 的軟件系統(tǒng)設(shè)計(jì)思路，解決高性能存儲(chǔ)數(shù)據(jù)傳輸?shù)膯?wèn)題

很高興來(lái)跟大家分享一下我們最近的工作，那天國(guó)強(qiáng)跟我說(shuō)正好今天有兩個(gè) RDMA 相關(guān)的話題，那我就換一個(gè)角度講，不再講 RDMA 的很多細(xì)節(jié)了。因?yàn)榭赡芎芏嗯笥鸦蚨嗷蛏俣加行┝私?，我主要從另外一個(gè)角度，就是硬件融合的角度，這個(gè)也是現(xiàn)在比較熱門(mén)的一個(gè)話題，可能很多朋友有軟件背景或者有硬件背景，但是可能軟硬件都搞的人確實(shí)不多，對(duì)吧？講一些我們?cè)谲浻布?CoDesign 方面的一些思考。

01 Geo-distributed Storage System

我先簡(jiǎn)單介紹一下我們?yōu)槭裁匆丬浻布诤?。首先我?a target="_blank">公司是 DatenLord，我們做的是叫 Geo-distributed Storage System。怎么理解 Geo-distributed Storage System ？就是說(shuō)不同的節(jié)點(diǎn)，它是在不同的 Data Center，Data Center 之間有專(zhuān)線去連接（或者說(shuō)這個(gè)上面是公有云，下面是私有云，中間是專(zhuān)線的連接）。這樣的這種比如多 Data Center 或者所謂 multi cloud 這個(gè)場(chǎng)景，現(xiàn)在是很多企業(yè)客戶都在關(guān)注這個(gè)場(chǎng)景，所謂的多云，所謂混合云等等。

這些概念里邊一個(gè)很頭疼的問(wèn)題就是我的業(yè)務(wù)系統(tǒng)部署在不同的地方，跨 Data Center 最痛苦的就是上面的數(shù)據(jù)怎么辦？你的業(yè)務(wù)系統(tǒng)，比如現(xiàn)在都是打包成 Docker， WebFamily 或者 Serverless 這些形式去部署，部署是很靈活的，對(duì)吧？甚至現(xiàn)在像Serverless 將應(yīng)用部署在哪里提前都不知道的。但是部署之后你的應(yīng)用程序一定是會(huì)訪問(wèn)數(shù)據(jù)的，對(duì)吧？數(shù)據(jù)先天又不是那么靈活的。數(shù)據(jù)絕對(duì)不是我們想放哪就放哪，想從哪訪問(wèn)就從哪訪問(wèn)。所以現(xiàn)在數(shù)據(jù)的遠(yuǎn)程的可訪問(wèn)性，這就是對(duì)于這種多云或者混合云架構(gòu)帶來(lái)的最大的問(wèn)題，所以我們就想嘗試解決這個(gè)問(wèn)題。

就是你的業(yè)務(wù)系統(tǒng)部署在任何的地方都可以，當(dāng)然也不是任意的，肯定有所謂的親和性的部署，但是有一定的靈活性。比如你的業(yè)務(wù)可以部署在多個(gè) Data Center，部署在多個(gè)云上。下面的數(shù)據(jù)可以遠(yuǎn)程去訪問(wèn)，數(shù)據(jù)去搬遷這個(gè)事是吃力不討好的，那我們能不能讓數(shù)據(jù)的遠(yuǎn)程訪問(wèn)的性能大幅度提升。

所以就是為了解決遠(yuǎn)程數(shù)據(jù)訪問(wèn)的問(wèn)題，所以我們用軟硬件融合的方式來(lái)把它的性能大幅度提升。因?yàn)檫h(yuǎn)程數(shù)據(jù)訪問(wèn)單靠軟件是無(wú)法解決的，單靠硬件也沒(méi)辦法去搞。這是我們?yōu)槭裁匆捎密浻布诤系姆绞健?/p>

02 System Design Abstraction

接下來(lái)簡(jiǎn)單的列一下，我們從一個(gè)軟硬件系統(tǒng)的角度看我們?cè)O(shè)計(jì)的抽象層次。從上往下越來(lái)越細(xì)。上面系統(tǒng)整體的抽象層次，下面的算法層面，再往下行為級(jí)的層面（行為級(jí)這層面可能有些軟件同學(xué)可能不太理解，舉個(gè)例子，你的加減法操作，在軟件里面你不會(huì)再關(guān)心加減法操作怎么實(shí)現(xiàn)了），這三個(gè)層級(jí)軟件硬件都可以干（系統(tǒng)級(jí)、算法級(jí)和行為級(jí)）。再往下兩個(gè)層級(jí)、寄存器級(jí)和門(mén)級(jí)，當(dāng)然還往下還有晶體管級(jí)，這些層級(jí)只能硬件干了。

所以這是不同的抽象層級(jí)軟件融合，其實(shí)比較大家一直來(lái)講比較難的一個(gè)點(diǎn)就是抽象層級(jí)融合起來(lái)以后會(huì)被打破。以前我們做軟件的人不會(huì)考慮硬件這么多細(xì)節(jié)，基本上不太考慮寄存器這些東西了，但是到了硬件的跨度很大，很底層的東西我得考慮，很上層的整體系統(tǒng)我也得考慮。所以這就是軟件融合帶來(lái)的一個(gè)設(shè)計(jì)上的挑戰(zhàn)。怎么去沿著原來(lái)一致的思路？比如我做系統(tǒng)的時(shí)候，思路不能割裂（這個(gè)事一個(gè)思路，另外的事情又個(gè)思路，這是很痛苦的），我做這種大的工程的時(shí)候，希望我的思路是一致的。

03 Software Design

簡(jiǎn)單回顧一下軟件的題材，思路是比較容易理解的，我們先做架構(gòu)設(shè)計(jì)，做完架構(gòu)設(shè)計(jì)看看算法怎么回事，然后去實(shí)現(xiàn)，去測(cè)試。軟件的架構(gòu)和硬件都是不一樣的，軟件的架構(gòu)我們很多時(shí)候考慮好，比如單線程還是多線程，你是單點(diǎn)還是分布式等等。所以軟件里的一開(kāi)始先考慮架構(gòu)，我們基于現(xiàn)在架構(gòu)設(shè)計(jì)，大家去開(kāi)始實(shí)現(xiàn)，最后測(cè)試一下。

04 Hardware Design

硬件的設(shè)計(jì)的起點(diǎn)，就不一定再?gòu)募軜?gòu)開(kāi)始了，因?yàn)橛布容^ low level ，硬件的設(shè)計(jì)的起點(diǎn)是計(jì)算模型 Model of Computation ，計(jì)算模型之后才是架構(gòu)算法等等實(shí)現(xiàn)，然后是驗(yàn)證 Verification 。

05 Model of Computation

這個(gè)計(jì)算模型是什么？這最經(jīng)典的兩個(gè)計(jì)算模型：圖靈機(jī) 和 Lambda 演算對(duì)吧？我們今天 CPU 都是圖靈機(jī) 這種模型，所以為什么前面講我們做軟件的時(shí)候不會(huì)上來(lái)先考慮你計(jì)算模型？是因?yàn)槲覀冏鲕浖蠹夷J(rèn)底下是有 CPU 的嘛。所以 Model of Computation 對(duì)于軟件來(lái)講是定死的，但對(duì)于硬件我們可以采用不同的計(jì)算模型。

雖然圖靈機(jī) 我們用了很多，但是圖靈機(jī) 也帶來(lái)了很多的問(wèn)題，比如典型我們?yōu)槭裁匆鲕浖布?Coding ？因?yàn)榇蠹野l(fā)現(xiàn)軟件很多時(shí)候處理大量數(shù)據(jù)效率并不高，因?yàn)?圖靈機(jī) 它的抽象是指令加數(shù)據(jù)，所以圖靈機(jī) 很擅長(zhǎng)的是做控制，指令都是控制對(duì)吧，指令里面帶了一點(diǎn)點(diǎn)數(shù)據(jù)。但是你做大量數(shù)據(jù)的處理的時(shí)候，其實(shí)今天看來(lái)為什么大家用 GPU 加速？其實(shí) GPU 每一個(gè) Core 還是圖靈機(jī)，但是 GPU 一堆并行，所以想做大量數(shù)據(jù)處理的時(shí)候一定要并行，只有并行才能加速。但是圖靈機(jī) 它是個(gè)串行模型，所以軟件本質(zhì)上是串行的模型。當(dāng)然今天還有多核，但多核的利用效率并不高，在并行的程度上。

所以這兩種計(jì)算模型，一個(gè)是基于是經(jīng)典的圖靈機(jī)，我們的軟件編程主要是面向過(guò)程，從 C 開(kāi)始面向過(guò)程。另一個(gè) Lambda 演算，它后來(lái)衍生出來(lái)的就是函數(shù)式編程。函數(shù)式編程今天大家用的時(shí)候，起源就是 Lambda 開(kāi)頭的。所以大家看軟件的發(fā)展也是。從單點(diǎn)到覺(jué)得單點(diǎn)計(jì)算能力有限，縱向擴(kuò)展 scale up 的空間是很有限的，開(kāi)始做橫向擴(kuò)展 scale out，軟件不叫并行，我們叫分布式。軟件分布式的時(shí)候不好搞，這個(gè)時(shí)候借鑒了很多函數(shù)式編程。今天我們寫(xiě)很多高級(jí)語(yǔ)言的時(shí)候，比如像 RUST 之類(lèi)的這些語(yǔ)言的時(shí)候，里面大量的采用了函數(shù)式編程的一些特性。為什么？因?yàn)檫@是底層的 Model of Computation 帶來(lái)的不一樣， Lambda Calculus 它就沒(méi)有什么指令和數(shù)據(jù)，它靠的是縮減遞歸這些東西，所以他的演算的邏輯和圖靈機(jī)是本質(zhì)上的不一樣。

這個(gè)是我們一直在探索的，解決不同的問(wèn)題需要用不同的 Model of Computation ，這是一個(gè)很大的挑戰(zhàn)。今天基本上幾乎所有的軟件都是基于圖靈機(jī) 模型，當(dāng)然有這么多年積累，肯定是有很多好處，但是缺點(diǎn)也很明顯，處理大量的數(shù)據(jù)，處理海量數(shù)據(jù)，性能跟不上了。提升性能？從軟件的角度對(duì)吧，借鑒一些函數(shù)式編程做分布式并行，這是一個(gè)維度。但是這還不夠，這還是在偏軟件層面。下一步我們想更深入地去壓榨性能，讓硬件先天并行的。

06 Software v.s. Hardware

簡(jiǎn)單地回顧一下，軟件的時(shí)候基本上是 Model of Computation ，我們很難去改變，即便今天用這種并行編程，但它底層還是跑到 CPU 上的，CPU 的計(jì)算模型是圖靈機(jī) 模型。

當(dāng)然早期（大概上個(gè)世紀(jì)七八十年代）也有人研究基于類(lèi)似 Lambda Calculus 那種所謂數(shù)據(jù)流的方式做 Data Flow 模型，也是一個(gè)當(dāng)年很熱的研究，但是后來(lái)輸給了圖形機(jī)，還是圖形機(jī) 變成了 CPU 最主流的架構(gòu)。所以硬件我們?cè)诘臅r(shí)候，根本問(wèn)題就得考慮好。軟件我們沒(méi)有人再去考慮，圖靈機(jī)模型就是一個(gè)前提假設(shè)，但硬件我可以突破圖靈機(jī)模型。

當(dāng)然今天有很多硬件，比如 Google 做 TPU( TensorProcessing Units) 的時(shí)候用的也還是圖靈機(jī)馮諾伊曼這套模型。但是它不一樣， Google 做 TPU 的時(shí)候，它的指令很少，四五條指令，指令的力度是非常非常粗的。不像 CPU x86 幾千條指令， RISC-V 都得上百條指令(這肯定有的)。

所以在硬件我們?cè)賮?lái)設(shè)計(jì)的時(shí)候，我們就必須根據(jù)你要做的計(jì)算任務(wù)，從 Model of Computation 出發(fā)，才有后面的東西。如果沒(méi)想清楚，后面在硬件上面，你做架構(gòu)，做算法，做實(shí)現(xiàn)，后面無(wú)從談起。

07 Model of Computation for Parallel

前面跟大家講了 Model of Computation 計(jì)算模型的概念。剛才講硬件先天并行，今天雖然有多核，但是軟件來(lái)源于圖靈機(jī)，它是個(gè)串行模型。我們今天所謂做性能加速，其實(shí)本質(zhì)上就是把以前串行的事該變成并行的，這樣速度就能快了。

剛才講了，硬件我們?cè)O(shè)計(jì)的時(shí)候，第一步就要考慮計(jì)算模型是什么？計(jì)算模型這個(gè)東西，其實(shí)計(jì)算機(jī)系統(tǒng)過(guò)去幾十年的研究已經(jīng)研究得很透徹了。在這舉了兩相對(duì)常見(jiàn)的，對(duì)于并行場(chǎng)景來(lái)講，我可以采用什么計(jì)算模型？這就不是圖靈機(jī)，也不是 Lambda Calculus。

第一個(gè)模型叫做 Kahn Process，名字大家不一定那么熟悉，但是其實(shí)它的理念很簡(jiǎn)單。每個(gè)節(jié)點(diǎn)是我的功能模塊，一個(gè)是生產(chǎn)者，另一個(gè)是它的消費(fèi)者。生產(chǎn)者生產(chǎn)出來(lái)這些數(shù)據(jù)或者消息傳給消費(fèi)者，消費(fèi)者可能又是別人的生產(chǎn)者。所以其實(shí)就是生產(chǎn)者消費(fèi)者問(wèn)題，只不過(guò)這些生產(chǎn)者消費(fèi)者之間的邏輯關(guān)系是一個(gè)網(wǎng)狀的，最后形成的 DAG 有向無(wú)關(guān)圖。還有很重要一點(diǎn)，這些消息中間都有個(gè)隊(duì)列給你緩沖一下。它假設(shè)是這些隊(duì)列是無(wú)限長(zhǎng)的（這是一個(gè)數(shù)學(xué)上的一個(gè)很大的假設(shè)）。所以。生產(chǎn)者來(lái)生產(chǎn)數(shù)據(jù)的時(shí)候，你隊(duì)列是無(wú)限長(zhǎng)的，所以寫(xiě)操作是無(wú)阻塞的。消費(fèi)者在讀取數(shù)據(jù)的時(shí)候，接收消息的時(shí)候是有可能阻塞的，因?yàn)槟氵@個(gè)隊(duì)列有可能是空。它就是個(gè)并行的模型。

第二個(gè)模型叫做 Petri Net，可能有的朋友聽(tīng)說(shuō)過(guò)，這也是很常見(jiàn)的一個(gè)并行模型。它也是生產(chǎn)者和消費(fèi)者模型，只不過(guò)它的建模方式和上面不一樣，它中間沒(méi)有所謂的緩沖隊(duì)列了，通過(guò) transition 的關(guān)系來(lái)建模。圓圈代表不同的功能模塊（代表生產(chǎn)者），黑點(diǎn)代表生產(chǎn)資料。比如生產(chǎn)者（P1）黑點(diǎn)經(jīng)過(guò) transition 或者一個(gè)動(dòng)作，它可以生產(chǎn)出兩個(gè)數(shù)據(jù)分別給到兩個(gè)消費(fèi)者（ P2 P3），這兩個(gè)數(shù)據(jù)是相同的數(shù)據(jù)，這兩個(gè)消費(fèi)者（ P2 P3）他拿分別拿到不同數(shù)據(jù)，他就可以變成生產(chǎn)者（ P2 P3）。這兩個(gè)生產(chǎn)者都得生產(chǎn)出來(lái)數(shù)據(jù)才能給到后面的消費(fèi)者（T2）。

并行模型中每一個(gè)功能模塊可以同時(shí)工作，只不過(guò)有的時(shí)候你上游數(shù)據(jù)不 ready，你這時(shí)候沒(méi)有數(shù)據(jù)讓你去處理。這種模型在于硬件建模是非常方便的，因?yàn)橛布忍炀褪遣⑿械?。但是又不是那種 free parallel，并行工作時(shí)候你要定期去 sync ，比如模塊都是生產(chǎn)者也同時(shí)都是消費(fèi)者，你什么時(shí)候有數(shù)據(jù)可以消費(fèi)，你什么什么時(shí)候生產(chǎn)數(shù)據(jù)，你下游不 ready，你生產(chǎn)出來(lái)數(shù)據(jù)會(huì)不會(huì)丟掉等等各種各樣配合的問(wèn)題。

這就是計(jì)算模型就把這些問(wèn)題給你抽象出來(lái)，大家并行的時(shí)候提升性能，但是并行不是代表大家各自去自由地去跑，一定要有中間的協(xié)同，這些就是 Model of Computation 帶來(lái)的。所以這就是我們做軟件融合系統(tǒng)的時(shí)候，一定第一步把這個(gè)問(wèn)題要想清楚，你到底解決這個(gè)問(wèn)題，它是用什么樣的一個(gè)計(jì)算模型來(lái)跟他進(jìn)行抽象。這些想明白的時(shí)候，剩下的東西就變得相對(duì)簡(jiǎn)單一些。

08 Architecture in Hardware

剛才講的是并行的計(jì)算模型，接下來(lái)對(duì)硬件的階段來(lái)講，計(jì)算模型定好之后，接下來(lái)定下硬件的架構(gòu)。常見(jiàn)的硬件架構(gòu)，我這列了幾個(gè)

?有限狀態(tài)自動(dòng)機(jī)（FSM），這是很常用的一個(gè)硬件模式，但狀態(tài)機(jī)它的一個(gè)缺點(diǎn)是什么？狀態(tài)機(jī)本質(zhì)它是個(gè)串行模型（現(xiàn)在是第一個(gè)狀態(tài)，什么時(shí)候到第二個(gè)狀態(tài)，什么時(shí)候第三個(gè)狀態(tài)）。

?流水線（Pipeline），是個(gè)很經(jīng)典的硬件的一個(gè)并行東西，只不過(guò)流水線的不同階段處理不同的數(shù)據(jù)，但它們是在一起來(lái)工作的。

?Replica，你的模塊想并行工作，怎么辦？在硬件上我也可以搞多份。比如我的加法器和乘法器，1 個(gè)不夠用，來(lái) 10 個(gè)，100 個(gè)。

?脈動(dòng)陣列（Systolic Array），是現(xiàn)在神經(jīng)網(wǎng)絡(luò)里面用的很多。它是一個(gè)陣列的方式，數(shù)據(jù)在上面不停地流動(dòng)每一個(gè)方框，這是一個(gè)處理節(jié)點(diǎn)。

所以大家看硬件設(shè)計(jì)的時(shí)候，對(duì)和軟件就很不一樣，這是常見(jiàn)的硬件的架構(gòu)圖，我們軟件不會(huì)畫(huà)這種架構(gòu)圖，因?yàn)橛布詈竽惴诺焦杵?，在硅片上?huà)的東西它是個(gè)二維結(jié)構(gòu)

09?Single-core Issue

硬件并行帶來(lái)了很大的問(wèn)題，并行模塊之前的協(xié)同是 Model of Computation 解決的問(wèn)題。

還有一個(gè)重要的問(wèn)題就是硬件并行工作，一定會(huì)導(dǎo)致沖突。例如兩個(gè)不同模塊，你去競(jìng)爭(zhēng)的寫(xiě)同一個(gè)地方，或者一個(gè)讀一個(gè)寫(xiě)，你希望先看到讀的結(jié)果還是先看到寫(xiě)的結(jié)果等等。所以沖突管理這是并行的時(shí)候一定要解決的。

?Control 沖突，比如你指令的跳轉(zhuǎn)帶來(lái)的沖突問(wèn)題，這因?yàn)橹噶钍橇魉€，同時(shí)有多條指令在執(zhí)行，你多條指令同時(shí)執(zhí)行，帶來(lái)的沖突。

?Data 沖突，先讀后寫(xiě)還是先寫(xiě)后讀。

?Resource 沖突，CPU 里邊加法器，乘法器和 Cache 是有限的。那對(duì)于資源的競(jìng)爭(zhēng)沖突訪問(wèn)，這也是沖突。

10 Multi-core Issue

多核帶來(lái)的問(wèn)題可能對(duì)于軟件的同學(xué)感受比較深一些。比如多核帶來(lái)了一個(gè)很頭疼的問(wèn)題，就是內(nèi)存一致性的問(wèn)題。多個(gè)核的競(jìng)爭(zhēng)的往內(nèi)存里讀寫(xiě)，這個(gè)時(shí)候你內(nèi)存的數(shù)據(jù)怎么才能稱之為是一致的？定義了幾種 Memory Order 的一致性的級(jí)別。

?順序內(nèi)存一致性 Sequential Consistency ，假設(shè)大家雖然是并行目的，但是順序地來(lái)讀寫(xiě)內(nèi)存顯然不會(huì)出錯(cuò)，但是顯然 sequential 太強(qiáng)的要求了，你想要性能的時(shí)候 sequence 為了保證正確性，得是串行的來(lái)。這跟我們對(duì)性能的要求是沖突的。

?Total Store Order 就是 X86 的默認(rèn)的 Order，先 store 后 load，可以亂序。

?Multi-copy Atomic 就是 RISC-V 的默認(rèn)Order。你個(gè)核先寫(xiě)的東西自己可以看見(jiàn)，如果別的核看見(jiàn)，都得能看見(jiàn)。

在借鑒 CPU 體系結(jié)構(gòu)過(guò)往的一些工程經(jīng)驗(yàn)里邊，已經(jīng)有很多實(shí)踐去來(lái)解決并行工作帶來(lái)的數(shù)據(jù)沖突的問(wèn)題。這塊是個(gè)很麻煩的問(wèn)題，我們做軟硬件設(shè)計(jì)的時(shí)候，這些問(wèn)題你都會(huì)碰到，因?yàn)槟阕鰯?shù)據(jù)處理，一旦并行的時(shí)候，這些問(wèn)題自然而就來(lái)了。而且我們做計(jì)算的時(shí)候很少碰到那種場(chǎng)景是純并行，完全不用考慮互相的協(xié)作，是很少很少的場(chǎng)景。

11 Parallel vs Distributed

不管是并行也好，還是分布式也好，是沖突的問(wèn)題，我們?nèi)ピ趺慈ソ鉀Q它。其實(shí)從軟件和硬件角度我們都有大量的工作。

?比如分布式一致性算法，像 Python 算法常用的 Raft 協(xié)議等等，它們也是在解決沖突的，只不過(guò)是在一個(gè)時(shí)間維度很大的的維度上（比如毫秒級(jí)，網(wǎng)絡(luò)傳輸都基本上都是毫秒）。

?到了內(nèi)存一致性問(wèn)題的時(shí)候，這個(gè)時(shí)候就到了一臺(tái)服務(wù)器了，這時(shí)候它的時(shí)間維度大概是微秒或者亞微秒，大幾十納秒等等。

?到了 CPU 里頭，這就是變成 Cache一致性問(wèn)題，考慮就是納秒級(jí)的問(wèn)題了。

所以其實(shí)我們?cè)谧鲆粋€(gè)復(fù)雜的系統(tǒng)（計(jì)算機(jī)系統(tǒng)或者數(shù)字系統(tǒng)）的時(shí)候，為了解決性能問(wèn)題，大量的用并行或者用分布式來(lái)做加速做肯定快。但是并行或者分布式加速帶來(lái)的問(wèn)題就是沖突。其實(shí)協(xié)作還是小問(wèn)題，沖突是最大的問(wèn)題。沖突怎么做？其實(shí)有很多現(xiàn)有的方案，只不過(guò)這些方案不一定是大家每個(gè)人都天天在研究的東西。但是當(dāng)我們下沉到軟硬件協(xié)同設(shè)計(jì)的時(shí)候，這些問(wèn)題就通通都暴露出來(lái)了，為什么會(huì)暴露出來(lái)？我們平時(shí)寫(xiě)軟件，我們我有一定的抽象，但是當(dāng)我軟硬件聯(lián)合迭代的時(shí)候，這些抽象就打破了，所以你只能從根上你把這個(gè)問(wèn)題想明白。

12 Conflict Resolution in Hardware

怎么解決沖突這個(gè)問(wèn)題？其實(shí)都有很多開(kāi)源的庫(kù)去解決它，每個(gè)語(yǔ)言里邊都有。硬件里面的沖突管理怎么做的？其實(shí) CPU 的體系結(jié)構(gòu)的研究里面講了不少，比如一個(gè)核里的流水線，各種 hazard 這些。

但是推而廣之，如果一個(gè)硬件系統(tǒng)，特指數(shù)字硬件 IC 這種系統(tǒng)，如果我們?cè)斓牟皇?CPU，今天做軟件融合的時(shí)候，大概率底下硬件系統(tǒng)不一定是個(gè) CPU，這個(gè)時(shí)候怎么解決這些沖突？其實(shí)借鑒的方法跟軟件的思路是一致的，本質(zhì)都是個(gè)都是并行工作帶來(lái)的沖突。所以解決問(wèn)題的思路是一致的，只不過(guò)具體的方法不一樣。

?彈性 Elastic ，軟件是很靈活很彈性的，但硬件沒(méi)那么彈性。硬件我在設(shè)計(jì)的時(shí)候，協(xié)議層面讓大家互相的消息傳遞要變成彈性，對(duì)這個(gè)消息的 delay，要對(duì) delay 變得不敏感（不要假設(shè)過(guò)多長(zhǎng)時(shí)間，我把消息發(fā)給你），這些消息的 delay 你是不可控的，什么時(shí)候消息傳遞成功等等。

?保證原子性 Atomic。比如大家我們做分布式系統(tǒng)的時(shí)候，基本上都有一個(gè)分布式一致性的，一個(gè)節(jié)點(diǎn)或者一個(gè)服務(wù)保證原子性。硬件也一樣，各種沖突我也得保證原子性，其實(shí)本質(zhì)上就是個(gè) transaction 的概念。怎么保證？就需要你底干上有一些東西，所以原子性是不好做的。比如軟件里面大家用所謂各種無(wú)鎖操作，其實(shí)本質(zhì)上就是用 CPU 直接提供原子操作。

?調(diào)度 Scheduling ，本質(zhì)通過(guò)優(yōu)先級(jí)來(lái)解決沖突問(wèn)題（沖突是不可避免的）。沖突的時(shí)候誰(shuí)優(yōu)先級(jí)更高，誰(shuí)優(yōu)先級(jí)更低。

當(dāng)然這幾個(gè)方法，可能彈性相對(duì)還好處理一點(diǎn)，有硬件協(xié)議來(lái)做，剩下的原子性，還有 Scheduling 都得我們?cè)O(shè)計(jì)硬件的都想得很清楚。

13 RDMA Software/Hardware Co-design

以我們做 RDMA 這樣一個(gè)軟件系統(tǒng)，給大家簡(jiǎn)單介紹一下我們的思路，就說(shuō)我們用 RDMA 主要是解決高性能存儲(chǔ)數(shù)據(jù)傳輸?shù)膯?wèn)題。 RDMA 本質(zhì)其實(shí)也是軟硬件的一個(gè)系統(tǒng)。我們?yōu)槭裁醋约鹤?RDMA 的硬件，是因?yàn)?RDMA 商用的卡里邊有一些不夠靈活的地方，比如 RDMA 的擁塞控制，今天基本上就兩種解決方案，一種你就買(mǎi) InfiniBand 的那套商用的方案。

但是當(dāng)今數(shù)據(jù)中心我們大量用的交換機(jī)路由器還是以太網(wǎng)的。你要用 InfiniBand 的解決方案，那跟以太網(wǎng)的交換記錄器的協(xié)議都不一樣，雖然也可以融合，但是肯定不是個(gè)很優(yōu)的方案，再加上成本的考慮。

今天 RDMA 落地?cái)?shù)據(jù)中心大部分都是 RoCE 方案，所以我們也是采用 RoCE 方案， RDMA 跟以太網(wǎng)融合。但 RoCE 方案最大的問(wèn)題是什么？流量控制對(duì)他來(lái)講是黑洞。為什么這么講？你看，比如像 InfiniBand 它解決 RDMA 的流量控制問(wèn)題，他從他的鏈路層，網(wǎng)絡(luò)層，傳輸層，每一層都要去解決這個(gè)問(wèn)題。但是到 RoCE 的時(shí)候就沒(méi)那么容易了。

RoCE 是把 RDMA 的傳輸層嫁接到了 UDP 上， UDP 根本沒(méi)有任何的流量控制和擁塞控制的管理能力，只用 RDMA 的傳輸層， RDMA 傳輸層只有很少的流量控制，而且 RDMA 傳輸層沒(méi)有擁塞控制能力。今天所有的 RDMA 的流量控制和擁塞控制，都是靠額外的算法在外層去來(lái)解決這個(gè)問(wèn)題。

我們?yōu)榱藢?shí)現(xiàn)高性能傳輸?shù)臅r(shí)候，就要流量控制和擁塞控制，特別是擁塞控制。我們覺(jué)得這個(gè)問(wèn)題對(duì)我們是非常關(guān)鍵的，所以我們自己去搞硬件。而且擁塞控制這個(gè)東西，它還不是純硬件能解決的，上面還有軟件的很多東西。當(dāng)然這些問(wèn)題我們今天還沒(méi)有解決完。所以我這列的時(shí)候沒(méi)有提很多流量空投有所控制的問(wèn)題。但是如果感興趣，是網(wǎng)絡(luò)研究的一個(gè)很大的熱點(diǎn)。

我們做 RDMA 軟件和硬件的時(shí)候，其實(shí)功能模塊還是比較容易理解的。

?軟件首先就是 RDMA 的 API，因?yàn)槲覀冘浖?Rust，我們把它做了一套 RDMA 的 API 的 Rust binding forlibverbs。再一個(gè) RDMA 的測(cè)試是沒(méi)有什么開(kāi)源的方案，所以我們自己搞了一套協(xié)議的一個(gè)測(cè)試框架。再一個(gè)還有驅(qū)動(dòng)的部分（硬件必然會(huì)有驅(qū)動(dòng)），今天我們看 Linux 內(nèi)核已經(jīng)開(kāi)始采用 Rust，我們正在看用 Rust for Linux 怎么來(lái)做一個(gè)驅(qū)動(dòng)，前期做了一些調(diào)研，但目前還不太成熟，所以我們還沒(méi)有真正上手在干?；氐接布@端 RDMA 的傳輸層，是要硬件實(shí)現(xiàn)好。

?硬件里邊 DMA 基本是 RDMA的性能瓶頸， DMA 系統(tǒng)的最大的 delay 都是 PCIE 帶來(lái)的。基于 PCIE的 DMA controller 怎么做高性能的 DMA 操作。包括現(xiàn)在新出 CXL 協(xié)議出來(lái)之后，會(huì)很大程度上解決 DMA 的性能問(wèn)題， CPU 和你的外設(shè)是在同一個(gè)地址空間，再也不需要做什么內(nèi)存的地址空間和 PCIE 地址空間 mmap 的問(wèn)題了。

?再一個(gè)就是 RoCE 方案，是用 UDP 來(lái)傳輸?shù)摹?UDP 也搬到硬件上去實(shí)現(xiàn)，需要實(shí)現(xiàn)的這些組件。

14 RDMA Software

但是在實(shí)現(xiàn)的時(shí)候，幾個(gè)底層的抽象就不一樣。軟件可能相對(duì)好想一些，你不需要考慮 Model of Computation ，你軟件是圖靈機(jī) 模型。

?軟件的架構(gòu)。這個(gè)時(shí)候我們選一個(gè)架構(gòu)，比如上面 RDMA 的這些 API 等等，我們都用協(xié)程的方式（不希望用線程這種模型，因?yàn)榫€程要內(nèi)核來(lái)調(diào)度，我們不希望做很多的上下文切換）。

?算法不太涉及， RDMA 網(wǎng)絡(luò)協(xié)議不太涉及太多算法。

?軟件我們主要是用 Rust，Rust 里面就是Rust Async。驅(qū)動(dòng)在內(nèi)核里面用 Rust for Linux 。

?測(cè)試我們主要用 Python，在 Python 里面主要用 Scapy做網(wǎng)絡(luò)包的一個(gè)測(cè)試，很常見(jiàn)的框架。

15 RDMA Hardware

硬件的設(shè)計(jì)要從 Model of Computation 開(kāi)始了。因?yàn)?RDMA 它是個(gè)網(wǎng)絡(luò)協(xié)議不是 CPU ，網(wǎng)絡(luò)協(xié)議主要是做數(shù)據(jù)傳輸。

?它的 Model of Computation 我們選擇的是叫作同步數(shù)據(jù)流模型。其實(shí)它本質(zhì)上是一個(gè)前面介紹 Kahn Process的簡(jiǎn)化。最大的簡(jiǎn)化在于好我不同的生產(chǎn)者、消費(fèi)者中間之間緩沖 FIFO，我這是要管理的（它不可能是無(wú)限的，硬件沒(méi)有那么多無(wú)限的資源）。同步數(shù)據(jù)的模型它的一個(gè)很大的優(yōu)點(diǎn)就是做了比較強(qiáng)的一些假設(shè)，就是每個(gè)生產(chǎn)者每個(gè)時(shí)刻產(chǎn)生一個(gè)數(shù)據(jù)，每個(gè)消費(fèi)者每個(gè)時(shí)刻接收一個(gè)數(shù)據(jù)，這樣有了很強(qiáng)的一個(gè)假設(shè)之后，好我中間緩沖，我就可以精確地算出來(lái)了。有了同步數(shù)據(jù)流模型之后，你的這些并行之間的調(diào)度問(wèn)題也可以提前做一些安排。

?架構(gòu)層面這就是用一些硬件經(jīng)典的架構(gòu)，比如 pipeline 流水線架構(gòu)。像網(wǎng)絡(luò)數(shù)據(jù)進(jìn)來(lái)之后，很長(zhǎng)的一個(gè)流水線，我們最長(zhǎng)的流水線也大概十七八級(jí)了。狀態(tài)機(jī)也少不了。整體的并行控制等等。比如 RDMA 它不同的隊(duì)列對(duì)吧？不同的 QP(Queue Pair)，預(yù)先設(shè)好有多少個(gè) QP，靠不停地去在硬件上去復(fù)制它。

?算法不涉及。

?Implementation 的時(shí)候，我們沒(méi)有采用 Verilog 傳統(tǒng)的硬件開(kāi)發(fā)語(yǔ)言。用一些比較新的 Implementation 的硬件描述，主要的考慮也在于盡可能提高開(kāi)發(fā)的效率。用兩個(gè)東西，一個(gè)是 Bluespec SystemVerilog，一個(gè)是 SpinalHDL。

?測(cè)試的時(shí)候，我們現(xiàn)在做一些基于 Python 來(lái)做硬件的 Verification。當(dāng)然這兩個(gè)開(kāi)發(fā)語(yǔ)言本質(zhì)它也要寫(xiě)很多測(cè)試驗(yàn)證的問(wèn)題。

這個(gè)是我們整個(gè)迭代硬件的一些思考和價(jià)值。

編輯：黃飛

閱讀全文

cpu(206163) cpu(206163)
網(wǎng)絡(luò)協(xié)議(21344) 網(wǎng)絡(luò)協(xié)議(21344)
加法器(29680) 加法器(29680)
python(83366) python(83366)
RDMA(8836) RDMA(8836)

評(píng)論

相關(guān)推薦

軟硬件信息檢測(cè)工具 AIDA64 3.00.2500 綠色至尊版

本帖最后由恩哲于 2014-5-29 19:30 編輯 軟硬件信息檢測(cè)工具 AIDA64 3.00.2500 綠色至尊版對(duì)于經(jīng)常使用電腦的人來(lái)說(shuō)，有時(shí)候難免需要知道相應(yīng)的軟硬件信息。曾經(jīng)

2014-03-19 14:53:08

軟硬件分離編程的相關(guān)資料下載

嵌入式LINUX驅(qū)動(dòng)學(xué)習(xí)之14軟硬件分離編程（三）代碼舉例（通過(guò)測(cè)試程序操作LED燈 ioctl、set_bit/clear_bit）一、硬件信息驅(qū)動(dòng)程序二、代碼舉例（軟件驅(qū)動(dòng)）三、測(cè)試程序（用戶

2021-12-16 07:08:19

軟硬件協(xié)同優(yōu)化，平頭哥玄鐵斬獲MLPerf四項(xiàng)第一

的第一。這意味著在AIoT領(lǐng)域，RISC-V架構(gòu)能以極低的計(jì)算代價(jià)實(shí)現(xiàn)定制化AI功能。（圖說(shuō)：MLPerf網(wǎng)站截圖）MLPerf Tiny是目前全球IoT領(lǐng)域?qū)?b class="flag-6" style="color: red">軟硬件性能和優(yōu)化能力測(cè)試的權(quán)威AI榜單

2022-04-08 14:47:36

AVR單片機(jī)軟硬件設(shè)計(jì)教程入門(mén)篇

AVR單片機(jī)軟硬件設(shè)計(jì)教程入門(mén)篇單片機(jī)就是一臺(tái)微型電腦。麻雀雖小，五臟俱全，單片機(jī)將微型電腦的所有基本部分都集成在一片硅片上。構(gòu)成單片機(jī)的基本要素：CPU核,ROM,RAM,片上外設(shè),總線 [hide]AVR單片機(jī)軟硬件設(shè)計(jì)教程.rar[/hide]

2009-12-09 15:22:26

DNW下載的軟硬件流程是如何去完成的

DNW下載的軟硬件流程是如何去完成的？怎樣去下載DNW的軟硬件呢？有哪些下載步驟？

2021-12-24 08:01:29

FPGA研修班(sopc的軟硬件協(xié)同設(shè)計(jì))

處理器簡(jiǎn)化RTL設(shè)計(jì) ? ◆軟硬件協(xié)同設(shè)計(jì)范例 2.2.實(shí)驗(yàn)部分基于ALTERA的DE2平臺(tái)，演示各種基于NIOS II的軟硬件協(xié)同設(shè)計(jì)思路 ?&nbsp

2008-12-19 16:08:31

Kinetis平臺(tái)電容式觸摸鍵盤(pán)的軟硬件系統(tǒng)設(shè)計(jì)

電容式觸摸感應(yīng)的原理是什么Kinetis平臺(tái)電容式觸摸鍵盤(pán)的軟硬件系統(tǒng)設(shè)計(jì)

2021-03-11 06:03:57

NI軟硬件平臺(tái)在汽車(chē)ECU開(kāi)發(fā)和測(cè)試中的應(yīng)用是什么？

2021-05-12 06:14:09

PSoC Creator如何簡(jiǎn)化可編程器件上的軟硬件協(xié)同設(shè)計(jì)？

PSoC Creator簡(jiǎn)化可編程器件上的軟硬件協(xié)同設(shè)計(jì)

2021-02-23 06:50:24

Purple Pi R1 開(kāi)發(fā)板軟硬件資源介紹

Purple Pi R1 開(kāi)發(fā)板軟硬件資源介紹*附件：Purple Pi R1 開(kāi)發(fā)板軟硬件資源介紹.pdf

2022-09-06 14:27:42

[轉(zhuǎn)帖]FPGA培訓(xùn)--基于SOPC的軟硬件協(xié)同設(shè)計(jì)

;nbsp;II的軟硬件協(xié)同設(shè)計(jì)思路     ◆實(shí)驗(yàn)1：NIOS II處理器自定義指令實(shí)驗(yàn)&nbsp

2009-07-10 13:18:05

【ZDS2024 Plus示波器申請(qǐng)】機(jī)械手軟硬件調(diào)試

Plus示波器這樣的高性能示波器用于研發(fā)階段的調(diào)試。項(xiàng)目描述：2015年12月份軟硬件聯(lián)調(diào)。希望能提供該示波器給研發(fā)工程師使用。試用完成后可以退回，如性價(jià)比合適，不排除購(gòu)買(mǎi)。

2015-12-02 15:43:45

什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題

的實(shí)踐經(jīng)驗(yàn)，來(lái)系統(tǒng)的梳理一下什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題。文中涉及到的開(kāi)源項(xiàng)目網(wǎng)站地址如下：開(kāi)源項(xiàng)目網(wǎng)站Handsfree

2021-08-06 06:13:07

關(guān)于stm32的軟硬件設(shè)計(jì)心得

第一次接觸stm32的軟硬件設(shè)計(jì)項(xiàng)目的一點(diǎn)感受硬件設(shè)計(jì)項(xiàng)目開(kāi)頭肯定是硬件設(shè)計(jì)，一般來(lái)說(shuō)，在做硬件設(shè)計(jì)之前，要先了解mcu內(nèi)部的各個(gè)功能和管腳分配情況，電源情況等等。我以前有不少設(shè)計(jì)Ti公司dsp

2022-02-14 06:50:58

分享一款不錯(cuò)的基于CPLD的臭氧電源控制系統(tǒng)的軟硬件設(shè)計(jì)

求大神分享一款不錯(cuò)的基于CPLD的臭氧電源控制系統(tǒng)的軟硬件設(shè)計(jì)

2021-04-29 06:45:15

單片機(jī)軟硬件聯(lián)合仿真解決方案

軟硬件聯(lián)合仿真，可以評(píng)估CPLD處理數(shù)據(jù)對(duì)性能的改進(jìn)。Mini Web卡軟硬件聯(lián)合仿真系統(tǒng)：軟硬件聯(lián)合仿真主要解決的問(wèn)題是系統(tǒng)功能設(shè)計(jì)與驗(yàn)證，它不解決電源、濾波電容、總線電平兼容問(wèn)題。做系統(tǒng)仿真

2008-07-17 08:56:46

單片機(jī)按鍵軟硬件設(shè)計(jì)技巧有哪些

單片機(jī)按鍵軟硬件設(shè)計(jì)技巧！

2020-04-22 14:37:38

國(guó)產(chǎn)軟硬件通用MCU可替代STM

NS32F103CBT6可軟硬通用：STM32F103C8T6、STM32F103CBT6NS32F030CBT6可軟硬件通用：STM32F030C8T6

2021-07-10 10:04:11

基于Altera FPGA的軟硬件協(xié)同仿真方法介紹

摘要：簡(jiǎn)要介紹了軟硬件協(xié)同仿真技術(shù)，指出了在大規(guī)模FPGA開(kāi)發(fā)中軟硬件協(xié)同仿真的重要性和必要性，給出基于Altera FPGA的門(mén)級(jí)軟硬件協(xié)同仿真實(shí)例。關(guān)鍵詞：系統(tǒng)級(jí)芯片設(shè)計(jì)；軟硬件協(xié)同仿真

2019-07-04 06:49:19

基于SoPC的嵌入式軟硬件協(xié)同設(shè)計(jì)性能怎么優(yōu)化？

軟硬件協(xié)同設(shè)計(jì)(Hardware／Software Co-deaign)是在20世紀(jì)90年代興起的跨領(lǐng)域交叉學(xué)科。隨著超大規(guī)模集成電路制造工藝的進(jìn)步，單個(gè)芯片所能提供的晶體管數(shù)量已經(jīng)超過(guò)了大多數(shù)

2020-04-08 08:03:10

基于SoPC的狀態(tài)監(jiān)測(cè)裝置的嵌入式軟硬件協(xié)同設(shè)計(jì)

上述的軟硬件協(xié)同設(shè)計(jì)思路合理分割功能，較高性能地實(shí)現(xiàn)了在線的多路狀態(tài)監(jiān)測(cè)。2. 1 采集控制IP設(shè)計(jì)采集控制IP主要以下幾部分：采集控制邏輯，各種寄存器，數(shù)據(jù)緩存RAM塊，時(shí)間戳計(jì)數(shù)器，PLB_EMC接口

2013-01-22 16:41:56

如何使用KEIL進(jìn)行軟硬件仿真

如何使用KEIL進(jìn)行軟硬件仿真

2012-08-20 14:14:51

如何去實(shí)現(xiàn)NRF24L01狀態(tài)機(jī)的軟硬件設(shè)計(jì)呢

NRF24L01是什么？有何特點(diǎn)呢？如何去實(shí)現(xiàn)NRF24L01狀態(tài)機(jī)的軟硬件設(shè)計(jì)呢？

2021-12-16 08:04:14

如何去實(shí)現(xiàn)RCC系統(tǒng)時(shí)鐘的軟硬件設(shè)計(jì)呢

RCC時(shí)鐘樹(shù)是由哪些部分組成的？如何去實(shí)現(xiàn)RCC系統(tǒng)時(shí)鐘的軟硬件設(shè)計(jì)呢？

2021-11-10 07:20:39

如何去實(shí)現(xiàn)一種基于SoPC的軟硬件協(xié)同設(shè)計(jì)呢

什么是軟硬件協(xié)同設(shè)計(jì)呢？片上可編程系統(tǒng)SoPC是什么？如何去實(shí)現(xiàn)一種基于SoPC的軟硬件協(xié)同設(shè)計(jì)呢？基于SoPC的軟硬件協(xié)同設(shè)計(jì)有何功能呢？

2021-12-24 07:15:15

如何實(shí)現(xiàn)高性能的射頻測(cè)試解決方案

如何實(shí)現(xiàn)高性能的射頻測(cè)試解決方案NI軟硬件的關(guān)鍵作用是什么

2021-05-06 07:24:55

如何實(shí)現(xiàn)波形發(fā)生器的軟硬件系統(tǒng)設(shè)計(jì)？

本文針對(duì)高精度波形發(fā)生器的開(kāi)發(fā)，進(jìn)行了以AD760為核心的波形發(fā)生器的軟硬件系統(tǒng)設(shè)計(jì)。

2021-04-12 06:54:00

如何對(duì)SOA進(jìn)行軟硬件部署

差異，對(duì)上提供統(tǒng)一的服務(wù)開(kāi)發(fā)框架。涉及功能包括服務(wù)管理、網(wǎng)絡(luò)管理、通信管理、升級(jí)、診斷、日志、狀態(tài)等。本文將重點(diǎn)重軟硬件解耦的方向講解如何對(duì)SOA進(jìn)行軟硬件部署。SOA的軟件架構(gòu)設(shè)計(jì)原理如下圖表示了

2022-06-10 17:23:22

如何進(jìn)行SoPC與嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)？

軟硬件協(xié)同設(shè)計(jì)是電子系統(tǒng)復(fù)雜化后的一種設(shè)計(jì)新趨勢(shì)，其中SoC和SoPC是這一趨勢(shì)的典型代表。

2019-11-11 07:35:04

尋軟硬件工程師

1、OBD II軟硬件開(kāi)發(fā)、更新、升級(jí)2、OBD II車(chē)輛協(xié)議破解3、通過(guò)WIFI、藍(lán)牙模塊升級(jí)硬件端4、與手機(jī)移動(dòng)端APP接口文件對(duì)接全職待遇面議電話：***QQ：297266953聯(lián)系人：歐先生

2015-07-23 11:44:14

尋軟硬件工程師合作伙伴

1、精通OBD II軟硬件開(kāi)發(fā)、更新、升級(jí)2、精通OBD II車(chē)輛協(xié)議破解3、通過(guò)WIFI、藍(lán)牙模塊升級(jí)硬件端4、與手機(jī)移動(dòng)端APP接口文件對(duì)接5、熟悉其它軟硬件的開(kāi)發(fā)合作方式及利潤(rùn)分配面議。電話：***QQ：297266953聯(lián)系人：歐先生

2015-07-25 13:38:53

尋找汽車(chē)canbus協(xié)議盒開(kāi)發(fā)軟硬件工程師

有過(guò)熟練canbus協(xié)議盒開(kāi)發(fā)經(jīng)驗(yàn)， 軟硬件都能跟導(dǎo)航廠協(xié)調(diào)好。

2014-09-28 22:08:53

錄像DV軟硬件設(shè)計(jì)

我公司是一家錄像存儲(chǔ)軟硬件設(shè)計(jì)方案商，優(yōu)秀的團(tuán)隊(duì)，多年的開(kāi)發(fā)經(jīng)驗(yàn)海思: HI3519 HI3559 HI3520D 聯(lián)詠:NT96658 NT96650 NT96655 NT96660

2017-11-27 15:38:02

怎么使用NI軟硬件開(kāi)發(fā)完整的生產(chǎn)測(cè)試解決方案？

請(qǐng)問(wèn)怎么使用NI軟硬件開(kāi)發(fā)完整的生產(chǎn)測(cè)試解決方案？

2021-04-15 06:45:16

怎么實(shí)現(xiàn)動(dòng)感系統(tǒng)的總體構(gòu)想及其軟硬件設(shè)計(jì)？

新型車(chē)輛模擬駕駛訓(xùn)練系統(tǒng)的組成及工作原理是什么怎么實(shí)現(xiàn)動(dòng)感系統(tǒng)的總體構(gòu)想及其軟硬件設(shè)計(jì)？

2021-05-12 06:15:16

承接單片機(jī)軟硬件開(kāi)發(fā)

承接單片機(jī)軟硬件方案，主營(yíng)無(wú)線產(chǎn)品開(kāi)發(fā)（GPRS,315-433M,2.4G發(fā)射接收，WIFI,ZIGBEE,藍(lán)牙），臺(tái)燈和吸頂燈燈控，工控，汽車(chē)電子，智能家居?？商峁?b class="flag-6" style="color: red">硬件設(shè)計(jì)和軟件開(kāi)發(fā)。歡迎大家咨詢，有需要的請(qǐng)聯(lián)系，范先生QQ1054467185，在深圳

2016-09-10 11:55:30

支持過(guò)程級(jí)動(dòng)態(tài)軟硬件劃分的RSoC設(shè)計(jì)與實(shí)現(xiàn)

。實(shí)驗(yàn)表明該系統(tǒng)能夠較好的支持過(guò)程級(jí)的動(dòng)態(tài)軟硬件劃分,實(shí)現(xiàn)了節(jié)省資源、簡(jiǎn)化設(shè)計(jì),提高性能等目的?！娟P(guān)鍵詞】：可重構(gòu)片上系統(tǒng);;動(dòng)態(tài)軟硬件劃分;;硬件透明編程模型【DOI】：CNKI:SUN

2010-05-28 13:40:38

求一整套完整的無(wú)人機(jī)軟硬件解決方案

Paparazzi是什么？怎樣去設(shè)計(jì)一種無(wú)人機(jī)的軟硬件呢？

2021-11-11 06:46:44

求一種嵌入式Linux平臺(tái)的軟硬件的設(shè)計(jì)方案

求一種嵌入式Linux平臺(tái)的軟硬件的設(shè)計(jì)方案

2021-04-27 06:56:56

求分享NCJ29D5 EVK的軟硬件文件

如果我從 NXP 購(gòu)買(mǎi) NCJ29D5 EVK。我能得到相關(guān)的軟硬件文件嗎？

2023-04-25 06:34:00

電子軟硬件項(xiàng)目承接

本帖最后由 dxb123321 于 2020-10-11 12:55 編輯本人有多年電子軟件,硬件，上位機(jī)開(kāi)發(fā)經(jīng)驗(yàn)，希望找電子軟硬件開(kāi)發(fā)或者上位機(jī)開(kāi)發(fā)的項(xiàng)目。熟練使用多種單片機(jī)。開(kāi)發(fā)過(guò)項(xiàng)目

2017-09-04 19:36:01

電感式觸摸屏軟硬件設(shè)計(jì)

求大神指點(diǎn)一下電感式觸摸屏軟硬件系統(tǒng)設(shè)計(jì)，我拿到這個(gè)題目很久了，不過(guò)一直沒(méi)有什么思路，不知道從何下手，求大神指點(diǎn)，萬(wàn)分感謝

2017-06-06 17:05:52

萌新求助，求步進(jìn)電機(jī)驅(qū)動(dòng)器軟硬件方面的知識(shí)點(diǎn)

萌新求助，求步進(jìn)電機(jī)驅(qū)動(dòng)器軟硬件方面的知識(shí)點(diǎn)

2021-10-28 08:06:50

計(jì)算機(jī)軟硬件維修精華集（夏季版）

計(jì)算機(jī)軟硬件維修精華集（夏季版）

2011-02-23 00:29:58

詳解移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題

什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題？移動(dòng)機(jī)器人軟硬件系統(tǒng)有哪些問(wèn)題呢？

2021-11-11 06:07:42

新域半導(dǎo)體NS32F103VBT6軟硬件通用STM

型號(hào)：NS32F103VBT6封裝：LQFP100容量：64/128KB特點(diǎn)：軟硬件通用STM32F103VBT6，不用改變?nèi)魏蔚胤?，深圳大量現(xiàn)貨庫(kù)存，擁有專(zhuān)業(yè)的技術(shù)支持團(tuán)隊(duì)??！NS32F103x8

2021-11-22 18:19:45

STM32F103CBT6軟硬件通用國(guó)產(chǎn)替代者NS32F103CBT6

型號(hào)：NS32F103CBT6封裝：LQFP48容量：64/128KB特點(diǎn)：軟硬件通用STM32F103CBT6，不用改變?nèi)魏蔚胤?，深圳大量現(xiàn)貨庫(kù)存，擁有專(zhuān)業(yè)的技術(shù)支持團(tuán)隊(duì)！！

2022-05-07 17:04:34

基于EDA的嵌入式系統(tǒng)軟硬件劃分方法

針對(duì)嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)中的軟硬件劃分問(wèn)題，提出了一種基于分布估計(jì)算法的解決方案，通過(guò)將算法映射到一般結(jié)構(gòu)Gauss 網(wǎng)絡(luò)上，提高了算法的穩(wěn)定性和搜索效率。結(jié)果

2009-06-18 08:52:42

單片機(jī)測(cè)控系統(tǒng)的軟硬件平臺(tái)技術(shù)

本文探討了一種用于工業(yè)測(cè)控系統(tǒng)的單片機(jī)軟硬件綜合設(shè)計(jì)方法——軟硬件平臺(tái)技術(shù)，重點(diǎn)闡述了其基本原理、設(shè)計(jì)思想、實(shí)現(xiàn)方法，并給出了一個(gè)單片機(jī)測(cè)控系統(tǒng)軟硬件開(kāi)發(fā)平臺(tái)

2009-08-13 09:38:36

基于時(shí)間Petri網(wǎng)的嵌入式系統(tǒng)軟硬件劃分方法

軟硬件劃分技術(shù)是軟硬件協(xié)同設(shè)計(jì)中的一個(gè)關(guān)鍵技術(shù)。提出將時(shí)間Petri 網(wǎng)應(yīng)用到軟硬件劃分當(dāng)中，為系統(tǒng)的性能評(píng)估提供了形式化的方法和工具。另一方面，將系統(tǒng)功能集中到Petri

2009-08-15 14:34:35

基于EDA 的嵌入式系統(tǒng)軟硬件劃分方法

基于EDA 的嵌入式系統(tǒng)軟硬件劃分方法Hardware/Software Partitioning Method Based on Estimation of Distribution 摘要：針對(duì)嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)中的軟硬件劃分問(wèn)題，提

2009-12-05 16:34:56

基于SOC的USB主設(shè)備的軟硬件協(xié)同驗(yàn)證

基于SOC 的USB 主設(shè)備的軟硬件協(xié)同驗(yàn)證李棟1，李正衛(wèi)2(桂林電子科技大學(xué)通信與信息工程系，廣西桂林 541004）摘要：本文首先介紹了SOC 軟硬件協(xié)同驗(yàn)證方法及其平臺(tái)Seamless

2009-12-14 11:31:21

基于軟硬件協(xié)同設(shè)計(jì)的低功耗生理信號(hào)處理ASIC設(shè)計(jì)

摘要文主要介紹了一種采用軟硬件協(xié)同設(shè)計(jì)策略的用于生理信號(hào)處理的低功耗醫(yī)學(xué)集成芯片。軟硬件協(xié)同設(shè)計(jì)能達(dá)到性能和設(shè)計(jì)靈活性的最大化。系統(tǒng)硬件包括ARM7TDMI處理器，AHB兼

2010-06-19 10:29:54

面向HDTV應(yīng)用的音頻解碼軟硬件協(xié)同設(shè)計(jì)

摘要:該文以Dolby實(shí)驗(yàn)室的音頗AC3算法為基礎(chǔ)，研究了在RISC核Virgo上HDTV音頻解碼的軟硬件協(xié)同設(shè)計(jì)方法，提出了通過(guò)對(duì)程序關(guān)鍵子函數(shù)建模來(lái)實(shí)現(xiàn)軟硬件劃分的軟硬件協(xié)同設(shè)計(jì)方法.即

2010-07-02 21:56:54

智能脫扣器的軟硬件設(shè)計(jì)

智能脫扣器的軟硬件設(shè)計(jì) 首先介紹了智能脫扣器的硬、軟件設(shè)計(jì)及其關(guān)鍵技術(shù)，接著提出了新的數(shù)據(jù)處理方法，最后總結(jié)出一些抗干擾的措施。關(guān)鍵詞：智能脫

2009-10-29 17:41:58

804

FPGA-SoPC軟硬件協(xié)同設(shè)計(jì)

本內(nèi)容詳細(xì)介紹了FPGA-SoPC軟硬件協(xié)同設(shè)計(jì)

2011-05-09 15:59:30

嵌入式軟硬件協(xié)同設(shè)計(jì)在氣象主采集器中研究

本文介紹了嵌入式系統(tǒng)的現(xiàn)狀，分析了傳統(tǒng)嵌入式設(shè)計(jì)方法的不足和 軟硬件協(xié)同設(shè)計(jì) 方法的特點(diǎn)與優(yōu)越性，以軟硬件協(xié)同設(shè)計(jì)為方法對(duì)系統(tǒng)進(jìn)行設(shè)計(jì)，并對(duì)本論文中采用的復(fù)雜可編程

2011-08-04 17:50:33

基于USB的串行通信軟硬件設(shè)計(jì)

本文是基于USB的串行通信軟硬件設(shè)計(jì)的詳細(xì)介紹

2011-10-17 17:38:03

127

思科謀求“軟硬件一體”轉(zhuǎn)型

作為路由器和交換機(jī)領(lǐng)域的領(lǐng)導(dǎo)者，思科正在謀求在一手抓硬件的同時(shí)，另一手也開(kāi)始抓軟件，實(shí)現(xiàn)“軟硬件一體”轉(zhuǎn)型。

2012-12-10 08:52:34

890

基于ARM嵌入式GPS導(dǎo)航系統(tǒng)軟硬件設(shè)計(jì)

基于ARM嵌入式GPS導(dǎo)航系統(tǒng)軟硬件設(shè)計(jì)

2015-11-19 14:36:36

基于SoC的PSTN短消息終端系統(tǒng)的軟硬件設(shè)計(jì)

基于SoC的PSTN短消息終端系統(tǒng)的軟硬件設(shè)計(jì)

2017-01-13 21:57:58

一種基于DSP的AD采樣自校正軟硬件設(shè)計(jì)_高志斌

一種基于DSP的AD采樣自校正軟硬件設(shè)計(jì)_高志斌

2017-01-14 22:34:29

Board從入門(mén)到精通（五）：軟硬件協(xié)同設(shè)計(jì)

Zynq最大的優(yōu)勢(shì)在于，同時(shí)具備軟件、硬件、IO可編程，即All Programmable。在設(shè)計(jì)Zynq過(guò)程中，同樣要建立一種意識(shí)，就是從原來(lái)單純的軟件思維（或單純的硬件思維）中解脫，轉(zhuǎn)向軟硬件協(xié)同設(shè)計(jì)的開(kāi)發(fā)方法。

2017-02-11 19:01:05

2007

基于FPGA的軟硬件協(xié)同實(shí)時(shí)紙病圖像處理系統(tǒng)_齊璐

基于FPGA的軟硬件協(xié)同實(shí)時(shí)紙病圖像處理系統(tǒng)_齊璐

2017-03-19 19:07:17

USB的串行通信軟硬件設(shè)計(jì)

USB的串行通信軟硬件設(shè)計(jì)

2017-09-04 10:08:34

基于S7-1200的軟硬件要求及實(shí)例

本文檔內(nèi)容介紹了基于S7-1200的軟硬件要求及實(shí)例，供網(wǎng)友參考。

2017-09-25 18:18:09

基于FPGA的軟硬件協(xié)同測(cè)試設(shè)計(jì)影響因素分析與設(shè)計(jì)實(shí)現(xiàn)

在軟硬件的開(kāi)發(fā)階段中，測(cè)試結(jié)果直接關(guān)系到這個(gè)軟硬件能否順利進(jìn)行調(diào)試應(yīng)用。其中，硬件的測(cè)試往往容易受外界因素的影響，如環(huán)境、計(jì)算機(jī)設(shè)備等，可以通過(guò)一些仿真軟件來(lái)避免外界環(huán)境的影響，但是其測(cè)試速度比較慢

2017-11-18 05:46:28

1616

軟硬件協(xié)同設(shè)計(jì)機(jī)遇與挑戰(zhàn)分析

軟硬件協(xié)同設(shè)計(jì)是指對(duì)系統(tǒng)中的軟硬件部分使用統(tǒng)一的描述和工具進(jìn)行集成開(kāi)發(fā),可完成全系統(tǒng)的設(shè)計(jì)驗(yàn)證并跨越軟硬件界面進(jìn)行系統(tǒng)優(yōu)化，軟硬件協(xié)同設(shè)計(jì)是嵌入式技術(shù)發(fā)展的一大趨勢(shì)，本PPT文件

2017-11-25 03:45:01

500

如何成為一個(gè)軟硬件通吃的技術(shù)大牛？

有沒(méi)有軟硬件通吃的大牛，絕對(duì)有。這樣的大牛多是懂一點(diǎn)軟件，也懂一點(diǎn)硬件，在軟件工程師面前和人聊硬件，在硬件工

2018-03-20 16:49:32

5798

嵌入式軟硬件協(xié)同設(shè)計(jì)的過(guò)程

或多種系統(tǒng)級(jí)描述語(yǔ)言對(duì)所要設(shè)計(jì)的嵌入式系統(tǒng)的功能和性能進(jìn)行全面的描述，建立系統(tǒng)的軟硬件模型的過(guò)程。系統(tǒng)建模可以由設(shè)計(jì)者用非正式語(yǔ)言，甚至是自然語(yǔ)言來(lái)手工完成，也可以借助EDA工具實(shí)現(xiàn)。手工完成容易導(dǎo)致系統(tǒng)

2018-07-12 14:55:54

815

軟硬件融合：一個(gè)開(kāi)發(fā)者的觀點(diǎn)

，而像Alexa和Fitbit這樣的專(zhuān)業(yè)個(gè)人設(shè)備，通過(guò)硬件和軟件構(gòu)件的結(jié)合，提升我們的日常生活品質(zhì)。也許軟硬件融合最明顯的例子應(yīng)該算是蓬勃發(fā)展的物聯(lián)網(wǎng)。物聯(lián)網(wǎng)涵蓋了從智能建筑等大規(guī)模系統(tǒng)到自主車(chē)隊(duì)這樣的小型

2018-09-18 19:18:42

526

基于ARM芯片MAX32660全程軟硬件設(shè)計(jì)實(shí)戰(zhàn)眾籌

基于ARM芯片MAX32660全程軟硬件設(shè)計(jì)實(shí)戰(zhàn)眾籌

2018-11-09 10:17:13

如何使用ADMP441評(píng)估套件的軟硬件設(shè)置

ADMP441評(píng)估套件的軟硬件設(shè)置演示。

2019-08-19 06:08:00

2415

單片機(jī)軟硬件的加密方法

總結(jié)前人的經(jīng)驗(yàn)，摸索著寫(xiě)一點(diǎn)實(shí)用的方法，供大家參考：在這里不講加密算法，只討論結(jié)合軟硬件的加密方法，總結(jié)了一下大該有以下幾種：

2020-09-13 10:04:44

2876

FOC電機(jī)控制軟硬件設(shè)計(jì)及動(dòng)手實(shí)踐的資料合集免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是FOC電機(jī)控制軟硬件設(shè)計(jì)及動(dòng)手實(shí)踐的資料合集免費(fèi)下載

2021-02-02 11:19:52

基于ESL的軟硬件劃分在AVS解碼器中的應(yīng)用

本文通過(guò)一個(gè)設(shè)計(jì)實(shí)例，介紹了基于電子系統(tǒng)級(jí)設(shè)計(jì)，的軟硬件劃分在嫡解碼器中的應(yīng)用在視頻解碼的軟硬件協(xié)同設(shè)計(jì)中，虛擬平臺(tái)在協(xié)同驗(yàn)證時(shí)指出每比特消耗的時(shí)鐘過(guò)多，需要對(duì)設(shè)計(jì)進(jìn)行修改通過(guò)合理的軟硬件劃分

2021-03-29 11:25:37

基于FPGA芯片的軟硬件平臺(tái)的使用

基于FPGA芯片的軟硬件平臺(tái)的使用

2021-07-01 09:35:17

阿里開(kāi)源玄鐵RISC-V系列處理器，大幅加速RISC-V軟硬件技術(shù)融合

成熟，幫助RISC-V軟硬件技術(shù)加速融合發(fā)展，推動(dòng)創(chuàng)新落地。 ? AIoT時(shí)代，RISC-V架構(gòu)因其開(kāi)放、靈活的特性，有望成為繼Intel X86、ARM后的下一代廣泛應(yīng)用的CPU架構(gòu)。但是，當(dāng)前RISC-V架構(gòu)面臨應(yīng)用碎片化、開(kāi)發(fā)效率低、軟硬件適配難等問(wèn)題，軟硬件生態(tài)尚未成熟。 ? 玄鐵

2021-10-19 14:00:51

2599

遠(yuǎn)距離遙控自動(dòng)避障小車(chē)軟硬件設(shè)計(jì)資料

遠(yuǎn)距離遙控自動(dòng)避障小車(chē)軟硬件設(shè)計(jì)資料

2021-10-26 14:30:41

2021 OPPO開(kāi)發(fā)者大會(huì)主會(huì)場(chǎng)：軟硬件融合技術(shù)升級(jí)

2021 OPPO開(kāi)發(fā)者大會(huì)主會(huì)場(chǎng)：軟硬件融合技術(shù)升級(jí)

2021-10-27 10:43:22

1180

2021 OPPO開(kāi)發(fā)者大會(huì)：軟硬件融合技術(shù)升級(jí)

2021 OPPO開(kāi)發(fā)者大會(huì)：軟硬件融合技術(shù)升級(jí) 2021 OPPO開(kāi)發(fā)者大會(huì)上介紹了軟硬件融合技術(shù)升級(jí)，提升開(kāi)發(fā)者生產(chǎn)效率。責(zé)任編輯：haq

2021-10-27 14:53:42

2356

專(zhuān)業(yè)軟硬件開(kāi)發(fā)

TEL18622454561 QQ343924663多年來(lái)一直從事軌道交通、鐵路專(zhuān)用電子設(shè)備開(kāi)發(fā)，做軟硬件開(kāi)發(fā)培訓(xùn)，小批量委托生產(chǎn)，曾做過(guò)很多項(xiàng)目，單片機(jī)軟件開(kāi)發(fā)及硬件設(shè)計(jì)的經(jīng)驗(yàn)豐富，具體項(xiàng)目信息

2021-12-16 16:51:48

Type-c設(shè)計(jì)及PD相關(guān)軟硬件實(shí)現(xiàn)詳解

Type-c設(shè)計(jì)及PD相關(guān)軟硬件實(shí)現(xiàn)詳解，

2022-02-23 09:53:38

軟硬件協(xié)同設(shè)計(jì)是系統(tǒng)芯片的基礎(chǔ)設(shè)計(jì)方法學(xué)

軟硬件協(xié)同仿真驗(yàn)證是對(duì)軟硬件功能設(shè)計(jì)的正確性及性能進(jìn)行驗(yàn)證和評(píng)估。傳統(tǒng)設(shè)計(jì)中，硬件和軟件通常是分開(kāi)獨(dú)立開(kāi)發(fā)設(shè)計(jì)的，到系統(tǒng)設(shè)計(jì)后期才將軟硬件兩部分集成到一起進(jìn)行驗(yàn)證。

2022-08-12 11:28:33

2693

EMC測(cè)試認(rèn)證軟硬件設(shè)計(jì)指導(dǎo)

電子發(fā)燒友網(wǎng)站提供《EMC測(cè)試認(rèn)證軟硬件設(shè)計(jì)指導(dǎo).pdf》資料免費(fèi)下載

2022-09-22 11:25:27

為什么要從“軟硬件協(xié)同”走向“軟硬件融合”？

軟件和硬件需要定義好交互的“接口”，通過(guò)接口實(shí)現(xiàn)軟硬件的“解耦”。例如，對(duì)CPU來(lái)說(shuō)，軟硬件的接口是指令集架構(gòu)ISA：ISA之下的CPU處理器是硬件，指令集之上的各種程序、數(shù)據(jù)集、文件等是軟件。

2022-12-07 14:23:15

1852

虛擬機(jī)和容器的性能損耗評(píng)測(cè)

本文選自極術(shù)專(zhuān)欄“軟硬件融合”，授權(quán)轉(zhuǎn)自微信公眾號(hào)軟硬件融合，本篇將詳細(xì)評(píng)測(cè)虛擬機(jī)和容器的性能損耗在相關(guān)的應(yīng)用場(chǎng)景下的性能對(duì)比。

2023-05-16 09:38:15

6187

浪潮云海新一代超融合發(fā)布全棧RDMA煥發(fā)優(yōu)質(zhì)性能

5月30日，浪潮云海正式發(fā)布新一代 InCloud Rail G7 系列超融合一體機(jī)，新品基于全棧 RDMA協(xié)議的軟硬件一體化設(shè)計(jì)，發(fā)布現(xiàn)場(chǎng)實(shí)測(cè)3節(jié)點(diǎn)性能超百萬(wàn) IOPS，是傳統(tǒng)方案的數(shù)倍。

2023-06-05 09:20:38

578

軟硬件融合的概念和內(nèi)涵

跟很多朋友交流，當(dāng)提到軟硬件融合的時(shí)候，他們會(huì)這么說(shuō)：“軟硬件融合，難道不是顯而易見(jiàn)嗎？我感覺(jué)在二三十年前就已經(jīng)有這個(gè)概念了?！痹谒麄兊南敕ɡ?，其實(shí)：軟硬件融合等同于軟硬件協(xié)同，甚至等同于軟硬件結(jié)合。他們混淆了軟硬件結(jié)合、軟硬件協(xié)同和軟硬件融合的概念。

2023-10-17 14:36:24

472

KubeCASH：基于軟硬件融合的容器管理平臺(tái)

、CSI、CDI等接口都奉行一個(gè)重要的原則：“不做事，就不會(huì)犯錯(cuò)”。K8S可以理解成嵌于整個(gè)軟硬件堆棧的一個(gè)薄層，僅僅提供硬件到容器環(huán)境的一個(gè)接入。至于具體的軟硬件交互接口和機(jī)制、硬件加速器的系統(tǒng)架構(gòu)和實(shí)現(xiàn)、如何把硬件性能和性能價(jià)值充分發(fā)揮出來(lái)的計(jì)算框架，以及硬件加速原生的軟件架構(gòu)規(guī)范等等，它統(tǒng)統(tǒng)不管。

2024-01-08 10:16:54

290

已全部加載完成

搜索歷史

RDMA高性能實(shí)踐之軟硬件融合設(shè)計(jì)思路

評(píng)論