目前比較主流的AI深度學(xué)習(xí)框架主要由國際巨頭領(lǐng)銜,比如谷歌的TensorFlow和Facebook的PyTorch等。2017年中國的一家初創(chuàng)團(tuán)隊(duì)悄悄成立,他們做的是對標(biāo)這些主流框架的技術(shù)開發(fā)。今年初,這家公司聲名鵲起,并獲得了由高瓴創(chuàng)投領(lǐng)投的5000萬元A輪融資。這家公司叫一流科技,他們的深度學(xué)習(xí)框架叫做OneFlow,今年7月31日,OneFlow即將迎來自己的開源一周年紀(jì)念日。
對框架的超前定位,有力支撐了深度學(xué)習(xí)領(lǐng)域的創(chuàng)業(yè)
一流科技創(chuàng)始人袁進(jìn)輝在創(chuàng)辦公司之前,在微軟研究院工作多年,主要從事機(jī)器學(xué)習(xí)、分布式系統(tǒng)的研發(fā)?!爱?dāng)時(shí)我們認(rèn)為隨著AI數(shù)據(jù)和算力需求的不斷增加,現(xiàn)有的深度學(xué)習(xí)框架在未來會遇到瓶頸,幾年前我多次在公開演講中提到過這個(gè)觀點(diǎn),但當(dāng)時(shí)業(yè)界不以為然?!痹M(jìn)輝說道。
袁進(jìn)輝分析,從機(jī)器視覺到人機(jī)對話,再到認(rèn)知智能,AI不斷突破能力邊界,同時(shí)伴隨著模型參數(shù)的指數(shù)級提升,AI模型加速膨脹導(dǎo)致訓(xùn)練成本攀升,預(yù)計(jì)2025年最先進(jìn)的AI訓(xùn)練模型成本將達(dá)到1億美元。
而單芯片存在算力天花板,單芯片在物理層面存在性能極限,先進(jìn)制程發(fā)展已難以維持摩爾定律;分布式硬件難以高效協(xié)同運(yùn)轉(zhuǎn),分布式方案芯片間傳輸帶寬低于片上帶寬,多芯片集群難以像“超級芯片”一樣高效工作。
針對內(nèi)存墻、用戶接口不友好和定制化成本高等AI分布式訓(xùn)練痛點(diǎn),OneFlow從底層機(jī)制提出Actor機(jī)制、一致性視角和自動并行技術(shù)加以解決。
袁進(jìn)輝表示,隨著大規(guī)模參數(shù)模型爆發(fā),OneFlow需求匹配程度愈發(fā)提高,將超過TensorFlow和PyTorch逐漸占據(jù)更多的市場空間。
近兩年,一些國內(nèi)科技巨頭也紛紛推出深度學(xué)習(xí)框架,例如百度飛槳PaddlePaddle、華為的MindSpore等。他們大多擁有自己的生態(tài)圈,能夠?qū)⒂布蛙浖钆涫褂?。相比之下,一流科技的OneFlow屬于獨(dú)立的第三方框架,更具有中立性,可以廣泛地與芯片廠商進(jìn)行適配。
“GPU芯片巨頭英偉達(dá)在美國的軟件棧團(tuán)隊(duì)對我們的深度學(xué)習(xí)框架表示了密切關(guān)注,每兩個(gè)星期我們會就框架優(yōu)化與合作問題進(jìn)行探討?!痹M(jìn)輝透露。
雖然TensorFlow和PyTorch等深度學(xué)習(xí)框架為也英偉達(dá)的芯片所適配,不過顯然,英偉達(dá)注意到OneFlow這個(gè)由獨(dú)立的軟件公司研發(fā)的框架的好處和價(jià)值。
開源與良好的商業(yè)模式并不沖突
去年OneFlow框架開源之后獲得了非常高的關(guān)注。OneFlow的開源代碼發(fā)布到了Github,開源讓全球開發(fā)者能夠直觀接觸、下載、使用OneFlow。開源十個(gè)月Star數(shù)量超過2500,超過華為Mindspore。
袁進(jìn)輝直言,“在開源社區(qū)里面,有很多基礎(chǔ)軟件,勝出的不是大公司,而是初創(chuàng)團(tuán)隊(duì),比如主導(dǎo)Spark的Databricks等。一些互聯(lián)網(wǎng)大公司都在用的軟件,剛開始都是小團(tuán)隊(duì)做的。只要技術(shù)上過硬,就有機(jī)會。”顯然,一流科技有這個(gè)技術(shù)實(shí)力,在其框架開源之后,獲得了谷歌、Facebook、華為、百度等同行的關(guān)注,也受到了資本的青睞。
但是,一個(gè)問題是,開源與公司的商業(yè)模式是否沖突呢?公司又如何建立自己的商業(yè)價(jià)值?
袁進(jìn)輝分析,開源的商業(yè)模式主要有兩種,一種是雖然一些有技術(shù)能力的互聯(lián)網(wǎng)公司或開發(fā)者自行下載開源軟件,進(jìn)行項(xiàng)目開發(fā),但是對于沒有開發(fā)能力的用戶,他們需要付費(fèi)購買開源軟件的商業(yè)版來使用。
另一種是云上托管。如今很多企業(yè)將數(shù)據(jù)計(jì)算在云上進(jìn)行,在用某個(gè)軟件處理大數(shù)據(jù)、AI計(jì)算的任務(wù)時(shí)他可以把開源工具下載下來在云上部署,這種方式下公司必須自己雇用工程師對這一流程進(jìn)行調(diào)優(yōu),需要承擔(dān)較高的人力成本。但也可以直接從云上使用開源公司部署的軟件,這種做法用戶需要承擔(dān)的成本較低,也更方便省事。
目前開源云托管是最好的商業(yè)模式,在美國已經(jīng)運(yùn)用相對成熟。相信在中國也將有越來越多的用戶接受這一模式。
OneFlow用起來不僅是快,下一步打通易用性
OneFlow選擇自上向下占領(lǐng)市場,占據(jù)技術(shù)制高點(diǎn),從高效性向易用性和完備性延伸。以高效性作為突破口,切入市場打破競爭格局。
目前,用OneFlow訓(xùn)練比其他框架快的口碑已經(jīng)在業(yè)內(nèi)傳開。一個(gè)數(shù)據(jù)是,OneFlowv0.2.0實(shí)現(xiàn)了多達(dá)17個(gè)性能優(yōu)化,使得CNN和BERT的自動混合精度(AMP)訓(xùn)練速度大幅提升,不僅遠(yuǎn)超其他各個(gè)主要框架的官方實(shí)現(xiàn),同時(shí)也超過了NVIDIA深度優(yōu)化過的版本,成為在主流旗艦顯卡(V100 16G)上訓(xùn)練ResNet50-v1.5和BERT-base模型最快的框架。OneFlow ResNet50-v1.5 AMP單卡比NVIDIA深度優(yōu)化過的PyTorch快80%,比TensorFlow2.3快35%。
袁進(jìn)輝表示,我們即將發(fā)布新的版本,將重點(diǎn)提升軟件的易用性體驗(yàn),首先在單卡代碼上保證和PyTorch的體驗(yàn)一致,而同時(shí)在多卡場景下推出了全新的接口設(shè)計(jì),將給用戶帶來革命性的開發(fā)體驗(yàn)。相信這個(gè)版本的發(fā)布將極大地帶動開發(fā)者群體,擴(kuò)大OneFlow的使用數(shù)量和應(yīng)用范圍。
在鋪設(shè)高效性和易用性之后,OneFlow還將打造完備性,從而形成自上而下、三位一體的布局。袁進(jìn)輝有信心,在不久的將來和TensorFlow、PyTorch是三分天下的市場格局。
AI軟件生態(tài),OneFlow需當(dāng)此重任
在移動端,開源的安卓系統(tǒng)形成強(qiáng)大的生態(tài)而成功。深度學(xué)習(xí)框架就像AI的操作系統(tǒng)一樣,它是模型算法和硬件資源之間的接口,是AI系統(tǒng)資源的管理者,實(shí)現(xiàn)對底層硬件資源的調(diào)度,讓開發(fā)者無需關(guān)心實(shí)現(xiàn)細(xì)節(jié)。
袁進(jìn)輝認(rèn)為,生態(tài)建設(shè)就是0和1的問題,OneFlow必然建設(shè)強(qiáng)大的生態(tài)才能實(shí)現(xiàn)更多的可能,取得最終的成功。
目前,OneFlow的硬核創(chuàng)新在核心AI開發(fā)圈樹立了口碑,得到全球框架專家的高度認(rèn)可,國內(nèi)外深度學(xué)習(xí)框架產(chǎn)品已在積極跟進(jìn)OneFlow所開創(chuàng)的設(shè)計(jì)理念。一流科技已與北京智源人工智能研究院、粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院、之江實(shí)驗(yàn)室、中關(guān)村智用人工智能研究院等頂尖AI科研院所開展深度合作。同時(shí),聯(lián)合芯片、云廠商等上下游企業(yè)加強(qiáng)配合,已與寒武紀(jì)、燧原科技等推進(jìn)超大模型訓(xùn)練方案。下一步將推動與更多芯片廠商和廣大開發(fā)者的合作,打造AI平臺的繁榮生態(tài)。
開源生態(tài)已經(jīng)得到國家層面的重視,“開源”寫進(jìn)了今年的十四五規(guī)劃,而開源將是中國占領(lǐng)科技高地的機(jī)會。例如硬件方面現(xiàn)在大力發(fā)展的RISC-V開源指令集架構(gòu),軟件方面OneFlow做為中國的深度學(xué)習(xí)框架,也將借助開源的力量進(jìn)一步壯大其AI生態(tài)。
基于深度學(xué)習(xí)的軟件2.0時(shí)代將打開30萬億美元的市場,袁進(jìn)輝表示,中國擁有大量的基礎(chǔ)軟件人才,積累了豐富的AI應(yīng)用場景,OneFlow有機(jī)會在這個(gè)AI時(shí)代乘風(fēng)而行。
本文為電子發(fā)燒友網(wǎng)原創(chuàng)文章,作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
-
AI
+關(guān)注
關(guān)注
87文章
31225瀏覽量
269579 -
pytorch
+關(guān)注
關(guān)注
2文章
808瀏覽量
13272 -
OneFlow
+關(guān)注
關(guān)注
0文章
9瀏覽量
8806
發(fā)布評論請先 登錄
相關(guān)推薦
評論