蒸汽機(jī),在工業(yè)革命中扮演著怎樣的角色?
保爾·芒圖在《十八世紀(jì)產(chǎn)業(yè)革命》中是這樣形容蒸汽機(jī)的:“蒸汽機(jī)并不創(chuàng)造大工業(yè)。但是它卻為大工業(yè)提供了動(dòng)力,更重要的是使大工業(yè)具有統(tǒng)一性。使用蒸汽機(jī),使一切工業(yè)的發(fā)展都要服從一般的法則,工業(yè)世界成為一個(gè)巨大的工廠?!?/p>
可以說(shuō),蒸汽機(jī)是工業(yè)革命的心臟,是手工生產(chǎn)走向模塊化、標(biāo)準(zhǔn)化的通道。此后每一次產(chǎn)業(yè)革新中,世界的優(yōu)先任務(wù)都是尋找那部“蒸汽機(jī)”。當(dāng)深度學(xué)習(xí)推動(dòng)AI技術(shù)又一次復(fù)興,人類(lèi)對(duì)它的最高期待,就是讓AI成為第四次產(chǎn)業(yè)革命中的“蒸汽機(jī)”。而近幾年身處智能革命前沿的,就是預(yù)訓(xùn)練大模型。
然而必須正視的是,全球大模型競(jìng)賽中,我們看到大模型的參數(shù)越來(lái)越大,數(shù)據(jù)集記錄不斷被刷新。但真正的產(chǎn)業(yè)空間里,卻很難看到大模型規(guī)?;?、標(biāo)準(zhǔn)化應(yīng)用。這可能是因?yàn)榇竽P团c行業(yè)知識(shí)不相匹配,行業(yè)算力基礎(chǔ)難以負(fù)載大模型部署等等問(wèn)題。我們似乎一直都在造一臺(tái)不能走進(jìn)工廠的“蒸汽機(jī)原型機(jī)”。
在中學(xué)課本里,我們都知道是瓦特改良了蒸汽機(jī),卻沒(méi)有提是誰(shuí)發(fā)明了蒸汽機(jī)。其原因在于,瓦特真正解決了蒸汽機(jī)走向應(yīng)用的問(wèn)題,從技術(shù)、產(chǎn)品、商業(yè)模式等問(wèn)題上讓蒸汽機(jī)具有與行業(yè)結(jié)合的可行性。
就在剛剛,似乎大模型也跨出了這歷史性的一步。
百度與國(guó)家電網(wǎng)、浦發(fā)銀行等行業(yè)頭部企業(yè)聯(lián)合研發(fā),融合了通用數(shù)據(jù)和行業(yè)特有知識(shí),推出知識(shí)增強(qiáng)能源行業(yè)NLP大模型國(guó)網(wǎng)-百度·文心,和知識(shí)增強(qiáng)的金融行業(yè)NLP大模型浦發(fā)-百度·文心,顯著提升了大模型在行業(yè)任務(wù)上的應(yīng)用效果。
“行業(yè)大模型”,這個(gè)我們從沒(méi)聽(tīng)說(shuō)過(guò)的概念背后,是大模型走向應(yīng)用化的開(kāi)端,是百度多年探索深度學(xué)習(xí)技術(shù)走向產(chǎn)業(yè)的又一次瓜熟蒂落。
5月20日,由深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主辦、百度飛槳承辦的WAVE SUMMIT 2022深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)在線上舉行。期間,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰博士發(fā)表主題演講,提出“產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái)飛槳助力人工智能越來(lái)越普惠,賦能千行百業(yè),惠及千家萬(wàn)戶(hù)”。
2019年的WAVE SUMMIT,王海峰提出深度學(xué)習(xí)技術(shù)已經(jīng)具備通往工業(yè)大生產(chǎn)的條件,并且明確了標(biāo)準(zhǔn)化、模塊化、自動(dòng)化的三大特征。彼時(shí)開(kāi)始,百度與AI開(kāi)發(fā)者、各行業(yè)AI應(yīng)用者共同開(kāi)始了一場(chǎng)在21世紀(jì)筑造蒸汽機(jī)的旅程。如今,王海峰指出在AI工業(yè)大生產(chǎn)階段,深度學(xué)習(xí)技術(shù)的通用性越來(lái)越強(qiáng),深度學(xué)習(xí)平臺(tái)的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化特征越來(lái)越顯著,深度學(xué)習(xí)應(yīng)用越來(lái)越廣泛且深入,已經(jīng)遍地開(kāi)花。
技術(shù)、平臺(tái)、應(yīng)用三層標(biāo)準(zhǔn),是一項(xiàng)技術(shù)走向產(chǎn)業(yè)普適的核心?;氐秸羝麢C(jī)的故事,瓦特也是改寫(xiě)了蒸汽機(jī)的這三大要素。在技術(shù)上實(shí)現(xiàn)了氣缸恒熱,確保了機(jī)械效率;在平臺(tái)上實(shí)現(xiàn)了器件的標(biāo)準(zhǔn)化,工廠能買(mǎi)到可維護(hù)、可換新的產(chǎn)品;在應(yīng)用上則與大量工廠主合作,讓蒸汽機(jī)走進(jìn)經(jīng)濟(jì)生產(chǎn)。就這樣,原本昂貴、效率差、損壞率高的蒸汽機(jī),變成了高效、低門(mén)檻的工業(yè)化代名詞。
今天,百度和中國(guó)AI產(chǎn)業(yè)也在進(jìn)行這樣的探索。大模型讓深度學(xué)習(xí)的技術(shù)效能不斷增強(qiáng),飛槳實(shí)現(xiàn)了AI工業(yè)大生產(chǎn)所需的平臺(tái)化支撐,百度與各行業(yè)開(kāi)發(fā)者的合作,讓AI應(yīng)用之花開(kāi)遍了中國(guó)原野。
在WAVE SUMMIT 2022,我們可以清晰看到深度學(xué)習(xí)技術(shù),預(yù)訓(xùn)練大模型,是如何一步步變成那臺(tái)“蒸汽機(jī)”的。
大模型做實(shí),從無(wú)盡跑分轉(zhuǎn)向全面可用
預(yù)訓(xùn)練大模型是近幾年AI產(chǎn)業(yè)最火熱的技術(shù)名詞。拼模型參數(shù),拼任務(wù)集完成效果,是廠商推出大模型后最喜歡做的幾件事。換個(gè)角度看,大模型依舊處在“無(wú)盡跑分”的初級(jí)階段。
從高分到高能,大模型距離現(xiàn)實(shí)中的產(chǎn)業(yè)場(chǎng)景還有不短的路程要走。比如很多產(chǎn)業(yè)需求無(wú)法用通用模型來(lái)處理,技術(shù)與使用場(chǎng)景之間存在代溝。再比如超大規(guī)模模型在部署時(shí)會(huì)面臨一系列問(wèn)題,比如算力、調(diào)參難度、硬件兼容性等。
讓大模型從“跑分考場(chǎng)”走向千行百業(yè),需要一場(chǎng)全面的轉(zhuǎn)向。而這就是今年WAVE SUMMIT最亮眼的一個(gè)發(fā)布和升級(jí)。
百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜表示,今年是大模型產(chǎn)業(yè)落地的關(guān)鍵年,飛槳文心大模型通過(guò)搭建更適配場(chǎng)景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺(tái)和方法,建設(shè)激發(fā)創(chuàng)新的開(kāi)放生態(tài),解決大模型技術(shù)與場(chǎng)景需求匹配的關(guān)鍵問(wèn)題。
面向行業(yè)智能化需求,百度圍繞大模型產(chǎn)業(yè)級(jí)與知識(shí)增強(qiáng)兩大關(guān)鍵詞,公布了全新的飛槳文心大模型全景圖。在模型方面,形成基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,以更有效地支持應(yīng)用需求,并發(fā)布10個(gè)全新的大模型;為促進(jìn)大模型惠及最廣泛的行業(yè)與開(kāi)發(fā)者,還配套發(fā)布大模型套件、API、平臺(tái),并建設(shè)大模型創(chuàng)意和探索社區(qū)旸谷,來(lái)幫助開(kāi)發(fā)者更低門(mén)檻地應(yīng)用。
文心大模型家族新增的十個(gè)大模型,基礎(chǔ)大模型包括融合任務(wù)相關(guān)知識(shí)的千億大模型ERNIE 3.0 Zeus、多任務(wù)視覺(jué)表征學(xué)習(xí)VIMER-UFO 2.0、商品圖文搜索表征學(xué)習(xí)VIMER-UMS、文檔圖像表征學(xué)習(xí)VIMER-StrucTexT 2.0、語(yǔ)音-語(yǔ)言跨模態(tài)大模型ERNIE-SAT和地理-語(yǔ)言跨模態(tài)大模型ERNIE-GeoL,任務(wù)大模型包括面向生物計(jì)算領(lǐng)域的化合物表征HELIX-GEM、蛋白質(zhì)結(jié)構(gòu)分析HELIX-Fold。
尤其值得注意的,還有文心大模型在業(yè)界首次打造發(fā)布的兩個(gè)行業(yè)大模型,實(shí)現(xiàn)了通用模型為主干,任務(wù)模型面向具體需求,行業(yè)模型面向具體產(chǎn)業(yè)的“三元化結(jié)構(gòu)”,從而使得不同需求、不同行業(yè)的開(kāi)發(fā)者可以第一時(shí)間找尋到大模型的落地方案,不再“望大模型而興嘆”。
最新發(fā)布的行業(yè)大模型,包括國(guó)網(wǎng)-百度·文心電力行業(yè)大模型和浦發(fā)-百度·文心金融行業(yè)大模型。背后是百度與國(guó)家電網(wǎng)、浦發(fā)銀行等行業(yè)頭部企業(yè)進(jìn)行了聯(lián)合研發(fā)與創(chuàng)新,更好地融合了通用數(shù)據(jù)和行業(yè)特有知識(shí),從而有效提升了大模型在電力、金融領(lǐng)域的行業(yè)任務(wù)應(yīng)用效果。
行業(yè)大模型可以說(shuō)是一個(gè)業(yè)界期待了很久的轉(zhuǎn)折點(diǎn)。從拼數(shù)值到效果落地,大模型需要一個(gè)轉(zhuǎn)向應(yīng)用化,強(qiáng)聯(lián)接產(chǎn)業(yè)的范式與方法,而行業(yè)大模型則正填補(bǔ)了這一空白。
除此之外,百度還發(fā)布了圍繞大模型的全新開(kāi)發(fā)套件,讓開(kāi)發(fā)者可用高效率應(yīng)用大模型開(kāi)發(fā),同時(shí)提供相應(yīng)的平臺(tái)功能與API服務(wù),進(jìn)一步降低大模型使用門(mén)檻;在生態(tài)建設(shè)方面,文心大模型將共享飛槳生態(tài),通過(guò)基于文心大模型推出的創(chuàng)意社區(qū)——文心·旸谷大模型創(chuàng)意與探索社區(qū),讓更多用戶(hù)感受到文心大模型的應(yīng)用潛力。
2022年,歐美科技公司依舊執(zhí)著在大模型參數(shù)上不斷強(qiáng)化,再?gòu)?qiáng)化;而百度AI則將大模型轉(zhuǎn)向了行業(yè)場(chǎng)景與真實(shí)需求。這個(gè)分叉路口的交錯(cuò),會(huì)給未來(lái)提供太多可能性。
飛槳做深,支撐大模走向產(chǎn)業(yè)
無(wú)論是傳統(tǒng)的深度學(xué)習(xí)模型還是大模型,都離不開(kāi)開(kāi)發(fā)平臺(tái)的有效支撐。百度能夠推動(dòng)大模型快速走向產(chǎn)業(yè)化落地,從產(chǎn)業(yè)需求中真實(shí)吸收和提煉大模型的升級(jí)方向,本質(zhì)上離不開(kāi)深度學(xué)習(xí)平臺(tái)飛槳,已經(jīng)建立了與開(kāi)發(fā)者、產(chǎn)業(yè)界、學(xué)界的高效溝通通道。
在飛槳的生態(tài)基礎(chǔ)上,百度可以最快速看到中國(guó)AI場(chǎng)景與開(kāi)發(fā)者的需求,以高速的頻率做出回饋,最終組成產(chǎn)業(yè)需求與平臺(tái)供給之間的急速互動(dòng)。放眼全球AI產(chǎn)業(yè),這可能是技術(shù)、平臺(tái)、產(chǎn)業(yè)之間互動(dòng)的最佳范式。
每次WAVE SUMMIT,我們都能看到飛槳進(jìn)行巨量的技術(shù)升級(jí),讓人感覺(jué)似乎已經(jīng)不可能有新的升級(jí)空間,然后又一次次完成突破。這背后就是最懂中國(guó)需求,與產(chǎn)業(yè)智能同在的飛槳范式。
在技術(shù)、場(chǎng)景、生態(tài)的三大領(lǐng)域,飛槳完成了進(jìn)一步深化。深挖技術(shù)方面,飛槳框架v2.3正式發(fā)布。沿著動(dòng)靜統(tǒng)一的框架設(shè)計(jì)理念,繼續(xù)將開(kāi)發(fā)效率與靈活性結(jié)合到一起,讓開(kāi)發(fā)平臺(tái)突破性達(dá)到了更加成熟的狀態(tài)。同時(shí)也將模型壓縮技術(shù)進(jìn)行了升級(jí),提升了深度學(xué)習(xí)模型的自動(dòng)化部署能力。
在平臺(tái)層面,飛槳推出了最懂中國(guó)AI場(chǎng)景的訓(xùn)推一體導(dǎo)航圖,打通了全流程的智能導(dǎo)航,更新了產(chǎn)業(yè)模型庫(kù)和產(chǎn)業(yè)實(shí)踐,讓開(kāi)發(fā)者可以更低門(mén)檻獲得開(kāi)發(fā)經(jīng)驗(yàn)與開(kāi)發(fā)能力。與此同時(shí),支撐科學(xué)計(jì)算的PaddleScience賽槳,以及便攜式AI工作站,也解決了現(xiàn)實(shí)場(chǎng)景中最迫切的AI開(kāi)發(fā)需求。
在生態(tài)領(lǐng)域,飛槳提出了共建硬件生態(tài)圈的新行動(dòng)。AI落地行業(yè)場(chǎng)景,是不可能離開(kāi)硬件適配與算力底座的。這可能是很多算法為核心的AI企業(yè)很少提到的話題,卻是產(chǎn)業(yè)智能化不能規(guī)避的一面。在飛槳一步步走向AI工業(yè)大生產(chǎn)平臺(tái)的過(guò)程里,也在一步步探索與硬件廠商合作、互補(bǔ),組成生態(tài)。在2020年,飛槳還是更多去尋找硬件合作伙伴,達(dá)成兼容性合作,也就是共聚階段。那一年,百度與13家伙伴聯(lián)合發(fā)起了飛槳硬件生態(tài)圈,促進(jìn)AI產(chǎn)業(yè)鏈的適配升級(jí);2021年,硬件伙伴開(kāi)始與飛槳共同創(chuàng)新,共同研發(fā)更好的AI落地方式,共同創(chuàng)新開(kāi)始成為飛槳硬件生態(tài)的推動(dòng)力;時(shí)間來(lái)到今天,飛槳的硬件生態(tài)已經(jīng)初具規(guī)模,合作進(jìn)一步深化,實(shí)現(xiàn)了全面共創(chuàng)。如今,百度已經(jīng)和硬件伙伴一起推出廠商版飛槳框架、建設(shè)模型庫(kù)、開(kāi)發(fā)課程,共同加速產(chǎn)業(yè)智能化升級(jí)。
至此,飛槳已經(jīng)可以從架構(gòu)、硬件、行業(yè)場(chǎng)景、開(kāi)發(fā)特殊需求等等維度,實(shí)現(xiàn)由最深處支撐大模型落地,AI工業(yè)化開(kāi)發(fā)。截至目前,飛槳平臺(tái)已凝聚477萬(wàn)開(kāi)發(fā)者,服務(wù)18萬(wàn)家企事業(yè)單位,累計(jì)創(chuàng)建了56萬(wàn)個(gè)模型。
飛槳,正在像蒸汽機(jī)、電力、燃油一樣,成為可以低門(mén)檻、高效率應(yīng)用的千行百業(yè)生產(chǎn)底座。
百度AI,正在分子化融入中國(guó)大地
文心大模型成為首個(gè)全面轉(zhuǎn)向應(yīng)用的大模型序列;飛槳成為了最了解中國(guó)經(jīng)濟(jì)需求,最深入中國(guó)AI場(chǎng)景的開(kāi)發(fā)平臺(tái)。這不是一場(chǎng)魔法,不是什么突然實(shí)現(xiàn)的黑科技,而是一段一脈相承,步步為營(yíng)的故事。
幾年前,有太多企業(yè)面對(duì)著AI許下了宏大的心愿,但今天他們?cè)僖膊惶崞餉I了。畫(huà)幾頁(yè)P(yáng)PT,宣布一個(gè)龐大愿景很容易。但在大浪褪去后,堅(jiān)定實(shí)踐每一個(gè)諾言卻很難。在WAVE SUMMIT上,我們能看到百度依舊扛著深度學(xué)習(xí)的旗幟,向技術(shù)的無(wú)人區(qū),向產(chǎn)業(yè)的戰(zhàn)略高地,向中國(guó)大地最深層智能化需求沖過(guò)去。
面向讓AI開(kāi)發(fā)標(biāo)準(zhǔn)化、自動(dòng)化、模塊化的目標(biāo),百度AI將自己一步步解耦,再以最小的分子化形態(tài)融入中國(guó)無(wú)比廣泛的開(kāi)發(fā)需求。在遠(yuǎn)離喧囂的鄉(xiāng)村角落,在最嚴(yán)苛的工業(yè)核心,在最前沿的科學(xué)研究,百度的AI技術(shù)都能滲透進(jìn)去。他們把深度學(xué)習(xí)的鐵杵磨成了針,深入那些真正需要智能的產(chǎn)業(yè)縫隙里。
你可能不會(huì)想到,AI能夠在牧區(qū)的農(nóng)貿(mào)市場(chǎng)完成“相牛”師傅的工作,推動(dòng)畜牧業(yè)走向市場(chǎng)標(biāo)準(zhǔn)化,現(xiàn)代化。這背后是飛槳的低門(mén)檻特性作為支撐。
你可能不會(huì)想到,在數(shù)據(jù)不能出車(chē)間的工廠里,飛槳可以通過(guò)便攜式AI工作站抵達(dá)生產(chǎn)核心,帶來(lái)工業(yè)智能化的無(wú)窮想象。而這只是飛槳產(chǎn)業(yè)級(jí)特性的一個(gè)縮影。
你可能不會(huì)想到,飛槳已經(jīng)在與中國(guó)所有主流的超算中心進(jìn)行適配,為了幫助前沿科學(xué)研究項(xiàng)目走向智能化。這只是飛槳在跨領(lǐng)域、跨學(xué)科探索的一個(gè)側(cè)面。
從2019年正式提出工業(yè)化大生產(chǎn)目標(biāo),百度AI依托飛槳連綿不絕的升級(jí),開(kāi)始伴隨各行業(yè)一起步入深度學(xué)習(xí)賦能產(chǎn)業(yè)的深水區(qū)。2020年,突如其來(lái)的疫情帶來(lái)了一系列變化,各行業(yè)開(kāi)始加速擁抱數(shù)字化、智能化,這也讓飛槳更加高效地肩負(fù)起支撐產(chǎn)業(yè)的責(zé)任。2021年,瞄準(zhǔn)AI技術(shù)降低門(mén)檻,融合創(chuàng)新的新特點(diǎn),百度持續(xù)打造了低門(mén)檻的飛槳使用體驗(yàn),推出了知識(shí)增強(qiáng)大模型的關(guān)鍵創(chuàng)新。
伴隨著百度AI的步步深入,一次次降低門(mén)檻,提升技術(shù)支撐力,各行業(yè)也開(kāi)啟了更加積極的AI探索。從少量先行者探索AI,到大量企業(yè)開(kāi)始“工坊”式嘗試AI,再到企業(yè)開(kāi)始以大規(guī)模資源協(xié)同的方式,啟動(dòng)AI工業(yè)化大生產(chǎn)。千行百業(yè)的智能化、數(shù)字化需求逐年深入,隨之而來(lái)的智能需求也不斷加強(qiáng)。為此,百度打造了以云計(jì)算為基礎(chǔ),以AI為引擎的賦能形態(tài),支撐企業(yè)數(shù)字化、智能化升級(jí)一步到位。
在技術(shù)供給與產(chǎn)業(yè)需求同步提升的同時(shí),百度此前提出培養(yǎng)500萬(wàn)AI人才的目標(biāo)也在持續(xù)進(jìn)展。各種各樣的產(chǎn)學(xué)研聯(lián)合培養(yǎng)方式與AI技術(shù)社區(qū),保障了智能化過(guò)程中的人才基礎(chǔ)。
王海峰認(rèn)為,在深度學(xué)習(xí)技術(shù)及平臺(tái)的支撐下,人工智能呈現(xiàn)出融合創(chuàng)新、降低門(mén)檻的特點(diǎn),將繼續(xù)推動(dòng)科技革命和產(chǎn)業(yè)變革,加快產(chǎn)業(yè)智能化升級(jí)。
這些特點(diǎn)并不是憑空浮現(xiàn),而是一步步探索出來(lái),一點(diǎn)點(diǎn)錘煉出來(lái)。在技術(shù)研發(fā)、平臺(tái)打造、生態(tài)培育、應(yīng)用落地的一重重探索下,真正的普惠AI正在實(shí)現(xiàn)。
時(shí)間來(lái)到2022年,面對(duì)大模型走向?qū)嵱没餍袠I(yè)開(kāi)始以AI重構(gòu)和升級(jí)生產(chǎn)力核心。我們會(huì)有點(diǎn)驚奇地發(fā)現(xiàn),那個(gè)把AI技術(shù)變成21世紀(jì)的蒸汽機(jī),讓第四次工業(yè)革命發(fā)生在中國(guó)的諾言,似乎開(kāi)始一步步,一點(diǎn)點(diǎn)地實(shí)現(xiàn)了?
那些聽(tīng)起來(lái)稚嫩的希望,那些看上去荒唐的夢(mèng)想,那些遲遲不敢說(shuō)出口的諾言,就去試試吧。
就去一次次調(diào)參那些模型,去在深夜里回復(fù)每個(gè)開(kāi)發(fā)者的疑問(wèn),就去深入車(chē)間,深入牧場(chǎng),深入實(shí)驗(yàn)室。去直面需求,升級(jí)技術(shù),錘煉平臺(tái),共創(chuàng)生態(tài),去實(shí)現(xiàn)那個(gè)關(guān)于大模型,關(guān)于深度學(xué)習(xí)技術(shù)的,最深的,最大的,也是最美好的夢(mèng)。
中國(guó)AI不是一張空頭支票。而是真的有人在把大模型、把AI技術(shù)變成一個(gè)機(jī)會(huì),一個(gè)撬動(dòng)產(chǎn)業(yè)變革,撬動(dòng)智能革命的機(jī)會(huì)。
還記得年少時(shí)的夢(mèng)嗎?
像朵永遠(yuǎn)不凋零的花
讓第四次工業(yè)革命發(fā)生在中國(guó),又為什么不能實(shí)現(xiàn)呢?
審核編輯:符乾江
-
AI
+關(guān)注
關(guān)注
87文章
31338瀏覽量
269747 -
百度
+關(guān)注
關(guān)注
9文章
2275瀏覽量
90585
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論