0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

文心4.0,啟動大模型時代的飛輪效應(yīng)

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-10-19 09:34 ? 次閱讀

從物理學(xué)到經(jīng)濟學(xué)、商學(xué)當中,有一個著名的“飛輪效應(yīng)”(Flywheel Effect),是指剛開始推動飛輪旋轉(zhuǎn)時,需要花費非常大的力氣卻轉(zhuǎn)速很慢,而一旦速度達到某個臨界點后,飛輪就會非常輕松地高速運轉(zhuǎn)。這一原理能應(yīng)用到方方面面,比如健身最難熬的是前幾天,一旦形成習(xí)慣就會越來越輕松。

一個企業(yè),一個行業(yè)要顯現(xiàn)飛輪效應(yīng),需要讓各個業(yè)務(wù)模塊、技術(shù)模塊之間形成如齒輪咬合般的帶動關(guān)系。初期要承受巨大的探索壓力,而當飛輪踏上正軌,就會發(fā)展迅猛,領(lǐng)先優(yōu)勢不斷加大。

AI大模型,正顯現(xiàn)出如此前互聯(lián)網(wǎng)產(chǎn)業(yè)一樣的“飛輪效應(yīng)”。

10月17日,以“生成未來”為主題的百度世界2023在北京首鋼園舉辦。其間,百度CEO李彥宏表示,“大模型正成為新型工業(yè)化的重要推動力”,并且表示,文心大模型4.0實現(xiàn)了基礎(chǔ)模型的全面升級,在理解、生成、邏輯和記憶能力上都有著明顯提升,綜合水平“與GPT-4相比毫不遜色”。

為什么在極短的時間內(nèi),業(yè)界關(guān)注重點就從“中國能否有大模型”,變成了“文心大模型與GPT-4”并駕齊驅(qū)?文心大模型飛速進化背后的奧秘是什么?

wKgaomUv1ASARNYsAAOJI4hNEO0415.jpg

同樣在百度世界大會期間,百度首席技術(shù)官王海峰解讀了文心大模型4.0背后的關(guān)鍵技術(shù)和最新進展。

在這當中,我們能讀懂文心大模型如何全維度發(fā)力,造就了屬于AI時代的飛輪效應(yīng)。

技術(shù)飛輪,文心大模型4.0全面進化

文心大模型已經(jīng)顯現(xiàn)出飛輪效應(yīng)的證據(jù)是多方面的。從體驗效果、用戶規(guī)模、落地場景三個最主要領(lǐng)域來考察,都可以發(fā)現(xiàn)文心大模型處在難以置信的進化速度當中。

王海峰介紹,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升,9月已開始小流量上線,過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今,用戶規(guī)模已經(jīng)達到4500萬、開發(fā)者5.4萬、場景4300個、應(yīng)用825個、插件超過500個。

wKgZomUv1AWABEa-AAPNn4EGA-o622.jpg

在各界非常關(guān)注的代碼生成領(lǐng)域,基于文心大模型研制的智能代碼助手Comate,在百度內(nèi)部應(yīng)用效果良好,整體代碼采納率達到40%,高頻用戶的代碼采納率達到60%。目前階段,百度每天的新增代碼中有20%是由Comate所生成。

而這些數(shù)字,還在快速增長。

文心大模型能夠快速更新至4.0版本,并且體驗與成績不斷提升,背后的邏輯是什么?

答案在于,百度通過多年在深度學(xué)習(xí)基礎(chǔ)技術(shù)以及模型訓(xùn)練、推理、應(yīng)用等方面的布局積累,已經(jīng)構(gòu)筑了大模型層面的全棧技術(shù)優(yōu)勢。換言之,百度已經(jīng)率先度過了飛輪效應(yīng)的投入期。聚集起來的技術(shù)動能不斷累加,讓文心大模型的“技術(shù)飛輪”高速運轉(zhuǎn)。

縱觀文心大模型的升級之路,就可以清楚地看到飛輪效應(yīng)的運作模式。文心大模型自誕生起,就準確把握了知識增強和產(chǎn)業(yè)級兩大關(guān)鍵突破點,既集成了百度的AI技術(shù)優(yōu)勢,又找準了未來的可持續(xù)發(fā)力方向。今年5月,作為文心一言的基礎(chǔ)模型,文心大模型升級到3.5版本,就在基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強、插件機制等方面實現(xiàn)了全面突破。而到4.0版本階段,其基本技術(shù)架構(gòu)與3.0和3.5版本一脈相承,并且在多個關(guān)鍵技術(shù)進一步突破?;仡櫸男拇竽P偷纳墯v程,可以發(fā)現(xiàn)在練算法效率方面,3月份以來文心已累計提升3.6倍,訓(xùn)練穩(wěn)定性方面,周均訓(xùn)練有效率已超過98%。

wKgaomUv1AaAOjDrAAOehnjIY4I915.jpg

帶著百度超過十年積累的AI技術(shù)與研發(fā)矩陣,文心大模型4.0展現(xiàn)出了巨大的升級幅度。我們可以將其關(guān)鍵節(jié)點,總結(jié)為三個強化:

1.模型強化。

模型訓(xùn)練、推理能力,是大模型的基礎(chǔ),也是大模型走向產(chǎn)業(yè)化的核心。在這方面,文心大模型4.0延續(xù)了此前的高速進化模式。通過在萬卡算力上運行飛槳平臺,構(gòu)筑集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了文心大模型的穩(wěn)定高效訓(xùn)練。

同時,百度還構(gòu)建了多維數(shù)據(jù)體系,形成了數(shù)據(jù)挖掘、分析、合成、標注、評估閉環(huán),可以充分釋放數(shù)據(jù)價值,大幅提升模型效果,并且基于有監(jiān)督精調(diào)、偏好學(xué)習(xí)、強化學(xué)習(xí)等技術(shù)進行多階段對齊,保證模型更好與人類的判斷和選擇對齊,再通過可再生訓(xùn)練技術(shù)完成增量式的參數(shù)調(diào)優(yōu),節(jié)省了訓(xùn)練資源和時間,加快了模型迭代速度。

由此可見,文心大模型保持高效、大幅的迭代,原因是由多方面構(gòu)成的。算力平臺、數(shù)據(jù)平臺、訓(xùn)練工具,以及一系列新型模型訓(xùn)練技術(shù)都參與其中。尤其與飛槳的聯(lián)合調(diào)優(yōu),不斷扮演著更加重要的角色。

2.知識強化。

文心大模型實現(xiàn)了準確率好,效率也高,關(guān)鍵在于知識點增強技術(shù)的運用。而在文心大模型4.0階段,知識點增強技術(shù)開始應(yīng)用于輸入和輸出的雙階段。在用戶輸入問題時,文心4.0會拆解回答問題所需的知識點,進而在搜索引擎、知識圖譜、數(shù)據(jù)庫中查找準確知識,再將知識組裝進Prompt送入大模型。另一方面,大模型還將對輸出結(jié)果進行反思,從生成結(jié)果總結(jié)知識點,進而通過以上方式進行確認驗證,對結(jié)果差錯進行修正。

如此一來,相當于大模型既要理解用戶提到的知識,又將反思自身輸出的知識。我們發(fā)現(xiàn)大模型偶爾會“胡說八道”,甚至懷疑輸出結(jié)果,知識點增強的雙向運用,將極大提升生成內(nèi)容準確率。

3.機制強化。

近段時間以來,智能體機制得到了行業(yè)的廣泛關(guān)注,成為大模型發(fā)展新的風(fēng)口。在這一方面,百度進一步研發(fā)了智能體機制,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行、自我進化,并將智能體的思考過程白盒化。從而讓AI可以具有與人類相近的理性思考能力,由此可以自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實現(xiàn)自主進化。

可以看到,文心大模型的核心技術(shù)升級環(huán)環(huán)相扣,彼此推動。在大模型訓(xùn)練效率、AIGC效果、前沿技術(shù)探索等方面構(gòu)成了正向的驅(qū)動循環(huán)。比如說,文心與飛槳的聯(lián)合優(yōu)化,目前可以看到價值越來越大,對于模型迭代效率提升、模型成本降低等方面有著巨大的作用,而這就是將百度潛心打造十年的深度學(xué)習(xí)開發(fā)平臺能力,釋放到了大模型當中。

高投入,廣積累、堅持前沿探索,把核心技術(shù)組成環(huán)環(huán)相扣的齒輪。

這種技術(shù)戰(zhàn)略的堅定篤行,正在全球AI賽道中進化著文心大模型的飛輪效應(yīng)。

應(yīng)用飛輪,行業(yè)落地全面深化

從技術(shù)飛輪向外看,大模型必須帶動場景的飛輪旋轉(zhuǎn),才能最終讓技術(shù)獲得價值。在這方面,可以看到文心大模型正在破解應(yīng)用道路上的關(guān)鍵難題:深度。

從目前來看,文心大模型帶來的應(yīng)用價值,已經(jīng)能給出肯定的回答。在百度世界大會現(xiàn)場,王海峰分享了兩個大模型的應(yīng)用案例。

其一是百度與中國國家圖書館展開戰(zhàn)略合作。利用國家圖書館擁有的全球最大古代方志資源,文心大模型通過學(xué)習(xí)古代方志與家譜數(shù)據(jù),從而幫助全球華人獲取尋根線索,實現(xiàn)尋根愿望。在這一場景中,我們可以看到使用了方志這種極少見、非傳統(tǒng)的數(shù)據(jù)資料,極度考驗大模型的理解與邏輯能力。而最終文心大模型經(jīng)受了考驗,構(gòu)筑了海外華人夢回鄉(xiāng)梓的智能之橋。

wKgZomUv1AaAZSocAAPLtiZMPOw422.jpg

其二是百度與國家跳水隊合作,基于文心一言等百度大模型技術(shù),幫助國家跳水隊實現(xiàn)AI輔助訓(xùn)練系統(tǒng)全面升級。大模型通過掌握豐富的跳水知識,理解和執(zhí)行教練員和運動員的復(fù)雜指令,及時對運動員的動作進行實時打分、完成精準量化分析,提供有價值的智能化指導(dǎo)。

這兩個場景,全面展示了文心大模型4.0的場景應(yīng)用深度。在技術(shù)不斷提升的情況下,大模型的行業(yè)落地門檻不斷降低,應(yīng)用空間不斷加大。各行業(yè)都愿意來和百度合作,探索大模型的可能性。

這些行業(yè)的意愿與探索,形成了應(yīng)用合力,正在千行百業(yè)中深化著文心大模型的飛輪效應(yīng)。

人才飛輪,大模型人才培養(yǎng)全面強化

大模型時代的最終需求是什么?從2012年以來開啟的AI熱潮其實早就告訴了我們答案:智能化,最終靠人才。巨大的人才缺口、難以獲得的教育資源、不連貫的產(chǎn)學(xué)研合作,始終是困擾AI技術(shù)發(fā)展的根本難題。

wKgaomUv1AeAEG0gAANhHtaZ0zI627.jpg

為了解決這個問題,需要各界的攜手發(fā)力,也需要頭雁企業(yè)的抉擇與擔(dān)當。我們還記得,百度早在2020年就提出了5年為全社會培養(yǎng)500萬AI人才的目標。如今來看,這一目標的提出和推進,對今天中國大模型事業(yè)的發(fā)展起到了底座與引擎的作用。在百度世界大會現(xiàn)場,王海峰公布了百度AI人才培養(yǎng)的最新數(shù)據(jù),面向5年培養(yǎng)500萬AI人才的目標,截至目前百度已經(jīng)培養(yǎng)了420萬AI人才。但顯然,大模型的到來將加大AI人才缺口,給AI人才培養(yǎng)帶來新的課題與挑戰(zhàn)。

在這方面,可以看到百度主動承擔(dān)起了大模型時代的人才培養(yǎng)承諾。為了高強度培養(yǎng)了解大模型技術(shù),適應(yīng)大模型發(fā)展需求的人才,王海峰發(fā)布了百度人才培養(yǎng)的“星河計劃”。他表示:“我們將與產(chǎn)學(xué)研各界密切合作,深化產(chǎn)教融合,為社會再培養(yǎng)500萬大模型人才,讓人工智能科技的‘創(chuàng)新之花’,結(jié)出更多‘產(chǎn)業(yè)之果’,服務(wù)國家戰(zhàn)略,服務(wù)社會發(fā)展,服務(wù)人民福祉?!?/p>

人才是持續(xù)發(fā)展的根本,是創(chuàng)新可能性的來源。持續(xù)的人才培養(yǎng)投入,不斷完善和升級的人才培養(yǎng)模式,都強化了這種原動力。

來自“星河計劃”中的500萬大模型人才,將在更廣闊的未來,強化文心大模型的飛輪效應(yīng)。

一個飛輪,萬個飛輪

從一個算力節(jié)點,一項訓(xùn)練方案,一項算法機制的創(chuàng)新,到千萬家企業(yè)的參與,千萬個行業(yè)的參與,千萬名開發(fā)者的參與。文心大模型的飛輪結(jié)構(gòu)正在變得愈發(fā)緊密,聯(lián)接范圍變得更加廣闊。

一項大模型核心技術(shù)的升級,或許就將通過某個Prompt改變一個人的生活,通過某個AI原生應(yīng)用影響一家企業(yè)的發(fā)展,通過某個落地場景升級一個行業(yè)的生產(chǎn)力。當技術(shù)、產(chǎn)業(yè)、人才的飛輪全速轉(zhuǎn)動,我們就將進入真正的大模型時代。

文心大模型4.0的飛輪效應(yīng),其實是一個縮影。其明確從啟動期進入飛速提升期,意味著中國大模型產(chǎn)業(yè)的整體進化速度更快、核心競爭力更強,從全球AI機遇的參與者逐漸變成引領(lǐng)者。

中國大模型的技術(shù)正不斷加快,核心創(chuàng)新正不斷增強,從文心大模型4.0的理解、生成、邏輯、記憶能力全面提升中就可以看到。

中國大模型的產(chǎn)業(yè)門檻不斷下降,各行業(yè)的AI原生應(yīng)用可能性極大增強。在國家圖書館、中國跳水隊的智能化嘗試中就可以看到。

中國大模型的人才培養(yǎng)路徑更加清晰,人才供給更加完善,創(chuàng)新動力源源不絕,在500萬大模型人才培養(yǎng)計劃中就可以看到。

目前的實際情況是,中國大模型產(chǎn)業(yè)正在踏上正軌。領(lǐng)軍企業(yè)有能力也有雄心,在大模型時代完成更大的探索和突破。文心大模型4.0可以與GPT-4并駕齊驅(qū),答案正在于此。

文心大模型的飛輪,帶動百度的AI飛輪;百度的一個飛輪,又會通過各種平臺、應(yīng)用、工具與合作通道將影響力擴散,帶動千行百業(yè)的萬個飛輪。

文心4.0的飛輪轉(zhuǎn)動,中國智能化的飛輪轟鳴。

大模型的列車,正疾馳在智能中國的鐵軌上。去下一站,去更遠的一站,去星辰大海之間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269065
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2269

    瀏覽量

    90391
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    124

    瀏覽量

    1279
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2448

    瀏覽量

    2701
收藏 人收藏

    評論

    相關(guān)推薦

    模力無限,星河共創(chuàng):啟明云端與您共赴模型生態(tài)大會

    在人工智能的浪潮中,我們即將迎來一場科技界的盛會——模型生態(tài)大會。這場將于12月26日在上?!埥茖W(xué)會堂舉行的大會,由深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主辦,百度飛槳及
    的頭像 發(fā)表于 12-24 18:01 ?525次閱讀
    模力無限,星河共創(chuàng):啟明云端與您共赴<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>生態(tài)大會

    天工大模型4.0 O1版即將啟動邀測

    昆侖萬維公司近日宣布,其自主研發(fā)的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動邀請測試。這款模型是國內(nèi)首款具備中文邏輯推理能力的O1
    的頭像 發(fā)表于 11-18 15:08 ?572次閱讀

    百度模型日均調(diào)用量超15億

    近日,百度在上海世博中心舉辦了主題為“應(yīng)用來了”的百度世界2024大會。會上,百度董事長李彥宏分享了關(guān)于大模型行業(yè)的最新動態(tài)和百度模型的顯著進展。
    的頭像 發(fā)表于 11-12 15:28 ?286次閱讀

    李彥宏宣布:百度模型日調(diào)用量超15億

    在百度世界2024大會上,百度公司創(chuàng)始人李彥宏宣布了一項令人矚目的數(shù)據(jù):百度模型的日調(diào)用量已經(jīng)超過15億次。這一數(shù)據(jù)不僅彰顯了百度在人工智能領(lǐng)域的領(lǐng)先地位,也預(yù)示著人工智能技術(shù)的廣泛應(yīng)用
    的頭像 發(fā)表于 11-12 10:40 ?209次閱讀

    【附實操視頻】聆思CSK6大模型開發(fā)板接入國內(nèi)主流大模型(星火大模型、一言、豆包、kimi、智譜glm、通義千問)

    接入一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不一樣,調(diào)試驗證會浪費很多時間。因此本篇以聆思CSK6大模型開發(fā)板接入為例,分享具體的接入步驟
    發(fā)表于 08-22 10:12

    模型時代的算力需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算力,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    百度模型4.0免費了 百度心智能體平臺免費開放模型4.0

    據(jù)悉;7月5日起 百度心智能體平臺(AgentBuilder) 免費開放模型4.0。 開發(fā)者在
    的頭像 發(fā)表于 07-06 17:12 ?1227次閱讀

    百度發(fā)布模型4.0 Turbo與飛槳框架3.0,引領(lǐng)AI技術(shù)新篇章

    SUMMIT深度學(xué)習(xí)開發(fā)者大會2024上,向世界展示了百度在AI領(lǐng)域的最新成果——模型4.0 Turbo和飛槳框架3.0,并詳細披露了飛槳
    的頭像 發(fā)表于 06-29 16:03 ?636次閱讀

    百度模型4.0 Turbo,正式發(fā)布 用戶規(guī)模已達3億

    的最新數(shù)據(jù),并正式發(fā)布模型4.0 Turbo、飛槳框架3.0等最新技術(shù),披露飛槳生態(tài)最
    的頭像 發(fā)表于 06-29 10:06 ?865次閱讀

    百度WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會,模型4.0 Turbo震撼發(fā)布

    及應(yīng)用國家工程研究中心主任王海峰正式發(fā)布了模型4.0 Turbo,標志著百度在人工智能領(lǐng)域的又一重大突破。
    的頭像 發(fā)表于 06-28 16:30 ?479次閱讀

    百度預(yù)計2025年下半年推出文模型5.0版本

    根據(jù)李彥宏去年十月份的披露,模型4.0在發(fā)布后已經(jīng)在性能方面全面超越了GPT-4。據(jù)已知信息,百度世界大會通常在每年下半年舉行,據(jù)此推測,
    的頭像 發(fā)表于 05-29 11:27 ?520次閱讀

    全球首款基于模型的學(xué)習(xí)機—小度學(xué)習(xí)機Z30重磅發(fā)布

    AI時代,大模型成為推動智能教育升維發(fā)展的新質(zhì)生產(chǎn)力。5月27日小度科技召開新品發(fā)布會,全球首款基于模型的學(xué)習(xí)機——小度學(xué)習(xí)機Z30重
    的頭像 發(fā)表于 05-28 09:30 ?655次閱讀

    百度模型擴展合作領(lǐng)域

    百度創(chuàng)始人兼CEO李彥宏在2024年第一季度財報電話會上宣布,模型API在繼與中國三星、榮耀成功合作后,本季度再度實現(xiàn)重要突破。小米、OPPO、vivo等主流手機廠商已全面接入
    的頭像 發(fā)表于 05-17 11:17 ?564次閱讀

    李彥宏:開源模型將逐漸滯后,模型提升訓(xùn)練與推理效率

    李彥宏解釋道,百度自研的基礎(chǔ)模型—— 4.0,能夠根據(jù)需求塑造出適應(yīng)各類場景的微型版模型,并支持精細調(diào)整以及后預(yù)訓(xùn)練。相較于直接使用開源
    的頭像 發(fā)表于 04-16 14:37 ?445次閱讀

    優(yōu)必選宣布人形機器人Walker S接入百度模型

    優(yōu)必選宣布人形機器人Walker S接入百度模型,共同探索中國AI大模型+人形機器人的應(yīng)用。
    的頭像 發(fā)表于 04-07 10:17 ?918次閱讀