【導(dǎo)讀】谷歌DeepMind CEO Hassabis全新爆料:全新Gemini模型將結(jié)合進(jìn)AlphaGo和大語言模型,成本預(yù)計是數(shù)千萬美元,甚至數(shù)億。
谷歌,是真的破釜沉舟了。
傳說中合并了AlphaGo和類GPT-4大模型的Gemini,終于要來了嗎?
一個是用強(qiáng)化學(xué)習(xí)擊敗人類圍棋冠軍、創(chuàng)造歷史的AI系統(tǒng),一個是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強(qiáng)多模態(tài)大模型,兩個AI一合體,簡直要無敵了!
谷歌DeepMind CEO Hassabis近日對外媒Wired表示,Gemini還在開發(fā)中,還需要幾個月,而谷歌DeepMind已經(jīng)準(zhǔn)備砸進(jìn)數(shù)千萬美元,甚至數(shù)億。
此前,Sam Altman曾透露,創(chuàng)建GPT-4的成本超過了1億美元。谷歌DeepMind,當(dāng)然也不能輸。
太長不看版
Gemini會將AlphaGo與GPT-4等大模型的語言功能合并,系統(tǒng)解決問題和規(guī)劃的能力將大大增強(qiáng)。
Gemini是一個大語言模型,類似于 GPT-4
預(yù)計花費(fèi)數(shù)千萬到數(shù)億美元,與開發(fā)GPT-4的成本相當(dāng)
除了AlphaGo,還會有別的創(chuàng)新
Gemini會整合使用了強(qiáng)化學(xué)習(xí)和樹搜索的AlphaGO。
強(qiáng)化學(xué)習(xí)允許AI通過從反復(fù)嘗試和反饋中學(xué)習(xí),解決挑戰(zhàn)性難題
樹搜索方法有助于探索和記住場景中可能的移動,比如在游戲場景中
DeepMind在強(qiáng)化學(xué)習(xí)方面的豐富經(jīng)驗(yàn),會為Gemini帶來嶄新功能。
其他領(lǐng)域技術(shù)(如機(jī)器人和神經(jīng)科學(xué))也會整合到Gemini中
下一個算法,要超越ChatGPT
根據(jù)OpenAI CEO Sam Altman的說法,GPT-5距離發(fā)布尚有時日,至少6個月內(nèi)不會開始訓(xùn)練。而Gemini的發(fā)布時間尚未確定,可能在幾個月之內(nèi)。
尚在開發(fā)中的Gemini,也是一個處理文本的大語言模型,性質(zhì)上和GPT-4類似。 但谷歌DeepMind CEO Demis Hassabis表示,Gemini會結(jié)合進(jìn)AlphaGo中使用的技術(shù),這將賦予系統(tǒng)全新的規(guī)劃、解決問題的能力。 2016年,AlphaGo擊敗圍棋世界冠軍李世石的那一幕,如今依然歷歷在目。 Hassabis表示,「可以這么說,Gemini把AlphaGo系統(tǒng)的一些優(yōu)勢,和大語言模型驚人的語言能力結(jié)合在一起了。并且,我們還有一些其他有趣的創(chuàng)新?!?據(jù)說,Gemini具有以前模型中沒有的多模態(tài)功能,在集成工具和API方面非常高效。而且,Gemini將提供多種規(guī)模,旨在支持未來內(nèi)存和規(guī)劃上的創(chuàng)新。 在三月份,曾經(jīng)有這樣一個說法:Gemini會像GPT-4一樣,具有一萬億個參數(shù)。而且,據(jù)說Gemini將使用數(shù)以萬計的谷歌TPU AI芯片進(jìn)行訓(xùn)練。 在上個月的谷歌開發(fā)者I/O大會上,谷歌就曾提到,從一開始,Gemini的目標(biāo)就是多模態(tài)、高效集成工具、API。 而當(dāng)時谷歌的預(yù)告是:「雖然還在早期,但我們已經(jīng)在Gemini中,看到了在之前的模型中從未見過的多模態(tài)能力,這讓人印象太深刻了?!?AlphaGo背后的技術(shù),就是強(qiáng)化學(xué)習(xí),這是DeepMind首創(chuàng)的技術(shù)。
RL代理隨著時間的推移與環(huán)境交互,通過反復(fù)試驗(yàn)來學(xué)習(xí)策略,從而最大限度地提高長期累積獎勵
通過強(qiáng)化學(xué)習(xí),AI能夠通過反復(fù)嘗試和接受反饋來調(diào)整自己的表現(xiàn),因而學(xué)會處理很棘手的問題,比如在圍棋或電子游戲中選擇如何采取下一步行動。 另外,AlphaGo還使用了蒙特卡洛樹搜索(MCTS)方法,來探索和記住棋盤上所有可能的動作。
這已經(jīng)不是Hassabis第一次攪動起科技巨頭的大規(guī)模人工智能淘金熱了。 2014年,DeepMind使用強(qiáng)化學(xué)習(xí),讓AI學(xué)會了玩簡單的視頻游戲,這一成果驚為天人,直接讓DeepMind被谷歌收購。 谷歌的注果然押對了。 接下來幾年,DeepMind隔一段時間就產(chǎn)出一個驚艷全世界的成果。
深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)正在解決許多經(jīng)典的人工智能問題,例如邏輯、推理和知識表示 2016年,石破天驚的AlphaGo,直接點(diǎn)燃了深度學(xué)習(xí)和第一輪AI產(chǎn)業(yè)的熱潮。 2017年,AlphaGo Zero沒有使用人類數(shù)據(jù),就迅速超越了AlphaGo。
AlphaGo Zero 2020年,AlphaFold對于蛋白質(zhì)結(jié)構(gòu)的預(yù)測與實(shí)驗(yàn)室技術(shù)相當(dāng),基本解決了蛋白質(zhì)的折疊問題。 今年6月,AlphaDev創(chuàng)造全新的排序算法,或?qū)氐赘淖冇嬎銠C(jī)科學(xué)的效率和成果。 相比OpenAI更通用的路線,DeepMind多年來深耕垂直領(lǐng)域。 語言模型的下一個重大飛躍在哪里?Gemini或許指引了下一代語言模型的方向。
背水一戰(zhàn)
很明顯,Gemini是谷歌的背水一戰(zhàn)。
谷歌開創(chuàng)的許多技術(shù),比如Transformer架構(gòu),讓最近的AI洪流成為可能。 因?yàn)閷τ诩夹g(shù)的開發(fā)和部署太過謹(jǐn)慎,在ChatGPT和其他生成式AI構(gòu)成的競爭面前,它反而顯得暫時落后。 為了對打ChatGPT,谷歌連續(xù)拋出多個動作,比如推出Bard,并且將生成式AI集成到搜索引擎和其他產(chǎn)品中。 為了集中力量辦大事,在4月,谷歌干脆把Hassabis的DeepMind和谷歌的主要人工智能實(shí)驗(yàn)室谷歌大腦合并,合體為谷歌DeepMind。 對于合體后的全新團(tuán)隊,Haasabis顯然非常自信。他表示,全新的團(tuán)隊匯集了兩股對最近的人工智能進(jìn)步至關(guān)重要的力量。 「如果你看看我們在人工領(lǐng)域的位置,你會相信,未來80%或90%的創(chuàng)新,就會來自其中一個團(tuán)隊。在過去十年里,兩個團(tuán)隊都做出了極其出色的成果。」
新的想法
訓(xùn)練像OpenAI的GPT-4這樣的大型語言模型,需要將來自書籍、網(wǎng)頁和其他來源的大量精選數(shù)據(jù)集的輸入「Transformer」中。
Transformer使用訓(xùn)練數(shù)據(jù)中的模式來熟練預(yù)測后續(xù)文本中應(yīng)該出現(xiàn)的每一個字母和單詞。 這種看似簡單的機(jī)制,卻在回答問題和生成文本或代碼方面非常強(qiáng)大。 但這個看似簡單的技術(shù)原理也被很多行業(yè)大佬或者人工智能專家們詬病。
馬斯克:目前AI技術(shù)的本質(zhì)就是統(tǒng)計學(xué) LeCun:現(xiàn)在的AI的智能水平還不如狗 OpenAI在GPT系列模型上的突破,就是在Transformer的核心技術(shù)之上,很激進(jìn)地采用了RLHF來強(qiáng)化模型的能力。 而DeepMind在強(qiáng)化學(xué)習(xí)方面同樣有非常豐富的經(jīng)驗(yàn)。 這就讓人有非常充足的理由期待Gemini在未來可能會展現(xiàn)出來的創(chuàng)新能力。 更加關(guān)鍵的是,Hassabis和他的團(tuán)隊也會試圖用人工智能其他領(lǐng)域的核心技術(shù)來增強(qiáng)大型語言模型的能力。 DeepMind的技術(shù)積累非常廣泛。 從機(jī)器人技術(shù)到到神經(jīng)科學(xué),他們武器庫里有各種各樣的裝備可供他們挑選。 比如像LeCun這樣的AI大佬就表示,Transformer將語言模型的能力過度限制在了文本的范圍之內(nèi)。 像人類和動物?樣,從世界的物理經(jīng)驗(yàn)中學(xué)習(xí)可能才是發(fā)展人工智能的最優(yōu)解。 也許在Gemini身上,人工智能將展示出其他方向的潛力。
不確定的未來
Hassabis的任務(wù)是加速谷歌的人工智能技術(shù)的發(fā)展,同時管理未知和潛在的嚴(yán)重的風(fēng)險險。
大語言模型的飛速進(jìn)步讓許多人工智能專家開始擔(dān)心這項技術(shù)是否會打開潘多拉的魔盒,讓人類社會付出無法接受的代價。 Hassabis表示,人工智能可能給人類社會帶來的收益不可估量。 人類必須要持續(xù)發(fā)展這項技術(shù)。 強(qiáng)制暫停發(fā)展AI技術(shù)完全沒有可操作性。 但是這并不意味著Hassabis和他領(lǐng)導(dǎo)的DeepMind會不計后果地推進(jìn)技術(shù)的發(fā)展。 畢竟,谷歌和DeepMind之所以把AI技術(shù)的領(lǐng)袖位置拱手讓給OpenAI。 很大一部分原因就是對待AI發(fā)展采用了「過于負(fù)責(zé)任」的態(tài)度。
網(wǎng)友:不看好
但是對于未來Gemini的發(fā)布,因?yàn)榭紤]到之前谷歌保守的態(tài)度,大部分網(wǎng)友似乎都不太看好。
你們覺得這個類似于AGI的模型會在什么時候發(fā)布呢?
我賭10塊谷歌永遠(yuǎn)不會發(fā)布這個東西。
如果有人關(guān)注過谷歌的項目的話,就會發(fā)現(xiàn),他們一般都是先吹一陣牛,然后什么也不發(fā)布,一年后再把這個項目給砍了。 不過,對于谷歌在目前大語言模型中做的貢獻(xiàn),網(wǎng)友還是很認(rèn)可的。
網(wǎng)友A:OpenAI用的大語言模型技術(shù)基本都是谷歌發(fā)明的 網(wǎng)友B:是的,不過特斯拉發(fā)不了財,但是愛迪生可以。
這位網(wǎng)友就很看好DeepMind將利用自己在強(qiáng)化學(xué)習(xí)方面的經(jīng)驗(yàn)?zāi)茉诖笳Z言模型上產(chǎn)生的突破。 不過他依然認(rèn)為可能谷歌只會用改進(jìn)自己現(xiàn)有產(chǎn)品的思路來推進(jìn)這個技術(shù),而不是推出全新的產(chǎn)品。
-
語言模型
+關(guān)注
關(guān)注
0文章
535瀏覽量
10306 -
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
268瀏覽量
11275 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
10901
原文標(biāo)題:碾壓GPT-4!谷歌DeepMind CEO自曝:下一代大模型將與AlphaGo合體
文章出處:【微信號:CloudBrain-TT,微信公眾號:云腦智庫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論