作者:小巖
編輯:白云朵朵
正所謂一波未平,一波又起。
OpenAI的宮斗大戲在歷經(jīng)幾次反轉(zhuǎn)后終于落下帷幕。就在看客們認為OpenAI終于要偃旗息鼓,回歸平靜時,新的一場風(fēng)波迫不及待的開始了。
根據(jù)路透社曝光,就在SamAltman被解雇之前,幾位研究人員曾給董事會寄出一封警告信。這封警告信的內(nèi)容,很可能是引起整個事件的真正導(dǎo)火索。警告信中表示,內(nèi)部名為Q*(發(fā)音為的QStar)的下一代AI模型,發(fā)展的過于強大過于先進,到底有多強大和先進呢?大概是到了可以威脅人類的地步。
而Q*的主導(dǎo)人,正是OpenAI的首席科學(xué)家Ilya Sutskeve,也是其宮斗大戲中,始終處于風(fēng)口浪尖上的人物。
大家很自然的就把這一切與OpenAI前幾天的“兵變”串聯(lián)在了一起,不禁發(fā)現(xiàn),這是一場分外精彩的大戲。
新模型Q*,究竟是什么?
截至目前,OpenAI官方還沒有關(guān)于Q*的詳細信息,我們先嘗試根據(jù)網(wǎng)上的信息,拼湊了解一下,究竟什么是Q*。
Q*,也叫QStar。需要說明的是,雖然在深度學(xué)習(xí)的領(lǐng)域,區(qū)塊之間通過乘積來求解,但在Q*這里并非如此,它只是代表“star”。
在AI領(lǐng)域,與Q相關(guān)的,本質(zhì)上都是Q學(xué)習(xí)(QLearning)。Q學(xué)習(xí)這一基本概念最早誕生于1989年。2013年,DeepMind曾經(jīng)通過改進Q學(xué)習(xí)的方式,推出過一個叫做深度Q學(xué)習(xí)的算法。深度Q學(xué)習(xí)最鮮明的特點就是使用經(jīng)歷回放,即從過去多個結(jié)果中進行采樣,再使用Q學(xué)習(xí),進而達到提高模型的穩(wěn)定性的作用,降低模型因為某一次結(jié)果導(dǎo)致訓(xùn)練方向過于發(fā)散的風(fēng)險。
一直以來,Q學(xué)習(xí)的研究都沒有太突出的成果,所以這個概念相對小眾。但Q學(xué)習(xí)起到了一個極其重要的作用——開發(fā)出了DQN。DQN是指深度Q網(wǎng)絡(luò),誕生于深度Q學(xué)習(xí)。DQN的思路和Q學(xué)習(xí)是一模一樣的,但是在求得Q學(xué)習(xí)中最大獎勵值的過程,是用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)的。這一下子就顯得與眾不同了。
以上我們所解釋的是“Q”代表的含義,那其中的“*”又意味著什么呢?
由于OpenAI沒有官方解釋,大家只能對此進行推測。但很多業(yè)內(nèi)專業(yè)人士認為,“*”代表的是A*算法。所謂A*算法的運行原理,是先通過啟發(fā)式算法(也就是估值),估算一個大概的值,當(dāng)然這個值很有可能極其偏離正解。估算完成后就會開始循環(huán)遍歷,如果怎么都沒辦法求解那就重新估值,直到開始出現(xiàn)解。如此反復(fù),最終得出最佳解。這種算法耗時較長,只能在實驗室環(huán)境進行操作。
通過以上的說明,想必大家對“Q”和“*”都有了初步的了解。根據(jù)AI圈的共識,OpenAI的Q*最有可能的樣子,就是利用Q學(xué)習(xí)快速找到接近最優(yōu)解的估值,再利用A*算法在小范圍內(nèi)求解,從而省去大量沒有意義的計算過程,以此達到快速求得最佳解的效果。
出其不意的Q*,是否會過于強大,威脅人類?
對于出其不意的Q*,大家關(guān)注的點基本一致:它的研發(fā)進行到哪一步了?是否會威脅到人類?
之所以有這樣的擔(dān)憂,是因為大家把Q*的推出與SamAltman此前在APEC峰會上的發(fā)言聯(lián)系在了一起。彼時,Altman表示,“OpenAI歷史上已經(jīng)有過4次,最近1次就是在過去幾周,當(dāng)我們推開無知之幕并抵達探索發(fā)現(xiàn)的前沿時,我就在房間里,這是職業(yè)生涯中的最高榮譽”。很多人認為,“最近的一次”,指的就是Q*。
而Ilya Sutskeve,也曾在幾周前的一次采訪中表示,“不談太多細節(jié),只想說數(shù)據(jù)限制是可以被克服,進步仍可以繼續(xù)”。
通過以上的信息,有人分析Q*目前至少具備兩個核心特性。一是突破了人類數(shù)據(jù)的限制,可以自己生產(chǎn)海量數(shù)據(jù);二是擁有了自主學(xué)習(xí)和自我改進的能力。特別是第2點,被認為很有可能對人類造成威脅。
但對此,一些業(yè)內(nèi)專業(yè)人士給予了不同的意見。Meta首席人工智能科學(xué)家楊立坤(Yann LeCun)就認為,Q*是OpenAI的一次規(guī)劃性嘗試,并不意味著它已經(jīng)取得了某些突破。諸如FAIR,DeepMind,OpenAI一類的頂級實驗室其實早早就對此有了研究。這不是什么新鮮的新聞,這看上去更像是在炒冷飯。
由此我們不難發(fā)現(xiàn),相較于Q*目前取得的進展,此次事件所帶給OpenAI的輿情影響力,似乎更大。
“人工智能是否會對人類構(gòu)成生存風(fēng)險”——這個問題始終值得警惕。
對于炒作和八卦,我們大可以一笑置之,但嚴峻的現(xiàn)實不容忽慮:不定期出現(xiàn)的炒作會讓大家降低對AI的警惕心理,會分散人們對AI可能造成的,AI已經(jīng)造成的問題的注意力。
AI是否會對人類構(gòu)成生存風(fēng)險,這將是一把始終懸在人類頭頂?shù)倪_摩克利斯之劍。不僅OpenAI這一類的專業(yè)公司需要警惕“人工智能暴動”,全人類都應(yīng)該對此保持清醒。譬如OpenAI 的董事會設(shè)計了“內(nèi)部終止開關(guān)和治理機制”,以防止推出有害技術(shù)。再比如歐盟即將敲定全面的《人工智能法案》。目前立法者之間最大的爭論之一是,是否要賦予科技公司更多的權(quán)力,讓它們自行監(jiān)管尖端的人工智能模型。
一旦我們允許AI系統(tǒng)設(shè)定自己的目標,并開始以某種方式與真實的物理或數(shù)字世界對接,很可能會出現(xiàn)安全問題。炒作永遠都不會缺席,商業(yè)性質(zhì)的公司永遠會將“優(yōu)先考慮自身利益”作為首要目標。在這種情況下,我們更需要擁有透過現(xiàn)象看本質(zhì)的能力,了解AI,重視AI,警惕AI。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
31259瀏覽量
269615 -
OpenAI
+關(guān)注
關(guān)注
9文章
1103瀏覽量
6597
發(fā)布評論請先 登錄
相關(guān)推薦
評論