国产精品福利在线观看秒播,黄片视频在线观看,久久天天丁香婷婷中文字幕

人工智能的學(xué)習(xí)總是需要大量數(shù)據(jù)的“喂養(yǎng)”。可是這數(shù)據(jù)要喂多少才是個頭呢？有沒有什么辦法能在少喂數(shù)據(jù)的同時，不影響AI的學(xué)習(xí)能力呢？或者直接把一些學(xué)習(xí)法則交給AI，讓它們舉一反三？谷歌和亞馬遜的研究人員近來就在琢磨這件事。

谷歌AI：背著有限的數(shù)據(jù)去探索新環(huán)境

來自卡耐基梅隆大學(xué)、谷歌和斯坦福大學(xué)的研究人員近日在一篇論文中寫道，他們開發(fā)出了一種“弱監(jiān)督”的人工智能訓(xùn)練框架。該模型會給機(jī)器人大量有限的、不精確的、或者是有噪聲的數(shù)據(jù)，讓它們通過數(shù)據(jù)學(xué)習(xí)，更好地探索一些極具挑戰(zhàn)性的環(huán)境。值得一提的是，研究人員“喂”給機(jī)器人的數(shù)據(jù)其實(shí)并不“完整”，機(jī)器人所得到的只是與它們所處的周圍環(huán)境直接相關(guān)的數(shù)據(jù)。然而出人意料的是，這套相對較少的數(shù)據(jù)反而提升了機(jī)器人操作任務(wù)的訓(xùn)練效率。

這個名叫“弱監(jiān)督控制”（Weakly－Supervised Control，后文簡稱為WSC）的框架可以對語料庫進(jìn)行學(xué)習(xí)；在學(xué)習(xí)過程中，智能代理（intelligent agents）可以生成自己的目標(biāo)并執(zhí)行探索任務(wù)。

從形式上看，該框架整合了“強(qiáng)化學(xué)習(xí)機(jī)制”（一種通過獎勵來激勵完成目標(biāo)的訓(xùn)練形式）。但不同的是，傳統(tǒng)的強(qiáng)化學(xué)習(xí)需要研究人員手動設(shè)計(jì)獎勵，智能代理獲取獎勵的計(jì)算成本很高；與之相比，WSC構(gòu)建的這種弱監(jiān)督學(xué)習(xí)機(jī)制是一種能隨著智能代理數(shù)據(jù)收集的進(jìn)度而自行伸縮擴(kuò)展的監(jiān)督方式。換句話說，該模型給代理們提出的獎勵目標(biāo)是基于它們的學(xué)習(xí)能力和進(jìn)度的。這樣不僅有利于智能代理的學(xué)習(xí)，對于研究人員來說，他們也不必在智能代理的強(qiáng)化學(xué)習(xí)循環(huán)中不斷增加新標(biāo)簽了。

譯者注：在人工智能領(lǐng)域，智能代理／智能主體指的是一個能夠觀察周遭環(huán)境并為實(shí)現(xiàn)具體目標(biāo)而付出一系列行動的自主實(shí)體。它通常是以軟件程序的形式出現(xiàn)的。

在實(shí)驗(yàn)中，研究人員試圖確定弱監(jiān)督機(jī)制對學(xué)習(xí)一個解纏表現(xiàn)（disentangled state representation）是否足夠必要。他們給幾個模型布置了不同復(fù)雜度、基于視覺、以目標(biāo)為條件的模擬操作任務(wù)。在一個環(huán)境中，智能代理的任務(wù)是將特定的對象移動到目標(biāo)位置；而在另一個環(huán)境中，代理必須打開一扇門，并讓門開的角度符合任務(wù)要求。

論文作者表示，WSC比此前最先進(jìn)的目標(biāo)導(dǎo)向式強(qiáng)化學(xué)習(xí)機(jī)制的學(xué)習(xí)速度還要快。特別是當(dāng)研究人員不斷提升智能代理所處環(huán)境復(fù)雜性的時候，這種學(xué)習(xí)速度上的優(yōu)勢表現(xiàn)的格外明顯。另外，研究人員還指出，對比智能代理的預(yù)設(shè)目標(biāo)和其達(dá)成目標(biāo)后的最終形態(tài)，WSC的智能代理呈現(xiàn)出了更高的一致性。這表明，代理們通過該機(jī)制學(xué)到的是可釋性更強(qiáng)的目標(biāo)達(dá)成策略。

不過研究人員也承認(rèn)，WSC并非沒有局限性。它需要使用者給智能代理們標(biāo)出各種與下游任務(wù)直接相關(guān)的各種要素，這就對使用者的專業(yè)知識提出了較高要求。此外，專家們還指出，他們目前的實(shí)驗(yàn)都是在預(yù)訓(xùn)練階段完成的，這個階段生成的內(nèi)容其實(shí)并不一定來自代理們與機(jī)制中的新要素所產(chǎn)生的互動結(jié)果。基于此，他們下一步的工作就是要細(xì)致研究弱監(jiān)督機(jī)制的其他形式，看看它們能否給智能代理們提供新的有益信息。

“目前在實(shí)驗(yàn)中的復(fù)雜環(huán)境里，WSC已經(jīng)呈現(xiàn)出了令人欣喜的成果。我們有理由相信，未來若能給真實(shí)環(huán)境下的機(jī)器人也應(yīng)用這種機(jī)制，效果會更為喜人?！闭撐牡暮现邆儗懙溃昂喲灾?，我們相信，這個新框架提供了一個監(jiān)督通用目標(biāo)學(xué)習(xí)機(jī)制在復(fù)雜環(huán)境下進(jìn)行應(yīng)用實(shí)踐的新視角。”

亞馬遜AI：用元學(xué)習(xí)機(jī)制來學(xué)會“舉一反三”

從上面的技術(shù)原理來看，谷歌的專家們有點(diǎn)像商人，他們的經(jīng)營思路是要在降低成本的同時，不影響產(chǎn)品（也就是AI的學(xué)習(xí)能力）的質(zhì)量和性能。與之相比，亞馬遜的研究人員更像是個老師，他們致力于“授人以漁”，讓AI學(xué)會舉一反三的能力。

在即將到來的ICLR上，亞馬遜的研究人員將提交一份關(guān)于元學(xué)習(xí)任務(wù)（meta－learning tasks）如何大幅提升AI學(xué)習(xí)能力的論文。

所謂元學(xué)習(xí)任務(wù)，即是一種能讓AI在完成相關(guān)目標(biāo)的同時，還能引導(dǎo)其學(xué)會如何更好的進(jìn)行學(xué)習(xí)的任務(wù)模式。亞馬遜的研究者聲稱，他們研發(fā)的這種任務(wù)模式資源消耗很?。褐恍枭贁?shù)幾個標(biāo)簽訓(xùn)練模板就能讓AI“舉一反三”，完成好一個個新任務(wù)。

在傳統(tǒng)的機(jī)器學(xué)習(xí)過程中，模型先是吸納一系列標(biāo)記數(shù)據(jù)（支持集，support set），學(xué)習(xí)如何把標(biāo)記數(shù)據(jù)與特征標(biāo)簽（labels）關(guān)聯(lián)起來；而后，研究人員再喂給模型一些測試數(shù)據(jù)（測試集，query set），看看它能否根據(jù)此前學(xué)到的特征標(biāo)簽來厘清這些新數(shù)據(jù)。

與此種方式相反，在元學(xué)習(xí)機(jī)制下，AI模型要同時運(yùn)用自身訓(xùn)練數(shù)據(jù)和研究人員給出的測試數(shù)據(jù)集來完成任務(wù)。在此過程中，模型還可以對兩套數(shù)據(jù)進(jìn)行比對。這樣一來，AI在完成任務(wù)的同時，也能看得到自身對訓(xùn)練數(shù)據(jù)的反應(yīng)是如何影響其在測試數(shù)據(jù)上的表現(xiàn)的。

而在第二階段，也就是所謂的元測試階段（meta testing），模型要完成的測試任務(wù)與自己此前做的元學(xué)習(xí)任務(wù)有明顯的關(guān)聯(lián)，卻又并不完全相同。和之前的方法相似，在執(zhí)行每個新任務(wù)的過程中，模型還是能同時看到訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)，但這一次，特征標(biāo)簽都是未知的，AI必須通過此前的學(xué)習(xí)與自己得到的數(shù)據(jù)來進(jìn)行判斷，正確找出數(shù)據(jù)與標(biāo)簽的關(guān)聯(lián)性。

在元訓(xùn)練過程中，研究人員所采用的技術(shù)并不需要學(xué)習(xí)一個完整的全局模型。他們的做法是訓(xùn)練一個輔助模型，再通過它為每一個任務(wù)生成本地模型，并同時確定其所對應(yīng)的支持集。

在完成上述工作后，他們又準(zhǔn)備了一個輔助網(wǎng)絡(luò)，目的是充分利用測試集里的未標(biāo)記數(shù)據(jù)。這樣到了元測試階段，研究人員就可以用測試集來對前文提到的本地模型進(jìn)行微調(diào)了。

按照該團(tuán)隊(duì)的說法，他們的系統(tǒng)通過一次任務(wù)學(xué)習(xí)就達(dá)到了16基線（baselines）。更具體的說，其所應(yīng)用的新機(jī)制提高了AI從一個標(biāo)記的示例出發(fā)，去學(xué)習(xí)一個新對象分類任務(wù)的性能。根據(jù)底層AI模型體系結(jié)構(gòu)的不同，這種提升幅度在11％和16％之間。

關(guān)于這項(xiàng)技術(shù)，Alexa Shopping 應(yīng)用科學(xué)家巴勃羅·加西亞（Pablo Garcia）還在一篇博客中進(jìn)行了介紹：

“過去10年，深度學(xué)習(xí)系統(tǒng)已經(jīng)在很多人工智能任務(wù)中取得了非同凡響的巨大成功。但在具體應(yīng)用層面，其發(fā)揮空間一直比較有限。元學(xué)習(xí)機(jī)制有望讓機(jī)器學(xué)習(xí)系統(tǒng)訓(xùn)練成‘多面手’……該機(jī)制的主體思路是讓系統(tǒng)能通過少量標(biāo)簽訓(xùn)練示例就能完成一個個新任務(wù)。很明顯，如果進(jìn)展順利，元學(xué)習(xí)將大幅縮減勞動密集型數(shù)據(jù)注釋工作的需求?！?/p>

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6217

瀏覽量
106979
AI

AI

+關(guān)注

關(guān)注
87

文章
33263

瀏覽量
273556
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2687

瀏覽量
84246

首創(chuàng)開源架構(gòu)，天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

科正將AI能力體系化并賦能終端生態(tài)。大會上，聯(lián)發(fā)科定義了“智能體化用戶體驗(yàn)”的五大特征：主動及時、知你懂你、互動協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個

發(fā)表于 04-13 19:52

《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個視頻應(yīng)用。AI Agent是一種智能應(yīng)用，能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)。通?；谏疃?/div>

發(fā)表于 03-05 19:52

聚云科技獲亞馬遜云科技生成式AI能力認(rèn)證

近日，云管理服務(wù)提供商聚云科技成功獲得亞馬遜云科技生成式AI能力認(rèn)證。此次認(rèn)證標(biāo)志著聚云科技在利用亞馬遜云科技全托管的生成式AI服務(wù)方面取得了顯著成就，特別是在Amazon Bedro

發(fā)表于 02-19 10:33 ?284次閱讀

聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證

助力企業(yè)加速生成式AI應(yīng)用落地北京2025年2月14日?/美通社/ -- 云管理服務(wù)提供商聚云科技獲得亞馬遜云科技生成式AI能力認(rèn)證，利用亞馬遜云科技全托管的生成式

發(fā)表于 02-14 16:07 ?253次閱讀

谷歌Gemini AI目標(biāo)年底用戶達(dá)5億

即將在AI市場掀起新的波瀾。據(jù)悉，谷歌的目標(biāo)是在今年年底前，讓全球有5億人使用基于Gemini AI技術(shù)構(gòu)建的聊天機(jī)器人。然而，目前谷歌尚

發(fā)表于 01-18 11:30 ?744次閱讀

谷歌加速AI部門整合：AI Studio團(tuán)隊(duì)并入DeepMind

近日，谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露，谷歌

發(fā)表于 01-13 14:40 ?509次閱讀

亞馬遜云科技AI Networking解決方案回顧

前一段時間的2024 re:Invent 大會中，亞馬遜云科技可謂是重磅連連，發(fā)布了全套最新AI networking基礎(chǔ)設(shè)施方案。

發(fā)表于 12-27 11:25 ?713次閱讀

亞馬遜轉(zhuǎn)向Trainium芯片，全力投入AI模型訓(xùn)練

近日，亞馬遜宣布了一項(xiàng)重大決策，決定停止Inferentia AI芯片的開發(fā)，轉(zhuǎn)而將全部精力投入到Trainium芯片的研發(fā)上，以此作為與英偉達(dá)競爭的新策略。自2018年進(jìn)軍AI芯片領(lǐng)域以來

發(fā)表于 12-13 14:14 ?494次閱讀

如何訓(xùn)練自己的AI大模型

訓(xùn)練自己的AI大模型是一個復(fù)雜且耗時的過程，涉及多個關(guān)鍵步驟。以下是一個詳細(xì)的訓(xùn)練流程：一、明確需求和目標(biāo) 首先，需要明確自己的需求和目標(biāo)。不同的任務(wù)和應(yīng)用領(lǐng)域需要不同類型的AI模型

發(fā)表于 10-23 15:07 ?4357次閱讀

GE醫(yī)療與亞馬遜云科技達(dá)成戰(zhàn)略合作，通過生成式AI加速醫(yī)療健康領(lǐng)域轉(zhuǎn)型

GE醫(yī)療已選擇亞馬遜云科技作為其戰(zhàn)略云服務(wù)合作伙伴，致力于推出全新的定制化基礎(chǔ)模型，加速創(chuàng)新醫(yī)療應(yīng)用快速開發(fā)。 ? GE醫(yī)療將利用亞馬遜云科技的機(jī)器學(xué)習(xí)和生成式AI技術(shù)，訓(xùn)練和部署臨床

發(fā)表于 08-29 16:38 ?345次閱讀

亞馬遜云攜手AI新創(chuàng)企業(yè)Hugging Face，提升AI模型在定制芯片計(jì)算性能

Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開發(fā)者分享Chatbot和相關(guān)軟件的核心平臺，受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。

發(fā)表于 05-23 14:24 ?538次閱讀

榮耀新品將搭載谷歌AI功能，提升生成式AI體驗(yàn)

榮耀于5月22日宣布，將在新款智能手機(jī)上集成谷歌的AI功能，實(shí)現(xiàn)生成式AI體驗(yàn)。此外，新機(jī)還將得到谷歌云服務(wù)的支持。

發(fā)表于 05-23 08:51 ?639次閱讀

亞馬遜、Meta等科技巨頭同時投資AI創(chuàng)企Scale AI

在OpenAI的ChatGPT引領(lǐng)下，人工智能領(lǐng)域掀起新浪潮。谷歌、亞馬遜、Meta等科技巨頭紛紛加大在生成式人工智能和大模型研發(fā)上的投入，并積極投資人工智能初創(chuàng)公司。亞馬遜對Anthropic的投資高達(dá)40億美元，微軟則投資了

發(fā)表于 05-22 14:33 ?570次閱讀

谷歌發(fā)布多模態(tài)AI新品，加劇AI巨頭競爭

在全球AI競技場上，谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日，谷歌在I/O開發(fā)者大會上掀起了一股新的技術(shù)浪潮，發(fā)布了多款全新升級的多模態(tài)AI產(chǎn)品。

發(fā)表于 05-16 09:28 ?552次閱讀

全球云服務(wù)市場增長，亞馬遜AWS、微軟Azure及谷歌GCP差距拉大

報(bào)告指出，目前全球的主要云服務(wù)商包括亞馬遜AWS（市場份額31%），其次是微軟Azure（25%）和谷歌（11%）。盡管亞馬遜在整體市場仍占優(yōu)勢，但隨著微軟和谷歌的快速發(fā)展，兩者的市場

發(fā)表于 05-06 11:34 ?777次閱讀

搜索歷史

谷歌和亞馬遜怎么讓AI自己學(xué)習(xí)

評論

首創(chuàng)開源架構(gòu)，天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

聚云科技獲亞馬遜云科技生成式AI能力認(rèn)證

聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證

谷歌Gemini AI目標(biāo)年底用戶達(dá)5億

谷歌加速AI部門整合：AI Studio團(tuán)隊(duì)并入DeepMind

亞馬遜云科技AI Networking解決方案回顧

亞馬遜轉(zhuǎn)向Trainium芯片，全力投入AI模型訓(xùn)練

如何訓(xùn)練自己的AI大模型

GE醫(yī)療與亞馬遜云科技達(dá)成戰(zhàn)略合作，通過生成式AI加速醫(yī)療健康領(lǐng)域轉(zhuǎn)型

亞馬遜云攜手AI新創(chuàng)企業(yè)Hugging Face，提升AI模型在定制芯片計(jì)算性能

榮耀新品將搭載谷歌AI功能，提升生成式AI體驗(yàn)

亞馬遜、Meta等科技巨頭同時投資AI創(chuàng)企Scale AI

谷歌發(fā)布多模態(tài)AI新品，加劇AI巨頭競爭

全球云服務(wù)市場增長，亞馬遜AWS、微軟Azure及谷歌GCP差距拉大

電子發(fā)燒友