0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

薩頓科普了強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí),并談到了這項(xiàng)技術(shù)的潛力和發(fā)展方向

人工智能和機(jī)器人研究院 ? 2017-12-27 09:07 ? 次閱讀

地處加拿大埃德蒙頓的阿爾伯塔大學(xué)(UAlberta)可謂是強(qiáng)化學(xué)習(xí)重鎮(zhèn),這項(xiàng)技術(shù)的締造者之一薩頓(Rich Sutton)在這里任教。

△薩頓

薩頓常被稱為“強(qiáng)化學(xué)習(xí)之父”,他對(duì)強(qiáng)化學(xué)習(xí)的重要貢獻(xiàn)包括時(shí)序差分學(xué)習(xí)和策略梯度方法。

如果你研究過強(qiáng)化學(xué)習(xí),可能對(duì)他和巴爾托(Andrew Barto)合著的一本書很熟悉:《強(qiáng)化學(xué)習(xí)導(dǎo)論》(Reinforcement Learning, an introduction)。這本書被引用了2.5萬多次,如今,第二版即將出版,全書草稿也已經(jīng)在網(wǎng)上公開。

薩頓科普了強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí),并談到了這項(xiàng)技術(shù)的潛力和發(fā)展方向

△Reinforcement Learning, an introduction草稿http://incompleteideas.net/book/bookdraft2017nov5.pdf

巴爾托是薩頓的博士論文導(dǎo)師,薩頓的博士論文《強(qiáng)化學(xué)習(xí)的時(shí)間學(xué)分分配》(Temporal Credit Assignment in Reinforcement Learning)中,引入了一種評(píng)價(jià)器結(jié)構(gòu)和“時(shí)間信用分配”。他們把“顯而易見”的強(qiáng)化學(xué)習(xí)理念,變成了一個(gè)以數(shù)學(xué)為基礎(chǔ)的可行理論。

薩頓獲得了斯坦福大學(xué)心理學(xué)學(xué)士學(xué)位(1978年)和碩士學(xué)位(1980),以及馬薩諸塞大學(xué)安姆斯特分校計(jì)算機(jī)博士學(xué)位(1984)。

從1985年到1994年,Sutton擔(dān)任GTE實(shí)驗(yàn)室的首席技術(shù)員。之后,他在麻省大學(xué)安姆斯特分校做了3年的高級(jí)研究員,然后又到AT&T香農(nóng)實(shí)驗(yàn)室做了5年的首席技術(shù)員。2003年以來,他一直在阿爾伯塔大學(xué)計(jì)算機(jī)系擔(dān)任教授兼iCORE主席,領(lǐng)強(qiáng)化學(xué)習(xí)和人工智能實(shí)驗(yàn)室。

2003年以來,薩頓在阿爾伯塔大學(xué)計(jì)算機(jī)系任教授、iCORE主席,領(lǐng)導(dǎo)著強(qiáng)化學(xué)習(xí)和人工智能實(shí)驗(yàn)室。今年6月,DeepMind在埃德蒙頓和阿爾伯塔大學(xué)聯(lián)合設(shè)立首個(gè)海外研究院,薩頓也是這個(gè)研究院的領(lǐng)導(dǎo)者之一。

最近,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)社區(qū)KDnuggets董事長(zhǎng),數(shù)據(jù)科學(xué)會(huì)議KDD和ACM SIGKDD的聯(lián)合發(fā)起者Gregory Piatetsky專訪了薩頓。

薩頓在專訪中(再次)科普了強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí),并談到了這項(xiàng)技術(shù)的潛力,以及接下來的發(fā)展方向:預(yù)測(cè)學(xué)習(xí)。

量子位將專訪內(nèi)容搬運(yùn)如下:

△典型的強(qiáng)化學(xué)習(xí)過程

我在上世紀(jì)80年代遇到了Rich Sutton,我和他當(dāng)時(shí)都剛開始在波士頓地區(qū)的GTE實(shí)驗(yàn)室讀博士。我研究智能數(shù)據(jù)庫,他在強(qiáng)化學(xué)習(xí)部門,但是我們?cè)贕TE實(shí)驗(yàn)室的項(xiàng)目還遠(yuǎn)沒有實(shí)際應(yīng)用。我們經(jīng)常下象棋,我們倆在這方面勢(shì)均力敵,但在機(jī)器學(xué)習(xí)方面,Rich遠(yuǎn)遠(yuǎn)領(lǐng)先于我。

Q:強(qiáng)化學(xué)習(xí)的主要思想是什么?它與監(jiān)督學(xué)習(xí)有何不同?

薩頓:在與世界的正?;?dòng)過程中,強(qiáng)化學(xué)習(xí)會(huì)通過試錯(cuò)法利用獎(jiǎng)勵(lì)來學(xué)習(xí)。因此,它跟自然學(xué)習(xí)過程非常相似,而與監(jiān)督學(xué)習(xí)不同。

在監(jiān)督學(xué)習(xí)中,學(xué)習(xí)只發(fā)生在一個(gè)特殊的訓(xùn)練階段,這個(gè)階段中會(huì)出現(xiàn)一個(gè)正常情況下不會(huì)出現(xiàn)的監(jiān)督或教學(xué)信號(hào)。

例如,語音識(shí)別目前通過監(jiān)督學(xué)習(xí)來完成,需要使用大量的語音數(shù)據(jù)集和正確的文本內(nèi)容。這些文本內(nèi)容就是一種監(jiān)督信號(hào),等系統(tǒng)開始工作、輸入了新的語音時(shí),就沒有這個(gè)監(jiān)督信號(hào)了。

AI打游戲,通常就是通過強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)的,需要利用游戲的結(jié)果作為獎(jiǎng)勵(lì)。即使你玩了一個(gè)新游戲,也會(huì)看到自己是贏是輸,并且可以用強(qiáng)化學(xué)習(xí)算法來提高你的游戲技術(shù)。

監(jiān)督式游戲?qū)W習(xí)方法則需要借助一些“正確”的動(dòng)作來實(shí)現(xiàn),這些動(dòng)作可以來自人類專家。這很方便,但在正常的游戲中是不可用的,而且會(huì)導(dǎo)致學(xué)習(xí)系統(tǒng)的技能局限在人類專家的技能范疇內(nèi)。在強(qiáng)化學(xué)習(xí)中,你可以用較少的訓(xùn)練信息,這樣做的優(yōu)勢(shì)是信息更充足,而且不受監(jiān)督者的技能限制。

Q:你跟Andrew Barto合著的經(jīng)典著作《強(qiáng)化學(xué)習(xí)導(dǎo)論》的第二版很快就要出版,具體什么時(shí)候?第二版的主要修訂了哪些內(nèi)容?你能跟我們講講新章節(jié)里關(guān)于強(qiáng)化學(xué)習(xí)與心理學(xué)之間有趣聯(lián)系嗎(第14章)?還有跟神經(jīng)科學(xué)之間的有趣聯(lián)系(第15章)?

薩頓:第二版的完整草稿目前已經(jīng)可以在richsutton.com上看到。Andy Barto和我正在定稿:驗(yàn)證所有的參考文獻(xiàn),諸如此類。印刷版將于明年初發(fā)行。

從第一版發(fā)行以來的20年里,強(qiáng)化學(xué)習(xí)領(lǐng)域發(fā)生了很多事情。其中最重要的或許是強(qiáng)化學(xué)習(xí)思想對(duì)神經(jīng)科學(xué)的巨大影響,現(xiàn)在,大腦獎(jiǎng)勵(lì)系統(tǒng)的標(biāo)準(zhǔn)理論是,它們是一種時(shí)間差異學(xué)習(xí)的實(shí)例(這是強(qiáng)化學(xué)習(xí)的基本學(xué)習(xí)方法之一)。

特別地,現(xiàn)在的理論認(rèn)為,神經(jīng)遞質(zhì)多巴胺的主要作用是攜帶時(shí)間差異誤差,也稱為獎(jiǎng)勵(lì)預(yù)測(cè)誤差。這是一個(gè)巨大的發(fā)展,有許多來源、影響和測(cè)試,我們只能在書中進(jìn)行概括。15和14章中介紹的這項(xiàng)發(fā)展和其他的發(fā)展概括了它們?cè)谛睦韺W(xué)中的重要前提。

總的來說,第二版比第一版多了三分之二內(nèi)容。函數(shù)逼近的內(nèi)容從一章擴(kuò)充到五章。還有關(guān)于心理學(xué)和神經(jīng)科學(xué)的兩個(gè)新章節(jié)。在強(qiáng)化學(xué)習(xí)的前沿也有一個(gè)新章節(jié),有一節(jié)專門介紹它的社會(huì)影響。所有的東西都在這本書中不斷更新和擴(kuò)展。例如,新的應(yīng)用程序章節(jié)涵蓋了Atari游戲和AlphaGo Zero。

Q:什么是深度強(qiáng)化學(xué)習(xí)?它與強(qiáng)化學(xué)習(xí)有何不同?

薩頓:深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的結(jié)合。這兩種學(xué)習(xí)方式在很大程度上是正交問題,二者結(jié)合得很好。

簡(jiǎn)而言之,強(qiáng)化學(xué)習(xí)需要通過數(shù)據(jù)逼近函數(shù)的方法來部署其所有的組件——值函數(shù)、策略、世界模型、狀態(tài)更新——而深度學(xué)習(xí)是最近開發(fā)的函數(shù)逼近器中最新、最成功一個(gè)。

我們的教科書主要介紹線性函數(shù)逼近器,并給出一般情況下的方程。我們?cè)趹?yīng)用一章和一節(jié)中介紹了神經(jīng)網(wǎng)絡(luò),但要充分了解深度強(qiáng)化學(xué)習(xí),就必須用Goodfellow、Bengio、和Courville的《深度學(xué)習(xí)》來補(bǔ)充我們的書。

Q:強(qiáng)化學(xué)習(xí)在游戲中取得了巨大的成功,例如AlphaGo Zero。你預(yù)計(jì)強(qiáng)化學(xué)習(xí)還將在哪些方面有優(yōu)異表現(xiàn)?

薩頓:當(dāng)然,我相信,從某種意義上講,強(qiáng)化學(xué)習(xí)是人工智能的未來。有人認(rèn)為,智能系統(tǒng)必須能夠在不接受持續(xù)監(jiān)督的情況下自主學(xué)習(xí),而強(qiáng)化學(xué)習(xí)正是其中的最佳代表。一個(gè)AI必須能夠自己判斷對(duì)錯(cuò),只有這樣才能擴(kuò)展到大量的知識(shí)和一般技能。

Q:Yann LeCun評(píng)論說,AlphaGo Zero的成功很難推廣到其他領(lǐng)域,因?yàn)樗刻於纪鏀?shù)百萬局游戲,但是你不能在現(xiàn)實(shí)世界里跑得更快。強(qiáng)化學(xué)習(xí)在哪些方面目前還沒有成功(例如,當(dāng)反饋稀疏時(shí))?如何能夠解決?

薩頓:Yann應(yīng)該會(huì)認(rèn)同這個(gè)觀點(diǎn):關(guān)鍵是要從普通的無監(jiān)督數(shù)據(jù)中學(xué)習(xí)。我和Yann也都會(huì)認(rèn)同這樣一個(gè)觀點(diǎn):在短期內(nèi),這將通過專注于“預(yù)測(cè)學(xué)習(xí)”來實(shí)現(xiàn)。

預(yù)測(cè)學(xué)習(xí)可能很快就會(huì)成為一個(gè)流行詞。它的意思是預(yù)測(cè)將要發(fā)生的事情,然后根據(jù)實(shí)際情況進(jìn)行學(xué)習(xí)。因?yàn)槟銖陌l(fā)生的事情中學(xué)習(xí),沒有一個(gè)監(jiān)督員告訴你應(yīng)該預(yù)測(cè)什么。但因?yàn)槟阃ㄟ^等待發(fā)現(xiàn)了結(jié)果,你就有了一個(gè)監(jiān)督信號(hào)。預(yù)測(cè)學(xué)習(xí)是無監(jiān)督的監(jiān)督式學(xué)習(xí)。預(yù)測(cè)學(xué)習(xí)可能會(huì)在應(yīng)用中取得重大進(jìn)展。

唯一的問題是,你希望把預(yù)測(cè)學(xué)習(xí)看成是監(jiān)督學(xué)習(xí)還是強(qiáng)化學(xué)習(xí)的產(chǎn)物?強(qiáng)化學(xué)習(xí)的學(xué)生知道強(qiáng)化學(xué)習(xí)有一個(gè)主要的子問題,稱為“預(yù)測(cè)問題”,如何有效地解決這個(gè)問題正是大部分算法工作的重點(diǎn)。事實(shí)上,第一篇討論時(shí)間差異學(xué)習(xí)的論文題目是《學(xué)會(huì)用時(shí)間差異的方法來預(yù)測(cè)》。

Q:20世紀(jì)80年代,當(dāng)研究強(qiáng)化學(xué)習(xí)時(shí),你認(rèn)為它會(huì)取得這樣的成功嗎?

薩頓:20世紀(jì)80年代,強(qiáng)化學(xué)習(xí)根本沒有流行。它本質(zhì)上并不是一個(gè)科學(xué)或工程的概念。但卻是一個(gè)顯而易見的想法。對(duì)心理學(xué)家來說很明顯,對(duì)普通人來說也很明顯。所以我認(rèn)為,這顯然是一件值得研究的事情,最終會(huì)得到認(rèn)可。

Q:強(qiáng)化學(xué)習(xí)的下一個(gè)研究方向是什么?你現(xiàn)在在做什么?

薩頓:除了預(yù)測(cè)學(xué)習(xí)之外,我想說的是,當(dāng)我們有用訓(xùn)練過的世界模型來做規(guī)劃的系統(tǒng)時(shí),下一個(gè)重大進(jìn)步就會(huì)到來。

我們目前擁有優(yōu)秀的規(guī)劃算法,但只有當(dāng)有模型提供給它們時(shí)才行,就像所有游戲系統(tǒng)中所看到的那樣,模型是由游戲規(guī)則(和自我對(duì)局)提供的。但我們?cè)诂F(xiàn)實(shí)世界中并沒有跟游戲規(guī)則類似的東西。我們需要物理定律,沒錯(cuò),但我們也需要知道很多其他的事情,從如何走路和觀察到別人如何回應(yīng)我們所做的事情。

我們?cè)诘诎苏碌腄yna系統(tǒng)中描述了一個(gè)完整的規(guī)劃和學(xué)習(xí)系統(tǒng),但卻局限為幾種方式。第17章闡述了可能克服這種局限的方法。我將從那里入手。

Q:強(qiáng)化學(xué)習(xí)可能是通用人工智能(AGI)發(fā)展的核心。你的觀點(diǎn)是什么——在可預(yù)見的未來,研究人員會(huì)開發(fā)AGI嗎?如過會(huì),這將會(huì)對(duì)人類產(chǎn)生巨大的好處,還是像埃隆·馬斯克(Elon Musk)警告的那樣,會(huì)對(duì)人類構(gòu)成威脅?

薩頓:我認(rèn)為人工智能是試圖通過制造與人類思想類似的東西來理解人類的思想。正如費(fèi)曼所說,“我無法創(chuàng)造的東西,我就不理解它”。在我看來,會(huì)發(fā)生的重大事件是我們即將第一次真正理解意識(shí)。這種認(rèn)識(shí)本身將產(chǎn)生巨大的影響。

這將是我們這個(gè)時(shí)代最偉大的科學(xué)成就,其實(shí)任何時(shí)候都是如此。它也將是有史以來人文學(xué)科最偉大的成就——深刻地理解我們自己。如果這樣來看待,那就不會(huì)把它看成是一件壞事。雖然是挑戰(zhàn),但并不是壞事。我們將揭示哪些東西是真實(shí)的。那些不想讓它成為現(xiàn)實(shí)的人會(huì)把我們的工作看成是壞事,就像科學(xué)拋棄了靈魂的概念一樣,那些珍視這些想法的人認(rèn)為是壞的。

毫無疑問,當(dāng)我們更深入地了解大腦如何運(yùn)作時(shí),我們今天所珍視的一些觀點(diǎn)也會(huì)面臨同樣的挑戰(zhàn)。

Q:當(dāng)你遠(yuǎn)離電腦智能手機(jī)的時(shí)候,你喜歡做什么?你最近讀過什么書?你喜歡什么書?

薩頓:我是自然的愛好者,也喜歡哲學(xué)、經(jīng)濟(jì)學(xué)和科學(xué)的思辨思想。我最近讀了尼爾·斯蒂芬森的《Seveneves》、尤瓦爾·赫拉利的《人類簡(jiǎn)史》,以及G.愛德華·格里芬的《美聯(lián)儲(chǔ)傳》。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:“強(qiáng)化學(xué)習(xí)之父”薩頓:預(yù)測(cè)學(xué)習(xí)馬上要火,AI將幫我們理解人類意識(shí)

文章出處:【微信號(hào):gh_ecbcc3b6eabf,微信公眾號(hào):人工智能和機(jī)器人研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過程,旨在通過理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?193次閱讀
    18個(gè)常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論<b class='flag-5'>技術(shù)</b>與代碼實(shí)現(xiàn)

    詳解RAD端到端強(qiáng)化學(xué)習(xí)后訓(xùn)練范式

    受限于算力和數(shù)據(jù),大語言模型預(yù)訓(xùn)練的 scalinglaw 已經(jīng)趨近于極限。DeepSeekR1/OpenAl01通過強(qiáng)化學(xué)習(xí)后訓(xùn)練涌現(xiàn)強(qiáng)大的推理能力,掀起新一輪技術(shù)革新。
    的頭像 發(fā)表于 02-25 14:06 ?405次閱讀
    詳解RAD端到端<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>后訓(xùn)練范式

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機(jī)遇

    人工智能尤其是深度學(xué)習(xí)技術(shù)的最新進(jìn)展,加速不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度
    的頭像 發(fā)表于 02-14 11:15 ?378次閱讀

    淺談適用規(guī)模充電站的深度學(xué)習(xí)有序充電策略

    深度強(qiáng)化學(xué)習(xí)能夠有效計(jì)及電動(dòng)汽車出行模式和充電需求的不確定性,實(shí)現(xiàn)充電場(chǎng)站充電成本化的目標(biāo)。通過對(duì)電動(dòng)汽車泊車時(shí)間和充電需求特征進(jìn)行提取,建立適用于大規(guī)模電動(dòng)汽車有序充電的馬爾可夫決策過程模型,
    的頭像 發(fā)表于 02-08 15:00 ?406次閱讀
    淺談適用規(guī)模充電站的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>有序充電策略

    波士動(dòng)力與RAI Institute聯(lián)手推進(jìn)人形機(jī)器人技術(shù)

    波士動(dòng)力公司與機(jī)器人與人工智能研究所(RAI Institute)近日宣布達(dá)成合作伙伴關(guān)系,旨在通過強(qiáng)化學(xué)習(xí)技術(shù)推動(dòng)人形機(jī)器人的發(fā)展。這一合作標(biāo)志著兩大行業(yè)巨頭將共同致力于提升電動(dòng)A
    的頭像 發(fā)表于 02-06 14:12 ?540次閱讀

    MLOps平臺(tái)的發(fā)展方向

    MLOps平臺(tái)作為機(jī)器學(xué)習(xí)開發(fā)運(yùn)維一體化的重要工具,其發(fā)展方向將深刻影響人工智能技術(shù)的普及和應(yīng)用。下面,是對(duì)MLOps平臺(tái)發(fā)展方向的探討,由AI部落小編整理。
    的頭像 發(fā)表于 12-31 11:51 ?343次閱讀

    螞蟻集團(tuán)收購邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家

    領(lǐng)域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實(shí)驗(yàn)室,擔(dān)任首席科學(xué)家一職。 吳翼在其個(gè)人社交平臺(tái)上對(duì)這一變動(dòng)進(jìn)行了回應(yīng)。他表示,自己最近接受了螞蟻集團(tuán)的邀請(qǐng),負(fù)責(zé)大模型強(qiáng)化學(xué)習(xí)領(lǐng)域的研究工
    的頭像 發(fā)表于 11-22 11:14 ?1233次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動(dòng)力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價(jià)值。NPU(Neural Processing
    的頭像 發(fā)表于 11-14 15:17 ?1583次閱讀

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是一種機(jī)器學(xué)習(xí)方法,它通過與環(huán)境的交互來學(xué)習(xí)如何做出決策,以最大化累積獎(jiǎng)勵(lì)。PyTorch 是一個(gè)流行的開源機(jī)器學(xué)習(xí)庫,
    的頭像 發(fā)表于 11-05 17:34 ?800次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    信息。這使得激光雷達(dá)在自動(dòng)駕駛、無人機(jī)、機(jī)器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)發(fā)展 深度學(xué)
    的頭像 發(fā)表于 10-27 10:57 ?873次閱讀

    谷歌AlphaChip強(qiáng)化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用

    近日,谷歌在芯片設(shè)計(jì)領(lǐng)域取得了重要突破,詳細(xì)介紹其用于芯片設(shè)計(jì)布局的強(qiáng)化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望顯著加速芯片布局規(guī)劃的設(shè)計(jì)流程,幫助芯片在性能、功耗和面積方面實(shí)現(xiàn)更優(yōu)表現(xiàn)
    的頭像 發(fā)表于 09-30 16:16 ?606次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    。 總之,F(xiàn)PGA 在深度學(xué)習(xí)領(lǐng)域具有很大的發(fā)展?jié)摿?/b>和機(jī)會(huì),但也面臨一些挑戰(zhàn)。隨著技術(shù)的不斷進(jìn)步和市場(chǎng)的不斷發(fā)展,F(xiàn)PGA 在
    發(fā)表于 09-27 20:53

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    發(fā)展,基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強(qiáng)大的自動(dòng)特征提取和分類能力。本文將從多個(gè)角度對(duì)深度學(xué)習(xí)在時(shí)間序列分類中的應(yīng)用進(jìn)行綜述,探討常用
    的頭像 發(fā)表于 07-09 15:54 ?1779次閱讀

    基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

    )的廣泛應(yīng)用,小目標(biāo)檢測(cè)的性能得到了顯著提升。本文將詳細(xì)探討基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)技術(shù),包括其定義、挑戰(zhàn)、常用方法以及未來發(fā)展方向
    的頭像 發(fā)表于 07-04 17:25 ?1736次閱讀

    通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇

    更快更好地學(xué)習(xí)。我們的想法是找到最優(yōu)數(shù)量的特征和最有意義的特征。在本文中,我們將介紹實(shí)現(xiàn)一種新的通過強(qiáng)化學(xué)習(xí)策略的特征選擇。我們先討論強(qiáng)化學(xué)習(xí),尤其是馬爾可夫決策
    的頭像 發(fā)表于 06-05 08:27 ?555次閱讀
    通過<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>策略進(jìn)行特征選擇

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品