0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

MqC7_CAAI_1981 ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-01-31 08:58 ? 次閱讀

神經(jīng)網(wǎng)絡(luò)的強(qiáng)大功能有目共睹,但它往往需要大量與目標(biāo)測(cè)試領(lǐng)域數(shù)據(jù)分布相似的訓(xùn)練數(shù)據(jù);而用于符號(hào)領(lǐng)域的歸納邏輯編程只需少量數(shù)據(jù),卻無(wú)法對(duì)抗噪聲,適用領(lǐng)域也很狹窄。

DeepMind在最近發(fā)表的一篇論文中,提出了可微分歸納邏輯編程方法?ILP,既能解決傳統(tǒng)歸納邏輯編程擅長(zhǎng)的符號(hào)類任務(wù),也對(duì)噪聲數(shù)據(jù)、訓(xùn)練集中的誤差有一定容忍度,還可以通過梯度下降來(lái)訓(xùn)練。

怎么樣?我們來(lái)看看DeepMind在官方博客上對(duì)這種方法的解讀:

想象一下踢足球的場(chǎng)景,球到了你腳下,你決定把它傳給沒人盯防的前鋒。這個(gè)看似簡(jiǎn)單的行為,需要兩種不同的思維。

首先,你認(rèn)識(shí)到自己腳下有一個(gè)球,這需要的是直觀的感性思維——你沒辦法簡(jiǎn)單地描述出你是怎么知道腳下有個(gè)球的。

其次,你決定把球傳給特定的一個(gè)前鋒。這個(gè)決策需要概念性思維,你的決定依賴于理由——你把球傳給這個(gè)前鋒的原因,是沒有人盯防她。

這種區(qū)別對(duì)我們來(lái)說(shuō)很有意思,因?yàn)檫@兩類思維對(duì)應(yīng)著兩種不同的機(jī)器學(xué)習(xí)方法:深度學(xué)習(xí)和符號(hào)程序合成(symbolic program synthesis)。

深度學(xué)習(xí)專注于直觀的感性思維,而符號(hào)程序合成專注于概念性的、基于規(guī)則的思考。這兩個(gè)系統(tǒng)各有各的優(yōu)點(diǎn),深度學(xué)習(xí)系統(tǒng)能適用于噪聲數(shù)據(jù),但難以解釋,而且需要大量訓(xùn)練數(shù)據(jù);符號(hào)系統(tǒng)更易于解釋,需要的訓(xùn)練數(shù)據(jù)也更少,但一遇到噪聲數(shù)據(jù)就不行了。

人類認(rèn)知將這兩種截然不同的思維方式無(wú)縫結(jié)合在了一起,但想要把這種結(jié)合復(fù)制到一個(gè)AI系統(tǒng)里,我們還不太清楚是否可能、如何做到。

我們最近在《JAIR》期刊(Journal of AI Research)上發(fā)表的論文表明,系統(tǒng)可以將直觀的感性思維和概念性的可解釋推理結(jié)合起來(lái)。我們所描述的?ILP(可微分歸納邏輯編程,Differentiable Inductive Logic Programming)系統(tǒng)具有下列特性:抗噪聲、數(shù)據(jù)上很經(jīng)濟(jì)、能產(chǎn)生可解釋的規(guī)則。

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

我們用一個(gè)歸納任務(wù)來(lái)演示?ILP的工作原理

已知一對(duì)表示數(shù)字的圖片,系統(tǒng)需要根據(jù)左側(cè)圖像數(shù)字是否小于右側(cè)圖像的數(shù)字,輸出0或1的標(biāo)簽,如下圖所示:

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

解決這個(gè)問題涉及兩種思維方式。從圖像中認(rèn)出數(shù)字,需要直觀的感性思維;要整體理解“小于”關(guān)系,則需要概念性的思考。

其實(shí),如果給標(biāo)準(zhǔn)的深度學(xué)習(xí)模型(例如帶有MLP的卷積神經(jīng)網(wǎng)絡(luò))提供足夠的訓(xùn)練數(shù)據(jù),它能學(xué)會(huì)有效地解決這個(gè)問題,訓(xùn)練完成后給它一對(duì)從未見過的新圖像,它也可以正確分類。

但實(shí)際上,只有每對(duì)數(shù)字你都給它多個(gè)樣例,它才能正確地泛化。這個(gè)模型擅長(zhǎng)視覺上的泛化,比如說(shuō)測(cè)試集中的每一對(duì)數(shù)字它都見過了,要泛化到新的圖像,就很容易(見下圖綠色方塊)。但它不適用于符號(hào)的泛化,比如說(shuō)它就不能泛化到從未見過的數(shù)字(見下圖藍(lán)色方塊)。

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

馬庫(kù)斯(Gary Marcus)、Joel Grus等研究者最近都撰文指出了這一點(diǎn)。

不同于標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò),?ILP能夠進(jìn)行符號(hào)的泛化;它和標(biāo)準(zhǔn)的符號(hào)程序也不一樣,可以進(jìn)行視覺上的泛化。?ILP從樣例中學(xué)習(xí)可讀、可解釋、可驗(yàn)證的,明確的程序。已知部分樣例(也就是預(yù)期的結(jié)果,下圖中的desired results),?ILP能生成一個(gè)滿足需求的程序。它用梯度下降從程序空間中搜索,如果程序的輸出與參考數(shù)據(jù)需要的輸出相沖突,系統(tǒng)就會(huì)修改程序以更好地匹配數(shù)據(jù)。

?ILP的訓(xùn)練過程如下圖所示:

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

?ILP能進(jìn)行符號(hào)性的泛化,給它足夠多x

DeepMind提出了可微分歸納邏輯編程方法?ILP并進(jìn)行解讀

上圖總結(jié)了我們的“小于”實(shí)驗(yàn):藍(lán)色曲線表示標(biāo)準(zhǔn)的深度神經(jīng)網(wǎng)絡(luò),無(wú)法正確泛化到從未見過的數(shù)字對(duì),相比之下,在只用40%數(shù)字對(duì)訓(xùn)練過的情況下,綠色曲線表示的?ILP依然能保持較低的測(cè)試誤差。這表明,?ILP能夠進(jìn)行符號(hào)性的泛化。

我們相信,對(duì)于深度神經(jīng)網(wǎng)絡(luò)中是否能夠?qū)崿F(xiàn)符號(hào)泛化這個(gè)問題,我們的系統(tǒng)能夠在某種程度上給予答案。今后,我們計(jì)劃將類似?ILP的系統(tǒng)集成到強(qiáng)化學(xué)習(xí)智能體以及更大的深度學(xué)習(xí)模塊中,賦予系統(tǒng)推理、反應(yīng)的能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:DeepMind提出可微分邏輯編程,結(jié)合深度學(xué)習(xí)與符號(hào)程序優(yōu)點(diǎn)

文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國(guó)人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    誕生AlphaGo的DeepMind回顧2016年,提出三大發(fā)展方向

    谷歌旗下DeepMind團(tuán)隊(duì)本周在官方網(wǎng)站上撰文,回顧了2016年所取得的進(jìn)展。展望2017年,DeepMind提出了三大發(fā)展方向,包括算法突破、社會(huì)影響,以及道德倫理的最佳行為。
    發(fā)表于 01-04 14:53 ?1839次閱讀

    基于BIST利用ORCA結(jié)構(gòu)測(cè)試FPGA邏輯單元的方法

    利用FPGA重復(fù)編程的特性,通過脫機(jī)配置,建立BIST邏輯,即使由于線路被操作系統(tǒng)的重新配置而令BIST結(jié)構(gòu)消失,測(cè)性也實(shí)現(xiàn)。本文給出
    的頭像 發(fā)表于 11-28 09:02 ?4458次閱讀
    基于BIST利用ORCA結(jié)構(gòu)測(cè)試FPGA<b class='flag-5'>邏輯</b>單元的<b class='flag-5'>方法</b>

    未來(lái)的AI 深挖谷歌 DeepMind 和它背后的技術(shù)

    險(xiǎn)投資公司、維港投資(Horizons Ventures)和Founders Fund獲得的額外資本。DeepMind的創(chuàng)始人向這些實(shí)體進(jìn)行了可靠的介紹,這就是他們獲得資金的原因。如果你也有一個(gè)創(chuàng)新而有前途
    發(fā)表于 08-26 12:04

    PLC的應(yīng)用大致歸納為哪幾類?

    PLC的應(yīng)用大致歸納為哪幾類?PLC控制系統(tǒng)與繼電器控制系統(tǒng)的區(qū)別在哪?
    發(fā)表于 07-05 06:44

    基于位串編碼的遺傳歸納邏輯程序設(shè)計(jì)

    歸納邏輯程序設(shè)計(jì)是基于一階邏輯的數(shù)據(jù)挖掘新方法。一階規(guī)則挖掘是目標(biāo)謂詞和背景知識(shí)謂詞對(duì)應(yīng)的各種原子的復(fù)雜組合優(yōu)化問題。該文根據(jù)Occam’s razor原理提出原子的位串編碼
    發(fā)表于 03-31 09:48 ?11次下載

    基于單片機(jī)的復(fù)雜可編程邏輯器件快速配置方法

    基于單片機(jī)的復(fù)雜可編程邏輯器件快速配置方法 基于SRAM(靜態(tài)隨機(jī)存儲(chǔ)器)的重配置PLD(可編程邏輯器件)的出現(xiàn),為系統(tǒng)設(shè)計(jì)者動(dòng)態(tài)改變運(yùn)行電路
    發(fā)表于 03-28 16:47 ?865次閱讀
    基于單片機(jī)的復(fù)雜可<b class='flag-5'>編程邏輯</b>器件快速配置<b class='flag-5'>方法</b>

    邏輯層網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)方法研究

    分析了傳統(tǒng)基于簡(jiǎn)單網(wǎng)管協(xié)議的網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)方法和不足,提出了邏輯層網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)方法研究
    發(fā)表于 05-26 16:16 ?29次下載
    <b class='flag-5'>邏輯</b>層網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)<b class='flag-5'>方法</b>研究

    在Multisim環(huán)境中Xilinx邏輯器件進(jìn)行編程及步驟

    的Xilinx邏輯器件進(jìn)行編程。這將使得理論概念與硬件實(shí)現(xiàn)之間的關(guān)系從未變得如此簡(jiǎn)單。 Multisim環(huán)境中的可編程邏輯設(shè)備 在Multi
    發(fā)表于 11-18 06:27 ?3840次閱讀

    利用嵌入式處理器對(duì)可編程邏輯器件進(jìn)行編程

    在嵌入式系統(tǒng)里除了嵌入式處理器外還會(huì)經(jīng)常使用到可編程邏輯器件,有些可編程邏輯器件在被焊接到印制電路板上之后還可以對(duì)其程序進(jìn)行更新,這種特性稱之為“在系統(tǒng)
    發(fā)表于 01-26 09:29 ?1440次閱讀
    利用嵌入式處理器對(duì)可<b class='flag-5'>編程邏輯</b>器件<b class='flag-5'>進(jìn)行</b>重<b class='flag-5'>編程</b>

    超全使用串口對(duì)DSP進(jìn)行應(yīng)用可編程方法

    本文介紹了一種通過串口對(duì)DSP進(jìn)行應(yīng)用可編程方法,該方法簡(jiǎn)單易操作,文中給出了具體的實(shí)現(xiàn)方法。
    的頭像 發(fā)表于 04-02 16:13 ?3309次閱讀

    基于可編程邏輯的SDRAM控制方法設(shè)計(jì)

    基于可編程邏輯的SDRAM控制方法設(shè)計(jì)
    發(fā)表于 06-30 10:16 ?8次下載

    創(chuàng)建小型組合與時(shí)序邏輯電路的PLU可編程邏輯單元

      在進(jìn)行MCU開發(fā)時(shí),有時(shí)需要用到一些簡(jiǎn)單的數(shù)字邏輯電路,LPC804與LPC55XX系列集成了PLU(Programmable Logic Unit),即可編程邏輯單元,
    的頭像 發(fā)表于 12-01 09:17 ?1595次閱讀

    張鈸院士: 邁向第三代人工智能

    符號(hào) AI 同樣可以應(yīng)用于機(jī)器學(xué)習(xí),把「機(jī)器學(xué)習(xí)」看成是基于知識(shí)的(歸納)推理。下面以歸納邏輯編程(inductivelogicprogramming,
    的頭像 發(fā)表于 07-11 15:34 ?1468次閱讀
    張鈸院士: 邁向第三代人工智能

    什么叫可編程邏輯器件 可編程邏輯器件有哪些特征和優(yōu)勢(shì)?

    編程邏輯器件(Programmable Logic Device,PLD)是一類集成電路器件,可以根據(jù)用戶的需求進(jìn)行編程和配置,以實(shí)現(xiàn)特定的邏輯功能。它們具有可
    發(fā)表于 09-14 15:25 ?2962次閱讀

    谷歌提出大規(guī)模ICL方法

    谷歌DeepMind團(tuán)隊(duì)近日取得了一項(xiàng)突破性的研究成果。他們提出了強(qiáng)化和無(wú)監(jiān)督兩種新型的ICL(In-Context Learning)學(xué)習(xí)方法,這一創(chuàng)新技術(shù)能夠在多個(gè)領(lǐng)域顯著提升模型的性能。
    的頭像 發(fā)表于 05-14 14:17 ?380次閱讀