0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究人工智能的讀心術(shù)

MqC7_CAAI_1981 ? 來源:cc ? 2019-01-16 14:32 ? 次閱讀

對于許多無法發(fā)出聲音的人來說,他們想說的話會通過某種信號隱藏在大腦中。

人類無法直接破譯這些信號。但是,最近有三個研究小組在“破譯”這種大腦語言密碼上取得了一定進展。

Science雜志最新報道了哥倫比亞大學(Columbia University)、德國不萊梅大學(Bremen)和加州大學舊金山分校的三個研究小組的相關(guān)研究:通過手術(shù),他們在大腦上放置電極,搜集電極產(chǎn)生的數(shù)據(jù),再將其通過計算機變成語音信息;接著通過神經(jīng)網(wǎng)絡模型,他們重建了在某些情況下,可以被人類聽眾所理解的單詞和語句。

通過計算機讓失去語言能力的人表達自己并不罕見,物理學家斯蒂芬·霍金在世時,就會通過拉緊他的臉頰肌肉,以觸發(fā)安裝在眼鏡上的開關(guān)。對于經(jīng)歷中風或其他疾病失去說話能力的人,他們可以使用他們的眼睛或做出其他小幅動作用來控制光標或選擇屏幕上的字母。

但是,如果腦機接口直接重塑語音,這樣的患者可能會重新獲得更多曾經(jīng)喪失的能力:例如,控制音調(diào)變化,或者介入一個快速的對話。

研究該問題的道路困難重重。哥倫比亞大學(Columbia University)計算機科學家Nima Mesgarani說:“我們正試圖找出在不同時間點打開與關(guān)閉神經(jīng)元的模式,并由此推斷語音內(nèi)容?!薄吧窠?jīng)元間的映射并不淺顯直白?!边@些信號如何轉(zhuǎn)換為語音聲音因人而異,因此模型必須針對每個人進行獨特“訓練”。

這些模型將在非常精確的數(shù)據(jù)上表現(xiàn)最好——而搜集這些精準的數(shù)據(jù)需要打開我們的頭蓋骨。

研究人員只能在極少數(shù)情況下才會進行此類危險性記錄:一種情況是在移除腦腫瘤期間,暴露在外的大腦產(chǎn)生的電讀數(shù)能夠幫助外科醫(yī)生定位以避開關(guān)鍵的語音及運動區(qū);另一種情況是在手術(shù)前為癲癇患者植入電極并保持數(shù)天以確定癲癇發(fā)作起因。

瑞士日內(nèi)瓦大學神經(jīng)工程師Stephanie Martin表示說,“我們最多只有20分鐘,最多30分鐘來收集數(shù)據(jù)——真的非常非常受限?!?/p>

新論文背后的研究組盡量最大化利用數(shù)據(jù)、將信息提供給神經(jīng)網(wǎng)絡;神經(jīng)網(wǎng)絡通過將信息傳遞到計算“節(jié)點”層來處理復雜的行為模式。網(wǎng)絡通過調(diào)整節(jié)點之間的連接來學習。本實驗則使用人類產(chǎn)生或聽到的語音以及與此同時大腦活動的數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡。

Mesgarani的團隊的研究使用了五名癲癇患者的數(shù)據(jù)。

隨著病人們聽到故事錄音以及0至9數(shù)字錄音,他們的神經(jīng)網(wǎng)絡同步分析其聽覺皮層(該皮層在語音和聽力過程中都很活躍)活動。隨后計算機僅根據(jù)神經(jīng)數(shù)據(jù)來重新生成數(shù)字。有一組聽眾會在計算機“說出”數(shù)字同時對其進行評估;其精確度大約為75%。

?聲音聽起來有些可怕,

但是仔細聽仍可以辨認出數(shù)字

基于人類聽到口述數(shù)字時腦活動記錄的電腦重建

由德國不萊梅大學(Bremen)計算機科學家Tanja Schultz領(lǐng)導的另一個團隊使用了六名接受腦腫瘤手術(shù)的人的數(shù)據(jù)。

他們讓被測試者朗讀單音單詞,用麥克風捕捉他們的聲音。同時,大腦的語音規(guī)劃區(qū)和運動區(qū)產(chǎn)生的電極會被記錄下來(這些電極向聲道發(fā)送命令以清楚地表達單詞)。

現(xiàn)在正與馬斯特里赫特大學(Maastricht)合作的計算機科學家Miguel Angrick和Christian Herff訓練了一個將電極讀數(shù)映射到錄音然后從以前看不見的大腦數(shù)據(jù)中重建單詞神經(jīng)網(wǎng)絡。根據(jù)一項計算機評分系統(tǒng),大約40%的計算機生成單詞是可以理解的。

最后,加州大學舊金山分校的神經(jīng)外科醫(yī)生Edward Chang和他的團隊根據(jù)由三名癲癇患者大聲朗讀語音引起的、從語言及運動區(qū)域捕獲的大腦活動,重建了整個句子。

在線上測試中,有166人聽懂了其中一個句子,并從10項文字選項中進行選擇。超過80%的情況下模型都能夠正確識別句子。研究人員還進一步改進了模型:他們使用它根據(jù)人類的唇語來重新創(chuàng)建句子。Herff說,這是一項重要的結(jié)果——“離我們所有人都設想到的‘語言修復’更近了一步。”

然而,“我們真正想知道的是當患者不能說話時,(這些方法)將能夠如何起作用”,加州圣地亞哥州立大學研究語言生成的神經(jīng)科學家Stephanie Riès說。

一個人默默說話或在自己腦中聽到自己聲音時的信號,與真正說話或聽到某些內(nèi)容時產(chǎn)生的信號并不是完全相同的。如果沒有外部聲音來匹配大腦活動,計算機甚至可能連理清內(nèi)部語音開始與結(jié)束位置這種任務都很難完成。

奧爾巴尼紐約州衛(wèi)生部國家自適應神經(jīng)技術(shù)中心的神經(jīng)工程師Gerwin Schalk說,解碼大腦中的演講將需要“科學大躍進”:“根本不清楚如何做到這一點?!?/p>

Herff說,有一種可能的方法,是向大腦-計算機交互界面的用戶提供反饋:如果他們能夠?qū)崟r聽到計算機的語音解釋,他們可能能夠即時調(diào)整他們的想法以獲得理想結(jié)果。

通過對用戶和神經(jīng)網(wǎng)絡的充分訓練,大腦和計算機可能最終能達成一致。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7530

    瀏覽量

    88419
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47604

    瀏覽量

    239528

原文標題:人工智能讀心術(shù)

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應性和靈活性,能夠根據(jù)用戶需求進行定制化設計。它廣泛應用于各種
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領(lǐng)域中的巨大潛力和廣泛應用。這一章詳細
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    很幸運社區(qū)給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章關(guān)于AI與生命科學的部分,為我們揭示了人工智能技術(shù)在生命科學領(lǐng)域中的廣泛應用和深遠影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準備相關(guān)體會材料。看能否有助于入門和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學家做了什么? 人工智能將如何改變我們所生
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    人工智能概述

    人工智能關(guān)鍵技術(shù)概述
    發(fā)表于 07-17 17:17 ?0次下載

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識指引
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    生成式人工智能和感知式人工智能的區(qū)別

    生成式人工智能和感知式人工智能人工智能領(lǐng)域中兩種重要的研究方向。本文將探討這兩種人工智能的區(qū)別。 生成式人工智能(Generative A
    的頭像 發(fā)表于 02-19 16:43 ?1956次閱讀