0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

腦機(jī)接口技術(shù) 不說話也能表達(dá)言語

Gv1N_smartman16 ? 來源:fqj ? 2019-06-06 14:07 ? 次閱讀

以腦機(jī)接口的方式,捕捉大腦電波,然后實(shí)現(xiàn)打字的目的,再進(jìn)行語音合成輸出,并不是一個(gè)很難的課題。

去年世界機(jī)器人大會(huì)上,清華大學(xué)研發(fā)的“動(dòng)態(tài)窗穩(wěn)態(tài)視覺誘發(fā)電位腦機(jī)接口系統(tǒng)”就“主導(dǎo)”了一場(chǎng)通過腦機(jī)接口來打字的比賽。參賽者們只要在頭上戴上相關(guān)設(shè)備,將注意力集中到電腦屏幕上的虛擬鍵盤中的字母上,腦電波就會(huì)被捕捉,然后將對(duì)應(yīng)的字母顯示出來。

字母打得多了,字也就打出來了。

這種方式和對(duì)霍金的一小塊兒肌肉進(jìn)行捕捉原理上基本上沒有差別,都是通過捕捉人對(duì)字母的強(qiáng)烈反應(yīng)而實(shí)現(xiàn)語言的輸出。不同之處在于,霍金由世界頂尖科技團(tuán)隊(duì)開發(fā),可以采用單詞聯(lián)想的方式提高打字的效率。

這種方法聽起來確實(shí)很高端,但也存在一定的不足。

第一,打字的速度較慢。英語還好一點(diǎn),只要字母拼全就完成了打字的過程;而漢語還需要進(jìn)行轉(zhuǎn)化,遇到同音詞還需要進(jìn)一步進(jìn)行選擇,這就需要進(jìn)行二次腦電波捕捉。逐字的打字方法令其在單位時(shí)間內(nèi)能夠打出的文字相當(dāng)有限。

第二,對(duì)參與者的精神集中有要求,而且抗干擾較弱。腦電波是非常敏感而且活躍的。一方面人如果注意力無法高度集中,系統(tǒng)就將很難對(duì)字母進(jìn)行定位;另一方面人的大腦在看到字母的時(shí)候往往會(huì)不由自主地產(chǎn)生聯(lián)想,比如看到“c”會(huì)想到“copy”或者“car”等詞,這也會(huì)對(duì)系統(tǒng)識(shí)別產(chǎn)生干擾。

正常人想要順利打個(gè)字都極度耗費(fèi)體力,就更不要說那些身患阿爾茲海默癥或者其他病癥導(dǎo)致無法言語的病人了?;艚鹬皼]有采用類似的方案,就是考慮到無法承受如此的體力消耗。

當(dāng)然,個(gè)人認(rèn)為這種方案雖然目前僅僅還停留在科技“趣聞”或者“獵奇”的階段,但其本身是一種突破性的。它的意義并不在于有多好用或是取得了多少實(shí)際的效果,而是在于探索出了一條腦機(jī)接口的新的道路。至少讓人們看到,通過腦機(jī)接口來實(shí)現(xiàn)“意念”輸處文本甚至是語音輸出是完全可行的。

而這種可行性,被加州大學(xué)舊金山分校的一項(xiàng)研究成果,進(jìn)一步證實(shí)并且加強(qiáng)。

把腦電波合成為語音,總共分幾步?

加州大學(xué)舊金山分校的神經(jīng)科學(xué)家的解決方案,是從解剖學(xué)的角度出發(fā),模擬真人發(fā)音時(shí)大腦發(fā)出的口腔喉嚨肌電信號(hào)對(duì)發(fā)音系統(tǒng)的調(diào)動(dòng),比如在發(fā)“啊”這個(gè)音的時(shí)候,嘴唇、下巴、舌頭和喉嚨以及其他成分的動(dòng)作,然后合成相應(yīng)的語音。

那么,要把腦電信號(hào)合成為語音,總共分幾步呢?

第一步,樣本收集。研究者讓5名完全健康的志愿者在UCSF Epileps接受了一項(xiàng)外科手術(shù),在其大腦中臨時(shí)植入了一塊電極。接下來,志愿者被要求大聲朗讀指定的數(shù)百句話。在朗讀的過程中,科學(xué)家記錄了不同語言文字在朗讀過程中在大腦區(qū)域內(nèi)的活動(dòng)信號(hào)

第二步,破譯信號(hào)。通過循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的不斷學(xué)習(xí),研究者將大腦神經(jīng)信號(hào)轉(zhuǎn)換成了發(fā)音器官動(dòng)作的信號(hào),這些信號(hào)與發(fā)音器官的動(dòng)作直接相關(guān),比如嘴唇、下巴、舌頭、喉嚨等。

第三步,虛擬聲道。虛擬不同聲音所產(chǎn)生的聲道運(yùn)動(dòng),就像漢語中雙唇音、唇齒音、舌尖中音等所需要調(diào)動(dòng)的不同發(fā)音部位一樣,正常來說,如果模擬的發(fā)音運(yùn)動(dòng)模式和人正常說話時(shí)一樣,那么所發(fā)的音也一定是一樣的。

最后一步,就可以進(jìn)行語音輸出了。

為了測(cè)試虛擬語音的流暢性,研究者們?cè)?a href="http://wenjunhu.com/tags/亞馬遜/" target="_blank">亞馬遜的任務(wù)眾包平臺(tái)Mechanical Turk上招募聽眾來對(duì)這些合成語音的325個(gè)單詞和101個(gè)句子進(jìn)行辨認(rèn),結(jié)果大部分的單詞和句子都被人們成功識(shí)別。

這意味著,不用動(dòng)嘴,通過腦電波來實(shí)現(xiàn)語音輸出,完全是有可能的。這對(duì)于中風(fēng)、腦損傷或其他疾病而導(dǎo)致的語言功能障礙的輔助,將具有里程碑式的意義。

技術(shù)落地尚遠(yuǎn),“腦機(jī)”仍需努力

相較于“字母表模式”,這項(xiàng)研究的優(yōu)勢(shì)是顯而易見的。

首先,語音合成速度會(huì)得到大大提高。字母表模式下,比如通過眼動(dòng)或者肌肉塊兒的捕捉,每分鐘能成功輸出10個(gè)單詞左右。對(duì)于正常交流而言,一分鐘說10個(gè)字,一方面的確很不便,另一方面確實(shí)很考驗(yàn)人的耐心。而通過聲道模擬語音,每分鐘輸出的單詞可以達(dá)到150個(gè),這與自然語言中每分鐘100-150個(gè)單詞已經(jīng)幾乎沒有差別。實(shí)現(xiàn)正常人般的交流,可以說毫無壓力。

其次,相較于捕捉大腦信號(hào)對(duì)字母的感應(yīng),語音產(chǎn)生的機(jī)電信號(hào)更為強(qiáng)烈,也就更容易捕捉。所以,這在很大程度上可以緩解因信號(hào)識(shí)別緩慢而導(dǎo)致語音合成效率低下和患者焦慮的問題,更進(jìn)一步而言,也增加了患者的接受度。

當(dāng)然,作為一項(xiàng)尚未走出實(shí)驗(yàn)室的技術(shù),它的缺陷也明顯存在。

第一,人工智能識(shí)別的準(zhǔn)確率和數(shù)據(jù)的豐富程度呈正相關(guān)。也就是說,利用RNN去進(jìn)行學(xué)習(xí)破譯腦電波信號(hào)并將其轉(zhuǎn)化為發(fā)音器官動(dòng)作的信號(hào),要想實(shí)現(xiàn)較高的正確率,就需要大量的數(shù)據(jù)。目前的現(xiàn)實(shí)是,雖然語音輸出的速度很快,但也只有一半的句子會(huì)被識(shí)別出來。就像說話的時(shí)候嘴里含著一口水,必然是會(huì)影響交流的感受和效率的。

第二,不同語言、不同方言之間的通用性很弱,即便是同一種語言,由于方言的差異性也會(huì)導(dǎo)致發(fā)音的時(shí)候各部位的運(yùn)動(dòng)存在著細(xì)節(jié)性的發(fā)音差異,會(huì)導(dǎo)致語音合成的混淆。比如在漢語中“六”的發(fā)音,不同地域之間的差別達(dá)到了二十多個(gè)。為一種語言建立一種樣本?似乎有點(diǎn)過于繁瑣。

所以,如果能找到一種更好的方法能夠增強(qiáng)該技術(shù)的通用性尚可,如果僅僅停留在這個(gè)層面,其產(chǎn)品很可能無法走入尋常百姓家,而是成為顯貴人群的私人訂制。

研究者們自己也承認(rèn),聲道運(yùn)動(dòng)和語音的最終形成是一個(gè)復(fù)雜的關(guān)系,目前該系統(tǒng)對(duì)合成較慢的發(fā)音比較擅長(zhǎng),對(duì)說話者的節(jié)奏和語調(diào)有一定的要求,距離最終的應(yīng)用,仍然是有很長(zhǎng)的一段路要走。

但不管怎樣,這也應(yīng)該屬于腦機(jī)接口技術(shù)的一次重大突破了。試想在不遠(yuǎn)的將來,你只需要?jiǎng)觿?dòng)腦子,就會(huì)有準(zhǔn)確無誤的文本或者語音轉(zhuǎn)化出來,人機(jī)交互將會(huì)變得多么順暢而自然;而對(duì)于那些長(zhǎng)期存在語言表達(dá)障礙的弱勢(shì)群體而言,或許“福音”二字,已經(jīng)遠(yuǎn)不足以表達(dá)其所蘊(yùn)含的難以估量的價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音合成
    +關(guān)注

    關(guān)注

    2

    文章

    90

    瀏覽量

    16175
  • 腦電波
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    17025

原文標(biāo)題:你盡管“動(dòng)腦”,話交給腦機(jī)接口來說

文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    機(jī)接口重大進(jìn)展,AI模仿讓患者發(fā)聲!上游芯片技術(shù)在不斷研發(fā)

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,機(jī)接口技術(shù)又取得重大進(jìn)展,美國加州大學(xué)戴維斯分校健康中心開發(fā)出一款新型機(jī)
    的頭像 發(fā)表于 08-17 00:03 ?7334次閱讀
    <b class='flag-5'>腦</b><b class='flag-5'>機(jī)</b><b class='flag-5'>接口</b>重大進(jìn)展,AI模仿讓患者發(fā)聲!上游芯片<b class='flag-5'>技術(shù)</b><b class='flag-5'>也</b>在不斷研發(fā)

    重大突破!優(yōu)刻得×虎科技機(jī)接口臨床試驗(yàn)取得新進(jìn)展

    在全球醫(yī)療科技的前沿,優(yōu)刻得攜手戰(zhàn)略合作伙伴上海虎科技有限公司(簡(jiǎn)稱“虎科技”),共同見證了醫(yī)療創(chuàng)新的歷史性時(shí)刻。虎科技自主研發(fā)的256導(dǎo)高通量植入式柔性
    的頭像 發(fā)表于 01-03 16:57 ?457次閱讀
    重大突破!優(yōu)刻得×<b class='flag-5'>腦</b>虎科技<b class='flag-5'>腦</b><b class='flag-5'>機(jī)</b><b class='flag-5'>接口</b>臨床試驗(yàn)取得新進(jìn)展

    成都華微亮相第二屆機(jī)接口大會(huì)

    日前,第二屆機(jī)接口大會(huì)在武漢市成功舉辦。本次大會(huì)以“機(jī)互聯(lián)·共創(chuàng)未來”為主題,匯聚了來自全球各地的1500余位醫(yī)學(xué)科學(xué)、腦科學(xué)、
    的頭像 發(fā)表于 11-27 11:06 ?330次閱讀

    景昱醫(yī)療:機(jī)接口是治療難治性精神疾病更有效的手段

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)在第三屆南渡江智慧醫(yī)療與康復(fù)產(chǎn)業(yè)高峰論壇上,景昱醫(yī)療科技(蘇州)股份有限公司(以下簡(jiǎn)稱:景昱醫(yī)療)董事、CFO、董事會(huì)秘書耿東分享的主題是《侵入式機(jī)接口技術(shù)在人類難治
    發(fā)表于 11-22 14:57 ?359次閱讀
    景昱醫(yī)療:<b class='flag-5'>腦</b><b class='flag-5'>機(jī)</b><b class='flag-5'>接口</b>是治療難治性精神疾病更有效的手段

    機(jī)接口初創(chuàng)公司Synchron稱AI將對(duì)設(shè)備發(fā)揮重要作用

    機(jī)接口技術(shù)的前沿探索中,初創(chuàng)公司Synchron Inc.正引領(lǐng)一場(chǎng)革命性的變革。該公司近期宣布,他們正攜手OpenAI的最新人工智能模型,共同開發(fā)一項(xiàng)創(chuàng)新技術(shù),旨在通過植入式設(shè)備
    的頭像 發(fā)表于 07-16 14:42 ?604次閱讀

    工信部引領(lǐng)未來科技浪潮,機(jī)接口標(biāo)準(zhǔn)化技術(shù)委員會(huì)籌建方案揭曉

    在科技日新月異的今天,機(jī)接口技術(shù)作為連接人類大腦與外部設(shè)備的橋梁,正逐步從科幻概念走向現(xiàn)實(shí)應(yīng)用的前沿。7月2日,這一重要領(lǐng)域迎來了里程碑式的進(jìn)展,工業(yè)和信息化部官方網(wǎng)站正式發(fā)布了“工業(yè)和信息化部
    的頭像 發(fā)表于 07-02 14:13 ?378次閱讀

    機(jī)接口技術(shù)如何獲取信號(hào)至關(guān)重要

    機(jī)接口又可分為輸出型和輸入型兩種。輸出型機(jī)接口主要由大腦向外部設(shè)備輸出通信或控制指令,在不依
    的頭像 發(fā)表于 04-09 11:16 ?817次閱讀

    馬斯克公布首位機(jī)接口受試者新進(jìn)展!微美全息(WIMI.US)深入研究開啟智能革命性飛躍!

    消息顯示,機(jī)接口初創(chuàng)公司Neuralink的創(chuàng)始人馬斯克表示,第一位植入Neuralink機(jī)接口技術(shù)
    的頭像 發(fā)表于 03-15 14:46 ?401次閱讀

    基于MEMS超聲波方案的“真”無線植入式機(jī)接口技術(shù)

    2024年1月30日,埃隆·馬斯克通過社交平臺(tái)發(fā)布消息,聲稱Neuralink公司成功進(jìn)行了首例機(jī)接口人體植入手術(shù),被植入者恢復(fù)狀況良好;
    的頭像 發(fā)表于 03-15 09:46 ?949次閱讀
    基于MEMS超聲波方案的“真”無線植入式<b class='flag-5'>腦</b><b class='flag-5'>機(jī)</b><b class='flag-5'>接口技術(shù)</b>

    國內(nèi)機(jī)接口研究再迎新進(jìn)展!微美全息(WIMI.US)斬獲V-BCI技術(shù)專利助力科技騰飛!

    三個(gè)月的居家康復(fù)訓(xùn)練,該患者目前可以通過電活動(dòng)驅(qū)動(dòng)氣動(dòng)手套,患者脊髓損傷臨床評(píng)分和感覺誘發(fā)電位測(cè)量均有改善。這一進(jìn)展表明,機(jī)接口技術(shù)已經(jīng)逐步從實(shí)驗(yàn)室走向臨床應(yīng)用,為未來的廣泛應(yīng)用奠
    的頭像 發(fā)表于 03-05 10:25 ?518次閱讀

    機(jī)接口:探尋大腦活動(dòng)新解碼技術(shù)

    據(jù)最新研究,2月20日,英國知名學(xué)術(shù)期刊《自然》(Nature)特別報(bào)道了未來機(jī)接口的發(fā)展趨勢(shì)及潛在影響力。研究強(qiáng)調(diào),機(jī)
    的頭像 發(fā)表于 02-25 15:50 ?780次閱讀

    馬斯克機(jī)接口技術(shù)迎來歷史性時(shí)刻

    馬斯克在X平臺(tái)上發(fā)布帖子稱,首位接受Neuralink機(jī)接口植入的人類患者恢復(fù)狀況良好。初步研究成果顯示,神經(jīng)元尖峰檢測(cè)充滿希望。
    的頭像 發(fā)表于 02-22 10:55 ?1001次閱讀

    機(jī)接口,帶火傳感器

    機(jī)接口研究倫理指引》,以指導(dǎo)機(jī)接口研究合規(guī)開展。以上種種,都揭示了
    的頭像 發(fā)表于 02-21 09:54 ?461次閱讀

    機(jī)接口將在十年內(nèi)實(shí)現(xiàn)市場(chǎng)化應(yīng)用,微美全息(WIMI.US)提前入局穩(wěn)步推進(jìn)邁入增長(zhǎng)階段

    在前沿科技這個(gè)充滿創(chuàng)新活力的領(lǐng)域中,機(jī)接口技術(shù)和突破性進(jìn)展將主導(dǎo)未來科技潮流。自機(jī)
    的頭像 發(fā)表于 01-09 15:06 ?402次閱讀

    光纖在植入式機(jī)接口中的應(yīng)用

    光纖在植入式機(jī)接口中的應(yīng)用? 光纖技術(shù)作為一種傳輸信息的重要媒介,已經(jīng)在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用。而在現(xiàn)代醫(yī)學(xué)領(lǐng)域中,光纖技術(shù)
    的頭像 發(fā)表于 01-09 14:41 ?480次閱讀