0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道屏幕后是誰在和你對(duì)話嗎?新研究開發(fā)仿真面對(duì)面對(duì)話系統(tǒng)

Hf1h_BigDataDig ? 來源:TW ? 2019-09-02 15:48 ? 次閱讀

基于深度神經(jīng)網(wǎng)絡(luò)仿真面對(duì)面對(duì)話系統(tǒng)

近日,CloudMinds和北京航空航天大學(xué)的研究人員基于深度學(xué)習(xí)提出了一種新的仿真面對(duì)面對(duì)話系統(tǒng)。CloudMinds是一家在機(jī)器人和云服務(wù)領(lǐng)域的領(lǐng)軍企業(yè),致力于成為針對(duì)各種機(jī)器人模型需求的供應(yīng)商。

該會(huì)話系統(tǒng)包括用于收聽和說話的兩個(gè)序列到序列模型以及基于虛擬代理合成器的生成性對(duì)抗網(wǎng)絡(luò)(GAN)模型。

當(dāng)虛擬代理與人通信時(shí),語音音頻和面部圖像被輸入到系統(tǒng)中。面部圖像由面部解析模塊處理,產(chǎn)生面部動(dòng)作和姿勢(shì)。然后將生成的信息傳遞到基于序列到序列的收聽模型中。當(dāng)虛擬代理在收聽時(shí),輸出被饋送到合成器中以產(chǎn)生逼真的面部圖像作為非語言反應(yīng)。

語音識(shí)別模型將語音音頻變換為文本,然后傳遞到會(huì)話模塊中以生成響應(yīng)語句,該響應(yīng)語句被傳遞到文本到語音(TTS)模塊以合成語音。響應(yīng)語句被傳遞到序列到序列的說話模型,其輸出也被輸入到虛擬合成器中以產(chǎn)生逼真的面部圖像,從而呼應(yīng)語音內(nèi)容。頭像合成器則用于在整個(gè)對(duì)話期間收聽和說話。

本文顯著改進(jìn)了傳統(tǒng)的基于3D模型的成果。為了訓(xùn)練模型,研究人員收集了大約700個(gè)ESPN視頻,其中包含來自YouTube的面對(duì)面對(duì)話場(chǎng)景。

與傳統(tǒng)3D模型的生成結(jié)果相比,該模型所生成的面部圖像更接近現(xiàn)實(shí)。毋庸置疑的是,在使得會(huì)話更加逼真自然的領(lǐng)域上,該系統(tǒng)還有很大的潛力可供挖掘,未來它還可用于實(shí)現(xiàn)個(gè)性化表情會(huì)話。

原文:

https://arxiv.org/abs/1908.07750

使用DISCo方法改進(jìn)鈣成像分析

本文中,德國(guó)海德堡大學(xué)跨學(xué)科科學(xué)計(jì)算中心(IWR)的研究人員介紹了DISCo方法,這是一種使用深度學(xué)習(xí),實(shí)例分割和相關(guān)性研究的新方法,可用于鈣成像分析中的細(xì)胞分割步驟。

DISCo將深度學(xué)習(xí)網(wǎng)絡(luò)的優(yōu)勢(shì)與最先進(jìn)的實(shí)例分割程序相結(jié)合,允許直接提取單元實(shí)例而無需任何復(fù)雜的后處理步驟。他們還以非常有效的方式利用鈣成像視頻的時(shí)間背景來計(jì)算像素之間的分段相關(guān)性。然后以摘要圖像的形式將此時(shí)間信息與基于形狀的信息相結(jié)合。

DISCo的最大優(yōu)勢(shì)在于能夠結(jié)合相關(guān)性和圖像特征,而不只依賴于其中一種方法。因此,DISCo可以通過在Neurofinder數(shù)據(jù)集上僅使用單個(gè)模型來使神經(jīng)研究人員獲得良好的整體性能。此外,當(dāng)在幾個(gè)數(shù)據(jù)集系列上訓(xùn)練單個(gè)網(wǎng)絡(luò)時(shí),研究人員能夠超越在Neurofinder數(shù)據(jù)集上訓(xùn)練的所有其他方法。

原文:

https://arxiv.org/abs/1908.07957

用于科研教育的低成本開源機(jī)器人賽車平臺(tái)

華盛頓大學(xué)保羅G.艾倫計(jì)算機(jī)科學(xué)與工程學(xué)院的研究人員最近介紹了MuSHR,即多代理的非完整賽車系統(tǒng)。MuSHR是一個(gè)低成本、開源的機(jī)器人賽車平臺(tái),致力于教育和研究,由MuSHR的個(gè)人機(jī)器人實(shí)驗(yàn)室開發(fā),旨在促進(jìn)機(jī)器人領(lǐng)域的公民化。作為一個(gè)低成本的平臺(tái),參與者可以通過說明,開源文檔和動(dòng)手教程參與其中。

賽車的硬件設(shè)計(jì)基于一系列現(xiàn)成的組件,這些組件可以從世界各地的線上和線下硬件商店中輕松地找到,而軟件架構(gòu)則是在個(gè)人機(jī)器人實(shí)驗(yàn)室中開發(fā)的。該平臺(tái)為華盛頓大學(xué)的移動(dòng)機(jī)器人課程開發(fā)了一套演示系統(tǒng)和許多寶貴的實(shí)踐經(jīng)驗(yàn),是機(jī)器人平臺(tái)開發(fā)的里程碑。

MuSHR的低成本開發(fā)模式和綜合的文檔記錄是寶貴的機(jī)器人研究資源。該平臺(tái)向?qū)W術(shù)研究實(shí)驗(yàn)室,機(jī)器人研究者及機(jī)器人愛好者等展示各種機(jī)器人研究項(xiàng)目提供了一個(gè)出色的測(cè)試平臺(tái)。

MuSHR具有開源指令和教程帶領(lǐng)用戶完成硬件開發(fā)。文檔托管在Github上,免費(fèi)供一般公眾下載使用。

代碼:

https://github.com/prl-mushr

原文:

https://arxiv.org/abs/1908.08031

三維掃描與CAD對(duì)象的聯(lián)合嵌入

近日,慕尼黑工業(yè)大學(xué)、斯坦福大學(xué)以及 Facebook 人工智能研究所共同提出了一種學(xué)習(xí)三維掃描和CAD之間的聯(lián)合嵌入空間的技術(shù)。而在這兩者中有很多聯(lián)系緊密且十分相似的事物。這一學(xué)習(xí)方法基于一種全新的3D CNN 技術(shù),通過學(xué)習(xí)聯(lián)合嵌入空間中事物的相似性來實(shí)現(xiàn)嵌入。

為了學(xué)習(xí)一個(gè)掃描對(duì)象和CAD模型可以相互交織的共享空間,研究人員提出使用堆疊沙漏的方式將前景、背景與掃描對(duì)象分開,并將其轉(zhuǎn)換為完整的類CAD表示,以此將它整合到共享嵌入空間中。這樣操作得到的嵌入空間可以用于CAD模型檢索。為了更好地完成這一任務(wù),研究人員引入了一個(gè)全新數(shù)據(jù)集,其中包括了掃描CAD相似性注釋。在這一數(shù)據(jù)集的幫助下,他們能夠?qū)AD模型檢索進(jìn)行細(xì)粒度的評(píng)估,并對(duì)雜亂、嘈雜部分進(jìn)行掃描。

這一新型學(xué)習(xí)方式比現(xiàn)有的CAD模型在實(shí)例檢索上的準(zhǔn)確率高出10% 以上。

因此,它在CAD模型檢索方面的表現(xiàn)比原有模型更好。學(xué)習(xí)這樣的聯(lián)合掃描- CAD嵌入空間不僅為CAD模型檢索提供了新的解決方案,也為這兩個(gè)領(lǐng)域之間的知識(shí)映射提供了新的可能性。

當(dāng)然,雖然這個(gè)技術(shù)在掃描與學(xué)習(xí)CAD對(duì)象空間方面非常有效,但它仍然有很多局限性——目前研究人員僅考慮了掃描和CAD對(duì)象領(lǐng)域中對(duì)象的幾何形狀;而這篇論文中未提及的顏色信息可能是聯(lián)合嵌入或CAD模型檢索的另一強(qiáng)大信號(hào)。

原文:

https://arxiv.org/abs/1908.06989

Google發(fā)布Turbo,可視化工具的里程碑式突破

Turbo 是由Google研究人員提出的一種著色工具,它既有Jet的優(yōu)勢(shì)功能,同時(shí)也解決了Jet的一些短板,例如細(xì)節(jié)錯(cuò)誤、條帶、和顏色混淆等。

在開發(fā)人員的精心調(diào)試下,Turbo的強(qiáng)大性能能夠勝任各種可視化任務(wù)。在開發(fā)過程中,研究人員們制作了一個(gè)簡(jiǎn)單的交互界面,在其中他們能夠使用7節(jié)立方條來調(diào)整RGB曲線,同時(shí)將樣本結(jié)果與其他知名彩繪程序的結(jié)果進(jìn)行比較。

Turbo可以作為順序和發(fā)散的可視化工具,因此它很適合開發(fā)人員保存在自己的“工具箱”中。它用于解決均勻性不那么重要的數(shù)據(jù)可視化任務(wù)非常有效,尤其是在需要展現(xiàn)強(qiáng)烈對(duì)比的情況下。

Google的團(tuán)隊(duì)將這個(gè)工具用于實(shí)現(xiàn)視差貼圖、誤差貼圖以及許多其他標(biāo)量的可視化中。您可以在下方鏈接中找到在Python和C/C++ 中的使用這幾技術(shù)的方法,以及多項(xiàng)式逼近的方法——用于可能查表查詢不太方便的情況中。

Python:

https://gist.github.com/mikhailov-work/ee72ba4191942acecc03fe6da94fc73f

C/C++:

https://gist.github.com/mikhailov-work/6a308c20e494d9e0ccc29036b28faa7a

Polynomial approximation:

https://gist.github.com/mikhailov-work/0d177465a8151eb6ede1768d51d476c7

原文:

https://ai.googleblog.com/2019/08/turbo-improved-rainbow-colormap-for.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4777

    瀏覽量

    100961
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31294

    瀏覽量

    269655

原文標(biāo)題:狗還是機(jī)器人?誰在屏幕后和你對(duì)話?新研究開發(fā)仿真面對(duì)面對(duì)話系統(tǒng) | 一周AI最火論文

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HarmonyOS NEXT 原生應(yīng)用開發(fā):社交聊天對(duì)話過程實(shí)現(xiàn)

    一、實(shí)現(xiàn)思路 本DEMO旨在展示如何在HarmonyOS NEXT平臺(tái)上,利用ArkTS開發(fā)語言構(gòu)建一個(gè)簡(jiǎn)易的社交聊天對(duì)話界面。用戶可以在此界面上查看聊天記錄,并發(fā)送新的消息。此示例中,聊天記錄
    發(fā)表于 01-07 10:55

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對(duì)話

    一、練習(xí)內(nèi)容 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個(gè)功能更為豐富的AI智能對(duì)話框。這個(gè)對(duì)話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號(hào),并
    發(fā)表于 01-03 11:29

    TIKOOL太酷信息無線內(nèi)部通話系統(tǒng)允許多個(gè)人一起講話,頻道內(nèi)會(huì)不會(huì)很吵?

    傳統(tǒng)的對(duì)講機(jī)聲音采樣率普遍是4K,音質(zhì)差,往往音量大但稍有干擾就聽不清內(nèi)容;TIKOOL太酷無線內(nèi)部通話系統(tǒng)音頻采樣率可達(dá)16K,音質(zhì)數(shù)倍的提升,具備極高的聲音還原度,如同面對(duì)面聊天,多人講話也不會(huì)
    發(fā)表于 12-18 09:07

    “向新而行,BC共生”BC領(lǐng)袖對(duì)話實(shí)錄

    股份有限公司(以下簡(jiǎn)稱“愛旭股份”)董事長(zhǎng)陳剛,上海交通大學(xué)太陽能研究所所長(zhǎng)沈文忠教授參加對(duì)話,共論BC的技術(shù)優(yōu)勢(shì)、市場(chǎng)潛力與協(xié)同發(fā)展。以下為對(duì)話文字實(shí)錄——
    的頭像 發(fā)表于 12-05 15:42 ?287次閱讀

    比亞迪“豹友面對(duì)面-豹8用戶專場(chǎng)活動(dòng)”成功舉辦

    在比亞迪集團(tuán)慶祝其輝煌30周年之際,比亞迪深圳總部禮賓樓迎來了“豹友面對(duì)面·豹8用戶專場(chǎng)”盛典。
    的頭像 發(fā)表于 11-27 10:19 ?189次閱讀

    AI對(duì)話魔法 Prompt Engineering 探索指南

    作者:京東物流 李雪婷 一、什么是 Prompt Engineering? 想象一下,在和一個(gè)智能助手聊天,需要說出非常清晰和具體的要求,才能得到你想要的答案。Prompt
    的頭像 發(fā)表于 11-07 10:11 ?854次閱讀
    AI<b class='flag-5'>對(duì)話</b>魔法 Prompt Engineering 探索指南

    ChatGPT:為未來的個(gè)人和企業(yè)提供革命性的對(duì)話解決方案

    和準(zhǔn)確性。6.增強(qiáng)用戶體驗(yàn):ChatGPT可以為個(gè)人和企業(yè)提供更好的用戶體驗(yàn),通過交互式對(duì)話提供個(gè)性化的建議、指導(dǎo)和支持。7.自動(dòng)化客服:ChatGPT可以被用于自動(dòng)化客服系統(tǒng),為用戶提供即時(shí)響應(yīng)
    的頭像 發(fā)表于 11-01 11:12 ?185次閱讀
    ChatGPT:為未來的個(gè)人和企業(yè)提供革命性的<b class='flag-5'>對(duì)話</b>解決方案

    大研智造廠家面對(duì)面 關(guān)于激光焊錫機(jī)、錫球焊設(shè)備高頻問題QA,你想知道的都在這!

    在這個(gè)問答系列中,我們將深入探討激光焊錫機(jī)的各個(gè)方面,從基礎(chǔ)概念到技術(shù)細(xì)節(jié),從設(shè)備構(gòu)成到市場(chǎng)應(yīng)用,再到未來的發(fā)展趨勢(shì)。無論您是電子制造行業(yè)的專業(yè)人士,還是對(duì)激光焊錫技術(shù)感興趣的學(xué)者,或是正在尋找合適焊接解決方案的企業(yè)家,這些問答都將為您提供寶貴的信息和深刻的見解。我們將一起揭開激光焊錫機(jī)的神秘面紗,探索它如何為現(xiàn)代制造業(yè)帶來革命性的變化。
    的頭像 發(fā)表于 10-31 11:28 ?239次閱讀
    大研智造廠家<b class='flag-5'>面對(duì)面</b> 關(guān)于激光焊錫機(jī)、錫球焊設(shè)備高頻問題QA,你想<b class='flag-5'>知道</b>的都在這!

    ChatGPT 在游戲開發(fā)中的創(chuàng)新應(yīng)用

    在游戲開發(fā)領(lǐng)域,人工智能技術(shù)的應(yīng)用正變得越來越廣泛。ChatGPT,作為一種先進(jìn)的自然語言處理(NLP)模型,為游戲開發(fā)帶來了許多創(chuàng)新的應(yīng)用。 1. 動(dòng)態(tài)對(duì)話系統(tǒng) ChatGPT的強(qiáng)項(xiàng)
    的頭像 發(fā)表于 10-25 18:05 ?680次閱讀

    定時(shí)關(guān)閉對(duì)話

    發(fā)一個(gè)項(xiàng)目上用的定時(shí)對(duì)話
    發(fā)表于 06-07 10:07

    基于微機(jī)電系統(tǒng)的智能手表

    微機(jī)電系統(tǒng)采用的是梳狀驅(qū)動(dòng)式致動(dòng)器。要理解其工作原理,可以設(shè)想兩個(gè)梳齒間隔很大的梳子,它們面對(duì)面擺放,梳齒交錯(cuò)。
    的頭像 發(fā)表于 04-28 11:18 ?666次閱讀

    Mode Maison利用基于OpenUSD的高保真數(shù)字孿生推動(dòng)零售業(yè)創(chuàng)新

    “ Omniverse 先鋒面對(duì)面”系列文章主要介紹使用 OpenUSD 為 3D 工作流和物理精確的虛擬世界構(gòu)建工具、應(yīng)用和服務(wù)的個(gè)人創(chuàng)作者和開發(fā)者。
    的頭像 發(fā)表于 04-03 10:04 ?358次閱讀
    Mode Maison利用基于OpenUSD的高保真數(shù)字孿生推動(dòng)零售業(yè)創(chuàng)新

    蘋果WWDC24將于6月10日至14日召開

    蘋果指出,WWDC規(guī)模宏大,是蘋果每年最重要的開發(fā)者盛典之一。屆時(shí),開發(fā)人員不僅能了解蘋果最新研發(fā)的各項(xiàng)技術(shù)和平臺(tái),也可體驗(yàn)如何對(duì)應(yīng)用程序和游戲進(jìn)行改造。據(jù)稱,開發(fā)者還有機(jī)會(huì)與蘋果設(shè)計(jì)及工程部門的專家進(jìn)行
    的頭像 發(fā)表于 03-27 13:54 ?2586次閱讀

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對(duì)話

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對(duì)話
    的頭像 發(fā)表于 03-21 09:44 ?432次閱讀
    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次<b class='flag-5'>對(duì)話</b>

    鴻蒙開發(fā)實(shí)戰(zhàn)-手寫文心一言AI對(duì)話APP

    本文我們學(xué)習(xí)使用了基本組件的使用,網(wǎng)絡(luò)請(qǐng)求以及狀態(tài)管理,使用了ForEach循環(huán)渲染來構(gòu)建對(duì)話界面。并且在HarmonyOS設(shè)備上成功運(yùn)行
    的頭像 發(fā)表于 01-24 18:02 ?1132次閱讀
    鴻蒙<b class='flag-5'>開發(fā)</b>實(shí)戰(zhàn)-手寫文心一言AI<b class='flag-5'>對(duì)話</b>APP