91无码人妻精品一区二区三区,999国产精品永久免费视频,被黑人伦流澡到高潮HNP动漫

您是否曾經(jīng)僅僅根據(jù)他們的聲音來(lái)構(gòu)造一個(gè)從未見(jiàn)過(guò)的人的心理形象？人工智能（AI）現(xiàn)在可以做到這一點(diǎn)，僅使用簡(jiǎn)短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個(gè)名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò)（一種以類(lèi)似于人腦的方式“思考”的計(jì)算機(jī)）經(jīng)過(guò)科學(xué)家培訓(xùn)，接受了來(lái)自互聯(lián)網(wǎng)的數(shù)百萬(wàn)個(gè)教育視頻，顯示了100，000多個(gè)不同的人在說(shuō)話。

研究人員在一項(xiàng)新研究中寫(xiě)道，Speech2Face通過(guò)該數(shù)據(jù)集學(xué)習(xí)了語(yǔ)音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后，AI使用音頻剪輯對(duì)與語(yǔ)音匹配的真實(shí)感面部建模。

值得慶幸的是，人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報(bào)告說(shuō)，神經(jīng)網(wǎng)絡(luò)識(shí)別語(yǔ)音中的某些標(biāo)記，這些標(biāo)記指向性別，年齡和種族，是許多人共有的特征。

科學(xué)家寫(xiě)道：“因此，該模型只會(huì)產(chǎn)生看上去普通的面孔?！?“它不會(huì)產(chǎn)生特定個(gè)人的圖像?！?/p>

盡管坦率地說(shuō)，對(duì)貓的解釋有點(diǎn)讓人恐懼，但AI已經(jīng)證明它可以產(chǎn)生出異常準(zhǔn)確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是，根據(jù)這項(xiàng)研究，這些圖像通常確實(shí)可以捕捉到正確的年齡范圍，種族和性別。

但是，該算法的解釋遠(yuǎn)非完美。當(dāng)面對(duì)語(yǔ)言變化時(shí)，Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如，當(dāng)AI收聽(tīng)亞洲人講中文的音頻片段時(shí)，該程序會(huì)產(chǎn)生亞洲人臉的圖像。然而，據(jù)科學(xué)家報(bào)道，當(dāng)同一個(gè)人用不同的音頻片段講英語(yǔ)時(shí)，人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見(jiàn)，將低音調(diào)的聲音與男性面孔相關(guān)聯(lián)，將高音調(diào)的聲音與女性面孔相關(guān)聯(lián)。研究人員寫(xiě)道，由于訓(xùn)練數(shù)據(jù)集僅代表YouTube上的教育視頻，因此“并不代表整個(gè)世界人口?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

數(shù)字圖像

數(shù)字圖像

+關(guān)注

關(guān)注
2

文章
119

瀏覽量
18837
人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47525

瀏覽量
239254
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24754

評(píng)論

相關(guān)推薦

HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí)：AI智能語(yǔ)音播報(bào)

一、DEMO思路在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中，我們將使用ArkTS開(kāi)發(fā)語(yǔ)言創(chuàng)建一個(gè)簡(jiǎn)單的AI智能語(yǔ)音播報(bào)應(yīng)用。該應(yīng)用能夠接收用戶(hù)輸入的文本，并使用TTS

發(fā)表于 01-06 15:33

充電樁語(yǔ)音方案，支持OTA語(yǔ)音升級(jí)的音頻芯片NV400F

1產(chǎn)品市場(chǎng)隨著新能源汽車(chē)的普及，充電樁作為其核心配套設(shè)施，其智能化、便捷化的需求日益增長(zhǎng)。充電樁語(yǔ)音方案，尤其是支持OTA（Over-The-Air）語(yǔ)音升級(jí)的音頻芯片NV400F，正逐步成為市場(chǎng)上

發(fā)表于 11-09 01:03 ?337次閱讀

充電樁<b class='flag-5'>語(yǔ)音</b>方案，支持OTA<b class='flag-5'>語(yǔ)音</b>升級(jí)的<b class='flag-5'>音頻</b>芯片NV400F

tlv320Ai32在輸出音頻時(shí)總有絲絲聲，為什么？

tlv320Ai32在輸出音頻時(shí)總有絲絲聲，即使輸出的濾波將噪聲調(diào)整到90mV以下還是存在。測(cè)試發(fā)現(xiàn)HPout的噪聲有將近480mV 請(qǐng)問(wèn)這是什么原因，Ai32還有什么寄存器要設(shè)置的？模擬電源的紋波大概60mV，有影響嗎？

發(fā)表于 11-05 06:09

NVH-FLASH語(yǔ)音芯片支持平臺(tái)做語(yǔ)音—打造音頻IC技術(shù)革新

隨著科技的飛速發(fā)展，人們對(duì)于電子產(chǎn)品的音頻性能要求越來(lái)越高。在這種背景下，NVH-FLASH系列語(yǔ)音芯片應(yīng)運(yùn)而生，作為音頻IC領(lǐng)域的一次重大技術(shù)革新，NVH-FLASH系列語(yǔ)音芯片憑借

發(fā)表于 10-16 08:02 ?231次閱讀

NVH-FLASH<b class='flag-5'>語(yǔ)音</b>芯片支持平臺(tái)做<b class='flag-5'>語(yǔ)音</b>—打造<b class='flag-5'>音頻</b>IC技術(shù)革新

真實(shí)感受，迷你主機(jī)到底是不是智商稅？

我是今年年初把我的臺(tái)式主機(jī)換成了華碩的迷你主機(jī)PN65（主要是我這臺(tái)主機(jī)太大，我感覺(jué)它太礙事），第一次接觸迷你主機(jī)是被它小巧輕便的外形所吸引的，相比與傳統(tǒng)主機(jī)的厚重，迷你主機(jī)只有巴掌哪么大，對(duì)于辦公面積不大的小伙伴來(lái)說(shuō)絕對(duì)是一大福音。直接上圖大家看吧 ? ? 尺寸大小對(duì)比 ? ? 都說(shuō)只有巴掌大小，現(xiàn)實(shí)對(duì)比只有我半個(gè)手掌大 ? 總感覺(jué)迷你主機(jī)的性能不如臺(tái)式主機(jī)，買(mǎi)臺(tái)式主機(jī)到底是不是智商稅？我手里的這臺(tái)迷你主機(jī)從購(gòu)買(mǎi)

發(fā)表于 08-13 18:25 ?278次閱讀

<b class='flag-5'>真實(shí)感</b>受，迷你主機(jī)到底是不是智商稅？

聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門(mén)資源合集（硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集）

本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯視覺(jué)語(yǔ)音大模型 AI 開(kāi)發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計(jì)的具備豐富語(yǔ)音圖像功能

發(fā)表于 06-18 17:33

語(yǔ)音降噪的原理

在專(zhuān)業(yè)音頻設(shè)備中，語(yǔ)音降噪是很重要的一個(gè)環(huán)節(jié)。隨著AI人工智能的快速發(fā)展，各種AI人工智能降噪方法應(yīng)運(yùn)而生。

發(fā)表于 06-03 17:21 ?2183次閱讀

3D建模的特點(diǎn)和優(yōu)勢(shì)都有哪些？

的應(yīng)用。特點(diǎn)： 1.三維模型化：3D建模允許用戶(hù)在虛擬空間內(nèi)創(chuàng)建具有長(zhǎng)度、寬度和高度的物體，從而形成真實(shí)感十足的三維模型。 2.精確性：通過(guò)3D建模軟件，用戶(hù)可以精確地控制對(duì)象的尺寸、形狀和位置，確保設(shè)計(jì)的準(zhǔn)確性。 3.可視化

發(fā)表于 05-13 16:41 ?2569次閱讀

USB AI話務(wù)語(yǔ)音降噪音頻方案

USB AI話務(wù)語(yǔ)音降噪音頻方案

發(fā)表于 04-25 18:16 ?652次閱讀

USB <b class='flag-5'>AI</b>話務(wù)<b class='flag-5'>語(yǔ)音</b>降噪<b class='flag-5'>音頻</b>方案

谷歌推出多模態(tài)VLOGGER AI

谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注，這項(xiàng)創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來(lái)并“說(shuō)話”。用戶(hù)只需提供一張人物肖像照片和一段音頻內(nèi)容，VLOGGER AI就能讓圖片中的人物仿佛真的在朗讀這段

發(fā)表于 03-22 10:45 ?875次閱讀