AIGC大爆發(fā),科技革新不斷,數(shù)字人在各種場景中嶄露頭角,如數(shù)字人主播、數(shù)字人解說員、數(shù)字人導(dǎo)購等。根據(jù)真人形象AI生成數(shù)字人分身,這項技術(shù)已經(jīng)從未來走進現(xiàn)實。
數(shù)字人(Digital Human)是指利用計算機技術(shù)和人工智能技術(shù),根據(jù)真實人類的外貌、動作、聲音等特征,生成的具有高逼真度以及高交互性的虛擬人物,可以為人類提供多樣化的服務(wù)。
近期,【東風(fēng)生萬物】思必馳DFM-2大模型及創(chuàng)新技術(shù)應(yīng)用成果發(fā)布會上,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱的數(shù)字分身重磅亮相發(fā)布會現(xiàn)場。
思必馳數(shù)字人生成技術(shù)
思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱
思必馳基于DFM-2大模型推出的自然場景數(shù)字人生成技術(shù),采用擴散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,實現(xiàn)高品質(zhì)數(shù)字人生成,個性化對話生成與語音合成模型無縫結(jié)合,構(gòu)建可自由交互的個性化數(shù)字形象。思必馳打造的數(shù)字人不僅能說會道,還精通粵語、四川話、上海話等各地方言及英語、法語、俄語等多國語言,可應(yīng)用于智能家居、智能車載、智能軌交、市場營銷等場景,為人類生活帶來更多可能。
思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱
真人出鏡
就像視頻中的數(shù)字人俞凱教授,無論是聲音、表情、動作還是形象,都與真人高度接近,甚至還可以根據(jù)不同場景,切換語言與人類進行交互。
數(shù)字人的打造需要運用計算機圖形學(xué)、計算機視覺、自然語言處理、智能語音等領(lǐng)域的知識和技術(shù),從而生成一個從形態(tài)到聲音上都媲美真人的數(shù)字人。
思必馳基于自研的對話式語言大模型DFM-2與全鏈路綜合對話技術(shù)的聯(lián)動能力,可快速生成高品質(zhì)的數(shù)字人。在外貌上,思必馳采用擴散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,基于真人形象,構(gòu)建出可自由交互的數(shù)字形象。在語音上,思必馳通過聲音復(fù)刻、單人千音、細粒度情感及風(fēng)格合成、音頻場景合成等系列技術(shù),為數(shù)字人賦予語言能力,讓數(shù)字人變的更加鮮活。
●聲音復(fù)刻為數(shù)字人賦予真人同款聲音。思必馳聲音復(fù)刻技術(shù)服務(wù),支持男聲、女聲、童聲及中、英文和方言復(fù)刻,可輔助用戶打造不同年齡、不同性別的數(shù)字人形象。
●情感合成讓數(shù)字人也能表達喜怒哀樂。思必馳可合成高音質(zhì)、多情感的音色,呈現(xiàn)“高興、抱歉、撒嬌、中性”等多種情感聲音,為數(shù)字人的情感表達賦予了更多活力,提升了人機交互體驗。
●單人千音讓數(shù)字人也能說方言外語。思必馳單人千音技術(shù)可以在短時間內(nèi)快速將單個發(fā)音人的音色,遷移成為粵語、四川話、上海話、蘇州話、閩南語等方言以及俄語、德語、日語、法語、泰語、西班牙語等外語,讓數(shù)字人“青出于藍而勝于藍”。
中商產(chǎn)業(yè)研究院發(fā)布的《2023年數(shù)字人產(chǎn)業(yè)發(fā)展白皮書》顯示,2022年我國數(shù)字人產(chǎn)業(yè)市場規(guī)模達1464億元(同比增長57%),預(yù)計2025年全國數(shù)字人相關(guān)企業(yè)數(shù)量將突破40萬家、數(shù)字人產(chǎn)業(yè)市場規(guī)模將達到2600億元。數(shù)字人將進入大規(guī)模應(yīng)用期,轉(zhuǎn)化為現(xiàn)實生產(chǎn)力為社會創(chuàng)造價值。
在市場營銷領(lǐng)域,數(shù)字人可用于線上直播進行產(chǎn)品營銷推廣,降低公司的人力成本;在智能車載領(lǐng)域,數(shù)字人可融入車載系統(tǒng),提供導(dǎo)航、新聞播報等服務(wù),為用戶帶來更智慧的出行體驗;在家居領(lǐng)域,數(shù)字人可入駐家電大屏中,為用戶提供菜譜推薦、家務(wù)規(guī)劃、情感陪伴等服務(wù),成為用戶貼心的數(shù)字人管家;在軌交領(lǐng)域,數(shù)字人可在車站提供路線導(dǎo)航、購票咨詢、信息咨詢等服務(wù),降低軌交領(lǐng)域人力成本。
相較于真人,數(shù)字人可以不受時間或空間的限制,隨著大模型技術(shù)的應(yīng)用,數(shù)字人也將持續(xù)釋放價值。未來,思必馳將基于DFM-2大模型,綜合全鏈路語音交互技術(shù),為用戶帶來更具特色的數(shù)字人形象,加速推進AI技術(shù)的應(yīng)用落地。
審核編輯:彭菁
-
計算機
+關(guān)注
關(guān)注
19文章
7513瀏覽量
88173 -
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238900 -
思必馳
+關(guān)注
關(guān)注
4文章
285瀏覽量
14293 -
數(shù)字人
+關(guān)注
關(guān)注
0文章
129瀏覽量
2060 -
大模型
+關(guān)注
關(guān)注
2文章
2478瀏覽量
2842
原文標(biāo)題:AI生成之?dāng)?shù)字人分身,音畫合一有模有樣
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論