91无码人妻精品一二三区,国产精品久久久久影院色片,国产最新免费视频网站

科技云報道原創(chuàng)。

北京冬奧運(yùn)AI 虛擬人手語主播、杭州亞運(yùn)會數(shù)字人點(diǎn)火、新華社數(shù)字記者、數(shù)字航天員小諍......當(dāng)隨著越來越多數(shù)字人出現(xiàn)在人們生活中，整個數(shù)字人行業(yè)也朝著多元化且廣泛的應(yīng)用方向發(fā)展，快速拓展到不同行業(yè)、不同場景。

面向C端，數(shù)字人幫助用戶生產(chǎn)內(nèi)容和輔助工作，如：數(shù)字人練口語、和數(shù)字人玩游戲等；面向B端，數(shù)字人是企業(yè)的“工具人”，應(yīng)用于金融、影視、電商、直播等行業(yè)，提高行業(yè)生產(chǎn)和運(yùn)營效率。

毫無疑問，數(shù)字人是一門好生意，但其規(guī)?；涞匾廊幻媾R著人才、成本、場景、技術(shù)等層層困難。其中，最關(guān)鍵的是技術(shù)瓶頸，如何讓數(shù)字人擺脫“空有一副好皮囊”的市場評價是一大難題。

然而，隨著大模型的出現(xiàn)，數(shù)字人的發(fā)展似乎正在迎來新的機(jī)遇。

大模型賦能數(shù)字人

對于產(chǎn)業(yè)界而言，數(shù)字人本身并不新鮮。在過去很長一段時間內(nèi)，為了又力求數(shù)字人視覺外形上的高保真呈現(xiàn)，生產(chǎn)成本不亞于制作一部專業(yè)級電影。

瑞銀發(fā)布的數(shù)字人研究報告指出，高級虛擬人物的先期投入成本平均為3000萬元，后期又需要真人團(tuán)隊(duì)完成拍攝、配音、剪輯。以樂華娛樂的虛擬女團(tuán)A-SOUL為例，其一支單曲制作成本約200萬元，一場線下演唱會成本約2000萬元。

但即便是如此高昂的成本，也解決不了數(shù)字人的互動效果問題。由于智能水平不足，與其說它是數(shù)字人，更像是一個沒有靈魂的數(shù)字皮套。

高成本，再加上互動效果不佳，使得數(shù)字人的使用被限制在廠商內(nèi)部或大企業(yè)客戶的試驗(yàn)項(xiàng)目。

因此，當(dāng)具有學(xué)習(xí)能力的生成式大模型顛覆了內(nèi)容制作范式后，面向更廣范圍的中小型企業(yè)用戶、優(yōu)先規(guī)?；涞厥褂玫牧畠r數(shù)字人成為了可行方案。

據(jù)一名人工智能研究人員介紹，大模型對數(shù)字人的重塑與賦能主要體現(xiàn)為降本增效。

從技術(shù)角度來說，搭建一個數(shù)字人主要分為建模、驅(qū)動、渲染幾個環(huán)節(jié)。傳統(tǒng)的數(shù)字人主要依托計(jì)算機(jī)圖形學(xué)技術(shù)+真人動作捕捉，需要采集大量的真人數(shù)據(jù)，深度建模，耗時長，效率低，成本高。

如今在大模型的加持下，通過AI算法，基于深度學(xué)習(xí)模型、動作模擬、情感模擬等技術(shù)，只需要幾分鐘的真人視頻，用大模型訓(xùn)練若干個小時，就可以生成逼真的數(shù)字人，制作成本大大降低。

不僅如此，數(shù)字人在成本降低的同時，效能也大大提升。

在大模型出現(xiàn)以前，數(shù)字人在外形上差異度較小，而且只能根據(jù)輸入的統(tǒng)一腳本，“照本宣科”地回答問題。

在大模型的賦能下，數(shù)字人擁有了“靈魂”，不僅外貌特征可以自定義設(shè)計(jì)，智能化、交互性也有了很大提升。比如在一些直播帶貨場景中，數(shù)字人已經(jīng)可以與受眾進(jìn)行基礎(chǔ)互動。

比如，百度智能云發(fā)布的曦靈數(shù)字人，大模型的加持下，可以15分鐘快速完成直播間搭建，自動生成匹配產(chǎn)品特色的講品話術(shù)，開啟智能互動問答。

在某餐飲品牌的直播間，曦靈數(shù)字人主播自動生成直播話術(shù)，包含開場破冰、福利放送、暖場話術(shù)、催單話術(shù)等。在這場真人與曦靈數(shù)字人的接力直播中，用戶竟然沒有絲毫察覺。

更令人驚訝的事，在真實(shí)6小時的直播比對中，數(shù)字人主播僅需真人主播15%的成本，就可獲得真人主播85%GMV。

除了直播帶貨，百度智能云曦靈作為國內(nèi)首個大模型全面重構(gòu)的數(shù)字人平臺，還可為企業(yè)提供2D真人、3D寫實(shí)、3D超寫實(shí)的人像，實(shí)現(xiàn)視頻制作、數(shù)字員工、數(shù)字人代言人等多種應(yīng)用。

比如，在曦靈平臺，只需5分鐘的真人視頻，半小時即可訓(xùn)練人像，錄制100句話語，24小時生成專屬音色庫，相比真人授課成本只需過去的30%，錄制效率提升20倍。

不難發(fā)現(xiàn)，經(jīng)過大模型重塑與賦能的數(shù)字人，一定程度上擺脫了價格昂貴、互動性差等問題，越來越廣泛地出現(xiàn)在短視頻、直播間中。

同時，數(shù)字人開始朝著更多“身份”進(jìn)軍——銀行理財師、律師、老師、已逝的名人……數(shù)字人正在成為任何想成為的人，也為這條日漸擁擠的賽道帶來了新的機(jī)遇。

讓數(shù)字人更像“人”

大模型的出現(xiàn)讓數(shù)字人“脫胎換骨”，成為如今最火的創(chuàng)業(yè)賽道之一。

目前市場上主要的數(shù)字人廠商主要有兩類：一類是以百度、騰訊、華為等為代表的科技巨頭，基于自身大模型方面的優(yōu)勢研發(fā)推出數(shù)字人產(chǎn)品；另一類是以硅基智能、出門問問、相芯科技等為代表的中小廠商。

多名人工智能領(lǐng)域投資人表示，目前AIGC（生成式人工智能）還處于早期階段，能落地產(chǎn)生利潤的不多，數(shù)字人是其中比較少有的商業(yè)化路徑，且已經(jīng)能夠盈利的項(xiàng)目。

但隨著大量的創(chuàng)業(yè)者涌入，行業(yè)競爭趨于激烈和同質(zhì)化，賽道逐漸變得擁擠和內(nèi)卷。

內(nèi)卷的一個表現(xiàn)是價格越降越低。目前2D數(shù)字人的價格大多數(shù)已經(jīng)降到千元級別，有的甚至只需要幾百元。

360集團(tuán)的數(shù)字人營銷服務(wù)也顯示，通過智能營銷云平臺的配套SaaS服務(wù)推廣給客戶，按照會員用戶每月付費(fèi)的標(biāo)準(zhǔn)估算，一款數(shù)字人的價格最低幾十元，最高在一、二百元上下。

隨著大量低成本的數(shù)字人涌入市場，百元級別的數(shù)字分身迅速被炒成一本萬利的“財富經(jīng)”。

每到深夜，打開主流平臺，大量的數(shù)字人堅(jiān)守在直播間。隨之而來的是關(guān)于數(shù)字人的質(zhì)疑聲漸起，諸如效果太假、市場混亂等，導(dǎo)致用戶體驗(yàn)不佳。

有業(yè)內(nèi)人士認(rèn)為，隨著越來越多的玩家涌入，一些創(chuàng)業(yè)者技術(shù)能力有限，生產(chǎn)的數(shù)字人產(chǎn)品質(zhì)量良莠不齊，容易導(dǎo)致劣幣驅(qū)逐良幣。

一方面，數(shù)字人多用于較為簡單的環(huán)境、解決較為基礎(chǔ)的問題，在場景切換或面對多輪對話時，可能出現(xiàn)答非所問或陷入死循環(huán)的情況，制約用戶體驗(yàn)。

另一方面，大模型下的數(shù)字人交互體驗(yàn)始終與真人存在明顯差異，比如，在Sora生成內(nèi)容中，無視物理學(xué)原理、人的手指時多時少等問題被廣為詬病，可能進(jìn)一步引發(fā)心理方面的“恐怖谷效應(yīng)”。

對此，也有專家認(rèn)為，需要進(jìn)一步提升技術(shù)創(chuàng)新能力和用戶體驗(yàn)感，在保證數(shù)字人外在擬人效果的同時，優(yōu)化用戶交互體驗(yàn)，注重實(shí)時渲染、光學(xué)捕捉、三維重建、智能人機(jī)交互等新興技術(shù)與自然語言處理、語音識別、計(jì)算機(jī)視覺、生成式AI等技術(shù)的研究和應(yīng)用。

“當(dāng)前行業(yè)正在共同突破的技術(shù)目標(biāo)是‘如何讓數(shù)字人變得更像一個人’，像人一樣去思考”，一位業(yè)內(nèi)人士表示，加快企業(yè)間的技術(shù)協(xié)同，解決交互型數(shù)字人在情緒感知、語義理解等方面的技術(shù)難題是接下來的重點(diǎn)。

這一系列的挑戰(zhàn)都指向技術(shù)側(cè)。

2024年度《中國虛擬數(shù)字人影響力指數(shù)報告》指出，截至2024年2月底，國家知識產(chǎn)權(quán)局“專利檢索”數(shù)據(jù)顯示，2023年全年數(shù)字人領(lǐng)域?qū)＠暾垟?shù)高達(dá)544個，反映出業(yè)界在核心技術(shù)研發(fā)上的強(qiáng)勁勢頭和深度創(chuàng)新。

從2023年數(shù)字人相關(guān)專利申請機(jī)構(gòu)來看，以百度、騰訊為代表的老牌互聯(lián)網(wǎng)巨頭，以中國移動、工商銀行為代表的頭部通信、金融機(jī)構(gòu)，以小冰公司、世優(yōu)科技、黑鏡科技為代表的頭部數(shù)字人公司形成了技術(shù)端的多強(qiáng)格局。

盡管行業(yè)頭部大廠在AI技術(shù)上擁有了先發(fā)優(yōu)勢，但在產(chǎn)業(yè)高速發(fā)展的過程中，每個公司在技術(shù)本身都沒有絕對的壁壘，本質(zhì)上技術(shù)背后是人。對于所有數(shù)字人廠商來說，AIGC帶來機(jī)會的同時，也成為直面挑戰(zhàn)的起點(diǎn)。

結(jié)語

數(shù)字人正處于風(fēng)口，吸引了大量想分一杯羹的創(chuàng)業(yè)者涌入。但不可否認(rèn)的是，作為一項(xiàng)年輕的技術(shù)，數(shù)字人還處于早期階段，市場尚在培育之中。

對于同處一片紅海中的數(shù)字人公司來說，要思考的或許不是如何“卷低價”，而是通過技術(shù)的不斷進(jìn)步，讓數(shù)字人“更像人”，提高行業(yè)的整體水位，讓數(shù)字人“活下去”，創(chuàng)造更多的價值。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年，是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可，可信云、全球云計(jì)算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269108
數(shù)字人

數(shù)字人

+關(guān)注

關(guān)注
0

文章
127

瀏覽量
2036
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2450

瀏覽量
2714

《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

研讀《具身智能機(jī)器人系統(tǒng)》第7-9章，我被書中對大模型與機(jī)器人技術(shù)融合的深入分析所吸引。第7章詳細(xì)闡述了ChatGPT for Robotics的核心技術(shù)創(chuàng)新：它摒棄了傳統(tǒng)的分層控制架構(gòu)，創(chuàng)造性地

發(fā)表于 12-24 15:03

雙十一入手數(shù)字人！華為云 Flexus 數(shù)字人 3 大優(yōu)勢賦予硬核體驗(yàn)

近年來，隨著技術(shù)的不斷發(fā)展，數(shù)字人的功能和表現(xiàn)力也在不斷提升，越來越多的企業(yè)開始探索如何利用數(shù)字人實(shí)現(xiàn)真正的降本增效。根據(jù)最新的市場研究報告，全球數(shù)

發(fā)表于 12-03 18:11 ?412次閱讀

數(shù)字人的市場趨勢分析

數(shù)字人，也被稱為虛擬人、數(shù)字虛擬形象或虛擬角色，是指通過計(jì)算機(jī)圖形學(xué)、人工智能、動作捕捉等技術(shù)創(chuàng)造的具有人類特征的數(shù)字化形象。隨著技術(shù)的發(fā)展，數(shù)字

發(fā)表于 10-28 14:46 ?347次閱讀

摩爾線程與羽人科技完成大語言模型訓(xùn)練測試

近日，摩爾線程與羽人科技攜手宣布，雙方已成功實(shí)現(xiàn)夸娥（KUAE）千卡智算集群與羽人系列模型解決方案的訓(xùn)練兼容適配。在本次測試中，羽人科技通過摩爾線程夸娥千卡智算集群，高效完成了70億參

發(fā)表于 08-27 16:19 ?536次閱讀

大模型助陣，人形機(jī)器人打工潮來了？

炙手可熱的大模型帶動不少企業(yè)開始嘗試。然而在大模型選型、挖掘具體的應(yīng)用場景、結(jié)合私域知識等方面要考慮哪些關(guān)鍵因素，實(shí)施中會有哪些挑戰(zhàn)，如何解決。工業(yè)數(shù)字孿生是工業(yè)元宇宙、燈塔工廠的關(guān)鍵內(nèi)容，然而從

發(fā)表于 08-13 09:35 ?853次閱讀

華發(fā)數(shù)智攜手字節(jié)跳動共同發(fā)布AI數(shù)字人及大模型綜合解決方案

近日，珠海華發(fā)數(shù)智技術(shù)有限公司（簡稱：華發(fā)數(shù)智）攜手字節(jié)跳動旗下領(lǐng)先的云服務(wù)平臺火山引擎，共同發(fā)布了AI數(shù)字人及大模型綜合解決方案，標(biāo)志著華發(fā)集團(tuán)在AI大模型技術(shù)探索與應(yīng)用上邁出了重要

發(fā)表于 08-07 16:53 ?667次閱讀

Al大模型機(jī)器人

金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說，薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā)，與同行相比具有許多優(yōu)

發(fā)表于 07-05 08:52

數(shù)字人源碼部署要選對數(shù)字人源頭工廠

數(shù)字人作為AI產(chǎn)業(yè)的中流砥柱,其應(yīng)用場景之廣泛。從數(shù)字人口播、到直播到數(shù)字人克隆、到聲音克隆、再至AI復(fù)活、

發(fā)表于 06-18 16:35 ?476次閱讀

融合AI大模型技術(shù)，數(shù)字人交互更自然、應(yīng)用更廣泛！

電子發(fā)燒友網(wǎng)報道（文/李彎彎）數(shù)字人是通過先進(jìn)的計(jì)算機(jī)圖形學(xué)、深度學(xué)習(xí)等技術(shù)創(chuàng)建出的具有高度逼真形象和行為的虛擬人物。AI大模型則是指具有大規(guī)模參數(shù)量和復(fù)雜結(jié)構(gòu)的人工智能模型，能夠處理

發(fā)表于 04-27 00:58 ?3849次閱讀

優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型

優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型，共同探索中國AI大模型+人形機(jī)器人的應(yīng)用。

發(fā)表于 04-07 10:17 ?918次閱讀

英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型

英偉達(dá)在一年一度的GTC開發(fā)者大會上，由創(chuàng)始人黃仁勛親自揭曉了令人矚目的Project GR00T人形機(jī)器人項(xiàng)目，其中引人注目的是一款全新的人形機(jī)器人基礎(chǔ)模型。這款

發(fā)表于 03-21 11:43 ?764次閱讀

Figure首發(fā)OpenAI大模型加持的機(jī)器人

近日，機(jī)器人初創(chuàng)公司Figure在業(yè)界引起了廣泛關(guān)注，該公司成功發(fā)布了首個由OpenAI大模型加持的機(jī)器人demo。這一創(chuàng)新成果不僅展示了Figure在機(jī)器

發(fā)表于 03-16 14:21 ?1089次閱讀

機(jī)器人基于開源的多模態(tài)語言視覺大模型

ByteDance Research 基于開源的多模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機(jī)器人操作模型，只用單機(jī)就可以訓(xùn)練。

發(fā)表于 01-19 11:43 ?422次閱讀

詳解機(jī)器人技術(shù)基礎(chǔ)模型

基礎(chǔ)模型在解決機(jī)器人技術(shù)中的數(shù)據(jù)稀缺問題上至關(guān)重要。它們?yōu)槭褂米钌俚奶囟〝?shù)據(jù)學(xué)習(xí)和適應(yīng)新任務(wù)提供了堅(jiān)實(shí)的基礎(chǔ)。

發(fā)表于 01-08 10:44 ?469次閱讀

人工智能大模型在工業(yè)機(jī)器人方面的規(guī)劃

工業(yè)機(jī)器人應(yīng)用較多的企業(yè)已具備良好的數(shù)字化基礎(chǔ)，結(jié)合實(shí)際需求，對人工智能大模型在工業(yè)機(jī)器人領(lǐng)域的應(yīng)用進(jìn)行整體設(shè)計(jì)規(guī)劃。

發(fā)表于 01-05 17:27 ?674次閱讀