0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全球首個AI合成女主播是如何誕生的呢?它未來又將有哪些應(yīng)用價值呢?

電子工程師 ? 來源:lp ? 2019-03-06 16:06 ? 次閱讀

2019年3月3日,全球首個AI合成女主播“新小萌”正式上崗新華社,而她的第一個工作任務(wù),便是參與到當(dāng)下最熱門的十三屆全國人大二次會議(后文簡稱兩會)報道中。對此,“今日俄羅斯”電視臺網(wǎng)站、英國Daily Mail、美國Futurism等海外媒體進(jìn)行了大幅報道,并表示“近年來,中國已成為全球領(lǐng)先的人工智能發(fā)展中心之一”。

作為第一個登上兩會的AI合成女主播,人們在驚嘆和稱贊之余,對于其背后由搜狗所開發(fā)的人工智能技術(shù)都無比好奇:這個在鏡頭前播報新聞的“新小萌”,是如何誕生的呢?它未來又將有哪些應(yīng)用價值呢?

什么是AI合成主播?

比起機(jī)器千篇一律的冰冷面孔,用戶期待的是一個有溫度的真人形象。所謂AI合成主播,顧名思義,指的就是依靠搜狗的“分身”技術(shù),來模擬出一個類似人類的AI主播進(jìn)行播報。搜狗的這款產(chǎn)品就是以新華社主播屈萌為原型,她不僅會用和真人一樣的聲音進(jìn)行播報,就連唇形、面部表情也能完全吻合。從新華社的新聞播報視頻來看,栩栩如生的AI合成女主播“新小萌”,在鏡頭前的形象與真人主播幾乎沒有什么區(qū)別。

AI合成主播在2018年的互聯(lián)網(wǎng)大會期間首次亮相,就引起了網(wǎng)絡(luò)上的一片熱議,被國內(nèi)外諸多媒體進(jìn)行報道。2019年2月21日,AI合成主播宣布再次升級,從過去的“坐著播新聞”升級成結(jié)合肢體動作的“站立式播報”,進(jìn)一步提升了合成主播的表現(xiàn)力,保持了搜狗在這一領(lǐng)域的全球領(lǐng)先。本次首個AI合成女主播參與兩會報道,更是成為了中國人工智能與傳媒業(yè)大膽融合并付諸規(guī)?;瘧?yīng)用的典型案例。

首個AI合成女主播的背后,有哪些搜狗的“黑科技”?

作為開發(fā)AI合成主播的基礎(chǔ),“搜狗分身”是搜狗人工智能的核心技術(shù)之一,誕生于搜狗“自然交互+知識計算”這一人工智能理念之下,它能通過人臉關(guān)鍵點檢測、人臉特征提取、人臉重構(gòu)、唇語識別、情感遷移等多項前沿技術(shù),并結(jié)合語音、圖像等多模態(tài)信息進(jìn)行建模訓(xùn)練后,生成與真人無異的AI分身模型,進(jìn)而幫助人類提高信息表達(dá)和傳遞的效率。

得益于前沿技術(shù)的加持,AI合成主播前期只需經(jīng)過少量的數(shù)據(jù)訓(xùn)練,就能呈現(xiàn)與真人相差無幾的播報狀態(tài),同時還支持個性化定制,滿足用戶的不同需求。AI合成主播不僅可以將新聞稿快速地轉(zhuǎn)變?yōu)椴笠曨l,還能快速學(xué)習(xí)用戶音色、韻律、情感等多維度特征,妥善處理聲調(diào)起伏、語言風(fēng)格、情感韻律等,并提供全天候不間斷的播報服務(wù),極大地提高廣電行業(yè)的傳播效率。

隨著“搜狗分身”技術(shù)能力的不斷提高,AI主播的定制周期也大為降低,合成效果和穩(wěn)定性也有著顯著提升。僅靠少量用戶真實音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型。本次在新華社兩會報道中驚艷亮相的首個AI合成女主播,正是“搜狗分身”技術(shù)持續(xù)復(fù)制不同類型、不同特點AI合成主播能力的一個有力體現(xiàn)。

為不同職業(yè)賦能,搜狗分身的未來遠(yuǎn)不止于主播

在兩會期間,AI合成女主播的首次登場亮相,即引發(fā)了媒體和網(wǎng)友關(guān)于主播行業(yè)的激烈討論,可見當(dāng)科技融入到生活后所帶來的沖擊感是非同凡響的。宛如科幻大片一般的場景,正在逐步成為現(xiàn)實。和真人主播相比,通過“搜狗分身”技術(shù)打造的AI合成主播能夠不知疲倦地工作24小時,同時還掌握多國語言,大大提升了效率、降低了成本。

然而,AI合成主播僅僅只是一個開始。伴隨著人工智能技術(shù)的不斷升級,個性化內(nèi)容生產(chǎn)的門檻大為降低,應(yīng)用范圍愈發(fā)廣泛。未來,“搜狗分身”技術(shù)還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個領(lǐng)域,通過提供個性化的行業(yè)解決方案,為不同場景展開賦能。根據(jù)不同場景而創(chuàng)造出虛擬教師、虛擬客服、虛擬管家、虛擬醫(yī)生等職業(yè),深度參與到人類的內(nèi)容表達(dá)和信息傳遞場景之中,提供服務(wù)并發(fā)揮更多價值。屆時,各行各業(yè)都將迎來AI技術(shù)下的新一輪變革。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269371
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238866
  • 黑科技
    +關(guān)注

    關(guān)注

    14

    文章

    127

    瀏覽量

    37348

原文標(biāo)題:全球首個AI合成女主播上崗,背后有哪些“黑科技”?

文章出處:【微信號:IC-008,微信公眾號:半導(dǎo)體那些事兒】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Arm 年度技術(shù)大會: 預(yù)計2025 年底,全球將有超過 1,000 億臺具備 AI 能力的 Arm 設(shè)備

    。值得一提的是,在生態(tài)伙伴的攜手合作下,Arm預(yù)計到2025年底,全球將有超過1,000億臺具備AI能力的Arm設(shè)備。Arm在本次大會上深入探討了AI對計算的需求,并分
    的頭像 發(fā)表于 11-22 12:41 ?299次閱讀
    Arm 年度技術(shù)大會: 預(yù)計2025 年底,<b class='flag-5'>全球</b><b class='flag-5'>將有</b>超過 1,000 億臺具備 <b class='flag-5'>AI</b> 能力的 Arm 設(shè)備

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的
    的頭像 發(fā)表于 11-15 16:53 ?714次閱讀

    全球首個開源AI標(biāo)準(zhǔn)正式發(fā)布

    近日,在備受矚目的2024年ALL THINGS OPEN大會上,開源組織Open Source Initiative(OSI)宣布了一項重大突破——正式發(fā)布了開源人工智能定義(OSAID)1.0版本。這一里程碑式的成就標(biāo)志著全球首個開源
    的頭像 發(fā)表于 10-31 10:59 ?274次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    如何激發(fā)科學(xué)家的創(chuàng)新思維。AI不僅僅是工具,更是一種思維方式,鼓勵我們跳出傳統(tǒng)框架,以數(shù)據(jù)為驅(qū)動,探索未知。這種思維方式的轉(zhuǎn)變,不僅促進(jìn)了科學(xué)方法的革新,也為解決全球性挑戰(zhàn)提供了新的視角和途徑
    發(fā)表于 10-14 09:12

    昆侖萬維發(fā)布全球首個AI流媒體音樂平臺Melodio

    昆侖萬維在科技創(chuàng)新領(lǐng)域再次邁出重要一步,正式推出了全球首個AI流媒體音樂平臺——Melodio,以及配套的AI音樂商用創(chuàng)作平臺Mureka。這兩款創(chuàng)新產(chǎn)品的問世,標(biāo)志著音樂產(chǎn)業(yè)正式邁入
    的頭像 發(fā)表于 08-14 17:44 ?851次閱讀

    阿里云推出首個域名AI大模型應(yīng)用

    阿里云近日宣布其域名產(chǎn)品服務(wù)已全面完成AI化升級,并成功推出首個基于通義大模型的域名AI應(yīng)用。此次升級不僅引入了“.ai”等40多個熱門新域名后綴,還納入了2000萬個
    的頭像 發(fā)表于 08-09 14:55 ?542次閱讀

    plc有三個數(shù)據(jù),在網(wǎng)關(guān)中如何整合成一個

    如:plc有三個數(shù)據(jù),在網(wǎng)關(guān)中如何整合成一個? 加注泵狀態(tài):正在加注PLC MM1.6離散量R/W 加注泵狀態(tài):未加注PLC MM1.7離散量R/W 加注泵狀態(tài):故障PLC MM2.0離散量R/W
    發(fā)表于 07-24 07:46

    如何利用AI進(jìn)行提升自我

    利用AI進(jìn)行學(xué)習(xí)是一個高效且富有創(chuàng)新性的過程。以下是一些建議,幫助你充分利用AI進(jìn)行學(xué)習(xí): 選擇適合的AI學(xué)習(xí)工具 : 深度學(xué)習(xí)框架 :如飛槳(PaddlePaddle)框架,提供了
    的頭像 發(fā)表于 07-19 10:46 ?564次閱讀

    2024 TUYA全球開發(fā)者大會盛大啟幕,Cube AI大模型重磅首發(fā)!

    2024TUYA全球開發(fā)者大會上,重磅推出AI大模型、AI開發(fā)工具、AI小程序開發(fā)基座等重量級產(chǎn)品,讓AI
    的頭像 發(fā)表于 05-31 08:15 ?374次閱讀
    2024 TUYA<b class='flag-5'>全球</b>開發(fā)者大會盛大啟幕,Cube <b class='flag-5'>AI</b>大模型重磅首發(fā)!

    工業(yè)物聯(lián)網(wǎng)究竟是什么?它又有哪些作用

    隨著科技的快速發(fā)展,物聯(lián)網(wǎng)技術(shù)已經(jīng)逐漸滲透到我們生活的各個角落,而 工業(yè)物聯(lián)網(wǎng)(IIoT) 更是引領(lǐng)著工業(yè)領(lǐng)域的數(shù)字化轉(zhuǎn)型。那么,工業(yè)物聯(lián)網(wǎng)究竟是什么?它又有哪些作用?本文將對此進(jìn)行深度解析
    的頭像 發(fā)表于 04-22 15:26 ?410次閱讀

    氧化硅薄膜具體有什么用途?

    氧化硅薄膜整個半導(dǎo)體制造過程是十分常見且不可或缺的,那么具體有什么用途?
    的頭像 發(fā)表于 04-22 09:52 ?750次閱讀

    全球AI音樂會,第一次聽見中國聲音

    全球AI音樂盛宴中,中國首個音樂AIGC SOTA 的獨特旋律
    的頭像 發(fā)表于 04-19 11:01 ?399次閱讀
    <b class='flag-5'>全球</b><b class='flag-5'>AI</b>音樂會,第一次聽見中國聲音

    英偉達(dá)AI服務(wù)器NVLink版與PCIe版有何區(qū)別?又如何選擇

    在人工智能領(lǐng)域,英偉達(dá)作為行業(yè)領(lǐng)軍者,推出了兩種主要的GPU版本供AI服務(wù)器選擇——NVLink版(實為SXM版)與PCIe版。這兩者有何本質(zhì)區(qū)別?又該如何根據(jù)應(yīng)用場景做出最佳選擇?讓我們深入探討一下。
    的頭像 發(fā)表于 03-19 11:21 ?5655次閱讀
    英偉達(dá)<b class='flag-5'>AI</b>服務(wù)器NVLink版與PCIe版有何區(qū)別?又如何選擇<b class='flag-5'>呢</b>?

    怎么在NanoEdge AI Studio設(shè)定交叉編譯器?

    20231009\", 那么問題來了,怎么在NanoEdge AI Studio設(shè)定交叉編譯器,比如設(shè)置為armcc、armclang、iccram,因為我需要將庫加到keil或者iar工程里面。 看樣子這個軟件生成的庫是arm-gcc編譯的,那它只能用于官方的STM
    發(fā)表于 03-07 06:28

    為什么電壓探頭會有降額曲線指標(biāo),的意義是什么?

    為什么電壓探頭會有降額曲線指標(biāo),的意義是什么? 電壓探頭是一種用于測量電路中的電壓的設(shè)備,通常由一個金屬探針和一個放大器組成。在使用電壓探頭進(jìn)行測量時,我們會發(fā)現(xiàn)在一定頻率范圍內(nèi),探頭的輸出
    的頭像 發(fā)表于 01-08 11:30 ?1044次閱讀