0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eros Now利用Google Cloud實(shí)現(xiàn)AI驅(qū)動(dòng)的字幕功能

倩倩 ? 來(lái)源:慧譯講視頻,風(fēng)尚網(wǎng),互 ? 作者:慧譯講視頻,風(fēng)尚 ? 2021-03-15 13:44 ? 次閱讀

Google 用三個(gè)項(xiàng)目:Live Transcribe、Live Caption、Live Relay,來(lái)幫助聽(tīng)障人群融入正常社會(huì),實(shí)現(xiàn)無(wú)障礙溝通。

1 Live Transcribe(實(shí)時(shí)轉(zhuǎn)錄):打開應(yīng)用軟件后,手機(jī)設(shè)備可以實(shí)時(shí)監(jiān)聽(tīng)周圍環(huán)境中的語(yǔ)音,并實(shí)時(shí)顯示出對(duì)應(yīng)的文字。

2 Live Caption(實(shí)時(shí)字幕):使用自動(dòng)語(yǔ)音識(shí)別,為視頻添加字幕。適用于播放音頻的任何媒體,包括視頻,音頻等消息,尤其是無(wú)字幕的直播,甚至和家人視頻聊天,都可以實(shí)時(shí)添加字幕。

3 Live Relay(實(shí)時(shí)語(yǔ)音)基于Live Transcribe的實(shí)時(shí)的文字轉(zhuǎn)語(yǔ)音的產(chǎn)品,以便聾啞人在打電話需求場(chǎng)景下,能打字轉(zhuǎn)換成語(yǔ)音播放達(dá)到溝通目的。

Eros Now周二表示,它已與Google Cloud合作,使用后者的AI技術(shù),以自動(dòng)字幕的形式流式傳輸其全部電影和原著。

AI驅(qū)動(dòng)的字幕功能將首先以阿拉伯語(yǔ)提供。該公司表示,語(yǔ)言支持將迎合喜歡印度電影和其他消費(fèi)印度娛樂(lè)內(nèi)容市場(chǎng)的“大量阿拉伯觀眾”。

Eros Now還詳細(xì)說(shuō)明了其如何在其流媒體平臺(tái)上使用尖端技術(shù)。

“通過(guò)使用AI框架和大量預(yù)先存在的數(shù)據(jù),Eros Now的內(nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)模擬,培訓(xùn)和開發(fā)了一種先進(jìn)的模型,該模型的性能相當(dāng)于人類,并且能夠生成所需的字幕電影和原著中使用的語(yǔ)言”,該公司在一份新聞稿中說(shuō)。

該公司表示,該部署將有助于推動(dòng)更高的消費(fèi)者參與度,并為“文本到語(yǔ)音”自動(dòng)化打開新的機(jī)會(huì)窗口。該公司指出,該模型可用于不同類型和語(yǔ)言。

“應(yīng)對(duì)性別非中立語(yǔ)言以及各種使用不同語(yǔ)言的標(biāo)點(diǎn)符號(hào)只是最大的挑戰(zhàn)中的幾個(gè)。自動(dòng)化過(guò)程花了六個(gè)月的時(shí)間才能使數(shù)據(jù)科學(xué)家完善?!痹摴狙a(bǔ)充說(shuō)。

Eros Now由Eros STX Global Corporation擁有。OTT平臺(tái)擁有使用印地語(yǔ)和當(dāng)?shù)卣Z(yǔ)言發(fā)行的12,000多部電影的權(quán)利。截至2020年9月,該平臺(tái)擁有超過(guò)2.11億注冊(cè)用戶和3,620萬(wàn)付費(fèi)用戶。

過(guò)去,愛(ài)神(Eros)也嘗試了其他新時(shí)代的技術(shù)。去年,它與美國(guó)視頻游戲和軟件公司Epic Games合作,將“虛幻引擎”技術(shù)引入了印度電影。以Fortnite之類的游戲而聞名的Epic Games表示,它將提供實(shí)時(shí)渲染,更好的VFX和虛擬制作等技術(shù)。

在2019年,Eros Now與Microsoft合作,利用Azure云平臺(tái)托管和流傳輸其數(shù)字視頻產(chǎn)品。

利用Google Assistant 中由AI驅(qū)動(dòng)的新功能非常方便

在Google助手首次為家庭采用解釋器模式大約一年后,該功能終于在移動(dòng)設(shè)備上發(fā)布。這是根據(jù)最近的報(bào)道援引Google自己的話說(shuō)的,該模式即將到來(lái)。

為清楚起見(jiàn),解釋器模式是一種實(shí)時(shí)翻譯器,可以進(jìn)行對(duì)話。因此,使用后,用戶將能夠閱讀和聽(tīng)到某人對(duì)他們說(shuō)的另一種語(yǔ)言的翻譯。他們還可以進(jìn)行交談或點(diǎn)擊智能回復(fù)并鍵入回復(fù)。

Google助理會(huì)以相應(yīng)的語(yǔ)言大聲朗讀所有內(nèi)容。用戶不必為外國(guó)的發(fā)音和語(yǔ)法上的細(xì)微差別而苦惱。目前,一長(zhǎng)串可用的語(yǔ)言總共有44種。明顯的內(nèi)容包括德語(yǔ),法語(yǔ)和類似的通用語(yǔ)言。但是Google也包含了一些在世界許多地方都不太常用的東西。

例如,用于移動(dòng)設(shè)備的新解釋器模式可以幫助用戶說(shuō)泰語(yǔ)或其他常用但使用較少的語(yǔ)言。

利用Google Assistant 中由AI驅(qū)動(dòng)的新功能非常方便。實(shí)際上,通常只需在“ Okay”或“ Hey Google”之后加上幾個(gè)字即可使事情向前發(fā)展。關(guān)鍵短語(yǔ)也很簡(jiǎn)單。因此,整個(gè)過(guò)程和小程序的使用應(yīng)非常直觀,而不是要求口頭體操來(lái)完成。

例如,用戶可以說(shuō)“嘿Google,幫我說(shuō)西班牙語(yǔ)”。正如所暗示的那樣,該短語(yǔ)將在西班牙語(yǔ)的解釋器模式下啟動(dòng)?!昂冒?,谷歌,當(dāng)我的泰語(yǔ)翻譯者”同樣可以很好地工作。

從那里開始,Google的解釋器模式將按預(yù)期工作。口語(yǔ)單詞會(huì)在屏幕上翻譯并大聲說(shuō)出來(lái)。智能答復(fù)似乎可以從中選擇,當(dāng)然,還會(huì)顯示一個(gè)鍵盤圖標(biāo)來(lái)鍵入響應(yīng)。語(yǔ)音響應(yīng)也會(huì)被捕獲,并以其他語(yǔ)言大聲朗讀。

Google似乎并未提供太多有關(guān)哪些移動(dòng)設(shè)備將能夠使用由Assistant AI支持的新解釋器模式的確切信息。但是,它確實(shí)說(shuō)它正在同時(shí)出現(xiàn)在iOSAndroid上。該模式將通過(guò)更新到達(dá)??梢詮腁pp Store或Google Play商店中找到專門用于Google Assistant應(yīng)用程序的內(nèi)容。

這意味著,盡管它現(xiàn)在正在推出,但要花一些時(shí)間才能敲打那里的所有設(shè)備。部署通常需要幾個(gè)星期才能完成。

(慧譯講視頻,風(fēng)尚網(wǎng),互聯(lián)網(wǎng)分析沙龍網(wǎng)綜合整理 )

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1765

    瀏覽量

    57536
  • 流媒體
    +關(guān)注

    關(guān)注

    1

    文章

    194

    瀏覽量

    16660
  • 解釋器
    +關(guān)注

    關(guān)注

    0

    文章

    103

    瀏覽量

    6513
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Google Cloud發(fā)布兩款針對(duì)企業(yè)客戶的全新解決方案

    Google Cloud 近期發(fā)布兩款專為企業(yè)客戶設(shè)計(jì)的全新解決方案——Google Agentspace與NotebookLM Plus,目的是通過(guò) Gemini 先進(jìn)的推理能力、Googl
    的頭像 發(fā)表于 12-27 16:31 ?130次閱讀

    OPPO與Google Cloud攜手開創(chuàng)AI手機(jī)新未來(lái)

    OPPO 與 Google CloudAI 技術(shù)上深入合作,在旗下的海外手機(jī)上實(shí)現(xiàn) AI 功能
    的頭像 發(fā)表于 12-06 14:13 ?285次閱讀

    聯(lián)想與Meta合作推出AI Now個(gè)人AI智能體

    聯(lián)想集團(tuán)近日在美國(guó)西雅圖舉辦了年度Tech World大會(huì),會(huì)上聯(lián)想CEO楊元慶與Meta創(chuàng)始人兼CEO馬克?扎克伯格共同宣布了一項(xiàng)重要合作。雙方基于Meta的Llama大模型,推出了面向PC的個(gè)人AI智能體——AI Now
    的頭像 發(fā)表于 10-17 16:58 ?552次閱讀

    扎克伯格:聯(lián)想運(yùn)用Meta Llama大模型打造個(gè)人AI助手AI Now

    美國(guó)西部時(shí)間10月15日,聯(lián)想集團(tuán)于美國(guó)西雅圖盛大舉辦了一年一度的Tech World大會(huì)。會(huì)上,聯(lián)想集團(tuán)首席執(zhí)行官楊元慶攜手Meta創(chuàng)始人兼首席執(zhí)行官馬克·扎克伯格,共同揭曉了一項(xiàng)重大合作成果——基于Meta的Llama大模型,面向PC用戶的個(gè)人AI智能助手AI
    的頭像 發(fā)表于 10-16 14:58 ?504次閱讀

    Google Cloud AI助力衛(wèi)安智能推出機(jī)器人解決方案

    Google Cloud 基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別技術(shù)讓衛(wèi)安智能得以滿足小語(yǔ)種地區(qū)用戶對(duì)機(jī)器人交互的需求,為其節(jié)省約60%與第三方溝通協(xié)作的人力成本,并運(yùn)用高性能的計(jì)算資源將產(chǎn)品的開發(fā)周期縮短了一半。
    的頭像 發(fā)表于 10-16 11:11 ?562次閱讀

    Commvault Cloud平臺(tái)提供Cloud Rewind功能

    混合云企業(yè)網(wǎng)絡(luò)彈性和數(shù)據(jù)保護(hù)解決方案領(lǐng)先提供商Commvault(納斯達(dá)克代碼:CVLT)宣布在Commvault Cloud平臺(tái)上提供Cloud Rewind功能。這項(xiàng)獨(dú)特的產(chǎn)品集成了通過(guò)收購(gòu)
    的頭像 發(fā)表于 10-15 09:21 ?357次閱讀

    NetApp與Google Cloud深化合作,強(qiáng)化分布式云存儲(chǔ)

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級(jí)。此次合作中,NetApp將統(tǒng)一數(shù)據(jù)存儲(chǔ)和智能服務(wù)融入Google Distributed Cloud
    的頭像 發(fā)表于 10-11 17:21 ?498次閱讀

    谷歌Vertex AI助力企業(yè)生成式AI應(yīng)用

    過(guò)去的一段時(shí)間,我們看到了許多 Google Cloud 客戶對(duì)生成式 AI 和 agent 的精彩應(yīng)用,令我們拍案叫絕。為了讓企業(yè)能夠更快推出功能強(qiáng)大的
    的頭像 發(fā)表于 09-09 15:59 ?513次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    Google Cloud 一如既往地踐行打造開放、靈活的 AI 生態(tài)系統(tǒng)的承諾,幫助您構(gòu)建最能滿足您需求的解決方案。
    的頭像 發(fā)表于 08-02 15:42 ?397次閱讀

    谷歌將優(yōu)化安卓系統(tǒng)的實(shí)時(shí)字幕功能,用戶可更改字幕行數(shù)

    Live Captions作為安卓系統(tǒng)的輔助工具,能自動(dòng)識(shí)別并實(shí)時(shí)將音頻轉(zhuǎn)化為字幕。此功能對(duì)聽(tīng)力受損或環(huán)境嘈雜時(shí)難以理解內(nèi)容的人群十分有用。
    的頭像 發(fā)表于 05-30 14:28 ?626次閱讀

    微軟網(wǎng)頁(yè)版PPT新增語(yǔ)音識(shí)別及字幕生成功能

    據(jù)報(bào)道,微軟計(jì)劃于今年六月份推出網(wǎng)頁(yè)版PowerPoint全新語(yǔ)音識(shí)別功能。此項(xiàng)功能將能夠監(jiān)控PowerPoint視頻中的聲音,進(jìn)而自動(dòng)生成字幕
    的頭像 發(fā)表于 05-16 14:36 ?423次閱讀

    Flutter首次亮相Google Cloud Next大會(huì)

    Flutter 團(tuán)隊(duì)在近期首次參加了 Google Cloud Next 大會(huì),這意味著 Flutter 在開發(fā)社區(qū)中的影響力正在日益增長(zhǎng)。
    的頭像 發(fā)表于 05-09 10:15 ?489次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺(tái)已成為云服務(wù)提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google Axion 處理器,面向通用計(jì)算和人工智能
    的頭像 發(fā)表于 04-16 14:30 ?654次閱讀

    Cognizant與Google Cloud深化合作,提升軟件交付效率

    近日,知名IT服務(wù)提供商Cognizant與Google Cloud宣布將進(jìn)一步擴(kuò)大合作伙伴關(guān)系,共同致力于增強(qiáng)軟件交付生命周期,并顯著提升開發(fā)人員的工作效率。
    的頭像 發(fā)表于 03-26 10:01 ?355次閱讀

    谷歌Chrome瀏覽器實(shí)時(shí)字幕功能拓展至11種語(yǔ)言,覆蓋簡(jiǎn)繁中文

    這款名為“提供音頻和視頻自動(dòng)字幕生成”的功能,不僅能夠實(shí)現(xiàn)設(shè)備間數(shù)據(jù)零泄漏,而且在IT之家當(dāng)前所試用的最新穩(wěn)定版Chrome瀏覽器環(huán)境下,其主要界面將顯示為英文,但同時(shí)也兼容其他如法語(yǔ)、德語(yǔ)及意大利語(yǔ)的
    的頭像 發(fā)表于 03-05 14:32 ?1220次閱讀