2月4日消息 據(jù)外媒 engadget 報道,微軟宣布開放其文本語音轉(zhuǎn)換 AI 的訪問權限,該技術名為 “自定義神經(jīng)語音”,允許開發(fā)人員通過文字創(chuàng)建自定義合成語音。
該技術是微軟 Azure 服務的一部分,開發(fā)人員可以將其用于諸如語音助手、聊天機器人、在線學習以及閱讀有聲讀物或新聞之類的工具。不過開發(fā)人員必須先申請微軟的訪問權限并獲得后者的批準。
微軟表示,該技術可以提供比許多其他文本語音轉(zhuǎn)換服務更自然的聲音,其使用多個神經(jīng)網(wǎng)絡來確保韻律(每個音素的音調(diào)和持續(xù)時間)和發(fā)音正確,AI 可以正確地模仿演員的聲音或合成任意逼真的人聲。
IT之家了解到,包括 AT&T 和華納兄弟在內(nèi)的多家公司已經(jīng)在使用這項技術,它們在微軟的幫助下錄制了 2000 多個行和短語,開發(fā)了一個兔八哥的語音助手。
責任編輯:PSY
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關推薦
一、DEMO思路
在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應用。
該應用能夠接收用戶輸入的文本,并使用TTS
發(fā)表于 01-06 15:33
智譜AI近日宣布了一項重大舉措,其自主研發(fā)的GLM-4-Flash大模型正式向公眾免費開放,用戶可通過智譜AI大模型開放平臺輕松調(diào)用。這款大
發(fā)表于 08-28 17:41
?883次閱讀
微軟于8月23日宣布,在其領先的Azure AI語音服務中融入了一項革命性創(chuàng)新——虛擬人形象功能,此功能徹底顛覆了傳統(tǒng)交互方式,讓文本轉(zhuǎn)視頻
發(fā)表于 08-23 16:25
?736次閱讀
受限開放的權限通常是不允許三方應用申請的。當應用在申請權限來訪問必要的資源時,發(fā)現(xiàn)部分權限的等級比應用APL等級高,開發(fā)者可以選擇通過ACL
發(fā)表于 07-02 17:34
?484次閱讀
5 月 22 日,微軟Build 2024大會在美正式開幕。薩提亞·納德拉CEO、董事長宣布,OpenAI新款旗艦模型GPT-4o已經(jīng)在Azure AI Studio上線,并開放API
發(fā)表于 05-22 11:18
?527次閱讀
其中,針對語音備忘錄,蘋果將在該應用中加入一個較大的錄音按鍵,據(jù)稱將占據(jù)應用界面的顯著位置。用戶只需輕按此鍵即可開始錄音,隨后,系統(tǒng)內(nèi)置的AI模型會將語音轉(zhuǎn)換為文字。
發(fā)表于 05-11 10:50
?854次閱讀
應用在語音信箱中留言。
權限級別 :system_basic
授權方式 :user_grant
ACL使能 :TRUE
ohos.permission.LOCATION_IN_BACKGROUND
發(fā)表于 04-25 16:12
ohos.permission.MANAGE_BLUETOOTH
允許應用配對藍牙設備,并對設備的電話簿或消息進行訪問。
權限級別 :system_basic
授權方式 :system_grant
ACL使能
發(fā)表于 04-23 14:33
一、場景介紹
應用在提供對外功能服務接口時,可以根據(jù)接口涉數(shù)據(jù)的敏感程度或所涉能力的安全威脅影響,在系統(tǒng)定義的權限列表中權限定義列表選擇合適的權限限制當前接口的開放范圍,對接口
發(fā)表于 04-22 17:52
一、權限的工作流程
權限申請使用的工作流程
應用在訪問數(shù)據(jù)或者執(zhí)行操作時,需要評估該行為是否需要應用具備相關的權限。如果確認需要目標權限,則
發(fā)表于 04-19 15:27
說明
根據(jù)權限對于不同等級應用有不同的開放范圍,權限類型對應分為以下三種,等級依次提高。
normal權限
normal 權限允許應用
發(fā)表于 04-17 15:29
微軟,這家全球市值最高的科技巨頭,近日宣布了一項重大的組織架構調(diào)整。公司決定組建全新的Microsoft AI部門,旨在統(tǒng)一管理和推進所有消費者AI產(chǎn)品和研究工作。為此,
發(fā)表于 03-21 10:52
?892次閱讀
微軟近日宣布向法國人工智能公司Mistral AI注資20億歐元(約合21億美元),以推動生成式人工智能領域的發(fā)展。此舉不僅加強了微軟在全球AI
發(fā)表于 02-28 10:08
?470次閱讀
谷歌公司近日宣布,其先進的AI大模型Gemma即日起在全球范圍內(nèi)開放使用。這一新模型由谷歌DeepMind和其他團隊合作開發(fā),并與其最大的AI模型Gemini共享技術和基礎架構。Gem
發(fā)表于 02-23 10:41
?805次閱讀
微軟近日宣布,將與印度領先的初創(chuàng)公司Sarvam AI展開緊密合作,共同推進基于語音的生成式人工智能(genAI)應用的開發(fā)。這一合作標志著微軟
發(fā)表于 02-18 11:42
?817次閱讀
評論