前言
通用AI是一種能夠像人類(lèi)一樣進(jìn)行思考、學(xué)習(xí)和推理的人工智能系統(tǒng)。與特定領(lǐng)域的人工智能不同,通用AI可以處理各種類(lèi)型的任務(wù),包括自然語(yǔ)言處理、圖像識(shí)別、機(jī)器學(xué)習(xí)等,具有廣泛的適用性和高度的靈活性。
通用AI的應(yīng)用前景非常廣闊,它可以在醫(yī)療、交通、金融、教育、娛樂(lè)等各個(gè)領(lǐng)域發(fā)揮作用,為人類(lèi)帶來(lái)更好的生活體驗(yàn)和更高效的工作方式。
通用AI的應(yīng)用場(chǎng)景
通用AI所涉及的應(yīng)用場(chǎng)景十分廣泛,由于它不需要人工進(jìn)行相關(guān)的訓(xùn)練,而且還可以從以往的經(jīng)驗(yàn)中不斷學(xué)習(xí)和改進(jìn),所以可以幫助加快許多行業(yè)的發(fā)展速度,并且在其中發(fā)揮著非比尋常的作用,通用AI在熱門(mén)行業(yè)領(lǐng)域中的應(yīng)用如下:
互聯(lián)網(wǎng)行業(yè)
人證核身IVS可用于游戲/直播/婚戀交友平臺(tái)用戶(hù)實(shí)名認(rèn)證,響應(yīng)國(guó)家監(jiān)管要求,防止出現(xiàn)業(yè)務(wù)風(fēng)險(xiǎn)。
內(nèi)容審核可用于涉黃、涉政暴恐、涉政敏感人物審核,監(jiān)控范圍覆蓋用戶(hù)昵稱(chēng)、聊天圖片、音視頻,發(fā)布內(nèi)容等。
語(yǔ)音交互SIS可用于游戲互動(dòng)場(chǎng)景,將語(yǔ)音轉(zhuǎn)成文字信息;或游戲配音時(shí),將腳本信息轉(zhuǎn)化為近似的真人發(fā)聲。
金融服務(wù)
文字識(shí)別OCR可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的身份證、銀行卡、合同等的識(shí)別和驗(yàn)證。
人證核身IVS和人臉識(shí)別FRS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)人臉識(shí)別、身份驗(yàn)證等場(chǎng)景,提高安全性和客戶(hù)體驗(yàn)。
語(yǔ)音交互SIS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的語(yǔ)音客服、自助服務(wù)等場(chǎng)景,提高客戶(hù)體驗(yàn)和服務(wù)效率。
對(duì)話機(jī)器人CBS可以幫助銀行、保險(xiǎn)等機(jī)構(gòu)處理客戶(hù)的咨詢(xún)、理賠等事項(xiàng)。
交通運(yùn)輸
文字識(shí)別OCR可用于智慧停車(chē)、交通監(jiān)管的車(chē)牌識(shí)別場(chǎng)景。
文字識(shí)別OCR和人證核身IVS可用于網(wǎng)絡(luò)貨運(yùn)/網(wǎng)約車(chē)/代駕的司機(jī)身份認(rèn)證場(chǎng)景,保障實(shí)際承運(yùn)人和注冊(cè)人保持一致。
文字識(shí)別OCR可用于物流快遞的快遞分揀、包裹派件場(chǎng)景,自動(dòng)識(shí)別物流面單信息。
教育
文字識(shí)別OCR可以用于學(xué)校的考試卷、試題、論文等的處理和評(píng)分。
人證核身IVS和人臉識(shí)別FRS可以用于學(xué)校的考勤、門(mén)禁管理、預(yù)防考生代考等場(chǎng)景,提高學(xué)校管理效率和安全性。
語(yǔ)音交互SIS可以用于學(xué)校的語(yǔ)音教育、智能評(píng)測(cè)等場(chǎng)景,提高教育效果和教育質(zhì)量。
對(duì)話機(jī)器人CBS可以幫助學(xué)生進(jìn)行題目練習(xí)、知識(shí)點(diǎn)講解等。
電商零售
文字識(shí)別OCR可以用于商場(chǎng)、超市的商品條碼、價(jià)格標(biāo)簽等的掃描和識(shí)別。
人證核身IVS和人臉識(shí)別FRS可以用于商場(chǎng)、超市的人臉識(shí)別、客流分析等場(chǎng)景,提高營(yíng)銷(xiāo)和客戶(hù)體驗(yàn)。
對(duì)話機(jī)器人CBS可以幫助電商平臺(tái)、零售店鋪等提供智能客服服務(wù),提高售后服務(wù)質(zhì)量。
內(nèi)容審核Moderation可用于稽核產(chǎn)品宣傳是否違反廣告法,是否違規(guī),防止出現(xiàn)業(yè)務(wù)風(fēng)險(xiǎn)。
華為云解決方案
華為云通用AI七件套定位為企業(yè)AI生產(chǎn)力工具,將算法專(zhuān)家的積累和行業(yè)專(zhuān)家的知識(shí)沉淀在相應(yīng)的套件和“行業(yè)工作流”(Workflow)中,幫助企業(yè)快速使用AI技術(shù),實(shí)現(xiàn)內(nèi)容的自動(dòng)化處理。
文字識(shí)別OCR:文字識(shí)別(OpticalCharacterRecognition,簡(jiǎn)稱(chēng)OCR)提供在線文字識(shí)別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識(shí)別成可編輯的文本。支持通用類(lèi)識(shí)別、證件類(lèi)識(shí)別、票據(jù)類(lèi)識(shí)別、行業(yè)類(lèi)識(shí)別、自定義定制模板識(shí)別等。
人臉識(shí)別服務(wù)FRS:人臉識(shí)別服務(wù)(FaceRecognitionService),能夠在圖像中快速檢測(cè)人臉、分析人臉關(guān)鍵點(diǎn)信息、獲取人臉屬性、實(shí)現(xiàn)人臉的精確比對(duì)和檢索。該服務(wù)可應(yīng)用于身份驗(yàn)證、電子考勤、客流分析等場(chǎng)景。
人證核身解決方案IVS:將用戶(hù)本人與身份證信息關(guān)聯(lián)起來(lái),應(yīng)用人臉識(shí)別與文字識(shí)別等技術(shù),對(duì)接權(quán)威數(shù)據(jù)庫(kù),支持基于二要素(姓名、身份證)認(rèn)證或三要素(人臉、姓名、身份證)認(rèn)證,實(shí)現(xiàn)對(duì)身份真實(shí)性的精準(zhǔn)核驗(yàn)。
實(shí)時(shí)語(yǔ)音識(shí)別RASR:實(shí)時(shí)語(yǔ)音識(shí)別(Real-timeASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語(yǔ)音識(shí)別更快??蓱?yīng)用于直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
圖像識(shí)別Image:圖像識(shí)別(ImageRecognition),基于深度學(xué)習(xí)技術(shù),可準(zhǔn)確識(shí)別圖像中的視覺(jué)內(nèi)容,提供多種物體、場(chǎng)景和概念標(biāo)簽,具備目標(biāo)檢測(cè)和屬性識(shí)別等能力,幫助客戶(hù)準(zhǔn)確識(shí)別和理解圖像內(nèi)容。
內(nèi)容審核Moderation:內(nèi)容審核(ContentModeration),基于圖像、文本、音頻、視頻檢測(cè)技術(shù),可自動(dòng)進(jìn)行涉黃、廣告、涉暴等內(nèi)容檢測(cè),幫助客戶(hù)降低業(yè)務(wù)違規(guī)風(fēng)險(xiǎn)。
視頻編輯VCP:視頻編輯(VideoContentProcessing)服務(wù),基于對(duì)視頻的整體分析,提供封面、拆條、摘要等能力。
通用AI服務(wù)以公有云服務(wù)為主,同時(shí)支持私有化部署,可選擇部署在本地服務(wù)器。華為云不僅提供AI原子能力,幫助客戶(hù)快速集成和應(yīng)用落地,同時(shí)也接受客戶(hù)定制化需求??蛻?hù)可提供需求文檔、交付時(shí)間和交付標(biāo)準(zhǔn),由華為云評(píng)估進(jìn)行定制開(kāi)發(fā)。
解決方案核心亮點(diǎn)
超高性能
識(shí)別率業(yè)界領(lǐng)先:語(yǔ)音交互服務(wù)基于深度學(xué)習(xí)技術(shù),對(duì)特定領(lǐng)域場(chǎng)景的語(yǔ)音識(shí)別進(jìn)行優(yōu)化,識(shí)別率達(dá)到業(yè)界領(lǐng)先。
檢測(cè)范圍多場(chǎng)景覆蓋:圖像識(shí)別服務(wù)中圖片內(nèi)容審核覆蓋涉黃、低俗、廣告、涉政涉暴、涉政敏感人物和不良場(chǎng)景等多種違規(guī)風(fēng)險(xiǎn)的智能審核。
定制化識(shí)別,效果更精準(zhǔn):實(shí)時(shí)語(yǔ)音識(shí)別針對(duì)客戶(hù)的特定場(chǎng)景需求,定制垂直領(lǐng)域的語(yǔ)音識(shí)別模型,識(shí)別效果更精確。
實(shí)戰(zhàn)演練,穩(wěn)定可靠:內(nèi)容審核服務(wù)成功應(yīng)用于各類(lèi)場(chǎng)景,基于華為等企業(yè)客戶(hù)的長(zhǎng)期實(shí)踐,經(jīng)受過(guò)復(fù)雜場(chǎng)景考驗(yàn)。
簡(jiǎn)單易用
簡(jiǎn)單上手,便捷高效:人臉識(shí)別服務(wù)提供的應(yīng)用程序接口功能明確。
簡(jiǎn)單易用;配套文檔描述詳細(xì),調(diào)用服務(wù)方式包含API和SDK兩種,方便客戶(hù)使用與集成。
增值服務(wù)全套配齊:人證核身解決方案配套人臉識(shí)別FRS、文字識(shí)別OCR等多種增值服務(wù)可供訂閱使用。
降本增效
減少人力,節(jié)省成本:幫助客戶(hù)減少人力成本,節(jié)省業(yè)務(wù)支出。
按需計(jì)費(fèi),經(jīng)濟(jì)劃算:以調(diào)用次數(shù)/調(diào)用時(shí)長(zhǎng)計(jì)費(fèi)。
安全可信
服務(wù)環(huán)境更安全:華為云承諾不保存服務(wù)過(guò)程數(shù)據(jù)和用戶(hù)隱私數(shù)據(jù)。
權(quán)威數(shù)據(jù)更可靠:人證核身解決方案服務(wù)數(shù)據(jù)來(lái)源自國(guó)家權(quán)威機(jī)構(gòu)公安第一研究所和全國(guó)身份證信息查詢(xún)中心。
BSI權(quán)威認(rèn)證更可信:華為云OCR服務(wù)通過(guò)德國(guó)BSIAIC4可信標(biāo)準(zhǔn)審計(jì)認(rèn)證。
典型客戶(hù)案例
華為云通用AI主要為軟件開(kāi)發(fā)行業(yè)及互聯(lián)網(wǎng)、金融、教育、交通運(yùn)輸?shù)刃袠I(yè)提供底層AI能力。軟件服務(wù)商通常將AI能力集成于SaaS系統(tǒng)為終端客戶(hù)提供身份驗(yàn)證、信息自動(dòng)處理、財(cái)務(wù)報(bào)銷(xiāo)等能力;政府、國(guó)企及各類(lèi)大中小型企業(yè),通常利用AI能力替代人工操作,實(shí)現(xiàn)降本增效、數(shù)字化升級(jí)的需求。經(jīng)典的客戶(hù)案例如下:
德邦快遞:德邦快遞以大件快遞為核心業(yè)務(wù),業(yè)務(wù)涉及快運(yùn)、整車(chē)、倉(cāng)儲(chǔ)與供應(yīng)鏈等多元業(yè)務(wù)。應(yīng)用了華為云OCR文字識(shí)別技術(shù),自動(dòng)識(shí)別快遞面單的收寄件人信息,快速完成訂單管理、自動(dòng)分揀、物流配送工作,大幅提高了業(yè)務(wù)效率及用戶(hù)體驗(yàn),同時(shí)降低了25%的管理成本。
報(bào)銷(xiāo)吧:報(bào)銷(xiāo)吧是企業(yè)采購(gòu)和費(fèi)用管理移動(dòng)報(bào)銷(xiāo)SaaS軟件?;谌A為云OCR技術(shù)構(gòu)建了移動(dòng)報(bào)銷(xiāo)解決方案,全部在手機(jī)上報(bào)銷(xiāo),將報(bào)銷(xiāo)時(shí)間從15天縮短到30分鐘,同時(shí)自動(dòng)幫助員工填寫(xiě)報(bào)銷(xiāo)單,幫助財(cái)務(wù)在金稅三期上自動(dòng)驗(yàn)證發(fā)票真?zhèn)?,提升工作效?0%。
中國(guó)人壽:中國(guó)人壽是國(guó)內(nèi)壽險(xiǎn)行業(yè)的龍頭企業(yè),占據(jù)了國(guó)內(nèi)壽險(xiǎn)市場(chǎng)領(lǐng)導(dǎo)者的地位。通過(guò)使用人證核身服務(wù),在投保時(shí)自動(dòng)驗(yàn)證投保人的身份真實(shí)性,防止肉眼審核錯(cuò)誤,降低了冒名頂替風(fēng)險(xiǎn),提高了安全性。
迷你創(chuàng)想:迷你創(chuàng)想以“激發(fā)想象,創(chuàng)造快樂(lè)”為使命,是國(guó)內(nèi)知名游戲公司。迷你創(chuàng)想攜手華為云,使用人證核身服務(wù),進(jìn)行實(shí)名認(rèn)證,防止未成年沉迷游戲,打造健康游戲環(huán)境,享受健康生活。
封面?zhèn)髅剑悍饷嫘侣勈敲嫦蛉珖?guó)的綜合性互聯(lián)網(wǎng)新聞產(chǎn)品,由四川日?qǐng)?bào)報(bào)業(yè)集團(tuán)打造。華為云為封面新聞提供內(nèi)容審核服務(wù),解決新聞平臺(tái)容易出現(xiàn)廣告、暴力、涉黃等違法違規(guī)內(nèi)容的難題。華為云內(nèi)容審核服務(wù)基于圖像、文本、視頻檢測(cè)技術(shù),可自動(dòng)進(jìn)行違法違規(guī)內(nèi)容檢測(cè),幫助封面?zhèn)髅浇档蜆I(yè)務(wù)違規(guī)風(fēng)險(xiǎn)。
華為云通用AI體驗(yàn)
華為云通用AI是華為云推出的一款人工智能服務(wù),它可以為企業(yè)提供豐富的AI能力,包括圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等多種領(lǐng)域。華為云通用AI的目的是讓企業(yè)快速、便捷地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,提升業(yè)務(wù)效率和用戶(hù)體驗(yàn)。
下面結(jié)合應(yīng)用場(chǎng)景對(duì)文字識(shí)別OCR、人證核身IVS、人臉識(shí)別FRS、語(yǔ)音交互SIS、對(duì)話機(jī)器人CBS等產(chǎn)品進(jìn)行測(cè)評(píng)。
文字識(shí)別OCR
文字識(shí)別OCR可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的身份證、銀行卡、合同等的識(shí)別和驗(yàn)證;醫(yī)院的病歷、影像、處方等的識(shí)別和管理;學(xué)校的考試卷、試題、論文等的處理和評(píng)分;商場(chǎng)、超市的商品條碼、價(jià)格標(biāo)簽等的掃描和識(shí)別。
開(kāi)通服務(wù)
這里我開(kāi)通了智能分類(lèi)識(shí)別、通用文字識(shí)別、車(chē)牌識(shí)別、身份證識(shí)別、發(fā)票驗(yàn)真、增值稅發(fā)票識(shí)別五個(gè)熱門(mén)服務(wù),調(diào)用服務(wù)有SDK和API兩種方式,下面以API調(diào)用身份證識(shí)別服務(wù)為例演示一遍。
產(chǎn)品體驗(yàn)
首先下載Postman配置文件下載地址
在API工具上導(dǎo)入配置文件
Token認(rèn)證鑒權(quán)
傳入參數(shù),這里傳入圖片的base64編碼,發(fā)送后會(huì)返回識(shí)別到的信息
產(chǎn)品優(yōu)勢(shì)
識(shí)別準(zhǔn)確率高達(dá)99.9%。采用先進(jìn)的自研深度學(xué)習(xí)算法,結(jié)合億萬(wàn)級(jí)海量標(biāo)注數(shù)據(jù)樣本訓(xùn)練,針對(duì)各種業(yè)務(wù)場(chǎng)景優(yōu)化
推出業(yè)內(nèi)第一款智能分類(lèi)超級(jí)API,只需要調(diào)用1個(gè)API,即可同時(shí)識(shí)別各類(lèi)票據(jù)、卡證類(lèi)圖片,調(diào)用更簡(jiǎn)單,且識(shí)別準(zhǔn)確率業(yè)內(nèi)領(lǐng)先
支持用戶(hù)自定義模板,對(duì)于版式固定的各種票據(jù)和卡證,均可通過(guò)可視化界面操作,指定需要識(shí)別的關(guān)鍵字段。識(shí)別準(zhǔn)確率和操作便捷性,均領(lǐng)先于友商
人臉識(shí)別FRS
人臉識(shí)別FRS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)人臉識(shí)別、身份驗(yàn)證等場(chǎng)景,提高安全性和客戶(hù)體驗(yàn);醫(yī)院的門(mén)診、住院管理等場(chǎng)景,提高醫(yī)療服務(wù)效率和安全性;學(xué)校的考勤、門(mén)禁管理等場(chǎng)景,提高學(xué)校管理效率和安全性;商場(chǎng)、超市的人臉識(shí)別、客流分析等場(chǎng)景,提高營(yíng)銷(xiāo)和客戶(hù)體驗(yàn)。
開(kāi)通服務(wù)
華為云人臉識(shí)別服務(wù)FRS有以下四大功能。
人臉檢測(cè):可快速檢測(cè)圖像中是否有人臉,并返回所有人臉位置
人臉比對(duì):對(duì)比兩張圖像中的人臉信息,分析面部特征,判斷是否為同一人
人臉?biāo)阉鳎核阉鲌D庫(kù)并返回與輸入人臉最相似的N張人臉圖像
活體檢測(cè):提供兩種檢測(cè)方法,判斷圖片、視頻中人物是否為真人活體
這里演示一遍調(diào)用人臉對(duì)比服務(wù)API,調(diào)用方法可參考用戶(hù)指南
產(chǎn)品體驗(yàn)
傳入兩張照片,可以傳入base64編碼也可以直接傳入路徑或者選擇文件。發(fā)送后會(huì)返回照片的基本信息以及相似度,一般情況下超過(guò)0.93即可認(rèn)為是同一個(gè)人。
產(chǎn)品優(yōu)勢(shì)
識(shí)別準(zhǔn)確:準(zhǔn)確檢測(cè)人臉,為多場(chǎng)景提供有力支撐,人臉比對(duì)在LFW公開(kāi)測(cè)試集上的準(zhǔn)確率為99.6%+
服務(wù)豐富:已開(kāi)放人臉檢測(cè)、比對(duì)和搜索服務(wù),即將開(kāi)放動(dòng)態(tài)人像、年齡識(shí)別、特征點(diǎn)定位等服務(wù)
穩(wěn)定可靠:在海量圖片特征庫(kù)中進(jìn)行人臉?biāo)阉鞯裙δ芙?jīng)華為企業(yè)客戶(hù)的長(zhǎng)期實(shí)踐,功能穩(wěn)定,時(shí)延可控
簡(jiǎn)單高效:服務(wù)提供的應(yīng)用程序接口功能明確,簡(jiǎn)單易用;配套文檔描述詳細(xì),方便客戶(hù)使用與集成
人證核身IVS
華為云人證核身IVS有以下兩個(gè)版本。
人證核身標(biāo)準(zhǔn)版(三要素):適用于通用的身份核驗(yàn)場(chǎng)景用戶(hù)上傳本人照片(可進(jìn)行活體檢測(cè),確保由真人操作,抵御照片攻擊)和身份證照片,使用華為云文字識(shí)別服務(wù)識(shí)別證件內(nèi)容(如姓名、身份證號(hào)等),及人臉識(shí)別服務(wù)確認(rèn)操作者為證件主人,并對(duì)接公安部權(quán)威數(shù)據(jù)庫(kù)進(jìn)行實(shí)名認(rèn)證。
人證核身證件版(二要素):適用于僅需實(shí)名認(rèn)證身份證信息,無(wú)需人像識(shí)別的核驗(yàn)場(chǎng)景用戶(hù)上傳本人身份證照片,使用華為云文字識(shí)別服務(wù)識(shí)別證件內(nèi)容(如姓名、證件號(hào)等),并對(duì)接公安部權(quán)威數(shù)據(jù)庫(kù)進(jìn)行實(shí)名認(rèn)證。
兩個(gè)版本的本質(zhì)就是調(diào)用文字識(shí)別OCR和人臉識(shí)別FRS服務(wù)獲取信息,然后對(duì)接公安部權(quán)威數(shù)據(jù)庫(kù)進(jìn)行實(shí)名認(rèn)證。
開(kāi)通服務(wù)
兩個(gè)版本調(diào)用API接口使用服務(wù)的流程一樣,這里以人證核身證件版(二要素)為例演示一遍,具體操作可參考用戶(hù)指南
產(chǎn)品體驗(yàn)
傳入?yún)?shù),這里傳入圖片的base64編碼,發(fā)送后會(huì)返回識(shí)別到的信息
產(chǎn)品優(yōu)勢(shì)
權(quán)威可信:服務(wù)數(shù)據(jù)來(lái)源自國(guó)家權(quán)威機(jī)構(gòu)公安第一研究所和全國(guó)身份證信息查詢(xún)中心
配套豐富:配套人臉識(shí)別FRS、文字識(shí)別OCR等多種增值服務(wù)可供訂閱使用
超高性能:低延時(shí)、高吞吐、迅速響應(yīng)拓容需求
安全可信:華為云承諾不保存服務(wù)過(guò)程數(shù)據(jù)和用戶(hù)隱私數(shù)據(jù)
語(yǔ)音交互SIS
語(yǔ)音交互SIS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的語(yǔ)音客服、自助服務(wù)等場(chǎng)景,提高客戶(hù)體驗(yàn)和服務(wù)效率;醫(yī)院的語(yǔ)音診斷、智能問(wèn)診等場(chǎng)景,提高醫(yī)療服務(wù)效率和醫(yī)療質(zhì)量;學(xué)校的語(yǔ)音教育、智能評(píng)測(cè)等場(chǎng)景,提高教育效果和教育質(zhì)量。
開(kāi)通服務(wù)
華為云語(yǔ)音交互SIS包含以下四種服務(wù)。
實(shí)時(shí)語(yǔ)音識(shí)別:將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語(yǔ)音識(shí)別更快。可應(yīng)用于直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
一句話識(shí)別:一句話識(shí)別將口述音頻轉(zhuǎn)換為文本,通過(guò)API調(diào)用識(shí)別不超過(guò)一分鐘的不同音頻源發(fā)來(lái)的音頻流或音頻文件。適用于語(yǔ)音搜索、人機(jī)交互等語(yǔ)音交互識(shí)別場(chǎng)景。
錄音文件識(shí)別:錄音文件識(shí)別,基于深度學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)5小時(shí)以?xún)?nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對(duì)應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。
語(yǔ)音合成四種服務(wù):語(yǔ)音合成服務(wù)提供在線語(yǔ)音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語(yǔ)言多音色語(yǔ)音在線合成。支持客戶(hù)的個(gè)性化語(yǔ)音定制化需求。
產(chǎn)品體驗(yàn)
通過(guò)語(yǔ)音合成,實(shí)現(xiàn)高品質(zhì)的機(jī)器人發(fā)聲,使得人機(jī)交互更加自然。語(yǔ)音合成精品發(fā)音人,50個(gè)字符內(nèi)(含50個(gè))記為1次計(jì)費(fèi)調(diào)用;普通發(fā)音人,100個(gè)字符內(nèi)(含100個(gè))記為1次計(jì)費(fèi)調(diào)用。
產(chǎn)品優(yōu)勢(shì)
識(shí)別準(zhǔn)確率高:采用最新一代語(yǔ)音識(shí)別技術(shù),基于深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetworks,簡(jiǎn)稱(chēng)DNN)技術(shù),大大提高了抗噪性能,使識(shí)別準(zhǔn)確率顯著提升。
識(shí)別速度快:把語(yǔ)言模型、詞典和聲學(xué)模型統(tǒng)一集成為一個(gè)大的神經(jīng)網(wǎng)絡(luò),同時(shí)在工程上進(jìn)行了大量的優(yōu)化,大幅提升解碼速度,使識(shí)別速度在業(yè)內(nèi)處于領(lǐng)先地位。
多種識(shí)別模式:支持多種實(shí)時(shí)語(yǔ)音識(shí)別模式,如流式識(shí)別、連續(xù)識(shí)別和實(shí)時(shí)識(shí)別模式,靈活適應(yīng)不同應(yīng)用場(chǎng)景。
定制化服務(wù):可定制特定垂直領(lǐng)域的語(yǔ)言層模型,可識(shí)別更多專(zhuān)有詞匯和行業(yè)術(shù)語(yǔ),進(jìn)一步提高識(shí)別準(zhǔn)確率。
總結(jié)
通用AI的意義在于它可以應(yīng)用于各個(gè)行業(yè)領(lǐng)域,幫助人們更高效、更準(zhǔn)確地完成各種任務(wù)??梢酝ㄟ^(guò)自動(dòng)化、智能化等方式提高生產(chǎn)效率、降低成本、提高質(zhì)量、提高客戶(hù)滿(mǎn)意度等,從而推動(dòng)各個(gè)行業(yè)的發(fā)展。因此,通用AI的發(fā)展具有重要的戰(zhàn)略意義和經(jīng)濟(jì)價(jià)值。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30998瀏覽量
269312 -
華為云
+關(guān)注
關(guān)注
3文章
2566瀏覽量
17461
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論