0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google以豐富的對話情境資訊改進(jìn)客服中心AI的語音識別能力

931T_ctiforumne ? 來源:YXQ ? 2019-07-30 15:57 ? 次閱讀

2018年Next大會上推出的人工智能預(yù)包裝服務(wù)客服中心AI(Contact Center AI),現(xiàn)在Google透過增加人工智能理解對話情境的方法,進(jìn)一步強(qiáng)化虛擬代理人語音識別的能力,用戶現(xiàn)在還可以更靈活地自訂定義Speech Context類別,減少人工智能對于文字概念混淆的問題。

Google提到,即便客服中心虛擬代理人的語音識別精準(zhǔn)度達(dá)90%,但是比起實(shí)驗(yàn)室,實(shí)際使用環(huán)境以及雜訊的影響,在部分情況下,仍然會使得自動語音識別的結(jié)果變得很糟,因此現(xiàn)在Google進(jìn)一步更新客服中心AI所使用的技術(shù),特別是在Dialogflow以及云端語音轉(zhuǎn)文字兩服務(wù),以提升辨識品質(zhì)。

Dialogflow讓用戶能夠在網(wǎng)頁、行動應(yīng)用程式或是熱門的傳訊平臺,建構(gòu)對話服務(wù),而這次更新,Google為Dialogflow加入了自動語音調(diào)適能力(Auto Speech Adaptation),以對話情境資訊,解決虛擬代理人混淆單字發(fā)音的問題。

由于許多單字的讀音很相似,在電話中可能無法很清楚傳遞,像是cheese和these的發(fā)音,還有可能把mail誤翻成male或nail,但是當(dāng)虛擬代理人知道這些對話背景,發(fā)生在速食餐廳或是商品退貨時,便不容易混淆這些字。用戶只要在Dialogflow控制臺中,將自動語音調(diào)適功能打開,就能讓語音識別準(zhǔn)確度上升40%以上。

Google也改進(jìn)了互動式語音應(yīng)答(IVR)以及電話虛擬代理人,所使用的云端語音轉(zhuǎn)文字基線模型,而這將會使語音轉(zhuǎn)錄的結(jié)果更好,Google以電話用語的常用短句最佳化了該模型,使得新模型的表現(xiàn),在美國英文上的辨識準(zhǔn)確度提高15%,再加上自動語音調(diào)適功能,還能進(jìn)一步提升辨識的品質(zhì)。

開發(fā)人員在使用云端語音轉(zhuǎn)文字服務(wù)時,能使用SpeechContext參數(shù)來控制情境資訊,讓語音轉(zhuǎn)錄更加精確,以讓虛擬代理人更精準(zhǔn)地辨識企業(yè)產(chǎn)品等特定名詞。

而現(xiàn)在Google在SpeechContext中新增類別,而預(yù)定義的類別則對應(yīng)到流行或是通用的概念上,使用情境像是在數(shù)字溝通時,4個數(shù)字的組合可能代表年、時間或是金錢,而開發(fā)者可以在SpeechContext類別,調(diào)校整個自動語音識別的單字列表,改善輸入語音的轉(zhuǎn)錄結(jié)果。

不過,Google也提到,使用SpeechContext這樣的工具,會增加部分短句被擷取的機(jī)率,這可能降低了語音有提及卻沒出現(xiàn)在轉(zhuǎn)錄文字上的錯誤,但同時也會增加語音未提及卻出現(xiàn)在轉(zhuǎn)錄文字的情形,自動語音調(diào)適的強(qiáng)度需要權(quán)衡結(jié)果進(jìn)行調(diào)整,而SpeechContext的Boost功能解決了開發(fā)者這樣的煩惱,可以自動為使用案例調(diào)整語音調(diào)適的最佳強(qiáng)度。

過去云端語音轉(zhuǎn)語音服務(wù),處理語音只能以1分鐘為單位,而這對于需要較長時間轉(zhuǎn)錄文字的使用案例,像是會議、即時影片或是電話等是個大問題,現(xiàn)在Google將處理語音時間上限提高至5分鐘,而且API也允許開發(fā)人員開啟新的串流對話,來接續(xù)前一個串流對話,以做到無限時間的串流語音轉(zhuǎn)錄文字。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1766

    瀏覽量

    57619
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112718

原文標(biāo)題:Google以豐富的對話情境資訊改進(jìn)客服中心AI的語音識別能力

文章出處:【微信號:ctiforumnews,微信公眾號:CTI論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對話

    顯示發(fā)送的時間戳,以便用戶了解消息的發(fā)送時間。 這個DEMO展示了如何使用ArkTS和擴(kuò)展后的ChatUI框架(或類似功能的庫)在HarmonyOS NEXT上創(chuàng)建一個功能豐富AI智能對話框。我們可以根據(jù)需要進(jìn)一步定制和擴(kuò)展這
    發(fā)表于 01-03 11:29

    基于W2605C語音識別合成芯片的智能語音交互鬧鐘方案-AI對話享受智能生活

    隨著科技的飛速發(fā)展,智能家居產(chǎn)品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時間管理的得力助手,也在不斷進(jìn)化?;赪2605C語音識別語音合成芯片的智能語音交互鬧鐘,憑借其強(qiáng)大的聯(lián)
    的頭像 發(fā)表于 12-31 11:54 ?79次閱讀

    湯姆貓AI語音情感陪伴機(jī)器人搭載全志R128芯片

    接入AI大模型,可實(shí)現(xiàn)語音交互、情緒識別、連續(xù)對話、中英雙語互動等功能,科技感滿滿。
    的頭像 發(fā)表于 12-26 14:20 ?272次閱讀

    【「大模型啟示錄」閱讀體驗(yàn)】如何在客服領(lǐng)域應(yīng)用大模型

    多個因素以確保所選模型能夠滿足企業(yè)的具體需求和目標(biāo)。首先,企業(yè)需要明確自己的客服需求和目標(biāo)。例如,是否需要24小時在線客服服務(wù)?是否需要處理復(fù)雜問題的能力?是否需要個性化服務(wù)?明確這些需求有助于企業(yè)更好
    發(fā)表于 12-17 16:53

    NVIDIA將在越南開設(shè)首個研發(fā)中心推動AI發(fā)展

    從事軟件開發(fā)等工作,借助越南豐富的 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))工程師人才庫,攜手行業(yè)領(lǐng)袖、初創(chuàng)企業(yè)、政府機(jī)構(gòu)、大學(xué)及學(xué)生,共同加速 AI 的應(yīng)用。 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“我們很高興能開設(shè) NVIDIA 的研發(fā)
    的頭像 發(fā)表于 12-07 11:19 ?784次閱讀

    基于智能語音交互的智能呼叫中心工作機(jī)制

    注于智能語音識別領(lǐng)域,與眾多呼叫中心、智能客服廠商建立穩(wěn)定的合作關(guān)系,標(biāo)貝科技接手過的案例為例,為您分享基于智能
    的頭像 發(fā)表于 12-03 16:44 ?323次閱讀
    基于智能<b class='flag-5'>語音</b>交互的智能呼叫<b class='flag-5'>中心</b>工作機(jī)制

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音識別
    的頭像 發(fā)表于 11-26 09:20 ?550次閱讀

    ASR語音識別技術(shù)應(yīng)用

    語音識別技術(shù)應(yīng)用的分析: 一、ASR語音識別技術(shù)原理 ASR語音識別技術(shù)的基本原理是將人類
    的頭像 發(fā)表于 11-18 15:12 ?816次閱讀

    ChatGPT:怎樣打造智能客服體驗(yàn)的重要工具?

    ChatGPT作為智能對話生成模型,可以幫助打造智能客服體驗(yàn)的重要工具。以下是一些方法和步驟:1.數(shù)據(jù)收集和準(zhǔn)備:收集和整理與客服相關(guān)的數(shù)據(jù),包括常見問題、回答示例、客戶對話記錄等。這
    的頭像 發(fā)表于 11-01 11:12 ?186次閱讀
    ChatGPT:怎樣打造智能<b class='flag-5'>客服</b>體驗(yàn)的重要工具?

    ChatGPT:為未來的個人和企業(yè)提供革命性的對話解決方案

    的知識:ChatGPT經(jīng)過大規(guī)模的預(yù)訓(xùn)練,可以提供豐富的知識和信息,能夠回答各種問題,并提供有用的建議和指導(dǎo)。3.可定制性:ChatGPT可以根據(jù)個人或企業(yè)的需求進(jìn)行定制,適應(yīng)特定的對話場景和行業(yè)需求
    的頭像 發(fā)表于 11-01 11:12 ?177次閱讀
    ChatGPT:為未來的個人和企業(yè)提供革命性的<b class='flag-5'>對話</b>解決方案

    AI破解個性化客服難題

    一文匯集多個行業(yè)借助 AI 實(shí)現(xiàn)的個性化客服實(shí)踐
    的頭像 發(fā)表于 10-25 09:06 ?1903次閱讀
    <b class='flag-5'>以</b><b class='flag-5'>AI</b>破解個性化<b class='flag-5'>客服</b>難題

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    大模型語音問答、拍照識圖、大模型繪圖等豐富供能示例,支持語音喚醒、多輪語音交互。 2智能對話除了大模型
    發(fā)表于 06-18 17:33

    【Longan Pi 3H 開發(fā)板試用連載體驗(yàn)】給ChatGPT裝上眼睛,并且還可以語音對話:5,音頻采集

    ,要根據(jù)環(huán)境噪音校準(zhǔn)一下麥克風(fēng)閾值,接下來開始采集。當(dāng)音量超過閾值后還是錄音,音量低于閾值一段時間后結(jié)束錄音。隨后將得到的音頻傳入語音識別模型轉(zhuǎn)為文字,這里我使用的是google的模型: import
    發(fā)表于 04-16 11:12

    【Longan Pi 3H 開發(fā)板試用連載體驗(yàn)】給ChatGPT裝上眼睛,還可以語音對話

    對話能力。 目前計(jì)劃使用的具體方案和流程如下: 使用speech_recognition進(jìn)行語音輸入,完成后將語音數(shù)據(jù)導(dǎo)入Whisper或googl
    發(fā)表于 04-12 12:41