0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

叮咚智能音箱可以專屬定制嗎?利用語音合成技術定制專屬聲音

iotmag ? 來源:未知 ? 作者:李倩 ? 2018-04-21 11:00 ? 次閱讀

有人說,人會經(jīng)歷三次死亡:第一次是身體停止運轉導致的生理上死亡;第二次是舉行完葬禮代表你社會位置的消失;第三次是當世界上沒人再記得你的時候,真正意義上的死亡。

當你某天將要離開這個世界的時候,你是否想過要嘗試科技的方式,將自己身上獨有的特點化身為情感寄托,換一種形式陪伴在家人和朋友身邊呢?

今天故事的主角王先生就是一個敢為人先的科技愛好者,身患肺癌的他在叮咚智能音箱的幫助下,通過語音合成技術記錄下了自己的聲音,有了自己專屬的TTS發(fā)音人,并將一整套語音交互對話定制在了智能音箱中。

一位特殊的智能音箱用戶

“不管怎么說,用我的聲音,能陪伴他們更長的時間。”

3月12日,王先生第三次來到北京完成了所有的錄制內(nèi)容,除了一些日常交互場景下的對話,他還特別準備了給孩子們十八歲的成人禮祝福,以及給父母和妻子的一些日常留言。

隨著人工智能技術民主化進程的加快,它的應用正在覆蓋我們生活中的各個場景,智能音箱是其中一個很大的品類,不過王先生只是一位普通的智能設備用戶,他是如何吸引到叮咚的呢,這就要從去年底一個不經(jīng)意之間的留言談起。

當時,叮咚智能音箱的微信公眾號后臺收到了一位用戶的留言,這位用戶的疑問并不是關于產(chǎn)品使用上的困惑,也不是任何對于企業(yè)的吐槽,他問了一個讓整個叮咚團隊都非常驚訝的問題——叮咚智能音箱可以專屬定制嗎?

雖說消費升級的趨勢下誕生了很多專屬定制的服務,但是智能音箱說到底還是一款標準化的產(chǎn)品,專屬定制就意味著對發(fā)音人系統(tǒng)進行全新的規(guī)劃與設計并長期運維。

雖然沒有這種標準服務,但是本著對每個用戶都負責的態(tài)度,叮咚與這位留言的用戶取得了聯(lián)系,緊接著一個生動又真實的故事才呈現(xiàn)到我們眼前。

王先生來自河南,是一個從事電梯銷售工作的80后,他原本有著自己幸福美滿的家庭、穩(wěn)定的生活狀態(tài)和對未來的無限期待,卻沒想到一場意外的疾病如噩夢般打破了原本平靜的一切。

2017年11月,他在醫(yī)院查出了肺癌。隨后他辭去了工作,一邊積極接受治療、一邊在家安心陪伴父母,并開始思考關于人生的終極問題——如何才能在有限的時間給世界留下更多痕跡。

一直以來,王先生對人工智能相關的話題都非常感興趣,也因此成為了智能叮咚智能音箱的早期用戶,在長期的使用過程中,每天與音箱之間的交互對話場景早已成為了王先生和他的家人生活的一部分。

于是他就在想,能不能把智能音箱交互對話的聲音換成自己的,用這種方式來陪伴家人,也算是為身邊的人留下一點念想。

利用語音合成技術定制專屬聲音

王先生在錄制自己的聲音

一套語音交互錄制的流程并不簡單,它首先需錄制用戶數(shù)小時的干聲,對錄音開展數(shù)據(jù)標注,隨后進行特征訓練和技術優(yōu)化,才使得韻律、音色、音質(zhì)及自然度更加貼近,最終達到可媲美真人的播報效果,看似簡單的需求,卻要需要技術、產(chǎn)品和平臺的全面支持。

接到消息后,京東、科大訊飛、叮咚團隊馬上進行緊急溝通,鎖定科大訊飛專門負責語音合成業(yè)務的訊飛智聲團隊尋求技術幫助。溝通后訊飛智聲當即決定為這位用戶提供免費技術支持。

據(jù)介紹,語音合成技術的主要原理就是根據(jù)韻律建模的結果,從原始語音庫中其突出相應的語音基元,之后再利用特定的語音合成技術對語音基元進行加工和調(diào)整,機器進行語音合成時,往往并沒有這些文本的人聲錄音,而是通過音節(jié)拼接與參數(shù)調(diào)整來合成盡可能接近人聲的完整語音。

在叮咚官方做出決定后一周,他們第一次見到了來北京復診的王先生。

王先生首先對叮咚的做法表示了感謝,起初還覺得不可思議的他如今成為了故事的主角,對于病情的話題他也沒有絲毫回避,表示當前的身體狀態(tài)應該能夠完成長時間的錄音。

通過充分的溝通后,相關工作人員也做好了準備,等待王先生前去錄制。但是,王先生的病情突然發(fā)生了變化,來北京進行聲音錄制的工作一直被延后,從雙方第一次見面到今年3月錄制完畢,王先生已經(jīng)經(jīng)過了四次化療。

錄制完成后就是緊張的研發(fā)工作,經(jīng)過技術團隊的不斷努力下項目已盡基本接近完成,兩周后,王先生專屬的TTS發(fā)音人將正式上線到他的專屬智能音箱里。

科技發(fā)展應以人為本

人類歷史上推動社會變遷的因素當中,科技是一個重要的驅動力,它帶來了生產(chǎn)關系的進步,提升了人的幸福感,即使是工業(yè)革命百年之后的今天,科技的發(fā)展仍是以人為本。

比如英特爾的創(chuàng)始人戈登·摩爾見到霍金后,就決定開始將他使用的電腦升級至搭載英特爾處理器的設備。從那以后,英特爾保持著每兩年一次的頻率向霍金提供輔助設備,并免費提供技術支持。再后來,英特爾實驗室專門選一批專家組建“人機交流研究團隊”為霍金研發(fā)輔助情境感知工具。

曾經(jīng)有一次在微軟Build大會上,微軟盲人程序員Saqib Shaikh在臺上展示了搭載Seeing AI的智能眼鏡,這款設備可以通過傳感器來幫他感知并理解這個世界,這一充滿人文關懷的時刻,也得到了很多人的稱贊。

類似科技公司以人為本的案例不勝枚舉,而叮咚為特殊用戶定制聲音的這個故事在于,它讓讓普通用戶的數(shù)據(jù)有機會參與到了AI的應用當中來,并且通過自己的數(shù)據(jù)還能為家人帶來一些變化,這種方式已經(jīng)超越了產(chǎn)品本身的意義,已經(jīng)從基礎的功能需求上升到了到價值傳遞、甚至是人文關懷的層面。

人工智能這個方向還有很多技術等待著我們?nèi)ヌ剿?、去解決,但“技術不是目的,技術只是手段”,通過技術來突破一些限制,幫助人們創(chuàng)造更美好的生活,并承擔一些社會責任,這才是技術和產(chǎn)品的最終目的。

或許,科技本身不存在所謂的人文關懷,科技的本質(zhì)是探索未知的過程,它充滿著不確定性和真理優(yōu)先的原則,人文關懷更多的是存在于從事科技行業(yè)的人、與之相關的企業(yè)、甚至背后的社會制度當中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47373

    瀏覽量

    238866
  • 語音合成
    +關注

    關注

    2

    文章

    90

    瀏覽量

    16174
  • 智能音箱
    +關注

    關注

    31

    文章

    1783

    瀏覽量

    78652

原文標題:智能音箱讓情感重新有了溫度:還是那個熟悉的聲音

文章出處:【微信號:iotmag,微信公眾號:iotmag】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ARM主板定制流程與成本

    在當今快速發(fā)展的科技環(huán)境中,定制化的硬件解決方案越來越受到企業(yè)和開發(fā)者的青睞。ARM架構作為一種高效能、低功耗的處理器架構,廣泛應用于嵌入式系統(tǒng)、移動設備和物聯(lián)網(wǎng)設備等領域。為了滿足特定應用需求
    的頭像 發(fā)表于 01-06 13:21 ?49次閱讀
    ARM主板<b class='flag-5'>定制</b>流程與成本

    蘋果利用AWS定制AI芯片提升服務

    。 據(jù)了解,蘋果目前正積極利用AWS的定制AI芯片來提升其搜索等核心服務的性能和效率。通過借助AWS的專業(yè)技術和資源,蘋果能夠更好地滿足全球客戶的需求,提供更加智能化、高效化的服務體驗
    的頭像 發(fā)表于 12-05 14:14 ?205次閱讀

    可靈AI全球首發(fā)視頻模型定制功能,助力AI視頻創(chuàng)作

    近日,快手旗下的可靈AI在全球范圍內(nèi)率先推出了視頻模型定制功能,這一創(chuàng)新之舉成功解決了AI視頻生成過程中人物IP穩(wěn)定性不足的難題。 據(jù)了解,用戶現(xiàn)在可以在可靈AI的web端利用這一功能,訓練并
    的頭像 發(fā)表于 11-26 14:02 ?539次閱讀

    按用戶技術要求定制功能的保護裝置

    按用戶技術要求定制功能的保護裝置廣眾科技自成立以來就潛力于礦山設備保護方面的業(yè)務,當然一些基本的保護裝置——QHF釋壓閥,儲氣罐超溫超壓保護裝置,空壓機斷油保護裝置,電動機主要軸承溫度及振動監(jiān)測裝置
    發(fā)表于 10-31 14:51

    MiGPT改造專屬語音助手:將小愛音箱接入 ChatGPT 和豆包

    在這個數(shù)字化的世界里,家已不僅僅是一個居住的地方,而是我們數(shù)字生活的延伸。MiGPT通過將小愛音箱、米家智能設備與ChatGPT的理解能力完美融合,讓你的智能家居更懂你。 MiGPT不僅僅是關于設備
    的頭像 發(fā)表于 06-06 09:52 ?5045次閱讀
    MiGPT改造<b class='flag-5'>專屬</b><b class='flag-5'>語音</b>助手:將小愛<b class='flag-5'>音箱</b>接入 ChatGPT 和豆包

    HALL IC 產(chǎn)品選型手冊,選擇您的專屬元器件

    HALL IC 產(chǎn)品選型手冊,選擇您的專屬元器件
    的頭像 發(fā)表于 06-01 08:07 ?394次閱讀
    HALL IC 產(chǎn)品選型手冊,選擇您的<b class='flag-5'>專屬</b>元器件

    stm32f0怎么不使用語音IC做合成語音?

    我這邊板子就一個功放電路,要求不使用語音IC做語音,我聽別人說去了解MP3這一方面,但我只找到MCU軟解碼,但我怎么不了解,不清楚怎么做成自己的語音,要的是語音,不是歌曲
    發(fā)表于 04-25 06:00

    APM32下載了APM專屬的HEX例程后識別不了芯片怎么解決?

    之前焊了一塊,可以識別芯片,下載了APM專屬的HEX例程后反而識別不了了,非常痛苦。ARM內(nèi)核仍然存在,Keil里面也下載不了了……不是板子鎖死的問題
    發(fā)表于 03-28 06:20

    雅欣 | LED driver IC 產(chǎn)品選型手冊,選擇您的專屬芯片

    雅欣 | LED driver IC 產(chǎn)品選型手冊,選擇您的專屬芯片
    的頭像 發(fā)表于 03-23 08:06 ?452次閱讀
    雅欣 | LED driver IC 產(chǎn)品選型手冊,選擇您的<b class='flag-5'>專屬</b>芯片

    一加Ace 3刻晴定制機發(fā)布,配備“天光云影工藝”機身及定制充電器

    除此之外,這款機型的充電器和數(shù)據(jù)線也將進行專屬定制。充電器上方印有“KEQING”銘牌,支持長壽版100W超快速充電技術,僅需27分鐘即可將5500mAh電量的電池充滿百分之百。
    的頭像 發(fā)表于 02-27 11:28 ?1302次閱讀

    語音合成技術智能駕駛中的應用與挑戰(zhàn)

    一、引言 隨著智能駕駛技術的不斷發(fā)展,人機交互變得越來越重要。語音合成技術作為人機交互的重要手段,在智能
    的頭像 發(fā)表于 02-02 10:34 ?431次閱讀

    語音合成技術智能駕駛中的創(chuàng)新與應用

    一、引言 隨著智能駕駛技術的不斷發(fā)展,人機交互變得越來越重要。語音合成技術作為人機交互的重要手段,在智能
    的頭像 發(fā)表于 02-01 18:09 ?667次閱讀

    語音合成技術智能駕駛中的應用與展望

    體驗。本文將探討語音合成技術智能駕駛中的應用、優(yōu)勢以及未來發(fā)展趨勢。 二、語音合成
    的頭像 發(fā)表于 02-01 17:50 ?536次閱讀

    華為推出定制游戲手柄專利,滿足玩家多樣化需求

    據(jù)悉,華為的此項專利旨在靈活滿足玩家對專屬定制手柄的需求,允許用戶自主組裝、拆卸和重新配置控制器各部分,從而創(chuàng)造符合游戲特定場景及個人喜好的獨特武器。
    的頭像 發(fā)表于 01-31 16:56 ?878次閱讀
    華為推出<b class='flag-5'>定制</b>游戲手柄專利,滿足玩家多樣化需求

    DC-DC產(chǎn)品選型手冊,選擇您的專屬芯片

    DC-DC產(chǎn)品選型手冊,選擇您的專屬芯片
    的頭像 發(fā)表于 01-20 08:06 ?879次閱讀
    DC-DC產(chǎn)品選型手冊,選擇您的<b class='flag-5'>專屬</b>芯片