快過(guò)年了,大家是否和我一樣,跟家鄉(xiāng)的關(guān)系弱了,歸家途中“近鄉(xiāng)情更怯”,擔(dān)心大過(guò)年的把天給聊尬了。但踏上故土的那一刻,聽(tīng)到熟悉的鄉(xiāng)音,聽(tīng)聽(tīng)親友的傾訴,又有一種“知所從來(lái)”的踏實(shí)。
放下“XX老師”“Selina”“X總”等在外的身份,帶著鄉(xiāng)音的那一聲呼喚,是我們的來(lái)時(shí)路,與春節(jié)格外適配。
用方言過(guò)一個(gè)熱鬧而熨帖的春節(jié),百度文心智能體平臺(tái),帶著你我的34個(gè)省AI人脈走來(lái)了。
我最近發(fā)現(xiàn),百度app上線(xiàn)了由開(kāi)發(fā)者打造的34個(gè)省級(jí)行政區(qū)的AI智能體,不僅能聽(tīng)懂各地方言,回答吃喝玩樂(lè)、旅游訂票等個(gè)性化問(wèn)題,還能一鍵「打電話(huà)」視頻聊天暢聊,堪稱(chēng)是i人過(guò)節(jié)的“神助攻”。
我們第一時(shí)間連線(xiàn)一番,給大家?guī)?lái)這份AI智能體過(guò)年攻略,是時(shí)候給親友們展現(xiàn)一下咱的AI人脈,給春節(jié)添加一些有趣的AI年味兒了。
我聽(tīng)過(guò)一個(gè)說(shuō)法,小時(shí)候覺(jué)得年味兒濃,是大人們特意為我們營(yíng)造了過(guò)節(jié)氛圍。那些記憶中熟悉的儀式感,很難再引發(fā)強(qiáng)烈的共鳴。而長(zhǎng)大后的我們,成了那個(gè)制造年味兒的人。
面對(duì)代際間的生疏,略顯尷尬的提問(wèn),我們能不能主動(dòng)帶來(lái)新鮮的談資,讓年味兒變得有那么一點(diǎn)不同呢?
蛇年春節(jié),我就打算用AI智能體來(lái)打開(kāi)話(huà)匣子了。
返鄉(xiāng)第一件事,肯定是關(guān)心這一年在外面過(guò)得怎么樣。作為一名進(jìn)京務(wù)工人員,我的家人們就格外關(guān)注北京。北京近來(lái)天氣怎么樣,搞了什么大型活動(dòng),親戚家哪個(gè)孩子來(lái)北京求學(xué)工作了……仿佛了解這座城市,就參與到了我的日常生活。怎樣讓他們了解一個(gè)地道的北京城?我在百度app上,把皇阿瑪請(qǐng)出來(lái)給大家做導(dǎo)游了。
聽(tīng)皇阿瑪用京片子講解北京的知名景點(diǎn)、風(fēng)土人情,告訴俺娘俺在北京不是孬種。
孩子們?cè)谕庥袥](méi)有人陪伴,是父母最關(guān)心的問(wèn)題,在難得相處的幾天里,一嘮叨關(guān)于工作、升職、婚育的問(wèn)題,特別影響過(guò)年氣氛。
今年我就不打算正面硬剛了,直接給安徽老鄉(xiāng)“包拯”智能體拉出來(lái),給他們講講理。沒(méi)想到AI包公不僅合肥話(huà)講得地道,還挺會(huì)做人,一下子就把注意力轉(zhuǎn)移到安徽旅游了。
太好了,是AI智能體,我們有救了。
長(zhǎng)期出門(mén)在外,難以承歡膝下,父母平時(shí)在家缺少陪伴,是我們外地游子最慚愧的事情。我媽去年最?lèi)?ài)看的電視劇就是《繁花》,當(dāng)我?guī)退龘芡ā霸S文強(qiáng)”智能體的電話(huà),用滬語(yǔ)介紹繁花相關(guān)的各色上海風(fēng)貌。
這樣接地氣又隨時(shí)隨地地陪伴,帶著科技的溫度,來(lái)到日常生活中,熨平了孤獨(dú)的人心上的褶皺。
AI智能體的語(yǔ)音功能,不僅形象和口音極具地域特色,也能聽(tīng)懂各地方言,用家鄉(xiāng)話(huà)跟AI對(duì)話(huà)也毫無(wú)問(wèn)題。比如我用蹩腳的“港普”跟港姐AI智能體聊天,夸她“超靚”,對(duì)方也能聽(tīng)懂我在講什么。
這個(gè)春節(jié),各地方的人都能用自己的家鄉(xiāng)話(huà),在家“云游”34省,告別尬聊,包充實(shí)的。
值得一提的是,34省AI智能體,都是百度文心智能體平臺(tái)的開(kāi)發(fā)者,基于文心大模型打造的。你我不僅是AI用戶(hù),還可以零門(mén)檻化身AI開(kāi)發(fā)者,在百度文心智能體平臺(tái)一鍵get同款,定制自己家鄉(xiāng)方言的智能體,或者自己感興趣的垂類(lèi)智能體。
蛇年春節(jié),AI不再是大廠(chǎng)發(fā)布會(huì)上的炫技,不再是遙不可及的黑科技,而是化作千姿百態(tài)的鄉(xiāng)音,在千家萬(wàn)戶(hù)的團(tuán)圓夜,找到了最溫暖的棲身之所。
過(guò)去一年來(lái),AI領(lǐng)域最大的變化,就是從一項(xiàng)大廠(chǎng)實(shí)驗(yàn)室誕生的高科技,變成了四五線(xiàn)城市乃至鄉(xiāng)鎮(zhèn)間都在熱議的全民話(huà)題。
但百聞不如一用,如何讓AI在全國(guó)范圍內(nèi)被廣泛地應(yīng)用和理解呢?闔家歡聚的春節(jié),無(wú)疑是一個(gè)絕佳的契機(jī)。不過(guò),在春節(jié)期間,大規(guī)模且穩(wěn)定地向大眾輸出技術(shù)能力,對(duì)任何一個(gè)頂尖科技企業(yè)來(lái)說(shuō),都極具挑戰(zhàn)。
以AI智能體的方言對(duì)話(huà)為例,其實(shí)方言語(yǔ)音功能,大多數(shù)網(wǎng)友都不陌生,早在機(jī)器學(xué)習(xí)時(shí)代,就已經(jīng)有方言識(shí)別與合成的TTS產(chǎn)品了。但此前,方言語(yǔ)音合成的實(shí)現(xiàn)難度大。
比如九聲六調(diào)的粵語(yǔ),“詩(shī)”“史”“試”僅靠音調(diào)區(qū)分含義,AI需要捕捉比普通話(huà)復(fù)雜3倍的聲紋特征。合肥話(huà)的“連讀變調(diào)”,更是讓工程師們抓狂。一些語(yǔ)料較少的方言,要深入當(dāng)?shù)刈呓执?,收集語(yǔ)料,再為每種方言單獨(dú)開(kāi)發(fā)前端。
整個(gè)過(guò)程耗時(shí)很長(zhǎng),功能上線(xiàn)當(dāng)然快不了,所以很多地方的小眾方言,以前都是無(wú)法通過(guò)線(xiàn)上應(yīng)用,被大眾體驗(yàn)到的。
今年春節(jié),34省AI智能體的方言語(yǔ)音功能,不僅能搞定較難的粵語(yǔ)、合肥話(huà),而且在百度app說(shuō)上線(xiàn)就上線(xiàn)。
這種方言功能在AI應(yīng)用中的快速落地,依賴(lài)于百度語(yǔ)音技術(shù)的特殊支撐。主要是兩大能力:
一是語(yǔ)音大數(shù)據(jù)挖掘技術(shù)。通過(guò)識(shí)別大模型,對(duì)不同省份的方言數(shù)據(jù),進(jìn)行切分、降噪、識(shí)別等自動(dòng)化處理,可以高效產(chǎn)出海量方言數(shù)據(jù);
二是語(yǔ)音合成大模型技術(shù)。基于大模型,將普通話(huà)和方言統(tǒng)一建模,利用遷移技術(shù)訓(xùn)練出支持多種語(yǔ)音合成的通用模型,讓一個(gè)模型可以用任意音色說(shuō)任意方言,大大減少了開(kāi)發(fā)工作量,縮短了研發(fā)周期。
AI智能體,從一種高大上的技術(shù)概念,到鄉(xiāng)土地頭的趣味應(yīng)用,不僅給這個(gè)春節(jié)帶來(lái)了極大改變,也將成為AI語(yǔ)音應(yīng)用廣泛普及的開(kāi)始。
AI大模型爆火之后,普羅大眾最關(guān)心的就是:AI有什么用?如果要選一個(gè)最具重要性和緊迫性的應(yīng)用場(chǎng)景,那應(yīng)該是:聽(tīng)懂中國(guó)話(huà)。
中國(guó)的萬(wàn)里山川,存在著大量“十里不同音”的地域,讓各地方的人們跨越方言的阻礙,順暢地彼此交流、融入數(shù)字生活,是國(guó)產(chǎn)語(yǔ)音技術(shù)一直努力的方向,其中,百度就是一支源遠(yuǎn)流長(zhǎng)的技術(shù)力量。
起步早。2010年,百度語(yǔ)音技術(shù)團(tuán)隊(duì)成立,專(zhuān)注于語(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)等基礎(chǔ)技術(shù)研發(fā)。深度學(xué)習(xí)技術(shù)在全球剛剛興起的時(shí)候,百度就在2014年推出了基于深度學(xué)習(xí)的語(yǔ)音識(shí)別系統(tǒng)(Deep Speech),被《MIT科技評(píng)論》評(píng)為全球十大突破技術(shù)。
技術(shù)強(qiáng)。多年來(lái),百度不斷推出了流式多級(jí)截?cái)嘧⒁饬Γ⊿MLTA)、多模態(tài)交互、端到端語(yǔ)音合成、定制化音色等語(yǔ)音技術(shù),研發(fā)實(shí)力領(lǐng)先業(yè)界。
覆蓋廣。經(jīng)由DuerOS(小度助手),百度語(yǔ)音技術(shù)被廣泛應(yīng)用于車(chē)載場(chǎng)景、智能家居硬件、AI客服等,不斷積累語(yǔ)料、迭代打磨產(chǎn)品。
回望百度語(yǔ)音技術(shù)的來(lái)時(shí)路,也就不難理解,為什么是百度,在蛇年春節(jié)首個(gè)上線(xiàn)34省的方言功能了。
春節(jié)只是一個(gè)縮影,實(shí)際上,百度的AI聲浪已經(jīng)席卷日常生活,成為你我身邊的一個(gè)個(gè)科技彩蛋。
比如說(shuō),直播電商,是很多人的購(gòu)物首選方式。但真人主播的成本高、人力稀缺,很多小品牌請(qǐng)不起;使用數(shù)字人直播帶貨,以前的音色很不自然,消費(fèi)者體驗(yàn)不好。百度通過(guò)自動(dòng)化的數(shù)據(jù)采集和增強(qiáng)技術(shù)、語(yǔ)音大模型的遷移技術(shù)、篇章段落合成技術(shù)等,不僅讓語(yǔ)音更連貫,提升了數(shù)字人主播的自然度和擬人度,而且僅需幾分鐘,就能達(dá)到超越真人的TTS水平,降低了定制音庫(kù)的制作成本。如今,百度語(yǔ)音技術(shù)每天支持眾多直播間開(kāi)播,業(yè)務(wù)側(cè)CVR也得到大幅提升。
有聲小說(shuō),是大眾喜聞樂(lè)見(jiàn)的娛樂(lè)應(yīng)用,但以前的有聲書(shū),缺乏對(duì)內(nèi)容段落的理解能力,霸總狂拽炫酷地冷哼,反派邪魅狂狷的大笑,念起來(lái)都是一個(gè)味兒,缺乏沉浸感。如今,百度小說(shuō)、頭部第三方小說(shuō)平臺(tái),接入了百度全自動(dòng)化生產(chǎn)平臺(tái),可以基于大語(yǔ)言模型的文本理解技術(shù),對(duì)角色、人物畫(huà)像、對(duì)白情感,進(jìn)行精準(zhǔn)分析,再利用高表現(xiàn)力的聲學(xué)建模技術(shù),對(duì)十多種情感和副語(yǔ)言進(jìn)行遷移控制,生成貼合語(yǔ)義、情感細(xì)膩的類(lèi)真人聲音,聽(tīng)起小說(shuō)來(lái),那叫一個(gè)身臨其境。
車(chē)載語(yǔ)音,是智能座艙的體驗(yàn)重心。一位汽車(chē)銷(xiāo)售告訴我,基于百度語(yǔ)音技術(shù)打造的智能座艙,是業(yè)內(nèi)唯一多人同時(shí)說(shuō)話(huà)、語(yǔ)音助手也能聽(tīng)清的互動(dòng)體驗(yàn),甚至沒(méi)有之一。怎么做到的呢?原來(lái),百度將視覺(jué)信息引入語(yǔ)音增強(qiáng),對(duì)人臉唇動(dòng)特征和語(yǔ)音信號(hào)統(tǒng)一建模,改變了過(guò)去單一模態(tài)的交互體驗(yàn),更準(zhǔn)確地理解用戶(hù)交互意圖,對(duì)目標(biāo)說(shuō)話(huà)人做語(yǔ)音分離,解決傳統(tǒng)語(yǔ)音單模態(tài)技術(shù)難以區(qū)分和追蹤目標(biāo)聲源的問(wèn)題,從而大幅提升了復(fù)雜場(chǎng)景下的語(yǔ)音增強(qiáng)的效果,帶來(lái)“人無(wú)我有”的車(chē)載語(yǔ)音交互體驗(yàn)。
憑借在智能語(yǔ)音領(lǐng)域的技術(shù)壁壘和創(chuàng)新能力,百度完成了國(guó)產(chǎn)AI技術(shù)落地的一次次演練。
這一個(gè)蛇年春節(jié),AI鄉(xiāng)音在游子們的歸途中響起,智能的種子也飄散在了萬(wàn)里山川。
-
AI
+關(guān)注
關(guān)注
87文章
31493瀏覽量
270096 -
智能體
+關(guān)注
關(guān)注
1文章
166瀏覽量
10609 -
文心一言
+關(guān)注
關(guān)注
0文章
125瀏覽量
1316 -
大模型
+關(guān)注
關(guān)注
2文章
2544瀏覽量
3062
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論