隨著大模型技術(shù)的不斷發(fā)展,大模型的應(yīng)用越來越受到行業(yè)的重視。如何在智能硬件的語音交互上快速應(yīng)用和普及大模型,一直是業(yè)內(nèi)熱議和探索的話題。
近日,科大訊飛AIUI人機(jī)交互開放平臺(tái)推出了大模型極速超擬人交互軟硬件方案,并開源了SDK接入代碼,大幅降低了接入門檻。用戶只需簡單更換配置信息,即可體驗(yàn)速度快、效果優(yōu)的AIUI語音交互功能。即使算力低的設(shè)備也能支持接入,為智能硬件語音交互帶來全新的體驗(yàn)。
01云端大模型賦能,交互 “快準(zhǔn)暖”
AIUI大模型交互具備卓越的語義理解能力,無論是復(fù)雜指令的泛化表達(dá),還是天馬行空的提問,都能流暢應(yīng)對(duì)。它能夠精準(zhǔn)捕捉用戶的每一個(gè)問題、情感需求或創(chuàng)意要求,實(shí)現(xiàn)真正意義上的自由對(duì)話,讓設(shè)備不再是簡單的指令執(zhí)行者,而是能夠理解并滿足用戶深層次需求的智能伙伴。
有了科大訊飛AIUI大模型交互的全鏈路交互能力,智能硬件能夠?qū)崿F(xiàn)超擬人的秒級(jí)回復(fù),多輪對(duì)話自然流暢。即使用戶在交流過程中打斷或插話,系統(tǒng)也能無延遲響應(yīng),為用戶提供類似真人的對(duì)話體驗(yàn)。
目前,科大訊飛大模型極速超擬人交互軟硬件方案支持人設(shè)、方言、情感語氣的自由切換,能夠精準(zhǔn)感知用戶的喜怒哀樂,并結(jié)合對(duì)話情境給出擬人的情緒反應(yīng)。例如,當(dāng)用戶感到沮喪時(shí),設(shè)備會(huì)用溫柔的語氣給予安慰和鼓勵(lì);在輕松愉快的氛圍中,設(shè)備則會(huì)用活潑的語調(diào)與用戶互動(dòng)。賦予設(shè)備更真實(shí)的情感,拉近與用戶的距離。
此外,為滿足用戶的多樣化需求,科大訊飛還為接入的設(shè)備提供海量正版兒歌、音樂、故事等多種音頻資源。無論是孩子在睡前需要聽故事,還是用戶在休閑時(shí)想聽音樂放松,都能在設(shè)備中找到豐富的內(nèi)容選擇,提升日常陪伴的娛樂性和教育性。
02開源接入SDK,低配置要求高效能體驗(yàn)
面向低成本、低算力智能硬件設(shè)備大模型交互接入難、門檻高的問題,科大訊飛開放了極速超擬人交互接入的代碼,極大地降低了硬件接入門檻。它能在低算力、低內(nèi)存設(shè)備上穩(wěn)定運(yùn)行,支持RTOS、Linux、安卓、鴻蒙等多種主流操作系統(tǒng),智能硬件廠商無需投入大量研發(fā)資源,即可快速實(shí)現(xiàn)設(shè)備的智能語音交互功能,推動(dòng)極速超擬人交互技術(shù)的普及和應(yīng)用。
在硬件方面,科大訊飛采用了AC7911芯片打造硬件模組,為設(shè)備廠商提供低功耗和低成本的軟硬件一體化解決方案。廠商可以直接“開箱”即用,無需復(fù)雜的硬件設(shè)計(jì)和調(diào)試過程,大大縮短了項(xiàng)目驗(yàn)證與快速部署語音交互能力的時(shí)間,加速智能硬件產(chǎn)品的上市進(jìn)程。
整體接入過程非常簡單,用戶下載開源的極速超擬人交互接入SDK后,可以直接修改鑒權(quán)參數(shù)調(diào)用大模型能力。如果要適配自有硬件和操作系統(tǒng),可以在SDK的框架下進(jìn)行二次開發(fā)。以Linux環(huán)境為例,極速超擬人交互接入SDK應(yīng)用包括五步:
1、注冊(cè)AIUI平臺(tái)賬號(hào),獲得開發(fā)權(quán)限。
2、創(chuàng)建語音交互應(yīng)用,獲得鑒權(quán)密鑰。
3、下載SDK,填寫鑒權(quán)信息,配置appid、scene、key和secret。
4、安裝必需軟件。
sudo apt install cmake libjack-jackd2-dev libasound2-dev pkg-config libpulse-dev
5、 編譯、運(yùn)行,體驗(yàn)極速超擬人交互。
cd aiui_embedded_sdk
mkdir build
cd build
cmake ..
make
cd ../tool/deploy/bin/
./aiui_demo
03多場景應(yīng)用,開啟智能未來
科大訊飛的大模型極速超擬人交互方案具有廣泛的應(yīng)用潛力,能夠賦予生活中的各種設(shè)備“開口說話”的能力,尤其在陪伴、教育等場景中優(yōu)勢(shì)獨(dú)特。
在親子互動(dòng)場景中,傳統(tǒng)的語音交互玩具往往只能點(diǎn)播固定故事,難以滿足孩子天馬行空的創(chuàng)意需求。而搭載科大訊飛大模型極速超擬人交互方案的智能玩具,能夠根據(jù)孩子的想法,流暢地生成全新的故事內(nèi)容。例如,當(dāng)孩子要求玩具講一個(gè)“熊大熊二與變形金剛大戰(zhàn)哥斯拉”的故事時(shí),玩具不僅不會(huì)因找不到相關(guān)故事而拒絕,反而會(huì)結(jié)合各種元素,創(chuàng)造一個(gè)充滿想象力的故事場景,鼓勵(lì)孩子一起參與情節(jié)的編排,激發(fā)他們的創(chuàng)造力和想象力。
在家庭陪伴場景里,人形機(jī)器人通過科大訊飛大模型極速超擬人交互方案,能夠更好地理解用戶的情感狀態(tài),并及時(shí)作出恰當(dāng)?shù)幕貞?yīng)。它不僅能完成各種任務(wù)指令,還能在用戶需要時(shí)提供安慰與鼓勵(lì)。當(dāng)用戶感到孤獨(dú)或壓力大時(shí),機(jī)器人可以用溫柔的語氣陪伴用戶聊天。甚至復(fù)刻家人的聲音與用戶交流,提供更真切、更貼心的情感支持,讓家庭氛圍更加溫馨和諧。
在教育場景中,科大訊飛大模型極速超擬人交互方案賦能學(xué)習(xí)機(jī),重塑語言學(xué)習(xí)體驗(yàn)。于兒童口語啟蒙而言,借聊天互動(dòng)助力發(fā)音練習(xí)與表達(dá)能力提升;在學(xué)習(xí)外語時(shí),輕松的對(duì)話互動(dòng)有效擴(kuò)充詞匯量,顯著增強(qiáng)聽說能力,使語言學(xué)習(xí)充滿趣味與成效。
在這個(gè)萬物互聯(lián)的時(shí)代,智能硬件正逐漸滲透到生活的每一個(gè)角落??拼笥嶏w大模型極速超擬人交互方案不僅提升了硬件設(shè)備的智能化程度,還拓寬了設(shè)備與用戶的互動(dòng)場景。
接下來,隨著訊飛星火大模型技術(shù)的不斷進(jìn)步,科大訊飛將繼續(xù)引領(lǐng)智能硬件交互的發(fā)展潮流,攜手合作伙伴共同打造更加智能的生活環(huán)境,開啟智能硬件發(fā)展的新篇章。
-
開源
+關(guān)注
關(guān)注
3文章
3381瀏覽量
42604 -
SDK
+關(guān)注
關(guān)注
3文章
1044瀏覽量
46078 -
科大訊飛
+關(guān)注
關(guān)注
19文章
816瀏覽量
61367 -
大模型
+關(guān)注
關(guān)注
2文章
2514瀏覽量
2929
原文標(biāo)題:開源!極速超擬人交互接入SDK,讓低配置硬件平臺(tái)輕松集成
文章出處:【微信號(hào):訊飛開放平臺(tái),微信公眾號(hào):訊飛開放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論