久久人妻超控超爽97,日日操天天操夜夜操

一、準(zhǔn)備工作

硬件部分：旭日X3派，USB免驅(qū)攝像頭，電源適配器，燒錄Ubuntu系統(tǒng)的SD卡，USB揚聲器，顯示屏（或者VNC/SSH遠(yuǎn)程連接）

軟件部分：Thonny IDE集成開發(fā)環(huán)境

首先，關(guān)于Ubuntu系統(tǒng)鏡像的燒錄官方有詳細(xì)的教程，這里不再贅述，我自己是選擇桌面Ubuntu 20.04，大家選擇最新的即可。如果是第一次進(jìn)入系統(tǒng)，記得使用命令行更新一下軟件源等，使用快捷鍵ctrl+alt+T打開命令行，輸入以下命令：

# 更新軟件源 apt-get update # 更新升級所有軟件 apt-get upgrade

接下來就可以開始安裝Thonny IDE，作為一款輕量化的python集成開發(fā)環(huán)境，對新手十分友好，簡單易上手，后續(xù)安裝各種python依賴庫也相當(dāng)方便。安裝方式Thonny官方網(wǎng)址提供了三種Linux的命令行下載方式，大家可以根據(jù)自己的情況進(jìn)行選擇。

flatpak install org.thonny.Thonny //Flatpak sudo apt install thonny //Debian,Raspbian,Ubuntu,Mintand others sudo dnf install thonny //FedoraFedora

耐心等待程序安裝即可，如果中途出現(xiàn)異常大概率是網(wǎng)絡(luò)不穩(wěn)定導(dǎo)致，檢查網(wǎng)絡(luò)連接并再次運行命令行即可。由于Ubuntu系統(tǒng)不會自動生成快捷方式，所以安裝成功后在命令行輸入Thonny即可啟動IDE。

重頭戲來了，安裝項目依賴庫。啟動Thonny IDE后，選擇左上方工具>>管理包，根據(jù)附件中提供的程序開始安裝python依賴庫。過程可能會比較漫長，這取決于當(dāng)前網(wǎng)絡(luò)情況，還有部分庫文件可能會出現(xiàn)下載失敗的情況，請耐心多嘗試幾次。

import os import threading import cv2 import mediapipe as mp import time import torch as t from model import HandModel from tools.landmark_handle import landmark_handle from tools.draw_landmarks import draw_landmarks from tools.draw_bounding_rect import draw_bounding_rect import numpy as np from tools.draw_rect_text import draw_rect_txt from PIL import Image, ImageFont, ImageDraw import pyttsx3 # 大家可以根據(jù)這個來添加項目依賴

（PS.cv2是opencv-python的縮寫，在import的時候采用這種縮寫，但添加庫的時候不能直接搜索cv2，而是要打全稱opencv-python。）

二、實現(xiàn)原理

智能手語識別系統(tǒng)共包括語音播報模塊，模型訓(xùn)練模塊，手勢識別模塊，文字轉(zhuǎn)寫模塊，一共可識別播報“也”、“吸引”、“美麗的”、 “相信”、“的”、“懷疑”、“夢想”、“表達(dá)”、“眼睛”、 “給”、“很難”、“有”、“許多”、“我”、“方法”、“不”, “只有”、“超過”、“請”、“放”、“說”、“微笑”、“星星”、“十分”、“看”、“你”等27個國家通用手語。

model_path = 'checkpoints/model_test1.pth' label = ["也", "吸引", "美麗的", "相信", "的", "懷疑", "夢想", "表達(dá)", "眼睛", "給", "很難","有","許多","我", "方法", "不", "只有", "結(jié)束", "請", "放", "說", "微信", "星星", "十分","看","你"]

語音播報模塊采用pyttsx3第三方庫，它是一個用于文字轉(zhuǎn)語音的第三方python庫，還可實現(xiàn)對音量，聲源，語速的調(diào)整，可脫機(jī)工作，兼容python2和python3。

def run(): str_show = this_label star_date = open("2.txt", "w", encoding="utf-8") star_date.write(str_show) star_date.close() star_data = open("2.txt", "r", encoding="utf-8") star_read = star_data.readlines() star_data.close() file = "2.txt" res = open(file, encoding="utf-8").read() engine = pyttsx3.init() content = res engine.say(content) engine.runAndWait() time.sleep(1)

模型訓(xùn)練模塊采用torch第三方庫，torch廣泛運用深度學(xué)習(xí)。它能夠幫助我們構(gòu)建深度學(xué)習(xí)項目，強(qiáng)調(diào)靈活性，而且允許使用我們習(xí)慣的python表示方法來表達(dá)深度學(xué)習(xí)模型。算力高，易學(xué)習(xí)，比較容易入門。

# 模型保存地址 targetX = [0 for xx in range(label_num)] target = [] for xx in range(label_num): target_this = copy.deepcopy(targetX) target_this[xx] = 1 target.append(target_this) # 獨熱碼 lr = 1e-3 # learning rate model_saved = 'checkpoints/model' # 模型定義 model = HandModel() optimizer = t.optim.Adam(model.parameters(), lr=lr) criterion = nn.CrossEntropyLoss() loss_meter = meter.AverageValueMeter() epochs = 40 for epoch in range(epochs): print("epoch:" + str(epoch)) loss_meter.reset() count = 0 allnum = 1 for i in range(len(label)): data = np.load('./npz_files/' + label[i] + ".npz", allow_pickle=True) data = data['data'] for j in range(len(data)): xdata = t.tensor(data[j]) optimizer.zero_grad() this_target = t.tensor(target[i]).float() input_, this_target = Variable(xdata), Variable(this_target) output = model(input_) outLabel = label[output.tolist().index(max(output))] targetIndex = target[i].index(1) targetLabel = label[targetIndex] if targetLabel == outLabel: count += 1 allnum += 1 output = t.unsqueeze(output, 0) this_target = t.unsqueeze(this_target, 0) loss = criterion(output, this_target) loss.backward() optimizer.step() loss_meter.add(loss.data) print("correct_rate:", str(count / allnum)) t.save(model.state_dict(), '%s_%s.pth' % (model_saved, epoch))

準(zhǔn)備好數(shù)據(jù)集就可以開始進(jìn)行模型訓(xùn)練，模型推薦在電腦上進(jìn)行訓(xùn)練，我自己的電腦是win10的系統(tǒng)，用的pycharm IDE的集成開發(fā)環(huán)境，如果只是想體驗一下的話也可以直接使用附件里訓(xùn)練好的模型。

手勢識別模塊采用Mediapipe和OpenCV庫對人手進(jìn)行特征提取與骨骼綁定，旭日X3派根據(jù)攝像頭捕捉的關(guān)鍵幀的進(jìn)行特征提取，基于PyTorch模型進(jìn)行推理，并將推理翻譯結(jié)果顯示到屏幕上，同時將翻譯結(jié)果以txt文件形式進(jìn)行保存和API接入后上傳到百度語音開發(fā)平臺，由平臺進(jìn)行人聲的合成，然后將生成的mp3文件下載到旭日X3派終端用揚聲器進(jìn)行播放，實現(xiàn)了為語言障礙人士發(fā)聲，為“礙”發(fā)聲。

# 百度大腦AI開放平臺API接入實現(xiàn)語音合成的示例 def fetch_token(): print("fetch token begin") params = {'grant_type': 'client_credentials', 'client_id': API_KEY, 'client_secret': SECRET_KEY} post_data = urlencode(params) if (IS_PY3): post_data = post_data.encode('utf-8') req = Request(TOKEN_URL, post_data) try: f = urlopen(req, timeout=5) result_str = f.read() except URLError as err: print('token http response http code : ' + str(err.code)) result_str = err.read() if (IS_PY3): result_str = result_str.decode() print(result_str) result = json.loads(result_str) print(result) if ('access_token' in result.keys() and 'scope' in result.keys()): if not SCOPE in result['scope'].split(' '): raise DemoError('scope is not correct') print('SUCCESS WITH TOKEN: %s ; EXPIRES IN SECONDS: %s' % (result['access_token'], result['expires_in'])) return result['access_token'] else: raise DemoError('MAYBE API_KEY or SECRET_KEY not correct: access_token or scope not found in token response') """ TOKEN end """ if __name__ == '__main__': token = fetch_token() tex = quote_plus(TEXT) # 此處TEXT需要兩次urlencode print(tex) params = {'tok': token, 'tex': tex, 'per': PER, 'spd': SPD, 'pit': PIT, 'vol': VOL, 'aue': AUE, 'cuid': CUID, 'lan': 'zh', 'ctp': 1} # lan ctp 固定參數(shù) data = urlencode(params) print('test on Web Browser' + TTS_URL + '?' + data) req = Request(TTS_URL, data.encode('utf-8')) has_error = False try: f = urlopen(req) result_str = f.read() headers = dict((name.lower(), value) for name, value in f.headers.items()) has_error = ('content-type' not in headers.keys() or headers['content-type'].find('audio/') < 0) except URLError as err: print('asr http response http code : ' + str(err.code)) result_str = err.read() has_error = True save_file = "error.txt" if has_error else 'result.' + FORMAT with open(save_file, 'wb') as of: of.write(result_str) if has_error: if (IS_PY3): result_str = str(result_str, 'utf-8') print("tts api error:" + result_str) print("result saved as :" + save_file) # 骨架綁定的可視化 draw_landmarks(frame, hand_local) brect = draw_bounding_rect(frame, hand_local)

文字轉(zhuǎn)寫模塊通過旭日X3派外接麥克風(fēng)進(jìn)行收音，API接入后將錄制的mp3文件上傳，通過云端語音平臺實時轉(zhuǎn)寫為文字后顯示到旭日X3派終端的屏幕上。最后利用python的多線程將手勢識別，語音播報，文字轉(zhuǎn)寫同時運行，至此，實現(xiàn)了聾啞人士與普通人的雙向無障礙溝通交流。

三、效果展示

得益于旭日X3派的強(qiáng)大算力，系統(tǒng)對手勢的識別展示并播報十分靈敏，畫面流程度也得到保障（溫馨提示：長時間運行請準(zhǔn)備小風(fēng)扇給開發(fā)板降溫哦）。

四、性能測試

系統(tǒng)測試方案：將訓(xùn)練好模型導(dǎo)入旭日X3派中，接入電源后等待初始化完成，由小組成員們隨機(jī)在鏡頭前做出27個國家通用手語，將翻譯終端識別播報的準(zhǔn)確率記錄，同時將識別的總時長記錄收集。

測試數(shù)據(jù)如下：

結(jié)果分析：實驗數(shù)據(jù)表明，27個國家通用手語隨機(jī)檢驗的識別準(zhǔn)確率均在90%以上，單次執(zhí)行時間也均在1秒之內(nèi)。

結(jié)論：手語翻譯終端有很高的實時性，充分保障聾啞殘障人士的無障礙溝通交流。

本文轉(zhuǎn)自地平線開發(fā)者社區(qū)
原作者：鑫辰大海王

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

嵌入式

嵌入式

+關(guān)注

關(guān)注
5086

文章
19141

瀏覽量
305955
python

python

+關(guān)注

關(guān)注
56

文章
4797

瀏覽量
84787

HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí)：AI智能語音播報

（Text-To-Speech，文本轉(zhuǎn)語音）技術(shù)將文本轉(zhuǎn)換為語音進(jìn)行播報。當(dāng)然除了基本的文本輸入和播報功能外，我們還增加了語音識別的功能，允許用戶通過語音輸入要播報的文本。還優(yōu)化了

發(fā)表于 01-06 15:33

英飛凌AURIX? TC3x MCU系列新增FreeRTOS支持

全球功率系統(tǒng)和物聯(lián)網(wǎng)領(lǐng)域的半導(dǎo)體領(lǐng)軍企業(yè)英飛凌科技股份公司，近日宣布其AURIX? TC3x微控制器(MCU)系列新增了對FreeRTOS的支持。這一舉措標(biāo)志著AURIX? TC3x

發(fā)表于 12-11 14:06 ?204次閱讀

中山大學(xué)：基于定制裂紋設(shè)計的超靈敏透氣水凝膠纖維應(yīng)變傳感器及無線手語識別應(yīng)用

和地域多樣性可能會給不懂手語的人造成交流障礙。目前，各種識別人類手勢的技術(shù)，包括視覺圖像處理、肌電圖和可穿戴應(yīng)變傳感器，在改善聾啞人群體的溝通方面發(fā)揮了重要作用。特別地，視覺圖像處理在手語識別

發(fā)表于 12-02 17:29 ?492次閱讀

Simplelink? Wi-Fi? CC3x3x網(wǎng)絡(luò)子系統(tǒng)電源管理

電子發(fā)燒友網(wǎng)站提供《Simplelink? Wi-Fi? CC3x3x網(wǎng)絡(luò)子系統(tǒng)電源管理.pdf》資料免費下載

發(fā)表于 09-23 11:17 ?0次下載

樹莓派是x86還是arm

樹莓派（Raspberry Pi）是一款由英國樹莓派基金會（Raspberry Pi Foundation）開發(fā)的微型計算機(jī)。它基于ARM架構(gòu)，而非x86架構(gòu)。一、樹莓派的發(fā)展歷程

發(fā)表于 08-30 15:42 ?1147次閱讀

F2800x C2000?實時MCU系列硬件設(shè)計指南

電子發(fā)燒友網(wǎng)站提供《F2800x C2000?實時MCU系列硬件設(shè)計指南.pdf》資料免費下載

發(fā)表于 08-30 11:32 ?2次下載

意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實現(xiàn)精確姿態(tài)識別應(yīng)用

憑借3核、6軸傳感架構(gòu)，意法半導(dǎo)體新款MEMS IMU LSM6DSV32X能夠進(jìn)行卓越的邊緣計算處理，是智能手機(jī)的高精度感測和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態(tài)識

發(fā)表于 08-01 10:15 ?839次閱讀

NRK330x系列語音識別芯片數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《NRK330x系列語音識別芯片數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-18 09:14 ?0次下載

我用香橙派做了一個Klipper 3D打印控制器

系列就已經(jīng)成為替代樹莓派做上位機(jī)的不二之選，搭載全志H616/H618的百元開發(fā)板，可以很好的滿足做為Klipper宿主的所有需求，甚至有點性能過剩。 Klipper有諸多獨特的功能需要使用到gpio

發(fā)表于 06-11 09:45

開源項目！設(shè)計一款智能手語翻譯眼鏡

這個項目是一款創(chuàng)新的智能手語翻譯眼鏡，它能夠實時地將手語轉(zhuǎn)換為聽得見的語音。這款眼鏡采用了VIAM平臺和樹莓派Zero 2 W，能夠幫助聾

發(fā)表于 05-20 15:59

NRK330X系列語音識別IC的功能及應(yīng)用

NRK330X系列語音識別IC，作為現(xiàn)代智能科技的重要組成部分，其應(yīng)用領(lǐng)域已經(jīng)日益廣泛且多元化。在眾多領(lǐng)域均展現(xiàn)出強(qiáng)大的應(yīng)用潛力。接下來，讓我為您介紹NRK330X

發(fā)表于 05-15 14:05 ?483次閱讀

Meta探索開發(fā)AI耳機(jī)：識別物體和翻譯外語

據(jù)外媒The Information透露，F(xiàn)acebook母公司Meta正積極研究研發(fā)配備攝像頭的人工智能耳機(jī)，旨在實現(xiàn)物體識別與外語實時翻譯功能。

發(fā)表于 05-14 14:26 ?518次閱讀

用悟空派全志H3開發(fā)板做一個基于ROS系統(tǒng)的全向輪小車

派H3和ROS系統(tǒng)的協(xié)同工作，我們能夠遠(yuǎn)程操控小車，實時獲取行駛里程數(shù)據(jù)，并在復(fù)雜的環(huán)境中靈活導(dǎo)航。在接下來的視頻中，我將詳細(xì)展示這款全向輪小車的詳細(xì)設(shè)計和性能表現(xiàn)，以及如何利用悟空

發(fā)表于 05-06 11:15

創(chuàng)客打造智能眼鏡，助聽障人士理解手語

據(jù)悉，知名創(chuàng)客Nekhil近期將樹莓派進(jìn)行深度改裝，成功研發(fā)出一款可用于解讀手語的智能眼鏡，以解決聽障人士的溝通問題。

發(fā)表于 04-23 15:32 ?530次閱讀

寶馬（中國）召回部分進(jìn)口X3、2系和X4車型

此次型號覆蓋的具體數(shù)量包括：2023年8月29日生產(chǎn)的進(jìn)口X3車型1輛，2023年9月21日至9月25日生產(chǎn)的進(jìn)口2系車型2輛，以及同一期間生產(chǎn)的進(jìn)口X4車型48輛。

發(fā)表于 03-01 14:56 ?821次閱讀

搜索歷史

手語翻譯系統(tǒng)系列之使用旭日X3派實時識別播報手語

一、準(zhǔn)備工作

二、實現(xiàn)原理

三、效果展示

四、性能測試

評論

HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí)：AI智能語音播報

英飛凌AURIX? TC3x MCU系列新增FreeRTOS支持

中山大學(xué)：基于定制裂紋設(shè)計的超靈敏透氣水凝膠纖維應(yīng)變傳感器及無線手語識別應(yīng)用

Simplelink? Wi-Fi? CC3x3x網(wǎng)絡(luò)子系統(tǒng)電源管理

樹莓派是x86還是arm

F2800x C2000?實時MCU系列硬件設(shè)計指南

意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實現(xiàn)精確姿態(tài)識別應(yīng)用

NRK330x系列語音識別芯片數(shù)據(jù)表

我用香橙派做了一個Klipper 3D打印控制器

開源項目！設(shè)計一款智能手語翻譯眼鏡

NRK330X系列語音識別IC的功能及應(yīng)用

Meta探索開發(fā)AI耳機(jī)：識別物體和翻譯外語

用悟空派全志H3開發(fā)板做一個基于ROS系統(tǒng)的全向輪小車

創(chuàng)客打造智能眼鏡，助聽障人士理解手語

寶馬（中國）召回部分進(jìn)口X3、2系和X4車型

搜索歷史

手語翻譯系統(tǒng)系列之使用旭日X3派實時識別播報手語

一、準(zhǔn)備工作

二、實現(xiàn)原理

三、效果展示

四、性能測試

評論

二、實現(xiàn)原理

三、效果展示

四、性能測試