在Facebook和其他社交媒體平臺上最常見的分享內容之一是照片。雖然大多數(shù)社交媒體用戶都能看懂一張圖片,并了解它所代表的內容,但對于那些盲人或視障人士來說就不那么容易了。Facebook表示,屏幕閱讀器可以使用合成語音描述這些圖片的內容,讓盲人或視障用戶能夠理解Facebook feed中的圖片。
然而,許多照片在發(fā)布時沒有alt文字,導致Facebook在2016年推出了自動替代文本(AAT)。該技術利用對象識別技術為盲人或視障用戶按需生成照片的描述。自2016年以來,F(xiàn)acebook一直致力于改進AAT,并在最近推出了下一代技術。Facebook在AAT上的進步改善了用戶的照片體驗,AAT可以可靠地檢測和識別照片中的概念數(shù)量擴大了十倍以上。這意味著沒有描述的照片減少了,提供的描述也更加詳細。AAT可以識別活動、地標、動物類型等等。
AAT現(xiàn)在會給出這樣的描述:“可能是兩個人的自拍,戶外,比薩斜塔”。Facebook還表示,能夠在照片中加入有關元素的潛在位置和相對大小的信息是行業(yè)首創(chuàng)。它不是簡單地描述 “可能是五人的合影”,而是描述成“兩個人在照片的中心,另外三個人向邊緣分散。”
Facebook表示,這一進步可以幫助盲人或視力受損的用戶更好地理解家人和朋友發(fā)布照片中的內容。最新版本的AAT使用了一個在數(shù)十億張Instagram公開圖片和標簽數(shù)據(jù)上訓練出來的模型。訓練后產(chǎn)生的模型更加準確,并且在文化和人口統(tǒng)計方面更具包容性。改進后的AAT可以可靠地識別1200多個概念。
責編AJX
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關推薦
,Luma AI宣布其最新版Luma AI Ray 2視頻模型即將發(fā)布,該模型僅需10秒即可根據(jù)文本和圖像提示生成視頻。Luma AI Ray 2視頻模型面向普通消費者、專業(yè)消費者及專業(yè)人士
發(fā)表于 12-18 09:49
?124次閱讀
Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學習和 NVIDIA Jetson邊緣 AI 和機器人平臺,為視障人士打造了機器人導盲犬。
發(fā)表于 11-09 13:51
?260次閱讀
Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學習和 NVIDIA Jetson 邊緣 AI 和機器人平臺,為視障人士打造了機器人導盲犬。
該項目名為 I
發(fā)表于 11-08 10:05
?404次閱讀
今天為大家?guī)淼氖莵碜詣?chuàng)作者X同學的作品:助盲環(huán)境感知裝置. 這個裝置主要利用Grove Vision AI V2-Camera module識別環(huán)境中的物體,并利用XIAO ESP32S3和樹莓派進行語音輸出,結合了物體檢測和文本轉語音技術,以向視
發(fā)表于 11-05 11:42
?227次閱讀
電子發(fā)燒友網(wǎng)站提供《如何通過改善工藝解決電感噪音問題.docx》資料免費下載
發(fā)表于 11-04 10:23
?0次下載
機器人紅外避障
發(fā)表于 09-19 12:57
?0次下載
許多小型化的飛行器類似于昆蟲,憑借其機動、靈活、體積小的特點能夠在復雜的環(huán)境中執(zhí)行飛行任務。但是再精細化的操控,也難以做到完全避免障礙物的阻礙,因此可以采用AI圖像處理板來輔助避障。AI避障
發(fā)表于 07-31 08:30
?274次閱讀
摘要據(jù)統(tǒng)計,我國視障人數(shù)達1731萬人,聽力殘疾患者2780萬人。視聽障礙者對出行和交流需求迫切,但現(xiàn)有設施和輔具局限性大,使他們面臨出行難題。因此,我們開發(fā)了一款安全、精準、語音與手部交互的導航避
發(fā)表于 07-19 08:11
?662次閱讀
?深視智能&斑馬技術7月9號下午,VisionChina行業(yè)盛會期間,深視智能與領先數(shù)字解決方案提供商Zebra公司強強聯(lián)合,成功舉辦一場以“AI時代下3D機器視覺與AI技術融合創(chuàng)新
發(fā)表于 07-16 10:40
?505次閱讀
在人工智能(AI)技術日新月異的今天,各大科技巨頭紛紛搶灘AI賽道,力圖通過技術革新引領行業(yè)變革。近日,有知情人士透露,Facebook的母
發(fā)表于 06-24 18:09
?1343次閱讀
AGV(自動導引車)小車使用避障雷達是為了確保其在運行過程中的安全性和穩(wěn)定性。避障雷達,如激光雷達或超聲波雷達,能夠實時檢測并避免與障礙物發(fā)生碰撞。 AGV小車避障雷達的安裝和使用通常涉及以下
發(fā)表于 05-20 10:48
?634次閱讀
據(jù)悉,知名創(chuàng)客Nekhil近期將樹莓派進行深度改裝,成功研發(fā)出一款可用于解讀手語的智能眼鏡,以解決聽障人士的溝通問題。
發(fā)表于 04-23 15:32
?480次閱讀
電子發(fā)燒友網(wǎng)報道(文/黃山明)隨著AI的發(fā)展,這一技術已經(jīng)與人們的生活緊密結合,甚至包括我們的睡眠。目前可以看到AI技術正在積極地賦能智能家居睡眠產(chǎn)品,以提高睡眠質量和改善睡眠環(huán)境。 ? 比如
發(fā)表于 04-12 00:08
?3279次閱讀
3月18日,在2024年上海家化“致美·致時代”年度發(fā)布會上,上海家化聯(lián)合股份有限公司與北京曠視科技有限公司正式簽署《AI科技創(chuàng)新合作框架協(xié)議》,雙方將在AI賦能美業(yè)領域進一步展開深度合作,以
發(fā)表于 03-20 10:21
?595次閱讀
遙測、遙控、遙信、遙調、遙視、遙感、遙視:這幾種技術在概念上容易混淆,在數(shù)據(jù)自動采集中常常用到,各自有不同的用途,下面加以簡述: 遙測 (Telemetry): ? 通過遠程傳輸數(shù)據(jù)來監(jiān)測遠程系統(tǒng)中
發(fā)表于 03-04 11:10
?3229次閱讀
評論