在线国产91,久久久久久久亚洲精品

微軟開(kāi)發(fā)了一種新的圖像字幕算法，在某些有限的測(cè)試中，其準(zhǔn)確率超過(guò)了人類(lèi)。該人工智能系統(tǒng)已被用于更新該公司為視障人士提供的助理應(yīng)用程序 “Seeing AI”，并將很快被納入Word、Outlook和PowerPoint等其他微軟產(chǎn)品中。在那里，它將被用于為圖像創(chuàng)建alt文本等任務(wù)，這一功能對(duì)于提高無(wú)障礙性尤為重要。

這些應(yīng)用包括微軟自己的Seeing AI，該公司于2017年首次發(fā)布。Seeing AI利用計(jì)算機(jī)視覺(jué)為視障人士描述通過(guò)智能手機(jī)攝像頭看到的世界。它可以識(shí)別家庭物品，閱讀和掃描文本，描述場(chǎng)景，甚至識(shí)別朋友。它還可以用來(lái)描述其他應(yīng)用中的圖像，包括電子郵件客戶端、社交媒體應(yīng)用和WhatsApp等消息應(yīng)用。

微軟沒(méi)有披露Seeing AI的用戶數(shù)量，但Azure AI的企業(yè)副總裁Eric Boyd告訴The Verge，該軟件是 “為盲人或低視力人士提供的領(lǐng)先應(yīng)用之一”。Seeing AI已經(jīng)連續(xù)三年被盲人和低視力iOS用戶社區(qū)AppleVis評(píng)選為最佳應(yīng)用或最佳輔助應(yīng)用。

微軟新的圖像字幕算法將顯著提高Seeing AI的性能，因?yàn)樗粌H能識(shí)別物體，還能更精確地描述它們之間的關(guān)系。因此，該算法可以在看一張圖片時(shí)，不僅能說(shuō)出圖片中包含哪些物品和物體（如 “一個(gè)人、一把椅子、一個(gè)手風(fēng)琴”），還能說(shuō)出它們之間的互動(dòng)關(guān)系（如 “一個(gè)人坐在椅子上，正在拉手風(fēng)琴”）。微軟表示，該算法是其之前自2015年開(kāi)始使用的圖像字幕系統(tǒng)的兩倍。

該算法在9月份發(fā)表的一篇預(yù)印論文中進(jìn)行了描述，在一個(gè)被稱為 “nocaps ”的圖像字幕基準(zhǔn)測(cè)試上取得了有史以來(lái)最高的分?jǐn)?shù)。這是一個(gè)業(yè)界領(lǐng)先的圖像字幕評(píng)分板，不過(guò)它有自己的限制條件。nocaps基準(zhǔn)測(cè)試由超過(guò)166，000個(gè)人類(lèi)生成的字幕組成，描述了從Open Images Dataset中提取的約15，100張圖片。這些圖片涵蓋了一系列場(chǎng)景，從運(yùn)動(dòng)到假日抓拍，再到美食攝影等等。
責(zé)任編輯：YYX

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6602

瀏覽量
104151
AI

AI

+關(guān)注

關(guān)注
87

文章
31028

瀏覽量
269367

評(píng)論

相關(guān)推薦

AI圖像識(shí)別攝像機(jī)

？AI圖像識(shí)別攝像機(jī)是一種集成了先進(jìn)算法和深度學(xué)習(xí)模型的智能監(jiān)控設(shè)備。這些攝像機(jī)不僅能夠捕捉視頻畫(huà)面，還能實(shí)時(shí)分析和處理所拍攝的內(nèi)容，從而實(shí)現(xiàn)對(duì)特定對(duì)象、場(chǎng)景或行

發(fā)表于 11-08 10:38 ?272次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識(shí)別攝像機(jī)

愛(ài)普生開(kāi)發(fā)了一種烤箱控制的晶體振蕩器，其功耗比傳統(tǒng)OCXOs1低56%

愛(ài)普生開(kāi)發(fā)了一種烤箱控制的晶體振蕩器，其功耗比傳統(tǒng)OCXOs1低56%-該振蕩器小巧且節(jié)能，是下一代通信基礎(chǔ)設(shè)施中參考信號(hào)源應(yīng)用的理想選擇-精工愛(ài)普生公司（TSE:6724，“愛(ài)普生”）開(kāi)發(fā)了

發(fā)表于 10-29 11:28 ?205次閱讀

BitEnergy AI公司開(kāi)發(fā)出一種新AI處理方法

BitEnergy AI公司，一家專注于人工智能（AI）推理技術(shù)的企業(yè)，其工程師團(tuán)隊(duì)創(chuàng)新性地開(kāi)發(fā)了一種名為線性復(fù)雜度乘法（L-Mul）的

發(fā)表于 10-22 15:15 ?404次閱讀

平衡創(chuàng)新與倫理：AI時(shí)代的隱私保護(hù)和算法公平

成了一把雙刃劍，其銳利的一面正逐漸指向我們的核心價(jià)值。面對(duì)這些挑戰(zhàn)，制定一套有效的AI治理框架和隱私保護(hù)機(jī)制變得迫在眉睫。確保AI決策

發(fā)表于 07-16 15:07

圖像識(shí)別算法的提升有哪些

方法。數(shù)據(jù)增強(qiáng) 數(shù)據(jù)增強(qiáng)是提高圖像識(shí)別算法性能的一種有效方法。通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行變換和擴(kuò)展，可以增加數(shù)據(jù)的多樣性，提高模型的泛化能力。常見(jiàn)的數(shù)據(jù)增強(qiáng)方法包括： 2.1 旋轉(zhuǎn)、縮放、平移和翻轉(zhuǎn) 通過(guò)對(duì)

發(fā)表于 07-16 11:12 ?666次閱讀

圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

圖像識(shí)別算法是一種利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行分析和理解的方法，它在許多領(lǐng)域都有廣泛的應(yīng)用，如自動(dòng)駕駛、醫(yī)療診斷、安全監(jiān)控等。然而，圖像識(shí)別

發(fā)表于 07-16 11:09 ?1701次閱讀

Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能

據(jù)悉，Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能，該功能應(yīng)允許用戶制作自己的個(gè)性化頭像，用于任何想象中的場(chǎng)景。WABetaInfo在新的Android版WhatsApp測(cè)試版2.24.14.7

發(fā)表于 07-14 17:50 ?1010次閱讀

rup是一種什么模型

RUP（Rational Unified Process，統(tǒng)一建模語(yǔ)言）是一種軟件開(kāi)發(fā)過(guò)程模型，它是一種迭代和增量的軟件開(kāi)發(fā)方法。RUP是由

發(fā)表于 07-09 10:13 ?1309次閱讀

日本九州大學(xué)開(kāi)發(fā)了名為QDyeFinder的人工智能(AI)工具

在探索大腦這一宇宙中最復(fù)雜結(jié)構(gòu)的征途中，科學(xué)家們不斷突破技術(shù)的邊界，以更精細(xì)、更高效的方式揭示其奧秘。近期，日本九州大學(xué)的研究團(tuán)隊(duì)在《自然·通訊》雜志上發(fā)表了一項(xiàng)革命性的研究成果，他們開(kāi)發(fā)了一

發(fā)表于 07-03 14:43 ?499次閱讀

基于一種AI輔助可穿戴微流控比色傳感器系統(tǒng)

存在的挑戰(zhàn)限制了這項(xiàng)技術(shù)的實(shí)際應(yīng)用。據(jù)麥姆斯咨詢報(bào)道，為了克服這些挑戰(zhàn)，來(lái)自中國(guó)石油大學(xué)（華東）的研究人員開(kāi)發(fā)了一種人工智能（AI）輔助的可穿戴微流控比色傳感器系統(tǒng)（AI-WMCS）

發(fā)表于 06-29 10:57 ?1.1w次閱讀

微軟、谷歌等科技巨頭承諾安全開(kāi)發(fā)AI模型

近日，微軟、谷歌、OpenAI等16家科技巨頭在“人工智能（AI）首爾峰會(huì)”上達(dá)成共識(shí)，承諾在AI模型的開(kāi)發(fā)過(guò)程中注重安全性，并在無(wú)法控制最極端風(fēng)險(xiǎn)時(shí)關(guān)閉其尖端系統(tǒng)。

發(fā)表于 05-22 11:25 ?512次閱讀

微軟網(wǎng)頁(yè)版PPT新增語(yǔ)音識(shí)別及字幕生成功能

據(jù)報(bào)道，微軟計(jì)劃于今年六月份推出網(wǎng)頁(yè)版PowerPoint全新語(yǔ)音識(shí)別功能。此項(xiàng)功能將能夠監(jiān)控PowerPoint視頻中的聲音，進(jìn)而自動(dòng)生成字幕。

發(fā)表于 05-16 14:36 ?436次閱讀

微軟在天氣預(yù)報(bào)領(lǐng)域突破，新AI模型精準(zhǔn)預(yù)測(cè)未來(lái)30天

微軟在天氣預(yù)報(bào)領(lǐng)域取得顯著成果。其Start團(tuán)隊(duì)成功研發(fā)了一種全新AI模型，能夠更精準(zhǔn)地預(yù)測(cè)未來(lái)30天的天氣狀況。

發(fā)表于 05-10 11:23 ?829次閱讀

微軟開(kāi)發(fā)新AI語(yǔ)言模型MAI-1，挑戰(zhàn)行業(yè)巨頭

據(jù)最新消息，微軟正積極開(kāi)發(fā)一款新型AI語(yǔ)言模型MAI-1，以提升在快速發(fā)展的AI市場(chǎng)中的競(jìng)爭(zhēng)力。

發(fā)表于 05-08 10:27 ?456次閱讀

博世與微軟合作開(kāi)發(fā)生成式AI產(chǎn)品

全球知名科技公司博世與微軟聯(lián)合宣布，雙方已建立合作關(guān)系，共同致力于開(kāi)發(fā)先進(jìn)的生成式AI產(chǎn)品。這一合作的核心目標(biāo)在于通過(guò)利用生成式AI技術(shù)來(lái)進(jìn)

發(fā)表于 03-05 11:17 ?918次閱讀

搜索歷史

微軟開(kāi)發(fā)了一種新的AI圖像字幕算法

評(píng)論

AI圖像識(shí)別攝像機(jī)

愛(ài)普生開(kāi)發(fā)了一種烤箱控制的晶體振蕩器，其功耗比傳統(tǒng)OCXOs1低56%

BitEnergy AI公司開(kāi)發(fā)出一種新AI處理方法

平衡創(chuàng)新與倫理：AI時(shí)代的隱私保護(hù)和算法公平

圖像識(shí)別算法的提升有哪些

圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能

rup是一種什么模型

日本九州大學(xué)開(kāi)發(fā)了名為QDyeFinder的人工智能(AI)工具

基于一種AI輔助可穿戴微流控比色傳感器系統(tǒng)

微軟、谷歌等科技巨頭承諾安全開(kāi)發(fā)AI模型

微軟網(wǎng)頁(yè)版PPT新增語(yǔ)音識(shí)別及字幕生成功能

微軟在天氣預(yù)報(bào)領(lǐng)域突破，新AI模型精準(zhǔn)預(yù)測(cè)未來(lái)30天

微軟開(kāi)發(fā)新AI語(yǔ)言模型MAI-1，挑戰(zhàn)行業(yè)巨頭

博世與微軟合作開(kāi)發(fā)生成式AI產(chǎn)品