數(shù)字化轉(zhuǎn)型是將數(shù)字技術(shù)集成到您業(yè)務(wù)的所有領(lǐng)域的過程——沒有什么比人工智能技術(shù)更具變革性的了,尤其是計算機(jī)視覺,它可以比人類更快、更準(zhǔn)確地評估視覺信息。
事實上,最先進(jìn)的計算機(jī)視覺策略目前正在利用視頻流傳輸?shù)竭吘壴O(shè)備——檢查、分析和評估視覺數(shù)據(jù),包括圖片、視頻、衛(wèi)星圖像和實驗室樣本——以進(jìn)行具有一定準(zhǔn)確性和成本水平的即時評估——使人眼的能力相形見絀。隨著我們訓(xùn)練越來越多的 AI 模型,計算機(jī)視覺將適用于幾乎所有的視覺任務(wù)。
我們所說的計算機(jī)視覺和嵌入式 AI 是什么意思?
直到最近十年,計算機(jī)可以解釋任何類型的視覺信息(具有與人類相同或更好的敏銳度)的想法被視為計算機(jī)科學(xué)的一個不可逾越的前沿。然而,現(xiàn)代計算機(jī)視覺技術(shù)現(xiàn)在由邊緣設(shè)備上的人工智能模型組成,這些模型可以分析和理解形成圖像和視頻的像素混亂——它們可以比人類更好地執(zhí)行最廣泛的視覺任務(wù)。
事實上,人工智能解釋的攝像頭饋送目前非常先進(jìn),它們可以比人類更好地計算載玻片下的細(xì)胞或識別工廠中有缺陷的瓶蓋,而且他們可以在幾毫秒內(nèi)完成。這只是兩個狹隘的例子。連接到服務(wù)器上嵌入式人工智能的攝像頭可以檢查商店貨架是否有貨,或者建筑工人是否穿著防護(hù)裝備。在這一點上,如果一項工作需要人眼來做出決定,那么訓(xùn)練有素的計算機(jī)視覺系統(tǒng)可能會做得更好。計算機(jī)視覺基本上是無限的。
計算機(jī)視覺比人類視覺好在哪里?
與其說無處不在,不如看看為什么計算機(jī)視覺在許多領(lǐng)域都比人類表現(xiàn)更好。首先,我們需要探索人類視覺的局限性以及它是如何影響準(zhǔn)確性的。
例如,科學(xué)家們早就知道,人類的視覺無法準(zhǔn)確客觀地反映我們周圍的世界。正如丹妮絲·格雷迪( Denise Grady)為發(fā)現(xiàn)雜志所寫的那樣,“眼睛和大腦協(xié)同工作,以解釋來自外部世界的相互沖突的信號。最終,我們會看到我們的大腦認(rèn)為我們應(yīng)該看到的任何東西?!?/p>
事實上,我們的大腦不斷地填補盲點,以創(chuàng)造對我們周圍世界的無縫體驗——即使他們必須“彌補”信息來做到這一點。大腦改變陰影,改變顏色,并無意識地決定我們在看什么。在許多情況下,我們只是感知到一種充滿錯誤和不準(zhǔn)確的錯覺。
例如,您在上圖中看到了什么?鴨子?一只兔子?兩者都是正確的,但不可能同時看到兩個圖像。選擇看到兔子暫時失去鴨子,反之亦然(試一試)。
這些感知差異在日常生活中不會造成太大問題 - 但在執(zhí)行需要高度準(zhǔn)確度的視覺任務(wù)時,它們絕對是有害的,例如:
檢查機(jī)器是否存在維修問題
監(jiān)控員工的 PPE 合規(guī)性
檢查基礎(chǔ)設(shè)施資產(chǎn)是否生銹和腐爛
在顯微鏡下計數(shù)細(xì)胞
檢查商店貨架是否有低庫存
除了簡單地打瞌睡或被手機(jī)分心,我們?yōu)槭裁磿谌蝿?wù)中犯錯誤?
根據(jù)密歇根州立大學(xué)的研究人員的說法,視覺皮層會做出復(fù)雜的決定,就像大腦的更高層次一樣,它通常是在無意識的情況下發(fā)生的。事實上,視覺皮層決定了我們將要看到的內(nèi)容是否準(zhǔn)確反映了現(xiàn)實。當(dāng)人類工作者解釋視覺數(shù)據(jù)時,這可能會產(chǎn)生確認(rèn)偏差和錯誤——當(dāng)我們感到無聊、疲勞和分心時,這些偏差和錯誤會變得更糟。
正如 Squilla Capital 的聯(lián)合創(chuàng)始人 Daniel Myakin 所說:
“人們總是保持偏見和情緒化,無論他們是否意識到這一點。每個人都知道人們會犯錯誤?!?/p>
與人類解釋容易出錯的性質(zhì)相比,計算機(jī)視覺更客觀地看待和理解視覺數(shù)據(jù)——一次又一次地以絕對一致性呈現(xiàn)相同的結(jié)果。讓我們來看看為什么計算機(jī)視覺模型比人類更擅長執(zhí)行視覺任務(wù)的一些主要原因:
一致:視覺 AI 任務(wù)性能的質(zhì)量不會因一天中的時間或 AI 運行的時間長短而變化。人工智能也不會變得無聊、疲倦、分心、生病、宿醉或沮喪——這些都是不可預(yù)測的變量,會對人類的表現(xiàn)產(chǎn)生負(fù)面影響。這些“人”因素都不會影響計算機(jī)視覺任務(wù)性能的一致性和準(zhǔn)確性。
始終可用:視覺 AI 系統(tǒng)不會占用午休時間、病假、假期或辭職。它們每周 7 天、每天 24 小時隨時可用。
可擴(kuò)展:隨著可視化監(jiān)控和評估任務(wù)量的增加,組織不需要雇用、尋找或培訓(xùn)新員工。只需按一下按鈕,他們就可以無限復(fù)制和擴(kuò)展現(xiàn)有的計算機(jī)視覺模型,以完成更多的工作。
更準(zhǔn)確:計算機(jī)視覺系統(tǒng)可以同時跟蹤更多變量。他們無需同時關(guān)注三個安全攝像頭,而是可以查看數(shù)百或數(shù)千個,并且不會錯過任何與安全相關(guān)的事件。他們可以識別人群中的數(shù)百或數(shù)千張面孔,而不是識別一張臉。同樣,計算機(jī)視覺無需花費 30 分鐘在顯微鏡下一次計數(shù)一個細(xì)胞,而是立即立即計數(shù)所有細(xì)胞。
最終,計算機(jī)視覺提供了同時和客觀地跟蹤無限數(shù)量的視覺因素的能力,并且比人類希望達(dá)到的更關(guān)注細(xì)節(jié)。它不會因為疲倦、分心或無聊而產(chǎn)生不一致的分析——而且它具有無限的可擴(kuò)展性。
當(dāng)您考慮使用視覺 AI 代替人眼的諸多優(yōu)勢時,計算機(jī)視覺是否會很快成為企業(yè)簡化工作流程、提高利潤并讓人類工人騰出時間從事更重要任務(wù)的競爭必需品?
激進(jìn)的數(shù)字化轉(zhuǎn)型已經(jīng)改變了世界
如果您仍然看不到帶有攝像頭的邊緣 AI 將如何改變一切,想想我們所看到的全球智能手機(jī)采用直接導(dǎo)致的根本性變化——這已經(jīng)深刻改變了我們相互交流和娛樂自己的方式。
除了它們只是一種更好、更簡單的交流和娛樂方式之外,智能手機(jī)成功的一個主要原因與它們變得更加實惠和易用有關(guān)。向智能手機(jī)添加短信和地圖以及約會和支付有助于鞏固它們的絕對必要性。
同樣,計算機(jī)視覺正變得越來越便宜和易用,為支持人工智能的相機(jī)成為提高商業(yè)、科學(xué)、軍事、政府等無數(shù)視覺任務(wù)的速度、效率和準(zhǔn)確性的競爭必需品鋪平了道路。
現(xiàn)在,無論用例涉及滑倒檢測、煙霧和火災(zāi)警報,還是監(jiān)視后門以確保沒有庫存,組織都可以在幾天內(nèi)輕松且廉價地建立獨特的視覺 AI 系統(tǒng)被盜。當(dāng) AI 檢測到正在進(jìn)行的跌倒、火災(zāi)或盜竊時,生成的數(shù)據(jù)會觸發(fā)警報,這是一個數(shù)字化變革事件。
視覺 AI 模型的快速開發(fā)和部署
就像人類兒童發(fā)展他們的思維來觀察、分析和解釋周圍環(huán)境一樣,視覺 AI 系統(tǒng)也需要訓(xùn)練。曾經(jīng)需要數(shù)年時間來訓(xùn)練計算機(jī)視覺模型來執(zhí)行基本的視覺任務(wù)。盡管大多數(shù)視覺 AI 策略仍需要 6 到 9 個月的時間來訓(xùn)練和部署,但我們現(xiàn)在看到更新、更快、更易于使用的視覺 AI 平臺可用。
現(xiàn)在,計算機(jī)視覺平臺允許公司在 6 到 9 天內(nèi)開發(fā)和部署 AI 模型。Chooch AI 通過為火災(zāi)、跌倒、面部、缺陷、細(xì)胞計數(shù)、產(chǎn)品庫存和其他用例提供預(yù)構(gòu)建的視覺 AI 模型庫來實現(xiàn)這種高速部署。選擇現(xiàn)有模型進(jìn)行即時部署,例如人體跌倒檢測,為更細(xì)微的應(yīng)用程序添加額外的訓(xùn)練層 - 或在需要時訓(xùn)練全新的模型。
Chooch AI用于生成和注釋圖像的自動化工具也加快了培訓(xùn)速度,為組織提供了巨大的敏捷性和可負(fù)擔(dān)性,以快速開發(fā)新穎的計算機(jī)視覺解決方案。
最終,隨著計算機(jī)視覺解決方案的培訓(xùn)和部署變得更容易、更快、更實惠,嵌入式視覺技術(shù)將像野火一樣蔓延——改變社會的速度甚至比智能手機(jī)還要快,因為除了相機(jī)和設(shè)備之外不需要特殊設(shè)備。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5086文章
19142瀏覽量
306035 -
計算機(jī)
+關(guān)注
關(guān)注
19文章
7513瀏覽量
88173 -
AI
+關(guān)注
關(guān)注
87文章
31054瀏覽量
269407
發(fā)布評論請先 登錄
相關(guān)推薦
評論