近日,阿丘科技 CEO 黃耀受邀出席參與了由中信證劵舉辦的"獨角獸十問十答"產(chǎn)業(yè)策略會,以"AI重構(gòu)工業(yè)視覺"為主題,分享了工業(yè)視覺領(lǐng)域市場發(fā)展現(xiàn)狀,當前AI 對工業(yè)視覺領(lǐng)域的影響和應(yīng)用,以及剖析了未來 AI 在工業(yè)視覺領(lǐng)域的發(fā)展思想、新觀點、新路徑等。
以下為精簡版紀要
Q1
從技術(shù)角度看,AI將如何影響工業(yè)視覺?
一、維度提升,優(yōu)化復雜問題的處理能力:Rule-based的方法受人工設(shè)計特征工程的維度限制,而深度神經(jīng)網(wǎng)絡(luò)可實現(xiàn)維度的量級提升。以大模型為例,可達到一千億、二千億的參數(shù)空間維度,高維度下處理復雜問題更為簡便。
二、性能改進:一方面,降低現(xiàn)場運維成本,受傳統(tǒng)Rule-based技術(shù)的瓶頸限制,現(xiàn)有AOI設(shè)備為保持低漏檢率與低過殺率,需進行人工復判;AI可進一步減少對人力的依賴,進而提升成本效益。另一方面,在產(chǎn)品層面重構(gòu)用戶的交互體驗,簡化操作流程。傳統(tǒng)的工業(yè)視覺依賴于Halcon或康耐視的Vision Pro,需對數(shù)百個算子進行預處理,工序復雜;而阿丘的AIDI軟件只有五個核心模塊,強調(diào)易用性。工業(yè)基礎(chǔ)視覺軟件正在從Software 1.0邁向 2.0,從Rule-based變成Smart Software后,用戶體驗發(fā)生質(zhì)的飛躍。
三、通用泛化:實現(xiàn)跨領(lǐng)域通用,賦能碎片化工業(yè)視覺市場整合。工業(yè)領(lǐng)域包含電子、汽車、醫(yī)藥等眾多細分賽道,單一品類的市場容量不大,但多行業(yè)整合后的市場空間巨大。AI的通用泛化能力可推動解決工業(yè)視覺領(lǐng)域的第一性原理問題:如何實現(xiàn)碎片化市場的最大化覆蓋。
Q2
從商業(yè)模式角度,AI將如何影響工業(yè)視覺?
一、降低門檻,不再需要資深算法工程師進行檢測與復雜的應(yīng)用,從業(yè)者只需對行業(yè)與軟件有基本認知即可;
二、重塑成本結(jié)構(gòu),研發(fā)成本降低,交付運維成本降低,短期內(nèi)尤其是AI進入一個行業(yè)的早期階段會增加數(shù)據(jù)成本(包括數(shù)據(jù)維護或數(shù)據(jù)標注成本),但隨著時間會不斷降低,最終會走向基礎(chǔ)模型。未來三年整個行業(yè)的成本結(jié)構(gòu)將大幅優(yōu)化。
Q3
AI+工業(yè)視覺目前處于什么階段?
一、AI 1.0階段,核心為以算法為中心。1.0階段的算法特征為小樣本、高精度、低算力;落地方法論關(guān)注AI認知、需求邊界、數(shù)據(jù)與模型的管理;客戶群體普遍存在痛點,愿意擁抱新技術(shù)且有一定支付能力。主要問題為數(shù)據(jù)缺乏,上線部署周期長,如遇未知缺陷必須重新訓練,研發(fā)成本與定價偏高。
二、AI 2.0階段,核心為以數(shù)據(jù)為中心。一是開始累積行業(yè)數(shù)據(jù),這是2.0階段的重點。某場景下的客戶達到一定數(shù)量后,累積的數(shù)據(jù)可協(xié)助在基礎(chǔ)模型上針對不同客戶的需求進行微調(diào)。二是形成工業(yè) AI 視覺的標準化平臺,減少對人工的依賴。三是完善數(shù)據(jù)清洗、數(shù)據(jù)生成、分析輔助的工具鏈。2.0階段產(chǎn)品易用性將大幅提升,同時成本進一步下降,客戶關(guān)注性價比。此外,大規(guī)模的AI運行 scale up & scale out、場景復制和遷移泛化的問題是本階段的重點議題。
目前,阿丘正處于從1.0邁向2.0的上半場。整體而言,當前AI在工業(yè)視覺領(lǐng)域仍屬于逐步加速滲透的過程,預計到2024、2025年之后將開始加速普及。
Q4
工業(yè)視覺下游場景眾多,各自有什么特點?
一、最上層為半導體、面板與PCB,特點是工藝屬性強,不僅依賴技術(shù)能力,典型公司如KLA。該領(lǐng)域存在重大機會。
二、腰部市場,如汽車、電子、新能源領(lǐng)域。具有兩個典型特點:
1)極具創(chuàng)新力,以電池為例,有磷酸鐵鋰、三元電池、氫燃料電池、固態(tài)電池等多種形態(tài)。除頭部公司外,不斷有創(chuàng)業(yè)公司用顛覆性的創(chuàng)新方法重塑行業(yè);
2)競爭激烈,市場規(guī)模大且快速變化,靠近消費者,難以形成一套標準解決方案。腰部市場需秉持解耦的理念,追求碎片化市場的覆蓋。
三、傳統(tǒng)行業(yè),如食品、金屬加工等。特點是節(jié)奏慢,認知度不佳,客戶較少關(guān)注底層技術(shù),更為關(guān)注解決具體問題的速度與產(chǎn)品易用性。因此在這類市場,產(chǎn)品力是制勝的關(guān)鍵點,而形成產(chǎn)品力的關(guān)鍵要素是易用性與快速部署。
Q5
除了仿真技術(shù)手段之外,還有什么方法可以加速corner cases的收集?
第一種方法是最早期采用的通過人為制造缺陷或PS缺陷數(shù)據(jù),即與客戶商討該缺陷的特征和表現(xiàn),以便公司能夠準確了解其特點。然而,這種方法存在一個問題,即如果客戶不提供足夠的信息,我們將無法準確了解該缺陷。因此,這種方法在早期使用較多,但后來逐漸減少。
第二種方法是利用AIGC來進行缺陷生成,通過模擬和生成缺陷的特征來解決問題。這種方法可以有效應(yīng)對缺陷背后的復雜性,并且可以生成各種不同類型的缺陷,這是目前常用的一種方法。
第三種方法是利用非監(jiān)督學習的方式,使用OK品進行建模。這種方法可以幫助公司更好地理解缺陷的特征和模式,從而提高缺陷檢測和修復的效果。
Q6
如何看待大模型對工業(yè)視覺領(lǐng)域的影響?
大模型是相對概念,用“基礎(chǔ)模型”描述更為準確?;A(chǔ)模型包含兩層概念:
1)通用基礎(chǔ)模型,如SAM,能夠解決通用問題,但是解決方案較為粗略,在工業(yè)場景中無法直接使用。
2)行業(yè)基礎(chǔ)模型,如針對PCB行業(yè)的基礎(chǔ)模型或預制模型,阿丘已在這類模型中取得進展并實現(xiàn)商業(yè)化落地。
另一方面,大模型不能通吃一切,其可能符合To C端的通用需求,并誕生相應(yīng)的公司。但對于To B類或垂類需求,會出現(xiàn)垂類的基礎(chǔ)模型(小模型)。最終的生態(tài)將是大模型+垂類的細分模型并存。
Q7
CV領(lǐng)域什么時候會迎來“ChatGPT時刻”?
目前在工業(yè)視覺的實際應(yīng)用中,AI的應(yīng)用仍屬于上一波的技術(shù)階段,主要是深度卷積神經(jīng)網(wǎng)絡(luò),其中神經(jīng)網(wǎng)絡(luò)層數(shù)大約為20-30層或30-50層,根據(jù)具體情況進行選擇。
CV領(lǐng)域的“ChatGPT時刻”目前還沒有出現(xiàn),顛覆性創(chuàng)新技術(shù)出現(xiàn)的時間具有不可預測性。Meta提出了SAM,得到資本市場瘋狂追捧,事實上只是邁出了一小步,CV領(lǐng)域的大模型依然需要一段時間。公司認為,CV領(lǐng)域一定會出現(xiàn)自己的ChatGPT,大概率由技術(shù)路線清晰的頭部大模型公司引領(lǐng)。
-
工業(yè)
+關(guān)注
關(guān)注
3文章
1854瀏覽量
46781 -
AI
+關(guān)注
關(guān)注
87文章
31316瀏覽量
269660 -
工業(yè)視覺
+關(guān)注
關(guān)注
0文章
72瀏覽量
7157
發(fā)布評論請先 登錄
相關(guān)推薦
評論