要說(shuō)現(xiàn)在最熱門(mén)的前沿技術(shù),那非人工智能(AI)莫屬。而人工智能的核心卻是機(jī)器學(xué)習(xí)(ML)??梢哉f(shuō),掌握了機(jī)器學(xué)習(xí),也就掌握了人工智能技術(shù)。
那么,對(duì)于工業(yè)用戶(hù)來(lái)說(shuō),機(jī)器學(xué)習(xí)如何在工業(yè)自動(dòng)化中應(yīng)用呢?
今天,筆者嘗試通過(guò)一個(gè)一般性方法的介紹來(lái)談?wù)勅绾螌C(jī)器學(xué)習(xí)引入自動(dòng)化,同時(shí)對(duì)機(jī)器學(xué)習(xí)的相關(guān)概念做一個(gè)梳理。
簡(jiǎn)單理解,機(jī)器學(xué)習(xí)就是通過(guò)根據(jù)各類(lèi)算法建立數(shù)學(xué)模型,然后通過(guò)數(shù)據(jù)不斷訓(xùn)練(優(yōu)化)模型,最后將訓(xùn)練好的模型放到實(shí)際應(yīng)用場(chǎng)景中運(yùn)行做推理計(jì)算,解決用普通數(shù)學(xué)方法難以解決的實(shí)際問(wèn)題。
將機(jī)器學(xué)習(xí)引入到工業(yè)自動(dòng)化中通常需要三步:收集工業(yè)現(xiàn)場(chǎng)數(shù)據(jù)、建立模型并訓(xùn)練模型、下載到實(shí)際應(yīng)用中運(yùn)行。聽(tīng)上去是不是很簡(jiǎn)單?
當(dāng)然了,實(shí)際使用過(guò)程并非如此簡(jiǎn)單,每個(gè)環(huán)節(jié)都會(huì)涉及到專(zhuān)業(yè)知識(shí)和工具。
首先,是數(shù)據(jù)收集階段,要通過(guò)各類(lèi)傳感器和測(cè)試測(cè)量工具來(lái)采集現(xiàn)場(chǎng)數(shù)據(jù),這個(gè)環(huán)節(jié)就會(huì)用到我們?cè)茸詣?dòng)化控制中的很多數(shù)采產(chǎn)品,利用這些工具將數(shù)據(jù)采集到本地?cái)?shù)據(jù)庫(kù)或者云端存儲(chǔ),以便下一步來(lái)建模和訓(xùn)練。
然后,第二步是模型的搭建和訓(xùn)練。這是至關(guān)重要的一步,也是目前機(jī)器學(xué)習(xí)中最難、研究最多的一步。這一步首先需要對(duì)上一步采集到的數(shù)據(jù)進(jìn)行預(yù)處理,除去異常值等。然后,提取特征數(shù)據(jù)確定數(shù)學(xué)模型,進(jìn)行學(xué)習(xí)微調(diào),并進(jìn)行未知數(shù)據(jù)的學(xué)習(xí)模型驗(yàn)證。模型訓(xùn)練完成后,生成導(dǎo)出一個(gè)可供自動(dòng)化控制軟件運(yùn)行的描述文件,通常是XML文件或者ONNX文件。這一步中特征數(shù)據(jù)的挖掘,也就是提取哪些數(shù)據(jù)來(lái)建模是整個(gè)機(jī)器學(xué)習(xí)能否成功的關(guān)鍵,往往需要精通行業(yè)知識(shí)經(jīng)驗(yàn)的人才能做到。
在這一步中,搭建模型時(shí)往往需要用到第三方框架(平臺(tái)工具),比如:Python SciKit、MATLAB Machine Learning Toolbox,以及深度學(xué)習(xí)框架TensorFlow (谷歌)、PyTorch (臉書(shū))、MxNet (亞馬遜)、CNTK (微軟)、MATLAB Deep Learning Toolbox (MathWorks)等,其中大多數(shù)是開(kāi)源的和基于Python的。
當(dāng)然,除了這些框架外,還有一個(gè)重要的事,數(shù)學(xué)模型的選擇和建立。在數(shù)學(xué)上,可以把萬(wàn)事萬(wàn)物所有問(wèn)題分為兩大問(wèn)題:回歸問(wèn)題和分類(lèi)問(wèn)題?;貧w問(wèn)題通常是用來(lái)預(yù)測(cè)一個(gè)值,如預(yù)測(cè)房?jī)r(jià)、未來(lái)的天氣情況等。分類(lèi)問(wèn)題是用于將事物打上一個(gè)標(biāo)簽,通常結(jié)果為離散值,如判斷一幅圖片上的動(dòng)物是一只貓還是一只狗。解決這兩類(lèi)問(wèn)題需要用到不同的數(shù)學(xué)模型,比如常見(jiàn)的有支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)和隨機(jī)森林、線(xiàn)性回歸、貝葉斯線(xiàn)性回歸等,這些模型在框架中是現(xiàn)存的,可以直接使用。
在這里,還需要提到一個(gè)知識(shí)點(diǎn),那就是ONNX開(kāi)放神經(jīng)網(wǎng)絡(luò)交換文件,這是一種針對(duì)機(jī)器學(xué)習(xí)所設(shè)計(jì)的開(kāi)放式文件格式,用于存儲(chǔ)訓(xùn)練好的模型。它使得不同的人工智能框架(如Pytorch,MXNet)可以采用相同格式存儲(chǔ)模型數(shù)據(jù)并交互。主要由微軟,亞馬遜 ,F(xiàn)acebook 和 IBM 等公司共同開(kāi)發(fā)。
最后,第三步是加載模型到控制器里運(yùn)行。由于模型描述文件并不能被工業(yè)控制器所識(shí)別,所以就需要用到像倍福TwinCAT 3、貝加萊Automation Studio軟件這樣的自動(dòng)化控制軟件平臺(tái)作為引擎,將訓(xùn)練好的模型文件加載到控制器,才能在自動(dòng)化中應(yīng)用機(jī)器學(xué)習(xí)。
從這么三步來(lái)看,似乎機(jī)器學(xué)習(xí)在自動(dòng)化中應(yīng)用起來(lái)還是挺簡(jiǎn)單的。當(dāng)然在實(shí)際操作中,特征數(shù)據(jù)的挖掘提取、模型的建立和訓(xùn)練是最難的兩步,好在目前建模工具和算法已經(jīng)十分豐富和成熟,而且我們領(lǐng)先的幾家自動(dòng)化廠商也在自己的軟件中無(wú)縫集成了機(jī)器學(xué)習(xí)模型的導(dǎo)入。這樣看來(lái),機(jī)器學(xué)習(xí)進(jìn)入自動(dòng)化領(lǐng)域已經(jīng)一路坦途,突破自動(dòng)化技術(shù)發(fā)展的“天花板”指日可待了!
責(zé)任編輯:YYX
-
工業(yè)自動(dòng)化
+關(guān)注
關(guān)注
17文章
2449瀏覽量
67308 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132845
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論