企業(yè)使用AI的一個(gè)復(fù)雜因素是,這個(gè)主題包含了多個(gè)不同的底層技術(shù)。這些技術(shù)中大多數(shù)都能夠完成很多替代功能。技術(shù)和功能的組合非常復(fù)雜,表1-1列出了7項(xiàng)關(guān)鍵技術(shù),包括每項(xiàng)技術(shù)的簡(jiǎn)要描述,以及它們可以實(shí)現(xiàn)的一些典型功能或應(yīng)用程序。
表1-1 人工智能關(guān)鍵技術(shù)
本文會(huì)更深入地描述這個(gè)表中的每種技術(shù)及其功能。我還將論述每種技術(shù)在商業(yè)AI世界有多普遍。我的本職工作是商學(xué)院的教授(跟很多不同的公司合作過),但我也是德勤戰(zhàn)略和分析實(shí)踐部門的高級(jí)顧問,該部門整合了人工智能方面的咨詢工作。
下面是對(duì)每一項(xiàng)技術(shù)及其功能的深入描述。
01~03 統(tǒng)計(jì)機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)
機(jī)器學(xué)習(xí)是一種自動(dòng)將模型與數(shù)據(jù)匹配,并通過訓(xùn)練模型對(duì)數(shù)據(jù)進(jìn)行“學(xué)習(xí)”的技術(shù)。機(jī)器學(xué)習(xí)是AI最常見的形式之一。
在2017年德勤對(duì)250位經(jīng)理(其所在公司都已經(jīng)在探索AI)開展的“了解認(rèn)知”調(diào)查中,接受調(diào)查的公司58%在其業(yè)務(wù)中采用了機(jī)器學(xué)習(xí)。它是許多人工智能方法的核心技術(shù)并且有很多的版本。公司內(nèi)部和外部數(shù)據(jù)(尤其是這些外部數(shù)據(jù))的爆炸式增長(zhǎng)使它們采用機(jī)器學(xué)習(xí)來全面理解這些數(shù)據(jù)變得既可行又必要。
神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一種更為復(fù)雜的形式,該技術(shù)出現(xiàn)在20世紀(jì)60年代,并用于分類型應(yīng)用程序,例如確定信貸交易是否為欺詐行為。它根據(jù)輸入、輸出、變量權(quán)重或?qū)⑤斎肱c輸出關(guān)聯(lián)的“特征”來分析問題。它類似于神經(jīng)元處理信號(hào)的方式,但把它比作大腦就有些牽強(qiáng)了。
最復(fù)雜形式的機(jī)器學(xué)習(xí)將涉及深度學(xué)習(xí),或通過很多等級(jí)的特征和變量來預(yù)測(cè)結(jié)果的神經(jīng)網(wǎng)絡(luò)模型。得益于當(dāng)前計(jì)算機(jī)架構(gòu)更快的處理速度,這類模型有能力應(yīng)對(duì)成千上萬個(gè)特征。
與早期的統(tǒng)計(jì)分析形式不同,深度學(xué)習(xí)模型中的每個(gè)特征通常對(duì)于人類觀察者而言意義不大。這導(dǎo)致的結(jié)果就是該模型的使用難度很大或者難以解釋。在德勤的調(diào)查中只有34%的人在使用深度學(xué)習(xí)技術(shù)。
深度學(xué)習(xí)模型使用一種稱為反向傳播的技術(shù),通過模型進(jìn)行預(yù)測(cè)或?qū)敵鲞M(jìn)行分類。AI技術(shù)已推動(dòng)了該領(lǐng)域的許多最新進(jìn)展,從在圍棋大賽中擊敗人類專家到對(duì)互聯(lián)網(wǎng)圖像進(jìn)行分類,便是使用反向傳播的深度學(xué)習(xí)。在多倫多大學(xué)及谷歌任職的杰弗里·辛頓(Geoffrey Hinton)通常被稱為深度學(xué)習(xí)之父,部分原因就在于他在反向傳播方面的早期研究。
機(jī)器學(xué)習(xí)采用了上百種可能的算法,其中大多數(shù)算法有些深?yuàn)W。它們的范圍從梯度增強(qiáng)(一種構(gòu)建用于解決先前模型錯(cuò)誤的模型的方法,從而增強(qiáng)預(yù)測(cè)或分類能力)到隨機(jī)森林(作為決策樹模型集合的模型)。
越來越多的軟件工具(包括DataRobot、SAS和谷歌的AutoML)支持機(jī)器學(xué)習(xí)模型的自動(dòng)構(gòu)建,這些模型可以嘗試許多不同的算法來找出最成功的算法。一旦通過訓(xùn)練數(shù)據(jù)找到了能夠進(jìn)行預(yù)測(cè)或分類的最佳模型,就可以部署它,并對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè)或分類(有時(shí)稱為評(píng)分過程)。
除了所使用的算法外,機(jī)器學(xué)習(xí)的另一個(gè)關(guān)鍵是模型如何進(jìn)行學(xué)習(xí)。有監(jiān)督學(xué)習(xí)模型(到目前為止是業(yè)務(wù)中最常用的類型)是使用一組對(duì)輸出做了標(biāo)記的訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)。
例如,一個(gè)試圖預(yù)測(cè)銀行欺詐行為的機(jī)器學(xué)習(xí)模型需要在一個(gè)明確構(gòu)成欺詐案例的系統(tǒng)上接受訓(xùn)練。這并不容易做到,因?yàn)閷?shí)際欺詐的頻率可能只有十萬分之一(有時(shí)稱為不平衡分類問題)。
有監(jiān)督學(xué)習(xí)與在評(píng)分模型中部署的傳統(tǒng)分析方法(如回歸分析)非常相似。在回歸分析中,目標(biāo)是創(chuàng)建一個(gè)模型,使用一組與輸出有關(guān)而且其值已知的輸入變量來預(yù)測(cè)一個(gè)已知結(jié)果。一旦模型開發(fā)完成,就可以用它通過相同輸入變量的已知值來預(yù)測(cè)一個(gè)未知的結(jié)果。
例如,根據(jù)患者的年齡、體育活動(dòng)水平、熱量消耗和體重指數(shù),我們可以開發(fā)回歸模型來預(yù)測(cè)他患上糖尿病的可能性。
我們針對(duì)已確診患有糖尿病或沒患糖尿病的患者建立模型(通常使用所有可用數(shù)據(jù)來建立回歸模型)。一旦找到了合適的預(yù)測(cè)回歸模型,就可以使用它基于一組新的數(shù)據(jù)來預(yù)測(cè)未知的結(jié)果(輸入變量達(dá)到特定等級(jí)時(shí)患者患上糖尿病的可能性)。其后的活動(dòng)(在回歸分析和機(jī)器學(xué)習(xí)中)稱為評(píng)分。
回歸過程與有監(jiān)督的機(jī)器學(xué)習(xí)相同,除了:
在機(jī)器學(xué)習(xí)中,用于開發(fā)(訓(xùn)練)模型的數(shù)據(jù)稱為訓(xùn)練數(shù)據(jù),而且它可以是明確出于訓(xùn)練目的而保留的數(shù)據(jù)子集;
在機(jī)器學(xué)習(xí)中,通常用另一個(gè)數(shù)據(jù)子集來驗(yàn)證訓(xùn)練模型,該子集的預(yù)測(cè)結(jié)果是已知的;
在回歸中,可能不需要使用模型來預(yù)測(cè)未知結(jié)果,相反在機(jī)器學(xué)習(xí)中則會(huì)對(duì)結(jié)果做假設(shè);
機(jī)器學(xué)習(xí)中可以使用許多不同的算法類型來代替簡(jiǎn)單的回歸分析。
開發(fā)無監(jiān)督模型通常更難一些,它要從未做標(biāo)記的數(shù)據(jù)中檢測(cè)模式并預(yù)測(cè)未知的結(jié)果。
強(qiáng)化學(xué)習(xí)是第三種變體,它是指機(jī)器學(xué)習(xí)系統(tǒng)制訂了目標(biāo)而且邁向目標(biāo)的每一步都會(huì)得到某種形式的獎(jiǎng)勵(lì)。它在玩游戲中非常有用,但也需要大量數(shù)據(jù)(在許多情況下,太多的數(shù)據(jù)對(duì)該方法不起作用)。
需要指出的是,有監(jiān)督的機(jī)器學(xué)習(xí)模型通常不會(huì)持續(xù)學(xué)習(xí)。它們從一組訓(xùn)練數(shù)據(jù)中學(xué)習(xí)然后繼續(xù)使用同一個(gè)模型,除非使用新的一組訓(xùn)練數(shù)據(jù)來訓(xùn)練新的模型。
機(jī)器學(xué)習(xí)模型是以統(tǒng)計(jì)為基礎(chǔ)的,而且應(yīng)該將其與常規(guī)分析進(jìn)行對(duì)比以明確其價(jià)值增量。它們往往比基于人類假設(shè)和回歸分析的傳統(tǒng)“手工”分析模型更準(zhǔn)確,但也更復(fù)雜和難以解釋。相比于傳統(tǒng)的統(tǒng)計(jì)分析,自動(dòng)化機(jī)器學(xué)習(xí)模型更容易創(chuàng)建,而且能夠揭示更多的數(shù)據(jù)細(xì)節(jié)。
考慮到學(xué)習(xí)所需的數(shù)據(jù)量,深度學(xué)習(xí)模型在圖像和語音識(shí)別等任務(wù)上非常出色(遠(yuǎn)遠(yuǎn)優(yōu)于以前針對(duì)這些任務(wù)的自動(dòng)化方法,并且在某些領(lǐng)域接近或超過了人類的能力)。
04 自然語言處理
自20世紀(jì)50年代以來,理解人類語言一直是人工智能研究者的目標(biāo)。這一領(lǐng)域被稱為自然語言處理(Natural Language Processing,NLP),包括諸如語音識(shí)別、文本分析、翻譯、生成的應(yīng)用程序及其他與語言有關(guān)的目標(biāo)。
在“了解認(rèn)知”的調(diào)查中,53%的公司在使用NLP。NLP有兩種基本方法:統(tǒng)計(jì)NLP和語意NLP。統(tǒng)計(jì)NLP是以機(jī)器學(xué)習(xí)為基礎(chǔ),而且其性能提升的表現(xiàn)要快于語意NLP。它需要一個(gè)龐大的“語料庫(kù)”或者語言體系來學(xué)習(xí)。
例如,在翻譯中它需要大量的翻譯文本,而通過統(tǒng)計(jì)分析可以發(fā)現(xiàn)西班牙語和葡萄牙語中的amor在統(tǒng)計(jì)上與英語中的love一詞高度相關(guān)。這雖然有點(diǎn)靠“蠻力”,但通常是相當(dāng)有效的方法。
語義NLP是近十年來唯一的現(xiàn)實(shí)選擇,如果能用單詞、語法和概念之間的關(guān)系有效地對(duì)系統(tǒng)進(jìn)行訓(xùn)練那么它就會(huì)相當(dāng)高效。
語言的訓(xùn)練和知識(shí)工程(通常指為特定領(lǐng)域所創(chuàng)建的知識(shí)圖譜)可能會(huì)消耗大量的人力和時(shí)間。然而,它需要開發(fā)知識(shí)主體或者單詞與短語之間的關(guān)系模型。雖然創(chuàng)建語義NLP模型難度很大,但現(xiàn)在有些智能座席系統(tǒng)已經(jīng)在使用該方法。
NLP系統(tǒng)的性能應(yīng)該用兩種方法來衡量。一種是看它能夠理解百分之多少的口語。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,該指標(biāo)不斷提高而且往往超過95%。
衡量NLP的另一種方法是看它能回答多少種不同類型的問題或者看它能解決多少種問題。這通常都需要語義NLP,但是由于這方面并沒有重大的技術(shù)突破,所以問答系統(tǒng)和問題解決系統(tǒng)都要基于特定的上下文而且必須進(jìn)行訓(xùn)練。
IBM沃森在回答《危險(xiǎn)邊緣》的問題時(shí)表現(xiàn)出色,但是除非進(jìn)行訓(xùn)練(通常都是以勞動(dòng)力密集型的方式),否則它回答不了《命運(yùn)之輪》(Wheel of Fortune,一檔綜藝節(jié)目)的問題。也許深度學(xué)習(xí)在未來會(huì)應(yīng)用于問題解答,但現(xiàn)在它還沒有。
05 基于規(guī)則的專家系統(tǒng)
在20世紀(jì)80年代,AI的主導(dǎo)技術(shù)是基于“if-then”規(guī)則集合的專家系統(tǒng),而且在那個(gè)時(shí)代開始廣泛地應(yīng)用于商業(yè)領(lǐng)域。如今人們往往認(rèn)為它沒有那么先進(jìn)了,但是2017年德勤“了解認(rèn)知”的調(diào)研顯示引入AI的美國(guó)公司里有49%使用了該技術(shù)。
專家系統(tǒng)要求人類專家和知識(shí)工程師在特定知識(shí)領(lǐng)域中構(gòu)建一系列規(guī)則。例如,它們通常用于保險(xiǎn)承銷和銀行信貸承銷中(但也用于一些深?yuàn)W的領(lǐng)域,如福爵咖啡的咖啡烘焙或金寶湯罐頭的湯汁調(diào)制)。
專家系統(tǒng)在一定程度上運(yùn)行良好,而且容易理解。然而,當(dāng)規(guī)則的數(shù)量很大(通常超過幾百條),并且規(guī)則開始相互沖突時(shí),它們往往會(huì)崩潰。而且如果知識(shí)領(lǐng)域發(fā)生了變化,那么更改規(guī)則將會(huì)很困難而且也會(huì)很耗時(shí)。
基于規(guī)則的系統(tǒng)自其早期的全盛時(shí)期以來并沒有太大的改進(jìn),但是保險(xiǎn)和銀行等大量使用它們的行業(yè)還是希望能夠出現(xiàn)新一代基于規(guī)則的技術(shù)。研究人員和廠商已經(jīng)開始討論“自適應(yīng)規(guī)則引擎”,該引擎將基于新的數(shù)據(jù)或規(guī)則引擎與機(jī)器學(xué)習(xí)的組合來不斷修改規(guī)則,但它們確實(shí)還沒有得到廣泛應(yīng)用。
06 物理機(jī)器人
鑒于全球每年安裝的工業(yè)機(jī)器人超過20萬臺(tái),物理機(jī)器人已經(jīng)廣為人知。在美國(guó)“了解認(rèn)知”調(diào)查中,32%的公司在某種程度上使用了物理機(jī)器人。它們?cè)诠S和倉(cāng)庫(kù)等地執(zhí)行起重、重新定位、焊接或裝配產(chǎn)品等任務(wù)。歷史上,這些機(jī)器人始終在細(xì)致的計(jì)算機(jī)程序控制下去執(zhí)行特定的任務(wù)。
然而,當(dāng)下的機(jī)器人變得越來越能夠跟人類協(xié)作,而且更加容易訓(xùn)練,只需要根據(jù)預(yù)定的任務(wù)來移動(dòng)機(jī)器人的部件就可以了。隨著其他AI能力嵌入它們的“大腦”(實(shí)際上是它們的操作系統(tǒng))中,它們也變得更加智能。隨著時(shí)間的推移,我們?cè)贏I的其他領(lǐng)域中看到的改進(jìn)很可能會(huì)被融入物理機(jī)器人中。
07 機(jī)器人流程自動(dòng)化
機(jī)器人流程自動(dòng)化(Robotic Process Automation,RPA)技術(shù)在執(zhí)行結(jié)構(gòu)化數(shù)字任務(wù)(即涉及信息系統(tǒng)的任務(wù))時(shí)就如同一個(gè)人類用戶按照一個(gè)腳本或者規(guī)則在工作。關(guān)于RPA是否屬于AI/認(rèn)知技術(shù)的集合存在著爭(zhēng)論,因?yàn)樗皇鞘种悄堋5怯捎赗PA系統(tǒng)非常流行、自動(dòng)化,且越來越智能化,因此我把它也視為AI世界的一份子。
有人把它們稱為“數(shù)字勞動(dòng)力”,而且與其他形式的AI相比,它們價(jià)格低廉、易于編程,而且行動(dòng)透明。如果你會(huì)操作鼠標(biāo)、能理解流程圖并能理解一些if-then業(yè)務(wù)規(guī)則,那么你可以理解甚至開發(fā)RPA。這些系統(tǒng)也比其他方法(例如,用編程語言開發(fā)自己的程序)更容易配置和實(shí)施。
RPA并不真正涉及機(jī)器人,它只是服務(wù)器上的計(jì)算機(jī)程序。它依賴于工作流、業(yè)務(wù)規(guī)則及信息系統(tǒng)集成的“表示層”的結(jié)合體,作為系統(tǒng)的半智能用戶進(jìn)行工作。
有些人將RPA與電子表格中的宏進(jìn)行了比較,但是我認(rèn)為這不是一個(gè)公平的比較,RPA可以執(zhí)行更為復(fù)雜的任務(wù)。還有人將它與業(yè)務(wù)流程管理(Business Process Management,BPM)工具進(jìn)行了比較,后者可能具有一些工作流功能,但通常旨在記錄和分析業(yè)務(wù)流程,而不是實(shí)際將其自動(dòng)化。
一些RPA系統(tǒng)已經(jīng)具有一定程度的智能。它們可以“觀察”人類同事的工作(例如回答常見的客戶問題),然后模仿他們的行為。其他一些則把過程自動(dòng)化與機(jī)器視覺相結(jié)合。與物理機(jī)器人一樣,RPA系統(tǒng)正慢慢地變得更加智能化,其他類型的AI技術(shù)也被用來指導(dǎo)它們的行為。
我對(duì)這些技術(shù)分別進(jìn)行了描述,但是現(xiàn)實(shí)中它們?cè)絹碓蕉嗟乇唤M合和集成。然而就目前而言,了解什么樣的技術(shù)可以完成什么樣的任務(wù)對(duì)一個(gè)業(yè)務(wù)決策者來說是非常重要的。
全球公司(Global Inc.)首席信息官克里希納·內(nèi)森(Krishna Nathan)指出,他在2018年的一個(gè)關(guān)鍵優(yōu)先事項(xiàng)是“幫助我的利益干系人了解人工智能能做什么和不能做什么,以便我們能以正確的方式使用它”。也許在將來,這些技術(shù)將混雜在一起,以至于這樣的理解將不再必要,甚至不可行。
責(zé)編AJX
-
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238534 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132654 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121175
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論