過去10年,人工智能技術(shù)的革新深刻改變了社會生產(chǎn)和生活方式。時至今日,人工智能技術(shù)和算法依然面臨落地應(yīng)用方面的種種困難。展望未來,讓企業(yè)用上并用好人工智能,讓企業(yè)的人工智能應(yīng)用可持續(xù),是人工智能技術(shù)和算法在產(chǎn)業(yè)領(lǐng)域落地應(yīng)用至關(guān)重要的環(huán)節(jié)。
中國工程院劉合院士研究團隊在中國工程院院刊《中國工程科學(xué)》2022年第6期發(fā)表《我國企業(yè)人工智能應(yīng)用現(xiàn)狀與挑戰(zhàn)》一文。文章著眼我國AI產(chǎn)業(yè)的健康可持續(xù)發(fā)展,從企業(yè)AI應(yīng)用落地的實際案例出發(fā),梳理業(yè)界現(xiàn)狀、剖析發(fā)展挑戰(zhàn)、探討根本原因、提出應(yīng)對策略。企業(yè)AI落地應(yīng)用的復(fù)雜性表現(xiàn)在業(yè)務(wù)需求、數(shù)據(jù)、算法、基礎(chǔ)設(shè)施、配套方案等多個維度,應(yīng)用成熟度取決于數(shù)據(jù)的準備程度及治理水平。在國家宏觀層面,有必要構(gòu)建更友好的AI產(chǎn)業(yè)生態(tài)環(huán)境,促進AI全產(chǎn)業(yè)鏈協(xié)同發(fā)展;以更有力的具體舉措支持AI產(chǎn)業(yè)的技術(shù)研發(fā),特別是全棧AI、AI基礎(chǔ)平臺及工具體系、AI根技術(shù)等,提高我國AI核心技術(shù)的自主可控能力;鼓勵企業(yè)積極實施數(shù)字化轉(zhuǎn)型,采用AI技術(shù)進行智能化升級,形成AI產(chǎn)業(yè)技術(shù)研發(fā)、企業(yè)AI落地創(chuàng)新的強耦合及雙向循環(huán)。
一、前言
當今世界正在經(jīng)歷數(shù)字化技術(shù)驅(qū)動產(chǎn)業(yè)變革的發(fā)展過程,人工智能(AI)、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、第五代移動通信等也在重塑創(chuàng)新版圖和產(chǎn)業(yè)鏈分工。國家高度重視這一發(fā)展趨勢,發(fā)布了《新一代人工智能發(fā)展規(guī)劃》(2017年),旨在促進AI技術(shù)和產(chǎn)業(yè)高速發(fā)展,加速滲透到更多應(yīng)用領(lǐng)域,進一步擴大關(guān)聯(lián)產(chǎn)業(yè)規(guī)模;支持AI和實體經(jīng)濟深度融合,建設(shè)數(shù)字中國、智慧社會,推進數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,形成具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。蓬勃發(fā)展的AI產(chǎn)業(yè),為AI領(lǐng)域“產(chǎn)學(xué)研”合作創(chuàng)造了機遇,也在技術(shù)創(chuàng)新和落地應(yīng)用方面提出了新的要求。
AI是借由人工制造的計算機來表現(xiàn)人類智慧的技術(shù),經(jīng)歷了數(shù)十年的發(fā)展和沉浮。2000年以來,以深度學(xué)習(xí)為代表的統(tǒng)計學(xué)習(xí)方法顯著增強了AI算法的通用性,提升了各項基礎(chǔ)任務(wù)的應(yīng)用性能,創(chuàng)造了將AI算法應(yīng)用于大量實際問題的機會;過去10年里,AI技術(shù)的革新深刻改變了社會生產(chǎn)和生活方式,逐漸催生了AI產(chǎn)業(yè)。然而時至今日,AI技術(shù)和算法依然面臨落地應(yīng)用方面的種種困難,也就引發(fā)了我們的思考:要想真正讓企業(yè)用上AI、用好AI,讓企業(yè)的AI應(yīng)用可持續(xù),學(xué)術(shù)界、產(chǎn)業(yè)界需要聚焦解決哪些事情,應(yīng)當如何協(xié)同以有效實現(xiàn)算法落地?
本文著眼于我國企業(yè)AI應(yīng)用的落地及可持續(xù)發(fā)展,就面臨的挑戰(zhàn)、潛在的解決方案提出構(gòu)思。從AI應(yīng)用于生產(chǎn)的實際案例出發(fā),梳理業(yè)界發(fā)展現(xiàn)狀及存在的問題,剖析AI產(chǎn)業(yè)發(fā)展面臨的迫切挑戰(zhàn),據(jù)此探討成因及應(yīng)對策略,以期為我國AI產(chǎn)業(yè)健康發(fā)展提供基礎(chǔ)參考。
二、人工智能發(fā)展的總體現(xiàn)狀和趨勢
(一)人工智能技術(shù)發(fā)展態(tài)勢
自1956年概念提出至今,AI的發(fā)展經(jīng)歷了3次浪潮。
① 第一次浪潮(1956—1974年)是AI的誕生時期,重在讓機器具備邏輯推理能力,開發(fā)的計算機可解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)并使用英文程序;研發(fā)了首款感知神經(jīng)網(wǎng)絡(luò)軟件和聊天軟件(即時通訊軟件)。
② 第二次浪潮(1980—1987年),AI變得更為實用,可解決某些領(lǐng)域特定問題的AI程序(“專家系統(tǒng)”)開始獲得企業(yè)應(yīng)用;知識庫系統(tǒng)、知識工程成為當時研究的主要方向。
③ 第三次浪潮(1993年至今),計算性能的基礎(chǔ)性障礙被逐步克服,“智能代理”范式獲得廣泛接受;深度學(xué)習(xí)的理論突破使得AI技術(shù)發(fā)展超越了研究人類智能的范疇。互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、芯片、物聯(lián)網(wǎng)等新興技術(shù)為AI技術(shù)的發(fā)展提供了充足的數(shù)據(jù)支持與算力支撐,以“AI+”為代表的業(yè)務(wù)創(chuàng)新模式逐步成熟。從全球?qū)W術(shù)數(shù)據(jù)庫中遴選出的2011—2020年AI領(lǐng)域十大熱門研究主題有:深度神經(jīng)網(wǎng)絡(luò)、特征抽取、圖像分類、目標檢測、語義分割、表示學(xué)習(xí)、生成對抗網(wǎng)絡(luò)、語義網(wǎng)絡(luò)、協(xié)同過濾、機器翻譯。
AI產(chǎn)業(yè)可按基礎(chǔ)層、技術(shù)層、應(yīng)用層進行劃分。基礎(chǔ)層主要指計算平臺和數(shù)據(jù)中心,如云計算平臺、高性能計算芯片、數(shù)據(jù)資源等,為AI應(yīng)用提供數(shù)據(jù)支持與算力支撐。技術(shù)層指AI算法和技術(shù),是AI產(chǎn)業(yè)的核心構(gòu)成。應(yīng)用層指面向特定產(chǎn)業(yè)和場景專門研發(fā)的產(chǎn)品及服務(wù),是AI產(chǎn)業(yè)的自然延伸。制約AI產(chǎn)業(yè)發(fā)展的因素有很多,如數(shù)據(jù)質(zhì)量、泛化能力、可解釋性等。本研究認為,企業(yè)AI落地應(yīng)用是復(fù)雜的系統(tǒng)工程,主要制約因素是可解釋性。對于傳統(tǒng)的機器學(xué)習(xí),特征提取由專家或富有經(jīng)驗的人員手動完成,嵌入了大量的專業(yè)知識;雖然提取的特征可能不夠全面,但因其良好的可解釋性而備受學(xué)術(shù)界的推崇。深度學(xué)習(xí)的特征提取則通過神經(jīng)網(wǎng)絡(luò)自動完成,因無需專家參與而減少了人為干預(yù),對特征的提取通常也更為全面。然而,以深度學(xué)習(xí)為主的神經(jīng)網(wǎng)絡(luò)模型無法給出合理的特征解釋;如果AI不能理解知識或行為之間的深層邏輯,在采用已有模型去應(yīng)對未知變量時就很容易引起模型崩塌。因此,企業(yè)AI落地應(yīng)用的關(guān)鍵在于將長期積累形成的專家知識融入AI模型,據(jù)此構(gòu)建知識與數(shù)據(jù)融合的神經(jīng)網(wǎng)絡(luò)模型,從而提高模型的可解釋性和泛化能力。
(二)人工智能的國內(nèi)外進展
AI發(fā)展的經(jīng)濟社會意義正在成為世界多數(shù)國家的共識,一系列AI發(fā)展戰(zhàn)略和計劃相繼提出并得到快速更新。各國積極設(shè)立AI研究機構(gòu),引導(dǎo)研發(fā)投入并注重人才培養(yǎng),建設(shè)算力和數(shù)據(jù)基礎(chǔ)設(shè)施,提高平臺和資源應(yīng)用水平,制定行業(yè)應(yīng)用政策法規(guī),以期為AI應(yīng)用發(fā)展創(chuàng)造良好的環(huán)境。例如,美國國家科學(xué)技術(shù)委員會發(fā)布的《國家人工智能研究和發(fā)展戰(zhàn)略計劃:2019年更新版》,突出了AI研發(fā)投資的優(yōu)先事項,聚焦領(lǐng)域前沿的快速發(fā)展。歐盟委員會通過了《人工智能法》提案(2021年),旨在構(gòu)建值得全球信賴的AI中心,加強歐盟范圍內(nèi)AI的使用、投資和創(chuàng)新活動。
在我國,AI技術(shù)持續(xù)創(chuàng)新和突破,AI資源持續(xù)優(yōu)化整合,AI產(chǎn)業(yè)結(jié)構(gòu)逐漸完善。
① 近年來,我國的AI相關(guān)專利申請數(shù)量居世界首位,增速明顯高于其他國家;我國學(xué)者在國際一流會議和期刊上發(fā)表的論文數(shù)量穩(wěn)步增長,成為AI社區(qū)的重要貢獻力量。
② 建立AI計算中心和創(chuàng)新中心,面向產(chǎn)業(yè)需求提供基礎(chǔ)數(shù)據(jù)資源、計算資源、關(guān)鍵算法服務(wù),顯著降低了中小型企業(yè)的研發(fā)成本和行業(yè)準入門檻,帶動了AI“產(chǎn)學(xué)研”協(xié)同創(chuàng)新;國產(chǎn)AI開源學(xué)習(xí)框架和開源軟件不斷豐富,昇思、飛槳等開源框架加速了行業(yè)技術(shù)創(chuàng)新。
③ AI為企業(yè)數(shù)字化轉(zhuǎn)型升級提供了源動力,智能產(chǎn)業(yè)加速創(chuàng)新發(fā)展,智能機器人、智慧城市、智能交通、智能制造等方向發(fā)展迅猛,以行業(yè)深化應(yīng)用為眾多企業(yè)帶來了實際價值;總結(jié)數(shù)百個企業(yè)項目的實踐后發(fā)現(xiàn),AI算法進入核心生產(chǎn)系統(tǒng)的比例接近30%,將AI引入核心生產(chǎn)系統(tǒng)后帶來的效率提升平均超過18%。
三、我國企業(yè)人工智能應(yīng)用的典型案例
在我國,隨著相關(guān)技術(shù)的不斷演進,AI算法逐步從實驗驗證走向企業(yè)落地。例如,以華為云計算技術(shù)有限公司為代表的AI企業(yè),已將AI落地應(yīng)用于能源(如智能勘探、生產(chǎn)巡檢、智慧加油站)、城市治理(如智能辦公 / 辦事、政務(wù)智能熱線)、交通運輸(如智慧高速、智能網(wǎng)聯(lián)、城市交通治理)、工業(yè)制造(如工藝優(yōu)化、優(yōu)化控制、工業(yè)視覺)、醫(yī)藥醫(yī)療(如醫(yī)學(xué)影像、臨床輔助、藥物研發(fā))、銀行與金融(如智能風(fēng)控、智能營銷、智能雙錄)等垂直領(lǐng)域。無論是交通運輸、工業(yè)制造等面向企業(yè)的服務(wù),還是智慧醫(yī)療、互聯(lián)網(wǎng)等面向個人的應(yīng)用,AI算法都正在或者已經(jīng)進入核心生產(chǎn)流程,在創(chuàng)造價值的同時也伴生新的問題,反哺和驅(qū)動了AI算法研發(fā)。
(一)智能油氣勘探
智能油氣勘探是AI算法在能源產(chǎn)業(yè)落地應(yīng)用的重要場景之一,可以認為AI算法深刻地改變了這一行業(yè)。在智能化,碳達峰、碳中和目標的時代背景下,石油勘探開發(fā)領(lǐng)域的智能化轉(zhuǎn)型是能源行業(yè)極為核心而又無法規(guī)避的發(fā)展模式。這是因為,隨著石油資源品質(zhì)的不斷劣質(zhì)化,油氣資源開采的難度持續(xù)加大,開采成本逐年攀高;拋棄“儲量為重”的舊觀點,樹立“數(shù)據(jù)為重”的新理念,加大數(shù)據(jù)挖掘力度并提升數(shù)據(jù)價值,是油氣勘探開發(fā)面臨的新挑戰(zhàn);數(shù)據(jù)、算力、算法、場景“四位一體”,共同驅(qū)動AI技術(shù)在石油勘探開發(fā)領(lǐng)域的“以點帶面”式應(yīng)用。
近年來,AI技術(shù)已逐步應(yīng)用于石油勘探開發(fā)中的沉積儲層研究、測井解釋、物探處理、鉆完井、油藏工程等多個方向,取得了一定的進展。
① 在沉積儲層研究方面,一些學(xué)者借助巖心圖像的智能分析手段實現(xiàn)了沉積儲層的精準量化,工業(yè)應(yīng)用效果良好且應(yīng)用潛力突出。
② 在測井方面,部分石油企業(yè)、科研機構(gòu)利用機器學(xué)習(xí)、深度學(xué)習(xí),在曲線重構(gòu)、巖性識別、儲層參數(shù)預(yù)測、油氣水層識別、智能分層、成像測井等方面完成了基礎(chǔ)研究及初步應(yīng)用。
③ 在物探方面,利用目標檢測、圖像分割、圖像分類等計算機視覺技術(shù),實現(xiàn)了構(gòu)造解釋、地震相識別、地震波場正演、地震反演、初至拾取、地震數(shù)據(jù)重建與插值、地震屬性分析等地震數(shù)據(jù)處理解釋。
④ 在鉆井AI應(yīng)用方面,主要體現(xiàn)在井眼軌道智能優(yōu)化、智能導(dǎo)向鉆井、鉆速智能優(yōu)化等。
⑤ 在油藏工程方面,利用精細分層注水“硬數(shù)據(jù)”,實現(xiàn)了數(shù)據(jù)驅(qū)動下的油氣水井智能注水優(yōu)化,有效提高了采收率。此外,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的產(chǎn)量預(yù)測、生產(chǎn)措施智能優(yōu)化等應(yīng)用點上也取得了初步效果。
具體來看,巖石薄片智能鑒定是計算機視覺技術(shù)在巖心分析上的代表性案例。傳統(tǒng)薄片鑒定依賴于巖礦鑒定專家在顯微鏡下的目估觀察,存在鑒定效率低、人員數(shù)量不足、鑒定結(jié)果不易精準量化等不足。巖石薄片智能鑒定通過收集并標注海量的薄片圖像,建立深度學(xué)習(xí)所需的標簽樣本庫;利用計算機視覺技術(shù)構(gòu)建巖石顆粒分割、礦物成分鑒定、孔隙結(jié)構(gòu)分析、巖石結(jié)構(gòu)分析等智能模型,使鑒定結(jié)果更加直觀、量化、精準(見圖1)。智能分層注水是AI在油氣田開發(fā)應(yīng)用方面的另一個典型案例,作為第四代智能分層注水技術(shù),利用注水開發(fā)中的“硬數(shù)據(jù)”,結(jié)合計算幾何、形態(tài)學(xué)等技術(shù)來優(yōu)化生產(chǎn)參數(shù),實現(xiàn)數(shù)據(jù)驅(qū)動的油氣水井智能注水優(yōu)化;形成的水驅(qū)油藏流場識別技術(shù),實現(xiàn)了注水效果的評價、分析、實時監(jiān)測與智能控制,為注水優(yōu)化、井網(wǎng)層系調(diào)整、深部調(diào)剖等提供了可靠的方案決策依據(jù),顯著提高了采收率。
圖1 巖石薄片智能鑒定的部分結(jié)果
中國石油天然氣集團有限公司在“十三五”時期建設(shè)了認知計算平臺,相應(yīng)的功能架構(gòu)如圖2所示。平臺實現(xiàn)了多個重點場景應(yīng)用,如地震初至波自動拾取、地震層位自動解釋、測井油氣層識別、抽油機井工況診斷、單井產(chǎn)量及含水規(guī)律預(yù)測等;在中國石油天然氣股份有限公司西南油氣田分公司、長慶油田分公司等企業(yè)進行了試點應(yīng)用,取得良好效果,如地震層位智能解釋將人工解釋所需約1個月的工作量降至一周內(nèi),測井油氣層智能識別將解釋符合率提高了10個百分點且單井解釋耗時從1天壓縮至10 min。
圖2 中國石油認知計算平臺功能架構(gòu)
注:GPU表示圖形處理器;FPGA表示現(xiàn)場可編程邏輯門陣列;CPU表示中央處理器。
也要注意到,雖然AI技術(shù)在石油勘探開發(fā)領(lǐng)域的應(yīng)用穩(wěn)健展開并不斷取得新進展,但較之于看圖識花、動作識別、智能修圖等通用技術(shù)領(lǐng)域,相應(yīng)進展仍是較為緩慢的,技術(shù)研究與落地應(yīng)用之間仍存在不小的距離,尚處于“知易行難”的發(fā)展階段。石油勘探開發(fā)領(lǐng)域的場景復(fù)雜,需要綜合利用測井、地震、遙感等手段進行多維度分析,具有系統(tǒng)工程特征,無法僅靠數(shù)據(jù)驅(qū)動的模型來解決問題,而通用技術(shù)領(lǐng)域的業(yè)務(wù)場景相對簡單且所見即所得,需要識別的對象也是常見物品。同時,石油勘探開發(fā)領(lǐng)域面臨嚴峻的數(shù)據(jù)質(zhì)量問題,建模所用的數(shù)據(jù)多是處理解釋過的,存在小樣本、數(shù)據(jù)失真等情況;相比之下,通用技術(shù)領(lǐng)域的數(shù)據(jù)多為實時采集的大數(shù)據(jù),各類公開數(shù)據(jù)集也為行業(yè)建模提供了豐富的數(shù)據(jù)來源。在研發(fā)生態(tài)方面,石油勘探開發(fā)等特定領(lǐng)域也相對薄弱;近年來開源的多種AI模型及代碼為AI建模提供了豐富的預(yù)訓(xùn)練模型,但多是針對通用技術(shù)領(lǐng)域所構(gòu)建,較難直接遷移到石油領(lǐng)域應(yīng)用。
(二)智慧城市治理
城市是人類文明的重要標志、工商業(yè)發(fā)展的產(chǎn)物,也代表著人類對更高質(zhì)量生活的追求。數(shù)字時代為城市所有物體、服務(wù)、空間的數(shù)字化提供了基礎(chǔ)。然而,不斷增加的主體與要素、快節(jié)奏的生產(chǎn)生活方式,對城市治理提出了更高要求。以AI算法為核心的“智慧城市”系統(tǒng),在大規(guī)模算力、大數(shù)據(jù)技術(shù)的支持下,能夠有效鏈接建筑、學(xué)校、醫(yī)院、公共交通等城市要素,實現(xiàn)城市中各類場景的智能化決策。智慧城市的基本策略是將數(shù)據(jù)變成城市治理的資源,進而應(yīng)用此資源賦能基層治理。
智能政務(wù)專線、城市交通治理是智慧城市的典型應(yīng)用案例。
① 傳統(tǒng)12345熱線的服務(wù)范圍不斷延伸,導(dǎo)致客服人員壓力增加、服務(wù)效率降低。智能熱線方案提取政務(wù)法規(guī)、文件、內(nèi)外部通知、工單等數(shù)據(jù),建立包括事件、時間、地點、責(zé)任主體、解決措施在內(nèi)的知識圖譜。利用知識圖譜相關(guān)算法,智能識別居民來電意圖,輔助人工坐席崗與居民進行高效交流,通過分析歷史訴求及處置情況來智能派單,形成“接得更準、分得更快、辦得更實”的熱線服務(wù)模式。在試點城市,整體派單效率提升超過50%,工單處置周期縮短20%以上,大幅改善了工單辦結(jié)的滿意度。
② 早晚高峰是城市交通面臨的巨大挑戰(zhàn)。為了緩解路網(wǎng)壓力增大造成的調(diào)度困難,智能調(diào)控信控方案利用電子警察解析的結(jié)構(gòu)化數(shù)據(jù),分析各路口車流規(guī)律并結(jié)合交警人工經(jīng)驗進行配時建模;在構(gòu)建路口流量、綠燈空放等目標函數(shù)的基礎(chǔ)上,將交通知識的數(shù)學(xué)描述以約束條件的形式整合到最優(yōu)信控配時的建模過程。在試點城市,實現(xiàn)了主干道平均車速提升18%,道路排隊溢出次數(shù)下降20%,早高峰提前10~15 min消散,顯著緩解了早晚高峰的交通擁堵現(xiàn)象。
智慧城市治理是AI算法面臨的極大挑戰(zhàn)。城市治理場景復(fù)雜且變化迅速,對AI算法的高級指標(如通用性、可遷移性等)提出了更高要求。城市治理需要結(jié)合圖像、語言、語音等多種模態(tài)的數(shù)據(jù),也契合了未來AI算法朝著多模態(tài)方向發(fā)展的趨勢。然而,當前的AI算法在靈活度、魯棒性等方面距離實際應(yīng)用還存在不小的差距,往往需要進行針對性研發(fā)以適應(yīng)不同的場景,導(dǎo)致開發(fā)及應(yīng)用成本居高不下,也就難以規(guī)?;?、規(guī)范化地“復(fù)制”到其他城市中去。
四、基于案例實踐促成企業(yè)人工智能應(yīng)用的若干關(guān)鍵要素分析
(一)人工智能的科學(xué)研究和需求驅(qū)動同樣重要
AI作為通用目的技術(shù),現(xiàn)階段在企業(yè)應(yīng)用落地時產(chǎn)生了新穎而積極的成效,但也面臨著諸多問題和挑戰(zhàn)。目前,AI算法缺乏規(guī)范性,開發(fā)效率較低,這是因為不同行業(yè)和企業(yè)的數(shù)據(jù)模態(tài)、數(shù)據(jù)體量及質(zhì)量、硬件環(huán)境等均有較大差別。在傳統(tǒng)的開發(fā)模式下,AI算法在場景之間的遷移能力差,開發(fā)者往往需要針對不同場景分別設(shè)計神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、執(zhí)行特定的優(yōu)化與部署流程;缺乏統(tǒng)一規(guī)范的開發(fā)模式,開發(fā)出的算法也無法滿足泛化性、魯棒性、安全性、可解釋性等要求。解決這些問題,需要從科學(xué)研究、企業(yè)應(yīng)用落地兩方面同步著手。
1. 依據(jù)企業(yè)技術(shù)需求進行AI算法的迭代演進
從訓(xùn)練數(shù)據(jù)的角度看,大數(shù)據(jù)時代的絕大部分數(shù)據(jù)都沒有標注信息。例如,從互聯(lián)網(wǎng)公開領(lǐng)域獲取的數(shù)據(jù)中,具有語義標簽的數(shù)據(jù)占比低于1%;為了充分利用這些數(shù)據(jù)以提升大模型的質(zhì)量,需要構(gòu)建高效的自監(jiān)督學(xué)習(xí)算法。雖然學(xué)術(shù)界提出了針對圖像、文本等特定模態(tài)的自監(jiān)督學(xué)習(xí)算法,但訓(xùn)練效率有限、訓(xùn)練所得模型的能力難以評估。不同模態(tài)數(shù)據(jù)之間存在差異性,也使得從圖像、文本等數(shù)據(jù)中學(xué)習(xí)的語義知識難以在同一語義空間中對齊。需要設(shè)計跨模態(tài)的模型訓(xùn)練和評測方案,擺脫對模型體量的盲目追求,讓大模型不再依賴下游任務(wù)而是根據(jù)自身對數(shù)據(jù)的理解能力進行評測,這樣才能解決AI落地過程中的模型生產(chǎn)問題。
從模型的角度看,深度學(xué)習(xí)的重要障礙在于模型的泛化能力和可解釋性。當模型遇到不在訓(xùn)練數(shù)據(jù)分布范圍之內(nèi)的測試樣本時,模型的效果會顯著下降,加之神經(jīng)網(wǎng)絡(luò)模型通常無法解釋自身推理過程,使得專業(yè)人員對模型預(yù)測結(jié)果持懷疑態(tài)度,也就限制了模型在實際生產(chǎn)場景下的應(yīng)用。遷移學(xué)習(xí)、對抗攻防、激活單元可視化等技術(shù)研究盡管取得了一定進展,但距離魯棒、可泛化、可解釋的AI算法尚有距離。
鼓勵學(xué)科交叉研究,推動AI與其他學(xué)科融合,以雙向互促實現(xiàn)協(xié)同發(fā)展。將AI算法應(yīng)用于其他學(xué)科的前沿研究(如醫(yī)學(xué)影像、生物制藥、科學(xué)計算等)潛力巨大,但對AI算法提出了更高要求。例如,科學(xué)計算區(qū)別于與傳統(tǒng)的AI應(yīng)用場景,AI算法設(shè)計面臨輸入數(shù)據(jù)是否完備、數(shù)據(jù)量是否充足、計算架構(gòu)是否合理等實質(zhì)性挑戰(zhàn),解空間的復(fù)雜度極高。因此,AI算法需要具備處理不確定性數(shù)據(jù)的能力并與知識計算、自動機器學(xué)習(xí)等算法相結(jié)合,才能輔助各學(xué)科的科學(xué)家探索未知領(lǐng)域。
2. 在技術(shù)體系與架構(gòu)設(shè)計中有機結(jié)合場景、算法和平臺
基于深度學(xué)習(xí)的AI算法需要大量的計算資源,訓(xùn)練成本較高。企業(yè)在技術(shù)體系與架構(gòu)設(shè)計中,應(yīng)追求與AI行業(yè)有機結(jié)合,在云端部署大模型,合理規(guī)避基于通用數(shù)據(jù)訓(xùn)練模型的過程;配合高效工具鏈,以較低的成本在私有數(shù)據(jù)上驗證大模型,便于將模型部署到端側(cè)和邊側(cè)設(shè)備,從而降低使用成本。這一發(fā)展方式才能讓更多的企業(yè)受惠于AI算法。
AI作為新興的交叉學(xué)科,關(guān)鍵基礎(chǔ)源自計算機科學(xué)的細分領(lǐng)域。將AI算法落地到企業(yè)應(yīng)用,需要不同類型的人員緊密配合:具備AI專業(yè)級技能的算法開發(fā)者和架構(gòu)師,理解AI基礎(chǔ)邏輯的產(chǎn)品經(jīng)理,接受AI應(yīng)用理念的企業(yè)技術(shù)人員。應(yīng)鼓勵A(yù)I培訓(xùn)深入企業(yè),通過實際案例提高企業(yè)技術(shù)和管理人員對AI的深刻認知,從而創(chuàng)造良好的協(xié)同環(huán)境。
(二)以系統(tǒng)性思維推進企業(yè)人工智能應(yīng)用落地
當前,企業(yè)界對于AI的認知水平參差不齊,許多企業(yè)甚至認為“AI就是算法”,忽略了“基礎(chǔ)設(shè)施”“配套方案”,使得AI應(yīng)用落地的復(fù)雜度被嚴重低估,往往導(dǎo)致項目應(yīng)用成效低下甚至失敗。實際場景具有需求多變性、數(shù)據(jù)多樣性的特點,往往需要結(jié)合領(lǐng)域?qū)<业男袠I(yè)知識將多種模型進行組合,才能打通企業(yè)的業(yè)務(wù)生產(chǎn)系統(tǒng)。企業(yè)在實施AI應(yīng)用時,需要建立系統(tǒng)思維,統(tǒng)籌考慮點 / 面、上 / 下、橫向 / 縱向維度的因素,確?!巴袋c清晰、步驟合理、量力而行”。在開發(fā)和應(yīng)用階段都需堅持系統(tǒng)性思維,這對AI行業(yè)與企業(yè)的協(xié)同進步是極為必要的。
AI應(yīng)用開發(fā)的全流程作為一項系統(tǒng)工程,其本質(zhì)是將算法開發(fā)的流水線進行工程化,形成降本增效的應(yīng)用場景;通過子流程的密切配合,形成小型閉環(huán)(見圖3)。其中,數(shù)據(jù)標注用于將數(shù)據(jù)集打上標簽以支持后續(xù)算法的訓(xùn)練;數(shù)據(jù)處理對異常數(shù)據(jù)進行清洗和整理,通過數(shù)據(jù)增強和精煉等方式提高數(shù)據(jù)量;算法訓(xùn)練開發(fā)新算法或者選擇已有算法,使用數(shù)據(jù)進行訓(xùn)練已建立模型;模型評估基于測試數(shù)據(jù)集對模型進行評估,反復(fù)進行調(diào)優(yōu);應(yīng)用生成對多個模型進行邏輯編排,指定輸入 / 輸出路徑;應(yīng)用評估基于業(yè)務(wù)數(shù)據(jù)集開展進一步評估;部署推理包含應(yīng)用的部署、監(jiān)控和維護。例如,在監(jiān)控和維護階段發(fā)現(xiàn)異常時,系統(tǒng)會將數(shù)據(jù)回流到數(shù)據(jù)標注環(huán)節(jié),進行難例標注后補充異常數(shù)據(jù),重新發(fā)起算法訓(xùn)練。
AI進入企業(yè)核心生產(chǎn)環(huán)境也是一項系統(tǒng)工程,最重要的環(huán)節(jié)是行業(yè)機理模型與AI模型的結(jié)合。各個行業(yè)都有長期的專業(yè)積累,形成了涵蓋物理、化學(xué)、生物等知識表達,數(shù)量眾多的機理模型。為了在不同行業(yè)落地應(yīng)用,AI算法應(yīng)結(jié)合行業(yè)知識、企業(yè)專有數(shù)據(jù),完成通用到專用的轉(zhuǎn)變。在此過程中,應(yīng)緩解通用數(shù)據(jù)與行業(yè)數(shù)據(jù)之間的領(lǐng)域鴻溝,支持大模型與各類行業(yè)知識庫的整合,降低大模型在各個行業(yè)的微調(diào)成本。
應(yīng)用系統(tǒng)工程的方法論,開展需求分解、架構(gòu)設(shè)計、系統(tǒng)開發(fā)、集成驗證,形成端到端的解決方案。以某企業(yè)落地的工業(yè)優(yōu)化控制項目為例,AI系統(tǒng)依托云端計算平臺,以容器化部署方式對外提供服務(wù)接口;通過邊緣應(yīng)用,完成工廠生產(chǎn)環(huán)境下生產(chǎn)作業(yè)系統(tǒng)數(shù)據(jù)接口的協(xié)議轉(zhuǎn)換,由此打通了AI系統(tǒng)與工廠生產(chǎn)環(huán)境舊系統(tǒng)之間的數(shù)據(jù)與指令交互;采取系統(tǒng)工程的可靠性設(shè)計方法,確保數(shù)據(jù)通道的安全性和穩(wěn)定性,保障企業(yè)的安全生產(chǎn)。鑒于工業(yè)生產(chǎn)工況的復(fù)雜多變,數(shù)據(jù)驅(qū)動的AI模型可能遇到從未“見過”的工況,需要以“邊云”協(xié)同的系統(tǒng)能力建立反饋回路,從而對AI應(yīng)用的異常結(jié)果進行監(jiān)控和迭代。這種AI應(yīng)用系統(tǒng)和企業(yè)業(yè)務(wù)系統(tǒng)的組合,可視為AI與核心生產(chǎn)系統(tǒng)融合的大型閉環(huán)。
圖3 AI應(yīng)用開發(fā)全流程
注:MLOPS表示機器學(xué)習(xí)運維。
(三)為人工智能落地創(chuàng)造良好的協(xié)同發(fā)展環(huán)境
1. 切入明確的企業(yè)應(yīng)用場景是成功應(yīng)用的開端
發(fā)掘企業(yè)應(yīng)用場景是AI落地應(yīng)用的第一步。為了準確定位行業(yè)AI,需要深刻理解企業(yè)需求的場景業(yè)務(wù)狀況,清醒認識AI算法的能力及所能解決的問題。一個持續(xù)演進的良性循環(huán)反映在:多部門、多類型專業(yè)人員協(xié)作,針對具體的業(yè)務(wù)場景問題明確AI應(yīng)用落地的邊界,以企業(yè)內(nèi) / 外部的數(shù)據(jù)治理及資產(chǎn)化水平來評估應(yīng)用AI的可能性及潛在價值,以現(xiàn)有的企業(yè)知識來優(yōu)化數(shù)據(jù)驅(qū)動的AI模型,在社會價值和商業(yè)價值的實現(xiàn)過程中補充并完善更多的數(shù)據(jù)。
企業(yè)AI應(yīng)用場景可分為海量重復(fù)場景、專家經(jīng)驗傳承場景、多域協(xié)同場景。通過場景化問題分析,可以找到問題邊界;通過行業(yè)知識引入,可以減少落地過程中的彎路,以此提高企業(yè)AI落地的質(zhì)量。以智能油氣勘探為例,地震資料的采集、處理和解釋流程涉及數(shù)十個工序,而作為基礎(chǔ)和關(guān)鍵業(yè)務(wù)環(huán)節(jié)的地震層位追蹤,目前主要采用人工解釋的方式完成;大的地震數(shù)據(jù)量導(dǎo)致人工解釋工作十分繁瑣,而利用AI進行層位自動追蹤可大幅減少重復(fù)性的專業(yè)勞動,縮短勘探周期并節(jié)省勘探成本。
2. 企業(yè)數(shù)字化是AI成功應(yīng)用的基礎(chǔ)
企業(yè)的數(shù)字化水平?jīng)Q定了數(shù)據(jù)要素的準備程度,這對AI應(yīng)用落地的效果至關(guān)重要。以深度學(xué)習(xí)為主的AI技術(shù)對數(shù)據(jù)的依賴性很強,特別是面向行業(yè)場景,因公開數(shù)據(jù)集有限而需企業(yè)自身積累大量的數(shù)據(jù),對信息化、數(shù)字化基礎(chǔ)能力提出了較高要求。在企業(yè)數(shù)字化轉(zhuǎn)型、智能化發(fā)展的過程中,及時構(gòu)建統(tǒng)一的行業(yè)數(shù)據(jù)標準,為企業(yè)建立數(shù)據(jù)管理模式及信任機制提供基礎(chǔ)依據(jù);逐步完善數(shù)據(jù)的知識產(chǎn)權(quán)保護和共享機制,避免強中心化帶來的“數(shù)據(jù)孤島”問題。
數(shù)據(jù)質(zhì)量也是重要方面。如果數(shù)據(jù)管理分散、規(guī)范性不足,則需先期進行數(shù)據(jù)治理以形成符合要求的數(shù)據(jù)平臺和數(shù)據(jù)資產(chǎn),隨后才能部署AI解決方案。以某供熱企業(yè)的智能化升級為例,AI上線至少有3個前置條件:
① 基礎(chǔ)數(shù)據(jù)的清理,從熱源、換熱站、機組、單元閥到室內(nèi)溫采等一系列設(shè)備的參數(shù),都要系統(tǒng)化地收集和建模;
② 至少1個供暖季的設(shè)備歷史運行數(shù)據(jù)、天氣數(shù)據(jù)等,作為AI訓(xùn)練集和驗證集;
③ 針對歷史數(shù)據(jù)缺失的異常場景(如數(shù)據(jù)斷連、設(shè)備數(shù)據(jù)異常、閥門異常、極端天氣等)進行分析和進一步的仿真,獲得更豐富、更可靠的數(shù)據(jù)集。以高質(zhì)量行業(yè)數(shù)據(jù)為代表的前置條件只有足夠充分,才能訓(xùn)練形成完整的AI調(diào)控方案。
3. 通過中樞化建設(shè)促成AI應(yīng)用場景的互聯(lián)互通并實現(xiàn)價值
中樞化建設(shè)是AI系統(tǒng)工程需要采用的模式。提前策劃在不同部門之間共建AI算法和算力,才能避免“各行其是”以消除重復(fù)建設(shè)與資源浪費;AI能力需從單點的算法匯聚至水平互通的中樞引擎層,以實現(xiàn)不同AI算法的共性能力復(fù)用和高效積累。換言之,通過中樞的算力底座解決物理資源的零散問題(如云計算的本質(zhì),就是將大量的零散算力資源進行打包、匯聚,實現(xiàn)更高可靠性、更高性能、更低成本的算力),由中樞的引擎層來解決AI算法的局部性問題。將中樞化的思維和模式同時應(yīng)用于場景問題定義、AI平臺建設(shè)等維度,才能將AI的應(yīng)用價值從局部提升至整體。
以智慧城市建設(shè)為例,當前的多數(shù)問題都屬于由復(fù)雜關(guān)聯(lián)的局部問題造成的整體問題。AI在對應(yīng)場景中的應(yīng)用效果,很大程度上取決于應(yīng)用場景的問題定義和建設(shè)模式。對于城市交通資源優(yōu)化,如果局限于解決單一路口的擁堵問題,即使通過AI算法將問題求解到最優(yōu),也很難對城市的整體交通狀況、車輛在途率形成根本性的改善。針對這類問題,需要采取中樞化的建設(shè)思維,將視野從局部拓展到整體,才能夠?qū)⒕植績?yōu)化輻射到全局層面,從而驅(qū)動整個系統(tǒng)產(chǎn)生更大的價值。具體而言,在設(shè)計AI算法之前,率先考慮數(shù)據(jù)、資源、場景能否互通互聯(lián);如果不能,需要優(yōu)先解決互通問題,才能再考慮如何將AI應(yīng)用于優(yōu)化后的問題及系統(tǒng)。
城市運行“一網(wǎng)統(tǒng)管”是代表性的實踐案例。與單一管理部門應(yīng)用場景不同,“一網(wǎng)統(tǒng)管”實質(zhì)上是中樞化的建設(shè)模式,實現(xiàn)了多個管理部門的互通互聯(lián);將原先只能局部閉環(huán)的城市問題,通過多部門協(xié)同尋求了更高效、更優(yōu)化的處置方案。針對重新設(shè)計后的全局化問題,AI應(yīng)用就從原先局限于特定事件的感知和發(fā)現(xiàn),拓展到了通過知識圖譜挖掘跨管理部門事件的處置關(guān)聯(lián)性,從而精準推薦事件處置的措施和責(zé)任主體,達到處置效率、處置滿意度的全局優(yōu)化。
(四)用發(fā)展的思維解決發(fā)展過程中的挑戰(zhàn)
AI技術(shù)的發(fā)展和應(yīng)用是一個循序漸進的過程。如果對AI算法缺乏寬容,實際應(yīng)用時一旦出現(xiàn)問題就導(dǎo)致信任危機,容易遏制技術(shù)的迭代和提升,也就帶來AI應(yīng)用落地的額外阻力。宜采用發(fā)展的思維來看待AI企業(yè)落地過程中的問題和挑戰(zhàn):既要給予發(fā)展機會和周期,也要在系統(tǒng)、流程、機制等方面提供支持,促成良性、可持續(xù)的能力演進。
列車運行故障動態(tài)檢測系統(tǒng)的應(yīng)用場景具有代表性:采用列檢設(shè)備拍攝貨車底部和側(cè)部照片,通過審圖判斷貨車是否存在安全風(fēng)險。列車速度極快、室外環(huán)境復(fù)雜,加之故障類型多達數(shù)百種,AI系統(tǒng)面臨在長尾數(shù)據(jù)上進行小樣本學(xué)習(xí)的困難。AI研發(fā)企業(yè)與鐵路科研單位合作開展了AI技術(shù)應(yīng)用,經(jīng)過迭代式開發(fā)和測試,使得誤檢、漏檢樣本快速進入系統(tǒng),模型能力不斷提升,最終達到專家人工判讀的水平。在類似的發(fā)展過程中,更加開放地優(yōu)化組織流程,讓行業(yè)專家與AI專家高效配合,應(yīng)用主動學(xué)習(xí)等技術(shù)提升人工輔助效率,將顯著加速AI應(yīng)用落地。
在過去的10多年,AI是發(fā)展最快的科技領(lǐng)域之一,這得益于業(yè)界在技術(shù)研究和產(chǎn)業(yè)落地之間的良性循環(huán),即技術(shù)研究的成果為企業(yè)落地創(chuàng)造了可能性,而企業(yè)落地的收益反哺了AI技術(shù)研究。也要注意到,在深度學(xué)習(xí)爆發(fā)式增長10年后,AI技術(shù)研究逐漸進入深水區(qū),易于攻克或提升的技術(shù)點越來越少;為了維系良性循環(huán),應(yīng)深入挖掘技術(shù)研究與產(chǎn)業(yè)落地的“結(jié)合點”。AI的應(yīng)用旨在“減少重復(fù)勞動”“擴展人類知識邊界”,瞄準這一根本目標,保持技術(shù)研究和行業(yè)落地的緊密結(jié)合,才能兼顧技術(shù)實現(xiàn)與社會價值創(chuàng)造。
五、我國企業(yè)人工智能應(yīng)用的發(fā)展建議
人類社會正在進入泛智能時代,在此關(guān)鍵時期,單項技術(shù)的重大突破、單一解決方案的深刻變化,都有可能改變各行業(yè)的競爭格局。種種跡象表明,當前正處于AI大規(guī)模落地應(yīng)用的爆發(fā)前夕。世界范圍內(nèi)的企業(yè)尤其是領(lǐng)軍企業(yè),普遍重視AI,加大投入以緊跟潮流并獲得領(lǐng)先優(yōu)勢。如果在布局階段錯失機遇,一旦馬太效應(yīng)形成,后發(fā)者可能處于更為弱勢的境地。相應(yīng)地,我國應(yīng)高度重視AI產(chǎn)業(yè)發(fā)展,積極發(fā)布AI企業(yè)落地配套政策,引導(dǎo)國產(chǎn)AI根技術(shù)、基礎(chǔ)平臺、關(guān)鍵行業(yè)應(yīng)用等層面的協(xié)調(diào)發(fā)展,以更好推動AI技術(shù)的產(chǎn)業(yè)集聚、促進AI與實體經(jīng)濟的深度融合。
建議支持AI產(chǎn)業(yè)鏈發(fā)展,扶持全棧AI國產(chǎn)化,完善AI基礎(chǔ)平臺及工具體系,培育國產(chǎn)AI根技術(shù),提高AI核心技術(shù)的自主可控能力。
① 加大底層根技術(shù)的研發(fā)投入,構(gòu)建算力、算法、數(shù)據(jù)三位一體的AI新生態(tài),鼓勵企業(yè)、高校、社會服務(wù)等加速應(yīng)用AI根技術(shù);以核心產(chǎn)業(yè)主體多方共建的方式,積極構(gòu)建具有國際有影響力、分布于若干行業(yè)的AI根技術(shù)應(yīng)用體系,構(gòu)筑AI企業(yè)應(yīng)用的技術(shù)縱深。
② 支持AI根技術(shù)持續(xù)創(chuàng)新,引導(dǎo)優(yōu)勢企業(yè)開展AI根技術(shù)研發(fā)攻關(guān),支持行業(yè)示范應(yīng)用,促進國產(chǎn)AI大模型、框架、芯片等核心技術(shù)突破及產(chǎn)業(yè)化落地。③ 鼓勵優(yōu)勢AI企業(yè)加速完善包括端到端的AI基礎(chǔ)平臺、工具鏈在內(nèi)的AI共性支撐技術(shù)體系,實質(zhì)性提高自主可控能力并形成一定的比較優(yōu)勢。
建議支持企業(yè)積極采用AI進行智能化升級,形成技術(shù)研發(fā)和產(chǎn)業(yè)智能創(chuàng)新的雙向大循環(huán)。企業(yè)智能化所需的生產(chǎn)要素,如數(shù)據(jù)、算法、算力等,通常很難依靠單一企業(yè)來構(gòu)建齊備。應(yīng)建立科學(xué)合理的算力、數(shù)據(jù)、算法開放共享機制,持續(xù)開放并積累各行業(yè)的算法、模型、數(shù)據(jù),促進跨企業(yè)的智能化協(xié)作,以要素的規(guī)?;嵘髽I(yè)AI應(yīng)用的水平。
① 地方政府可借助新型基礎(chǔ)設(shè)施建設(shè)的發(fā)展機遇,新建或擴建包括AI計算中心(公共算力)、一體化大數(shù)據(jù)中心(數(shù)據(jù)共享)、AI創(chuàng)新中心(模型共享)在內(nèi)的AI公共要素體系。
② 由企業(yè)、管理部門注入數(shù)據(jù)和應(yīng)用需求,支持企業(yè)開展基于云計算、大數(shù)據(jù)的AI應(yīng)用創(chuàng)新示范;鼓勵企業(yè)采用AI進行技術(shù)換代、流程再造、服務(wù)升級,形成自主技術(shù)研發(fā)和產(chǎn)業(yè)智能創(chuàng)新循環(huán)互促的發(fā)展格局。③ 制定相關(guān)標準,規(guī)范AI技術(shù)研究,以發(fā)展的思維積極應(yīng)對AI落地過程中可能帶來的問題;完善與企業(yè)AI應(yīng)用相關(guān)的法律法規(guī)和流程制度,促進產(chǎn)業(yè)智能化良性發(fā)展,防控潛在技術(shù)和社會風(fēng)險。
劉合,能源與礦業(yè)工程管理專家,中國工程院院士。
主要從事采油工程技術(shù)及裝備研發(fā)、工程管理創(chuàng)新與實踐研究。
編輯:黃飛
?
評論
查看更多