超大預(yù)訓(xùn)練模型(large scale pre-trained model, LSPTM) 的發(fā)展在人工智能領(lǐng)域產(chǎn)生了意想不到的效果, 尤其是在自然語言處理(natural language processing, NLP)上 ChatGPT 的突破, 似乎打通了 “人工智能” 的任督二脈, 在短短的幾個月內(nèi), 其智能實現(xiàn)了從人類可以理解的智能到無法理解的智能跨越。以 ChatGPT 為代表的 LSPTM 即將開啟一個全新的硅基智能時代,指揮與控制(command and control, C2) 作為人類社會引以為豪的體現(xiàn)智慧的關(guān)鍵要素,會面臨什么樣的機遇和挑戰(zhàn)?以 C2 過程的基本范式和運行基本模式框架為指導(dǎo), 全面分析 LSPTM 在 C2 活動的物理域、信息域、認(rèn)知域以及社會域各方向潛在的應(yīng)用, 闡述硅基智能時代,人工智能從輔助工具角色向伙伴和替代角色的跨越,C2 領(lǐng)域發(fā)展的機遇. 軍事領(lǐng)域?qū)剐?C2 的競爭不再局限于技術(shù), 而是培育 LSPTM 的文化底蘊, 東西方文化與價值觀的差異將決定兩種不同 LSPTM 的智慧與智能。
自1943年美國神經(jīng)科學(xué)家麥卡洛克(Warren McCulloch)和邏輯學(xué)家皮茨(Water Pitts)建立神經(jīng)元的數(shù)學(xué)模型以來,人工智能的發(fā)展可謂是“過山車”,既有符號主義、聯(lián)結(jié)主義(神經(jīng)網(wǎng)絡(luò))學(xué)派掀起的高潮,也有專家系統(tǒng)帶來的困境和徘徊,總而言之,人工智能的孕育過程跌宕起伏。2018年,一種全新的學(xué)習(xí)訓(xùn)練方法——預(yù)訓(xùn)練為深度學(xué)習(xí)打開了一扇智慧之門。預(yù)訓(xùn)練成功激活了深度神經(jīng)網(wǎng)絡(luò)對大規(guī)模無標(biāo)注數(shù)據(jù)的自監(jiān)督學(xué)習(xí)能力,在圖形處理器(graphics processing unit,GPU)算力和海量無標(biāo)注文本數(shù)據(jù)的雙重加持下,實現(xiàn)深度學(xué)習(xí)模型規(guī)模與性能齊飛,成為人工智能領(lǐng)域的革命性突破。
圍繞LSPTM在海量數(shù)據(jù)、并行計算和模型學(xué)習(xí)能力方面等展開的“軍備競賽”日益白熱化。2023年,OpenAI發(fā)布的預(yù)訓(xùn)練多模態(tài)模型GPT-4已經(jīng)達到了萬億級參數(shù)量的驚人訓(xùn)練規(guī)模,其智能在各種職業(yè)和學(xué)術(shù)考試上的表現(xiàn)與人類水平相當(dāng)。
馬克思認(rèn)為科學(xué)技術(shù)是軍事發(fā)展中最活躍、最具革命性的因素,每一次重大科技進步都深刻影響著世界軍事發(fā)展走向,引發(fā)戰(zhàn)爭形態(tài)和作戰(zhàn)方式的重大變革[1]。超大規(guī)模預(yù)訓(xùn)練模型帶來的人工智能的技術(shù)突破將導(dǎo)致什么樣的軍事變革?本文深度剖析LSPTM的發(fā)展歷程、科學(xué)原理、關(guān)鍵技術(shù)及涌現(xiàn)功能,以軍事體系的關(guān)鍵要素——指揮與控制為對象,以C2過程的基本范式和運行模式框架為指導(dǎo),從物理域、信息域、認(rèn)知域和社會域,全維LSPTM的應(yīng)用場景,闡述LSPTM實現(xiàn)人工智能突破給C2領(lǐng)域發(fā)展帶來的機遇和挑戰(zhàn)。
1LSPTM
1.1 LSPTM發(fā)展歷程
LSPTM一般指在大規(guī)模未標(biāo)注數(shù)據(jù)集上進行預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)(deep neural network)。預(yù)訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)可以通過微調(diào)(fine-tune)、上下文學(xué)習(xí)(in-context learning)等方式適配各種下游任務(wù),并達到最佳性能(state of the art,SOTA)。LSPTM已經(jīng)成為人工智能領(lǐng)域中最具潛力的方向之一。
LSPTM的發(fā)展歷程可以追溯到2017年Vaswani等發(fā)表的論文《Attention Is All You Need》[2],文中提出了Transformer新型神經(jīng)網(wǎng)絡(luò)。Transformer的優(yōu)勢在于設(shè)計自注意力機制(self-attention mechanism),在機器翻譯、文本分類、問答系統(tǒng)等NLP問題中,超越循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)取得了SOTA。隨后Transformer被拓展至計算機視覺(computer vision,CV)、多模態(tài)數(shù)據(jù)等其他任務(wù)中,并同樣取得了優(yōu)異的成績。
在Transformer提出不久后,研究人員開始探索基于Transformer的LSPTM,首先應(yīng)用于NLP任務(wù),隨后拓展至CV和多模態(tài)任務(wù)。由于超大的參數(shù)量和強大的性能,這類LSPTM也被稱之為基石模型(foundation model)、大模型(large/big model)[3]。
1.2典型LSPTM
國內(nèi)外多家高校、研究機構(gòu)和公司已開展了LSPTM的研究,并取得了豐碩的成果,本節(jié)簡要介紹相關(guān)LSPTM,更多關(guān)于LSPTM的介紹和發(fā)展討論可以參考文獻[4]。
1)生成式預(yù)訓(xùn)練Transformer(generative pre-trained transformer,GPT)
2018年,OpenAI提出了GPT。GPT采用自監(jiān)督學(xué)習(xí)(self-supervised learning)訓(xùn)練模型,其首先使用大量文本數(shù)據(jù)進行預(yù)訓(xùn)練,然后針對各種NLP任務(wù)進行微調(diào)[5]。GPT采用了Transformer結(jié)構(gòu),使用了12層解碼器和768個隱藏單元,共有1.17億個參數(shù)。GPT使用的文本數(shù)據(jù)包括維基百科、新聞、書籍等。GPT在英文的文本生成任務(wù)中取得了當(dāng)時的SOTA。GPT-2在GPT的基礎(chǔ)上提升了網(wǎng)絡(luò)規(guī)模,約有15億個參數(shù)和48層Transformer結(jié)構(gòu),訓(xùn)練集為約40 GB的文本數(shù)據(jù)[6]。GPT-3沿著該思路進一步升級,網(wǎng)絡(luò)約有1750億個參數(shù)[7]。今年3月份,OpenAI發(fā)布了約有1.6萬億個參數(shù)的GPT-4。GPT-4除了可以完成更加復(fù)雜的NLP任務(wù),還可處理多模態(tài)數(shù)據(jù),能夠描述不尋常圖像中的幽默、總結(jié)截屏文本以及回答包含圖表的試題。在GPT-4發(fā)布前,OpenAI發(fā)布了第一款面向大眾的LSPTM產(chǎn)品——ChatGPT,提供了堪比真人的交流體驗,引起了全球轟動。
2)基于Transfomer的雙向編碼器表征(bidirectional encoder representations from Transformers,BERT)
2018年,Google提出了NLP模型BERT[8]。相比與其他NLP模型,BERT的不同之處在于采用了雙向的Transformer結(jié)構(gòu),可以同時利用左右兩個方向的上下文信息,從而更好地理解文本。在預(yù)訓(xùn)練任務(wù)中,BERT設(shè)計了遮蔽語言模型(masked language model)和下句預(yù)測(next sentence prediction)兩種任務(wù)。在遮蔽語言模型任務(wù)中,BERT會隨機遮蔽文本中的一些詞匯,然后讓模型預(yù)測這些被遮蔽的詞匯。在下句預(yù)測任務(wù)中,BERT會隨機選擇兩個句子,并讓模型判斷這兩個句子是否為相鄰的兩個句子。標(biāo)準(zhǔn)版的BERT約有3.4億個參數(shù),基本結(jié)構(gòu)為Transformer。BERT在11種NLP任務(wù)上都取得了當(dāng)時的SOTA,是LSPTM的代表之一。
3)對比語言圖像預(yù)訓(xùn)練(contrastive language-image pre-training,CLIP)
在多模態(tài)任務(wù)中,OpenAI于2021年提出了CLIP,用于實現(xiàn)圖像和文本之間的交互理解[9]。CLIP同樣采用了Transformer結(jié)構(gòu),其目標(biāo)是通過預(yù)訓(xùn)練模型,在大規(guī)模的圖像和文本數(shù)據(jù)上學(xué)習(xí)一個通用的視覺和語言表示,從而使得模型能夠同時理解圖像和文本的含義。CLIP的預(yù)訓(xùn)練任務(wù)是通過對圖像和文本之間的對比學(xué)習(xí)來實現(xiàn)的。具體來說,CLIP會將一張圖像和一段文本作為輸入,然后讓模型判斷這個圖像和文本是否相關(guān)。通過這種方式,CLIP能夠?qū)W習(xí)到圖像和文本之間的關(guān)聯(lián)性,從而建立起視覺和語言之間的聯(lián)系。CLIP可以應(yīng)用于各種NLP和CV任務(wù),例如:圖像分類、圖像生成、視覺問答、圖像檢索、文本分類等。與一般的單模態(tài)的NLP和CV模型相比,CLIP的優(yōu)點在于它能夠同時處理
文本和圖像數(shù)據(jù),完成更復(fù)雜的任務(wù)。
4)文心一言
文心一言(ERNIE Bot)是今年3月百度發(fā)布的一款知識增強大語言模型產(chǎn)品,能夠與人對話互動、回答問題、商業(yè)文案創(chuàng)作、數(shù)理邏輯推理、多模態(tài)生成(協(xié)助用戶創(chuàng)作和繪圖),高效地幫助用戶們獲取信息、知識和靈感。文心一言在中文的NLP任務(wù)中具有一定的優(yōu)勢,其基礎(chǔ)LSPTM是ERNIE5。根據(jù)文獻[10],ERNIE中ERNIE 3.0 Titan約有2600億個參數(shù)。ERNIE Titan采用了自監(jiān)督對抗損失(self-supervised adversarial loss)和一個可控語言建模損失(controllable language modeling loss),使ERNIE 3.0 Titan產(chǎn)生可控且具有可信度的文本,ERNIE 3.0 Titan在68個NLP任務(wù)中取得了當(dāng)時的SOTA。
5)盤古
盤古(PanGu)是華為推出的一系列人工智能LSPTM產(chǎn)品,包括NLP大模型、CV大模型、科學(xué)計算大模型。盤古系列大模型于2021年預(yù)先發(fā)布了NLP大模型和CV大模型,沉寂兩年后,今年4月8號將正式發(fā)布相關(guān)產(chǎn)品,首次將Transformer的編碼器和解碼器同時用于LSPTM,保證模型生成能力和理解能力。文獻[11]介紹了華為自然語言LSPTM盤古-α(PanGu-α),展示了盤古NLP大模型的技術(shù)。PanGu-α網(wǎng)絡(luò)參數(shù)量為2 000億。PanGu-α是在MindSpore2下開發(fā)的,并在2 048個Ascend 910人工智能處理器的集群上進行訓(xùn)練。訓(xùn)練的并行策略是基于MindSpore Auto-parallel實現(xiàn)的。此外,華為為增強模型的泛化能力,收集了1.1TB的中文NLP數(shù)據(jù)訓(xùn)練模型。
6)M6
M6是阿里巴巴推出的多模態(tài)大模型產(chǎn)品,目前模型參數(shù)達10萬億以上。M6通過將不同模態(tài)的信息經(jīng)過統(tǒng)一加工處理,沉淀成知識表征,為各個行業(yè)場景提供語言理解、圖像處理、知識表征等智能服務(wù),其M6指多模態(tài)到多模態(tài)多任務(wù)巨型轉(zhuǎn)化器(multi-modality to multimodality multitask mega-transformer)。根據(jù)文獻[12],M6的工作包括構(gòu)建了當(dāng)時最大的中文多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集,其中包括超過1.9 TB的圖像和292 GB的文本,并在一系列下游任務(wù)取得了良好的表現(xiàn),例如電商圖文商品檢索、推薦;智能制造中設(shè)計圖片生成、汽車3D圖片展示;金融行業(yè)摘要和文本生成、數(shù)字感知、點評等等。
2ChatGPT的技術(shù)原理與功能分析
ChatGPT是OpenAI發(fā)布的第一款面向大眾的LSPTM產(chǎn)品,也是GPT系列的代表作之一,發(fā)布即取得了全世界范圍內(nèi)的廣泛關(guān)注,具有里程碑式的意義。本章以ChatGPT為例介紹其相關(guān)原理和方法。由于GPT-2以后GPT模型不再開源,且ChatGPT并無論文,所以主要參考InstructGPT[13]和ChatGPT的博客。
2.1 ChatGPT的技術(shù)原理
與RNN和CNN不同,Transformer在處理數(shù)據(jù)(尤其是時序數(shù)據(jù))時無需按時間順序來處理信息。Transformer利用自注意力機制,能夠同時考慮輸入序列中所有位置的信息,從而能夠更好地捕捉長距離依賴關(guān)系。另外,Transformer還引入位置編碼(position encoding)來保留輸入序列中的位置信息。Transformer結(jié)構(gòu)由編碼器和解碼器兩部分組成。編碼器負(fù)責(zé)將輸入序列編碼為特征表示,而解碼器則將這些特征表示轉(zhuǎn)化為輸出序列。Transfomer更詳細(xì)的介紹可參考論文[14]。
與其他深度神級網(wǎng)絡(luò)不同,增加Transformer的網(wǎng)絡(luò)參數(shù)可以提升其性能,這使得提升網(wǎng)絡(luò)參數(shù)以突破網(wǎng)絡(luò)性能瓶頸成為了可能,因而引領(lǐng)了LSTPM的人工智能潮流。ChatGPT基于Ttransformer框架,基礎(chǔ)模型為GPT-3.5,并采用人類反饋強化學(xué)習(xí)(reinforcement learning from human feedback,RLHF)對模型輸出進行優(yōu)化,實現(xiàn)了真人的交流體驗。
ChatGPT的訓(xùn)練流程如圖1所示,其訓(xùn)練流程大致可分為3步:
Step 1 基于真人回復(fù)示例監(jiān)督訓(xùn)練GPT-3.5;
Step 2 基于真人排序訓(xùn)練獎勵模型;
Step 3 反饋優(yōu)化監(jiān)督訓(xùn)練后的GPT-3.5。
圖1 ChatGPT訓(xùn)練流程
Fig.1The training process of ChatGPT
1)基于真人回復(fù)示例監(jiān)督訓(xùn)練GPT-3.5
針對同一提示,該步基于GPT-3.5的回復(fù)以及人類給出的回復(fù)示例,再采用監(jiān)督學(xué)習(xí)的方式訓(xùn)練GPT-3.5,使其初步產(chǎn)生與人類對話類似的回復(fù)。該步過后的GPT并不完美,但可初步提供具有人類對話感覺的體驗。
2)基于真人排序訓(xùn)練獎勵模型
該步是RLHF的核心步驟之一,其目的是通過神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)真人的價值偏好。針對所有的提示,如果都可以用真人去評價,自然也可以訓(xùn)練得ChatGPT,但這樣無法實現(xiàn)自動化的訓(xùn)練方式,客觀上實現(xiàn)也并不可能。因而需要有個符合真人價值偏好的獎勵模型來評價監(jiān)督訓(xùn)練后GPT-3.5的回復(fù),以糾正其輸出。該步通過對比學(xué)習(xí)的方式實現(xiàn),即真人在多個回復(fù)中,任意對比其中兩個,選出更為偏好的一個,為獎勵模型提供標(biāo)注信息實現(xiàn)監(jiān)督學(xué)習(xí)。該步也是RLHF中引入人類反饋的關(guān)鍵步驟。
3)反饋優(yōu)化監(jiān)督訓(xùn)練后的GPT-3.5
一旦獲得獎勵模型后,監(jiān)督訓(xùn)練后GPT-3.5根據(jù)獎勵模型給出的獎勵自動反饋優(yōu)化模型,最終形成ChatGPT。該步是采用了近端策略優(yōu)化(proximal policy optimization,PPO)強化學(xué)習(xí)算法,是實現(xiàn)ChatGPT的核心,也是與其他LSPTM不同的地方。
ChatGPT是一個典型基于平行智能Hanoi(integrated human, artificial, natural, and organizational intelligence)的LSPTM[4, 15-16],構(gòu)成了人在回路的社會化大閉環(huán)(the grand socialization closed-loop of human in the loop)[4]。ChaGPT中各種要素在實際物理空間和虛擬空間基于中心化自主組織及全中心化自主運行(decentralized autonomous organizations and decentralized autonomous operations,DAO)通訊、組織和協(xié)調(diào)[15],形成了人類、人工、自然和組織智能的有機結(jié)合體,是語言智能范式的代表之一[16]。
2.2 ChatGPT的功能
ChatGPT是一款能夠以文字方式進行自然對話的人工智能模型,其基本功能如圖2所示[8]??梢詮氖赂鞣N復(fù)雜的語言工作,如自然對話、自動摘要、文本生成、自動問答等。在自動文本生成方面,ChatGPT能夠根據(jù)用戶要求生成論文、代碼、劇本、企劃等內(nèi)容。在自動問答方面,它能夠理解用戶提出的問題,并給出相應(yīng)答案。此外,ChatGPT的知識范圍廣泛,涵蓋自然科學(xué)、人文社科、社會科學(xué)、文體娛樂、奇聞趣事等等領(lǐng)域,同時它還能夠掌握用戶的語氣,正確分析文本情感。ChatGPT出色的自動摘要、文本生成能力在C2中會有出色的表現(xiàn),例如:作戰(zhàn)方案生成、敵方意圖分析等等。該部分會在后面詳細(xì)介紹。
圖2ChatGPT的基本功能
Fig.2 Basic functions of ChatGPT
ChatGPT能出色完成上述任務(wù)的能力可能源自復(fù)雜系統(tǒng)涌現(xiàn)現(xiàn)象。復(fù)雜系統(tǒng)涌現(xiàn)現(xiàn)象是指在一個復(fù)雜系統(tǒng)中出現(xiàn)的新的特征或行為,這些特征或行為是由系統(tǒng)中各個組成部分相互作用和協(xié)同作用產(chǎn)生的,不能被簡單地從單個組成部分的行為中預(yù)測或解釋。復(fù)雜系統(tǒng)涌現(xiàn)現(xiàn)象在自然界和人工系統(tǒng)中都廣泛存在,例如自然界中的蜂群、蟻群和鳥群等,人工系統(tǒng)中的交通流、股市和互聯(lián)網(wǎng)等[17]。
在以LSPTM為代表的人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域,涌現(xiàn)現(xiàn)象同樣存在。總體來說,LSPTM的涌現(xiàn)能力可總結(jié)為如下兩種表現(xiàn):1)上下文學(xué)習(xí);2)思維鏈(Chain-of-Thought,CoT),在較小的模型中,上述兩種能力是不具備的。
上下文學(xué)習(xí)是指采用零樣本學(xué)習(xí)(研究人員或用戶給出幾個示例)就可以使LSPTM在不調(diào)整深度神經(jīng)網(wǎng)絡(luò)參數(shù)的情況下很好地處理研究人員給出的任務(wù)。這與根據(jù)下游任務(wù)微調(diào)模型的方式有明顯的不同。在上下文學(xué)習(xí)中,模型參數(shù)不變,說明LSPTM在預(yù)訓(xùn)練階段根據(jù)基本的自然語言任務(wù)已經(jīng)習(xí)得了特定任務(wù)的特征,僅需一些示例就可將該能力激發(fā)出來。
CoT可視為少樣本提示(few shot prompt)推理,即對于某個復(fù)雜的問題,研究人員或用戶分步給LSPTM展示出具體的分析/推導(dǎo)過程,LSPTM根據(jù)展示就可完成一些類似的復(fù)雜推理任務(wù)。CoT在數(shù)學(xué)、物理等自然科學(xué)等問題中表現(xiàn)良好。
3LSPTM在指揮控制領(lǐng)域的應(yīng)用場景分析構(gòu)設(shè)計
3.1 C2過程的基本范式及C2過程產(chǎn)品與技術(shù)分析
C2是軍事體系的關(guān)鍵要素,直接決定戰(zhàn)爭的勝負(fù)。指揮控制活動過程機理存在尺度的關(guān)聯(lián)性[18],戰(zhàn)術(shù)C2、戰(zhàn)役與戰(zhàn)略C2有各自的活動過程機理。戰(zhàn)術(shù)C2以經(jīng)典理論觀察-判斷-決策-行動 (observe, orient, decide, act, OODA)環(huán)[19]為指導(dǎo),在宏觀戰(zhàn)役與戰(zhàn)略尺度上,其C2活動以籌劃-準(zhǔn)備-執(zhí)行-評估 (planning, readiness, execution, assessment, PREA)環(huán)為指導(dǎo),多尺度C2是軍事體系的指揮控制過程的一般機理[20-21]。
多尺度C2過程可描述為多PREA環(huán)與OODA環(huán)的結(jié)合,PREA環(huán)負(fù)責(zé)軍事體系C2活動的宏觀指導(dǎo),其C2活動過程從作戰(zhàn)籌劃、部署準(zhǔn)備、執(zhí)行監(jiān)控到作戰(zhàn)評估與轉(zhuǎn)換活動4個主要環(huán)節(jié)構(gòu)成3個反饋閉環(huán),從態(tài)勢角度,是對態(tài)勢的謀劃設(shè)計、部署和評估;OODA環(huán)負(fù)責(zé)軍事體系的戰(zhàn)術(shù)執(zhí)行的C2活動指導(dǎo),從態(tài)勢角度上,是對態(tài)勢演化的控制,其C2活動從觀察、判斷、決策到行動4個環(huán)節(jié)構(gòu)成一個閉環(huán)。
PREA&OODA構(gòu)成了軍事體系各級指揮與控制活動的基本指導(dǎo),如圖3所示。
圖3 軍事體系C2過程的基本范式:PREA&OODA
Fig. 3 The basic paradigm of the C2 process of the military system: PREA & OODA
軍事體系C2過程的基本范式涵蓋各域的活動,并伴隨相關(guān)產(chǎn)品。在物理域,體現(xiàn)為真實戰(zhàn)場的各種形態(tài),包括基于歷史→未來設(shè)計的戰(zhàn)場、構(gòu)建引導(dǎo)的戰(zhàn)場、實際的戰(zhàn)場以及評估所需要的描述戰(zhàn)場;在信息域,主要體現(xiàn)為演繹態(tài)勢、直前態(tài)勢、實時態(tài)勢和復(fù)盤態(tài)勢4種態(tài)勢所需要的信息產(chǎn)品以及相關(guān)技術(shù);在認(rèn)知域,主要體現(xiàn)為基于意圖的周密決策、基于預(yù)案的審慎決策、基于規(guī)則的快速決策和基于評估效果的轉(zhuǎn)換決策;在社會域,主要體現(xiàn)為政治、經(jīng)濟、文化以及組織形態(tài)的相關(guān)活動,包括政治、經(jīng)濟、文化策略設(shè)計,組織結(jié)構(gòu)關(guān)系設(shè)計,政治、經(jīng)濟、文化引導(dǎo)及軍事組織關(guān)系構(gòu)建,政治、經(jīng)濟、文化及軍事組織協(xié)同,政治、經(jīng)濟、文化影響評估及組織結(jié)構(gòu)關(guān)系效能評估,等等。軍事體系C2過程的關(guān)鍵活動、技術(shù)與產(chǎn)品如圖4所示。
圖4 軍事體系C2過程的關(guān)鍵活動、技術(shù)與產(chǎn)品
Fig. 4Key activities, technologies and products of the C2 process of the military system
3.2 指揮控制領(lǐng)域LSPTM的應(yīng)用場景分析
在上一節(jié)中,C2過程的基本范式描述了C2在物理域、信息域、認(rèn)知域和社會域的具體活動、技術(shù)需求及產(chǎn)品,從ChatGPT-4.0公布的功能看,LSPTM的潛在應(yīng)用體現(xiàn)在C2活動的全過程和各域。
3.2.1 LSPTM在物理域的應(yīng)用
在物理域,C2活動與LSPTM一樣,需要有物理域的憑借和依托,包括真實的戰(zhàn)場環(huán)境和支撐C2活動的算力所需要的計算與存儲設(shè)備。
LSPTM作為通用人工智能工具,在物理域上有大規(guī)模計算與存儲設(shè)備支撐其算力,同樣,C2活動在物理域也需要相關(guān)的系統(tǒng)與設(shè)備支撐,LSPTM對C2活動在物理域的應(yīng)用主要體現(xiàn)在3個方面:1)通用人工智能進入C2系統(tǒng),可大幅度減少C2系統(tǒng)對一般算力的設(shè)備需求,如LSPTM能提供的翻譯、自動對話、文本生成等通用智能都不需要C2系統(tǒng)再配置相應(yīng)的計算與存儲設(shè)備,LSPTM的應(yīng)用為小型無人作戰(zhàn)平臺、小規(guī)模無人集群等輕量級C2智能系統(tǒng)的物理配置提供了條件;2)LSPTM的算力與存儲設(shè)備的配置與應(yīng)用,可為C2系統(tǒng)的設(shè)計提供借鑒和參考,尤其是跨域聯(lián)合的大型有人與無人結(jié)合的C2系統(tǒng);3)在戰(zhàn)場環(huán)境方面,LSPTM可用于構(gòu)建C2訓(xùn)練環(huán)境,支持C2對抗的戰(zhàn)場環(huán)境從物理狀態(tài)向描述戰(zhàn)場、預(yù)測戰(zhàn)場和引導(dǎo)戰(zhàn)場的持續(xù)演化。
3.2.2 LSPTM在信息域的應(yīng)用
在C2基本范式中,信息域的主要活動包括各類情報產(chǎn)品的獲取、處理,歷史數(shù)據(jù)的統(tǒng)計與分析處理,各類傳感器數(shù)據(jù)的獲取和融合處理,基于實時數(shù)據(jù)的預(yù)測與預(yù)報產(chǎn)品處理,以及行動過程的數(shù)據(jù)采集及態(tài)勢復(fù)盤信息處理,等等,針對信息域的這些活動及產(chǎn)品技術(shù),LSPTM的潛在應(yīng)用有正向應(yīng)用和逆向應(yīng)用,正向應(yīng)用以支持C2在信息域的相關(guān)活動,主要體現(xiàn)在3個方面:1)信息不完備條件下的推理,如根據(jù)動向情報進行關(guān)聯(lián)分析,推理敵方的行動規(guī)律;2)信息在大規(guī)模條件下的挖掘,如對大數(shù)據(jù)的分析技術(shù);3)信息在不確定條件下的分析,如情報信息的相互應(yīng)證分析。相反,對確定的信息、完備的信息以及小規(guī)模數(shù)據(jù)的分析,LSPTM的應(yīng)用與傳統(tǒng)C2系統(tǒng)的相關(guān)技術(shù)并存在特別的優(yōu)勢,如小尺度的推算與推演、實時態(tài)勢數(shù)據(jù)的融合以及行動過程數(shù)據(jù)采集與復(fù)盤技術(shù),等等,在這些方面,傳統(tǒng)C2系統(tǒng)仍然存在技術(shù)優(yōu)勢。
LSPTM在信息域還有另外一種重要應(yīng)用,即逆向應(yīng)用。LSPTM的逆向應(yīng)用場景包括生成不同模態(tài)的虛假內(nèi)容,包括文本、語音、視頻等等,造成以假亂真的信息傳播,以欺騙對手,其生成虛擬內(nèi)容可以是動向情報信息、歷史統(tǒng)計數(shù)據(jù),也可以是虛擬的預(yù)測與預(yù)報數(shù)據(jù),實時感知數(shù)據(jù)以及作戰(zhàn)行動過程數(shù)據(jù),等等。所有這些生成的虛擬數(shù)據(jù),可對敵方的認(rèn)知活動造成干擾,從而影響其決策的正確性或延誤其決策時機。
3.2.3 LSPTM在認(rèn)知域的應(yīng)用
以ChatGPT為代表的LSPTM已經(jīng)具備人類無法理解的推理能力。LSPTM在認(rèn)知域的對抗是最具潛力的應(yīng)用領(lǐng)域[23],認(rèn)知戰(zhàn)是LSPTM未來的主戰(zhàn)場。LSPTM在認(rèn)知域的潛在應(yīng)用包括7個方面。
1)意圖理解/識別
LSPTM的語言與文本解析功能可用于無人作戰(zhàn)系統(tǒng)對有人指揮意圖的理解,包括對作戰(zhàn)構(gòu)想的理解、作戰(zhàn)命令或作戰(zhàn)計劃的解析或者作戰(zhàn)指令的解碼,等等。
另一方面,LSPTM的圖形場景分析功能可用于對敵行動意圖的識別,如基于作戰(zhàn)情況圖或作戰(zhàn)經(jīng)過圖,識別敵方行動的意圖,為指揮員的判斷提供支持。
2)基于演繹態(tài)勢的推理與周密決策技術(shù)
LSPTM具備事件關(guān)聯(lián)與邏輯推理能力,這一功能可用于動向情報分析和歷史統(tǒng)計數(shù)據(jù)分析,通過LSPTM的推理分析,從歷史構(gòu)建未來的演繹態(tài)勢;同時,在構(gòu)建演繹態(tài)勢過程中,提出相關(guān)的假設(shè);基于假設(shè),提出相應(yīng)的解決問題方案,即作戰(zhàn)構(gòu)想和作戰(zhàn)預(yù)案。
3)基于預(yù)案匹配的審慎決策技術(shù)
在意圖識別基礎(chǔ)上,LSPTM可進一步支持基于預(yù)案匹配的審慎決策。一方面,LSPTM強大的邏輯推理可對態(tài)勢進行預(yù)判,基于預(yù)判匹配各類預(yù)案,對匹配的預(yù)案進行風(fēng)險和收益評估,為指揮員的決心提供支持。
4)基于實時態(tài)勢的威脅判斷技術(shù)
在計劃執(zhí)行的實時對抗過程中,LSPTM的強大計算推理功能可用于支持目標(biāo)的快速跟蹤識別和威脅判斷,為不同主體的OODA環(huán)提供運行支持。
5)基于規(guī)則的快速決策技術(shù)
在計劃執(zhí)行的實時對抗過程中,LSPTM的強大算力可支持指揮主體的快速決策,如戰(zhàn)術(shù)規(guī)則的快速匹配,或者實施平行推演,快速組織規(guī)則的重建,為不同主體的OODA環(huán)提供決策和平行行動的支持。
6)事件的識別與響應(yīng)技術(shù)
當(dāng)不確定事件發(fā)生時,LSPTM的意圖理解與識別功能可用于支持事件的響應(yīng)與處置,包括事件的觀察、事件的識別、事件影響的評估,并提供事件處置的方案建議,輔助指揮員的臨機決策。
7)基于復(fù)盤態(tài)勢的行動效果評估技術(shù)
LSPTM在大(時間)尺度上的記錄分析可用于作戰(zhàn)過程的數(shù)據(jù)采集和復(fù)盤分析,其模式匹配與識別功能可進行初始態(tài)勢和當(dāng)前態(tài)勢的一致性分析,從而支持指揮主體對作戰(zhàn)行動效果的評估分析。
3.2.4 LSPTM在社會域的應(yīng)用
C2在社會域的活動以解決多主體在任務(wù)上的高效協(xié)同為目標(biāo),其主要活動包括團隊文化的宣傳與思政教育、C2組織結(jié)構(gòu)的設(shè)計以及協(xié)同計劃的制定和實施等等。
1)組織文化的宣傳與思政教育
LSPTM的方案編寫、文本與視頻制作等功能可用于組織文化的宣傳與思政教育,指揮機構(gòu)的政治工作在確定方案主旨的基礎(chǔ)上,可運用LSPTM,根據(jù)戰(zhàn)場實際情況快速編寫宣傳方案,并生成相應(yīng)的文本或視頻,進行戰(zhàn)地宣傳教育。
2)基于任務(wù)的團隊設(shè)計構(gòu)建以及敵方C2組織結(jié)構(gòu)的識別
LSPTM強大的算力可替代傳統(tǒng)團隊設(shè)計技術(shù),一方面用于己方團隊的設(shè)計構(gòu)建,根據(jù)作戰(zhàn)任務(wù)的需求設(shè)計科學(xué)的團隊組織;另一方面,可進行逆向設(shè)計,對敵方戰(zhàn)場的C2組織進行結(jié)構(gòu)的辨識,從而分析其關(guān)鍵的C2結(jié)構(gòu)和力量。
3)多智能體的自適應(yīng)編組、協(xié)同決策與協(xié)同控制技術(shù)
LSPTM的通用智能可用于支持群體智能技術(shù),包括多智能體的自適應(yīng)編組、協(xié)同決策與協(xié)同控制,如空中無人機群、海上無人集群以及陸上跨域無人作戰(zhàn)系統(tǒng)等等,這些無人作戰(zhàn)體系在完成復(fù)雜作戰(zhàn)任務(wù)的快速編組與協(xié)同,LSPTM可替代傳統(tǒng)的智能優(yōu)化算法。
3.3 LSPTM在C2活動過程應(yīng)用的潛力比較分析
在C2范式中,LSPTM對C2活動的支持并不均衡,在不同的閉環(huán)中有不同的應(yīng)用潛力,如圖5所示。
圖5 LSPTM在PREA環(huán)的4個階段運用的潛力比較
Fig. 5 Comparison of the potential applicationof LSPTM in the fourstages of the PREA loop
從圖中可以看出,LSPTM應(yīng)用更多潛力并不在作戰(zhàn)計劃執(zhí)行環(huán)節(jié)的OODA環(huán),而是在PREA環(huán)的作戰(zhàn)籌劃和準(zhǔn)備環(huán)節(jié),在作戰(zhàn)籌劃準(zhǔn)備環(huán)節(jié),其應(yīng)用包括作戰(zhàn)任務(wù)分析、作戰(zhàn)意圖的理解和識別、情報獲取和處理分析、態(tài)勢的預(yù)測與預(yù)判斷、作戰(zhàn)構(gòu)想與作戰(zhàn)方案的生成等等,這些應(yīng)用的背景是戰(zhàn)場具有太多的不確定性,存在各種假設(shè),需要進行推演評估生成相應(yīng)的方案預(yù)案,這些問題都是傳統(tǒng)智能算法表現(xiàn)不佳或者根本無法解決的問題,只有LSPTM在強大的算力與數(shù)據(jù)支撐條件下才有可能突破解決。
從3.2節(jié)LSPTM在物理域、信息域、認(rèn)知域與社會域4個域應(yīng)用分析看,LSPTM的強大功能表現(xiàn)并不在物理域、信息域,而是認(rèn)知域和社會域,其中認(rèn)知域?qū)SPTM的需求最為強烈,究其原因在于認(rèn)知技術(shù)是智能的終極體現(xiàn),C2在認(rèn)知域的活動最為關(guān)鍵,同樣,對智能技術(shù)的支持也最為強烈,過去關(guān)于C2系統(tǒng)研發(fā)的關(guān)鍵和難點也在認(rèn)知的輔助功能,包括態(tài)勢與意圖的理解、行動的規(guī)劃以及輔助決策技術(shù)等等。
4C2領(lǐng)域發(fā)展的機遇與挑戰(zhàn)
馬克思主義認(rèn)為科學(xué)技術(shù)是軍事發(fā)展中最活躍、最具革命性的因素,每一次重大科技進步都深刻影響著世界軍事發(fā)展走向,引發(fā)戰(zhàn)爭形態(tài)和作戰(zhàn)樣式的重大變革。人工智能領(lǐng)域LSPTM的技術(shù)突破將帶來C2哪些方面的變革?
1)C2對抗形式:從真實戰(zhàn)場轉(zhuǎn)向虛擬戰(zhàn)場,不戰(zhàn)而屈人之兵成為未來戰(zhàn)爭的常態(tài)
LSPTM為虛擬戰(zhàn)場的構(gòu)建與對抗推演提供了條件,沖突雙方可在虛擬戰(zhàn)場展開C2對抗,既可實現(xiàn)實力的較量,同時又避免現(xiàn)實沖突的損失與傷亡。
2)C2方式:集中籌劃與控制
未來戰(zhàn)場,中心C2的集中籌劃與集中控制將成為未來C2方式,LSPTM強大的算力與智力彌補了過去指揮主體——人的局限性,指揮員的參謀團隊逐漸被各種角色的LSPTM替代,戰(zhàn)場超強大腦可輔助指揮員實施集中籌劃和控制。
3)C2手段:戰(zhàn)術(shù)C2系統(tǒng)的無人化,中心C2系統(tǒng)實現(xiàn)有人與無人混合智能
LSPTM可替代戰(zhàn)術(shù)指揮員,戰(zhàn)術(shù)C2系統(tǒng)將逐漸退出人在回路的閉環(huán),實現(xiàn)OODA環(huán)的智能閉環(huán),邊緣戰(zhàn)術(shù)C2實現(xiàn)中心C2指導(dǎo)下的自主行為;同時,傳統(tǒng)的中心C2根據(jù)角色和內(nèi)容訓(xùn)練LSPTM,實現(xiàn)機構(gòu)精簡和業(yè)務(wù)活動的智能轉(zhuǎn)型,實現(xiàn)有人與無人的混合智能。
4)C2技術(shù):從領(lǐng)域細(xì)分轉(zhuǎn)向融合通用智能
C2技術(shù)領(lǐng)域分布廣,從物理域的計算設(shè)備,到社會域的網(wǎng)絡(luò)分析,學(xué)科交叉與跨域是C2手段建設(shè)的難點所在。LSPTM通用智能可實現(xiàn)跨域技術(shù)的融合,未來C2技術(shù)將逐步統(tǒng)一至LSPTM的算力與數(shù)據(jù)。
人工智能時代,C2從對抗形式到技術(shù)的變革是未來軍事制高點,搶占這一制高點需要加速LSPTM的建設(shè)與應(yīng)用,LSPTM盡管不存在技術(shù)上障礙,然而,LSPTM所依賴的其他條件是C2領(lǐng)域未來發(fā)展的挑戰(zhàn)。
挑戰(zhàn)1:LSPTM通用智能發(fā)展的挑戰(zhàn)。在LSPTM建設(shè)應(yīng)用上,ChatGPT獨占鰲頭,盡管國內(nèi)有百度的文心一言、華為的盤古及阿里巴巴的M6等產(chǎn)品,與ChatGPT的智能相比較,還存在較大的差距。
挑戰(zhàn)2:LSPTM在C2領(lǐng)域發(fā)展的挑戰(zhàn)。LSPTM在通用智能上的縱向突破是橫向發(fā)展基礎(chǔ)。軍事C2領(lǐng)域的LSPTM需要通用智能的突破,這是基礎(chǔ)和前提,國內(nèi)LSPTM建設(shè)在通用智能產(chǎn)品上存在差距,其人機交互體驗不盡友好。
挑戰(zhàn)3:LSPTM的算力與數(shù)據(jù)支持。算力與數(shù)據(jù)是LSPTM發(fā)展的基礎(chǔ),在算力上,硬件芯片發(fā)展與C2系統(tǒng)的輕量化發(fā)展是矛盾對立面,在數(shù)據(jù)上,LSPTM需要大量的訓(xùn)練標(biāo)注樣本,軍事領(lǐng)域的數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)不同,存在孤立性、保密性,如何圍繞LSPTM建設(shè)的需求展開軍事領(lǐng)域的數(shù)據(jù)建設(shè)與訓(xùn)練實施,這是挑戰(zhàn)之一。
挑戰(zhàn)4:LSPTM的應(yīng)用的倫理與安全。從測試看,ChatGPT已具備一定程度上的自我意識,與ChatGPT的溝通需要掌握對話技藝。LSPTM成熟產(chǎn)品一旦應(yīng)用于軍事C2領(lǐng)域,不可避免帶來倫理安全問題。如何應(yīng)用LSPTM獲取未來C2對抗的優(yōu)勢,同時,減小LSPTM應(yīng)用可能帶來的安全風(fēng)險,LSPTM在軍事C2領(lǐng)域的挑戰(zhàn)。
5結(jié)論與展望
本文以C2活動過程的基本范式為指導(dǎo),分析了LSPTM在軍事C2領(lǐng)域的潛在應(yīng)用,包括物理域、信息域、認(rèn)知域和社會域C2活動的主要應(yīng)用,指揮與控制作為軍事力量的關(guān)鍵要素,對人工智能建設(shè)的需求最為強烈,因此,LSPTM在指揮與控制領(lǐng)域的潛在應(yīng)用是廣泛的,涵蓋了從PREA到OODA的全過程、多尺度。從應(yīng)用場景分析看,LSPTM的關(guān)鍵作用突顯在基本范式的“籌劃準(zhǔn)備”環(huán)節(jié),大量的態(tài)勢認(rèn)知、研判、意圖理解與任務(wù)規(guī)劃等活動都是LSPTM應(yīng)用的典型場景,從C2 4個域的維度分析看,最具潛力的運用在認(rèn)知域,LSPTM可以成為C2主體認(rèn)知活動理想的工具和手段。
C2領(lǐng)域LSPTM的建設(shè)既是機遇,同樣也面臨挑戰(zhàn)。在機遇上,可以通過LSPTM的建設(shè),彌補常規(guī)武器裝備建設(shè)上的差距,以智能優(yōu)勢彌補裝備技術(shù)劣勢;在挑戰(zhàn)上,需要解決LSPTM在C2領(lǐng)域的算力支持、領(lǐng)域數(shù)據(jù)與訓(xùn)練支持以及LSPTM運用帶來的倫理安全等問題。這些問題是本課題研究的未來方向。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100772 -
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238511 -
數(shù)學(xué)模型
+關(guān)注
關(guān)注
0文章
83瀏覽量
11935
原文標(biāo)題:超大預(yù)訓(xùn)練模型在指揮控制領(lǐng)域的應(yīng)用與挑戰(zhàn)
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論