OpenAI在6月25日凌晨宣布,將從7月9日起,將阻止來自不支持其服務(wù)的國家和地區(qū)的API流量,而中國也在禁用名單之列。
消息一出,國產(chǎn)大模型們應(yīng)聲而動,立刻推出了相應(yīng)的“搬家”或“遷移”方案。有的還提出了與OpenAl 使用規(guī)模對等的 Token 贈送計劃(不設(shè)上限),坊間戲稱,“這下中國做AI的可以實現(xiàn)token自由了”。
我們知道,海外對于中國AI的限制一直存在。但此前針對AI的禁令,主要是限制英偉達(dá)和AMD的高性能AI算力卡,而OpenAI此次強(qiáng)勢禁用,則讓AI軟件算法層面的“另一只靴子落地”。
從硬件到軟件,越來越擴(kuò)大的禁用范圍,以及越來越嚴(yán)格的限制,無時無刻不在提醒著我們,在AI這一關(guān)鍵科技領(lǐng)域,全方位阻隔中國的進(jìn)步,已經(jīng)是一張明牌了。
面對這個不可逆的AI封鎖大趨勢,中國企業(yè)受的影響到底有多大?AI全面國產(chǎn)化,中國做好準(zhǔn)備了嗎?
放棄幻想:OpenAI禁用到底影響了誰?
自ChatGPT發(fā)布以來,OpenAI的API已向近190個國家和地區(qū)開放,其中并不包括中國。不過,一直以來,一些國內(nèi)企業(yè)和用戶,可以通過技術(shù)手段來繼續(xù)使用OpenAI的服務(wù)。
對于這些來自中國的流量,OpenAI并非檢測不出,只是以前可能“槍口抬高了一寸”。
而就在6月22日,美國財政部發(fā)布了一份規(guī)則草案,進(jìn)一步限制美國個人和企業(yè)投資中國的半導(dǎo)體、量子計算和人工智能業(yè)務(wù)。新規(guī)則草案推出,面對越來越明確的AI封鎖態(tài)勢,OpenAI也主動明哲保身,選擇了加強(qiáng)區(qū)域限制,采取額外措施阻止來自不受支持地區(qū)的API流量。
到底是什么人和公司“明知不可為而為之”,在使用OpenAI的API呢?主要有三類:
一是部分自研模廠。一部分模廠會在研發(fā)階段,調(diào)用OpenAI的API,使用其GPT產(chǎn)品進(jìn)行模型訓(xùn)練、數(shù)據(jù)對比迭代等。實際上,谷歌Gemini-Pro大模型的訓(xùn)練也曾用到了百度文心生成的數(shù)據(jù)。此前就有國內(nèi)某互聯(lián)網(wǎng)公司,被爆出經(jīng)常達(dá)到OpenAI API的最大訪問上限,不過對方也表示,僅在年初的初期探索階段使用了OpenAI的API,而在今年4月已經(jīng)停止了這種做法。
二是套殼AI公司。一些初創(chuàng)公司為了快速推出AI產(chǎn)品或服務(wù),可以通過技術(shù)手段,對OpenAI的API進(jìn)行封裝,“改頭換面”作為自己的產(chǎn)品推向市場。實際上用戶的每次交互,都會通過API調(diào)用OpenAI的模型來完成。
三是面向海外市場的應(yīng)用開發(fā)者。在OpenAI所支持的國家和地區(qū),為了跟海外開發(fā)者“站在同一起跑線”,而選擇OpenAI API。
目前來看,上述群體受OpenAI禁令的影響程度都不高。
隨著國內(nèi)模廠的模型基本完善,不用再通過調(diào)用API的方式收集數(shù)據(jù)。海外應(yīng)用的開發(fā),應(yīng)用往往需要對本地市場的深入了解,因此國內(nèi)開發(fā)者數(shù)量規(guī)模也較小。相比之下,“套殼API”的初創(chuàng)公司可能受到的打擊是最大的,不過通過“搬家”切換到國產(chǎn)大模型,快速找到能力接近的替代方案,也能一定程度上規(guī)避風(fēng)險。
所以總體來說,OpenAI更嚴(yán)格的API限制,并不會給中國AI帶來很大的動蕩。
但這并不意味著,中國AI可以高枕無憂了。從“英偉達(dá)禁令”到“OpenAI禁令”,發(fā)出了一個鮮明的信號:“潘多拉魔盒”一旦開啟,就不會關(guān)上,針對中國AI的封鎖,也不可能在短時間內(nèi)被撤回。
是時候摒棄“槍口抬高一寸”的僥幸心理和幻想了,事實證明,槍口隨時可以朝下扣動扳機(jī)。
認(rèn)清現(xiàn)實:不可逆的AI封鎖,還有哪些牌可出?
在封鎖烈度上,美國官方和AI企業(yè)的行動在不斷加強(qiáng);在封鎖廣度上,從高性能AI芯片的底層算力,到大模型的底層算法,“釜底抽薪式”的封鎖正逐漸延伸到AI基礎(chǔ)設(shè)施的各個關(guān)鍵部分。
那么,在算力禁運(yùn)、算法禁用之后,海外想要阻隔中國AI的發(fā)展,還有哪些牌可以打?梳理一下AI軟件基礎(chǔ)設(shè)施:
框架。深度學(xué)習(xí)框架,是支持AI算法模型開發(fā)和部署的軟件平臺,對AI應(yīng)用的開發(fā)效率和性能有重要影響。目前國內(nèi)深度學(xué)習(xí)框架市場主要由飛槳(由百度開發(fā))、TensorFlow(由Google開發(fā))、PyTorch(由Meta開發(fā))三家主導(dǎo),共同占據(jù)了超過80%的市場份額。這三家均為開源框架,允許開發(fā)者自由地查看、修改和使用其源代碼,不過TensorFlow、PyTorch作為開源平臺也需要遵守所在國法律法規(guī),并可以通過開源許可證等方式,限制開發(fā)者的訪問。
2.算子庫。包含各種數(shù)學(xué)和邏輯運(yùn)算函數(shù)的庫,在深度學(xué)習(xí)框架中扮演著至關(guān)重要的角色,為各種算法提供了基礎(chǔ)的計算單元。如果算子庫是閉源的,又歸屬于海外公司,那么可以直接限制使用。開源的算子庫也要遵循一定的開源協(xié)議,協(xié)議中往往會規(guī)定代碼的使用、修改和分發(fā)規(guī)則,如果開發(fā)者沒有獲得適當(dāng)?shù)脑S可或權(quán)限,也無法使用。目前,國內(nèi)飛槳、昇思等AI開發(fā)平臺都發(fā)布了算子庫。
3.數(shù)據(jù)集。AI界有句名言“garbage in,garbage out(垃圾進(jìn),垃圾出)”,高質(zhì)量的數(shù)據(jù)集,對于AI算法模型的性能至關(guān)重要,在大模型時代也不例外。各個領(lǐng)域和應(yīng)用場景都有專有數(shù)據(jù)集,比如計算機(jī)視覺領(lǐng)域的MNIST、CIFAR、ImageNet等。NLP領(lǐng)域的SQuAD、GLUE等,再比如AI蛋白質(zhì)結(jié)構(gòu)預(yù)測任務(wù)所需要的數(shù)據(jù)集,如CASP、AlphaFold DB、PDB等,這些數(shù)據(jù)集為AI研究提供了豐富的數(shù)據(jù)資源,大多由海外研究機(jī)構(gòu)建立。
近年來,中國AI領(lǐng)域的高質(zhì)量數(shù)據(jù)集也在快馬加鞭地建設(shè),數(shù)據(jù)治理體系也在不斷完善,數(shù)據(jù)作為核心生產(chǎn)要素的戰(zhàn)略地位不斷提升。但現(xiàn)階段,與海外一流水平還有差距。而AI算法的特別之處在于,不像傳統(tǒng)軟件能一次開發(fā)完成,模型需要不斷學(xué)習(xí)、迭代和進(jìn)化,依賴于持續(xù)更新的數(shù)據(jù)集進(jìn)行訓(xùn)練。一旦數(shù)據(jù)集被阻止訪問,就如同剝奪了模型成長的土壤,甚至可能變得停滯不前。
此外還有編譯器、IDE等,這些軟件工具可以大大提高開發(fā)者的編程效率。如果被禁用,開發(fā)者將需要手動完成這些工作,從而導(dǎo)致開發(fā)效率降低,團(tuán)隊協(xié)作困難,甚至影響項目的進(jìn)度和質(zhì)量。
“英偉達(dá)禁令”執(zhí)行以后,一位國內(nèi)某計算廠商向腦極體表示,“雖然我們還可以用特供版的AI芯片,但確實支持不了英偉達(dá)最新的平臺了”。
所以說,硬件、軟件基礎(chǔ)設(shè)施共同構(gòu)成了AI產(chǎn)業(yè)的支撐體系。面對阻隔中國AI的封鎖禁令,一定要有“底線思維”,軟件并不比硬件更安全,開源軟件并不比閉源軟件更安全。
準(zhǔn)備應(yīng)對:中國AI,必須兩條腿走路
提到國產(chǎn)化替代,總有人擔(dān)憂這是在閉門造車、與世界脫節(jié)。AI作為高度全球化的高新技術(shù)產(chǎn)業(yè),這種擔(dān)憂確實不無道理。
但也必須看到,“沒有一次AI斷鏈?zhǔn)俏覀兿葎拥氖帧薄?/p>
實際上,中國AI產(chǎn)學(xué)界始終保持著開放心態(tài),積極吸收國際先進(jìn)技術(shù),與世界接軌。斯坦福大學(xué)發(fā)布的《2024 年人工智能指數(shù)報告》顯示,自2011年以來,GitHub上的開源人工智能項目,中國參與度不斷增長,直到2019年在科技領(lǐng)域遭受不合理打壓之后,才開始走低。
無論是芯片禁運(yùn),還是API禁用,都是海外以“國家安全”“保證美國AI領(lǐng)先地位”等理由,發(fā)起的單方面阻隔。而在短時間內(nèi),這種單方面動手的“AI封鎖”,并不會告一段落。
這種情況下,中國AI將面臨一個重要抉擇:是徹底國產(chǎn)化替代,底層軟硬件全用自己的?還是繼續(xù)參與全球AI大市場,更多利用國外技術(shù)?
小孩子才做選擇,成年人全都要。中國AI,必須學(xué)會“兩條腿走路”。
第一條腿,是基礎(chǔ)軟硬件的自主創(chuàng)新,做好全棧AI技術(shù)國產(chǎn)化的準(zhǔn)備。
中國AI在底層軟硬件的關(guān)鍵“卡脖子”環(huán)節(jié),都積累了不少力量。以軟件為例,百度、華為云等頭部大模型廠商,都建立了“AI大底座”,從底層算力(百度昆侖、華為昇騰)、基礎(chǔ)模型(文心、盤古)、深度學(xué)習(xí)框架(飛槳、昇思)、全棧AI開發(fā)工具平臺(千帆平臺、昇騰AI云服務(wù))等。
這些全棧自研的AI軟硬件基礎(chǔ)設(shè)施,可以讓中國AI做好“最壞的準(zhǔn)備”,無懼來自海外的斷鏈風(fēng)險。
但正如經(jīng)濟(jì)學(xué)家江小涓所說的,在當(dāng)今科技全球化、產(chǎn)業(yè)全球化的格局下,“會做的全部自己做”并不是最優(yōu)選項。
所以中國AI的第二條腿,是保持與全球最新趨勢的緊密聯(lián)系,確保信息通暢、創(chuàng)新同步。
還記得芯片禁運(yùn)之時,有網(wǎng)友義憤填膺地表示要“對等制裁”“不用也沒有損失”,但一位資深從業(yè)者卻說“別人小心眼,我們自己不能小心眼”。美國封閉但我們不能封閉,不能自己把路走窄了。
緊密貼近全球趨勢、充分利用全球資源,是中國AI保持領(lǐng)先的必要條件。一方面,吸收全球最先進(jìn)的技術(shù),中國AI可以在更高的起點(diǎn)上推動技術(shù)自主創(chuàng)新,避免產(chǎn)業(yè)鏈割裂帶來方向迷失,錯過主流的AI發(fā)展機(jī)會。
另一方面,中國AI是科技競賽中排名全球前列的一個領(lǐng)域,這種領(lǐng)先優(yōu)勢十分關(guān)鍵,且不容失去,必須與全球創(chuàng)新保持同步,因此要積極擁抱國際市場和科技合作。
隨著國產(chǎn)算力的突破,“英偉達(dá)禁令”不再讓AI算力束手無策,就在大家覺得中國AI穩(wěn)了的時候,OpenAI的禁令猶如一道閃電,劃破了中國AI界對“限AI=限卡”的幻想。
國產(chǎn)算力固然是底氣所在,但絕非高枕無憂的保證,來自O(shè)penAI的API限制說明,海外AI軟件也并不完全可靠,同理,開源軟件也并非絕對安全的屏障。
AI產(chǎn)業(yè)鏈封鎖,如同懸在頭頂?shù)倪_(dá)摩克利斯之劍。但換個角度看,逐漸加碼的禁令,恰恰是之前的措施勞而無功,沒能起到徹底阻攔中國AI進(jìn)步的效果,這也間接反映出中國AI產(chǎn)業(yè)的生存活力,是不會輕易被阻隔在世界之外的。
中國AI,唯有認(rèn)清現(xiàn)實,把一張張產(chǎn)業(yè)鏈王牌都握在自己手心里,才能繼續(xù)留在全球大市場的牌桌上。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
456文章
51002瀏覽量
425204 -
API
+關(guān)注
關(guān)注
2文章
1506瀏覽量
62205 -
AI
+關(guān)注
關(guān)注
87文章
31223瀏覽量
269579 -
算力
+關(guān)注
關(guān)注
1文章
999瀏覽量
14875 -
OpenAI
+關(guān)注
關(guān)注
9文章
1103瀏覽量
6597
發(fā)布評論請先 登錄
相關(guān)推薦
評論