人工智能 | 深度學(xué)習(xí) |GPT-4
文心一言 | 機(jī)器學(xué)習(xí) | ChatGPT
隨著科技的不斷發(fā)展,人工智能技術(shù)已經(jīng)成為了當(dāng)今社會的熱門話題。人工智能技術(shù)的應(yīng)用范圍越來越廣泛,不僅在工業(yè)、醫(yī)療、金融等領(lǐng)域得到了廣泛應(yīng)用,而且在人們的日常生活中也越來越常見。在這個人工智能時代,人們對于人工智能技術(shù)的發(fā)展和應(yīng)用也越來越關(guān)注。而在這個時代,AIGC成為了人工智能時代的新引擎。
AIGC即AI Generated Content,是指利用人工智能技術(shù)來生成內(nèi)容,AIGC也被認(rèn)為是繼UGC、PGC之后的新型內(nèi)容生產(chǎn)方式,AI繪畫、AI寫作等都屬于AIGC的分支。AIGC的投資領(lǐng)域主要包括人工智能、機(jī)器學(xué)習(xí)、自然語言處理、計算機(jī)視覺等領(lǐng)域。這些領(lǐng)域都是人工智能技術(shù)的核心領(lǐng)域,也是未來人工智能技術(shù)發(fā)展的重要方向。在這些領(lǐng)域,AIGC已經(jīng)投資了多家創(chuàng)新企業(yè),并且取得了不俗的成績。這些企業(yè)涉及的領(lǐng)域包括智能制造、智能醫(yī)療、智能金融、智能交通等,都是人工智能技術(shù)應(yīng)用的典型案例。
AIGC的投資理念是“投資未來,引領(lǐng)變革”。這個理念體現(xiàn)了AIGC對于人工智能技術(shù)的信心和追求。在AIGC看來,人工智能技術(shù)是未來的引擎,可以推動社會的進(jìn)步和發(fā)展。而AIGC作為人工智能領(lǐng)域的投資機(jī)構(gòu),希望通過投資和支持創(chuàng)新企業(yè),引領(lǐng)人工智能技術(shù)的變革和發(fā)展。
在人工智能時代,AIGC成為了人工智能技術(shù)的新引擎。通過投資和支持創(chuàng)新企業(yè),AIGC推動了人工智能技術(shù)的發(fā)展和應(yīng)用,為人工智能時代的到來做出了貢獻(xiàn)。未來,AIGC將繼續(xù)堅(jiān)持“投資未來,引領(lǐng)變革”的理念,為人工智能技術(shù)的發(fā)展和應(yīng)用不斷注入新的動力。本文將從AIGC的角度,探討人工智能時代的新引擎。
從上網(wǎng)到上算
由網(wǎng)絡(luò)世界至虛擬現(xiàn)實(shí)
隨著服務(wù)器和網(wǎng)絡(luò)的發(fā)展,人人都可以“上網(wǎng)”,而算力和算法的進(jìn)步將開啟人人“上算”的時代。人工智能將以場景、應(yīng)用和內(nèi)容來創(chuàng)造用戶的新需求,而元宇宙則將包含現(xiàn)實(shí)物理世界,成就真正的虛擬現(xiàn)實(shí)。在這個背景下,我們建立了一個研究框架,其中包含四層嵌套關(guān)系。首先,人工智能和虛擬現(xiàn)實(shí)都屬于技術(shù)層面。其次,人形機(jī)器人/腦機(jī)接口和元宇宙分別代表了智能最終實(shí)現(xiàn)的兩種技術(shù)路徑——混合平臺和重構(gòu)時空。人形機(jī)器人和腦機(jī)接口是混合平臺這一路徑上的不同工程方案,以機(jī)器和人為載體去構(gòu)建混合平臺。第三,相較于人形機(jī)器人和腦機(jī)接口,元宇宙是智能真正實(shí)現(xiàn)的內(nèi)在部分。最后,元宇宙的建設(shè)過程是上半場,而囊括現(xiàn)實(shí)物理世界的過程則是下半場,最終實(shí)現(xiàn)虛擬現(xiàn)實(shí)。
AIGC將成為Web3.0/元宇宙時代的內(nèi)容供給范式之一。目前ChatGPT、AI繪畫均為AIGC的應(yīng)用范疇。隨著Web3.0/元宇宙時代內(nèi)容的快速增長,依靠PGC/UGC的供給有限,低成本高效率的AIGC將成為重要的內(nèi)容供給方式之一。當(dāng)前ChatGPT、AI繪畫的突出表現(xiàn)打開了人們對于AI生成式內(nèi)容的想象空間,我們推演,AIGC的終極是以內(nèi)核為AI,依場景需求借助一定的硬件形態(tài)呈現(xiàn)出來的垂類硬件,如特斯拉推出的人形機(jī)器人等。AIGC或?qū)⑾破鹦乱惠啴a(chǎn)業(yè)浪潮,沖擊原有競爭格局與商業(yè)模式。
AIGC具有廣泛的應(yīng)用場景,以ChatGPT為代表,其在代碼生成、糾正語法生成文本等方面表現(xiàn)出極強(qiáng)的能力,并憑借“對話式”搜索的強(qiáng)交互模式對現(xiàn)有的搜索引擎造成了較強(qiáng)的沖擊,并影響了現(xiàn)有戰(zhàn)略布局。谷歌內(nèi)部拉響了紅色警報,微軟將ChatGPT整合入Bing搜索,擬重塑現(xiàn)有業(yè)務(wù)體系。在此基礎(chǔ)上,ChatGPT試點(diǎn)訂閱制付費(fèi)模式,將打破原有競價搜索廣告的商業(yè)模式,具有巨大的商業(yè)化潛力,同時也為AI行業(yè)的商業(yè)化路徑做出了更多模式的探索。
生成式 AI 商業(yè)化應(yīng)用新篇章
一、AIGC 成本大幅下降,人工智能商業(yè)化進(jìn)程拐點(diǎn)已現(xiàn)
我們認(rèn)為以 ChatGPT 為代表的 AIGC 興起,在內(nèi)容創(chuàng)作成本、創(chuàng)作效率、模型計算消耗、用戶流量基礎(chǔ)等維度實(shí)現(xiàn)了重大突破,有望推動 AI 商業(yè)化進(jìn)程的大幅加速。
1、AI 內(nèi)容創(chuàng)作成本大幅降低且耗時更短,相較傳統(tǒng)方式優(yōu)勢顯著
目前 OpenAI 定價最高的文字模型達(dá)芬奇(基于 GPT-3)為每 750 詞約 0.02 美元(折合約 0.14 元人民幣),相較傳統(tǒng)方式優(yōu)勢顯著。在圖像生成領(lǐng)域,Open AI 透露其 DALL-E2 模型的圖片智能編輯及生成服務(wù)的價格,超過免費(fèi)額度數(shù)量的圖片收費(fèi)為每 460 張圖片 15 美元,折合每張圖片約 0.22 元人民幣。AIGC 繪畫創(chuàng)作平均耗時已達(dá)到分秒級,創(chuàng)作效率較人工優(yōu)勢明顯。
2、AIGC 模型算力消耗快速下降,落地門檻降低有望驅(qū)動消費(fèi)級應(yīng)用出現(xiàn)
借助最新的 Colossal-AI 通用深度學(xué)習(xí)系統(tǒng),AIGC 領(lǐng)域的 Stable Diffusion 模型訓(xùn)練過程中可最高節(jié)省約 5.6 倍的顯存需求(從 64.5GB 大幅降低到 11.6GB),未來有望采用消費(fèi)級 GTX 3060 顯卡實(shí)現(xiàn)模型運(yùn)算功能,大幅降低 AI 商業(yè)化應(yīng)用的落地門檻。
3、爆款應(yīng)用快速積累用戶流量,商業(yè)化條件已基本具備
ChatGPT 發(fā)布后日活用戶數(shù)量快速突破千萬,使用者數(shù)量的爆炸式成長即反應(yīng)出用戶的嘗試使用意愿強(qiáng)烈,未來嵌入到微軟的業(yè)務(wù)生態(tài)中也有望提升用戶的工作效率,優(yōu)化使用體驗(yàn),創(chuàng)造更大的商業(yè)價值。
4、國內(nèi)外公司持續(xù)探索商業(yè)化路徑,AIGC 生態(tài)有望加速形成
近日,OpenAI 推出 ChatGPT 付費(fèi)訂閱版 ChatGPT Plus,每月收費(fèi) 20 美元,而包含 Synthesia、Jasper、runway 等 AIGC 初創(chuàng)公司相繼推出細(xì)分領(lǐng)域的收費(fèi)服務(wù),未來 AIGC 產(chǎn)業(yè)生態(tài)有望加速構(gòu)建,并形成更加清晰的 AI 商業(yè)化應(yīng)用路徑。
Jasper 文本寫作功能收費(fèi)模式
二、應(yīng)用場景豐富,AI 商業(yè)化空間前景廣闊,建議關(guān)注三條投資主線
AIGC正在推動人工智能商業(yè)化進(jìn)程的加速,這有望打開千億市場。根據(jù)德勤的數(shù)據(jù)顯示,到2021年,中國的人工智能市場規(guī)模已經(jīng)達(dá)到了2058億元,預(yù)計到2025年,這個市場規(guī)模將會達(dá)到5460億元,年復(fù)合增長率約為27.63%。
中國人工智能市場規(guī)模及增速(單位:億元)
根據(jù)德勤的預(yù)測,全球人工智能產(chǎn)業(yè)規(guī)模預(yù)計將從2017年的6900億美元增長至2025年的6.4萬億美元,復(fù)合增長率達(dá)到32.10%。這一預(yù)測得益于移動互聯(lián)網(wǎng)時代帶來的海量數(shù)據(jù)、模型和算力的不斷迭代,以及各類應(yīng)用場景中的商業(yè)化嘗試,這些因素為人工智能的商業(yè)化奠定了堅(jiān)實(shí)的基礎(chǔ)。未來,人工智能產(chǎn)業(yè)動能有望加速釋放,從而推動人工智能產(chǎn)業(yè)的快速發(fā)展。
全球人工智能產(chǎn)業(yè)規(guī)模發(fā)展趨勢(單位:億美元)
根據(jù)《20220-2023 中國人工智能計算力發(fā)展評估報告》,人工智能商業(yè)化進(jìn)程有望加速,未來隨著自然語言處理、計算機(jī)視覺、AIGC 等細(xì)分技術(shù)的持續(xù)迭代,AI 應(yīng)用將呈現(xiàn)場景應(yīng)用深度和廣度并行發(fā)展態(tài)勢。特別是以 AIGC 為代表的生成式 AI 將在創(chuàng)作型工作(文本、圖像視頻創(chuàng)作)和預(yù)測、決策型工作中扮演更加重要角色。
人工智能應(yīng)用場景發(fā)展
三、AIGC 應(yīng)用有望從 B 端延伸至 C 端市場,空間廣闊規(guī)模超兩千億
根據(jù)Gartner《2021年預(yù)測:人工智能對人類和社會的影響》,到2025年AIGC產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。因此,我們對標(biāo)海外AIGC廠商,如Jasper.AI、Stability.AI等公司的商業(yè)模式,測算國內(nèi)2023年、2025年和2030年AIGC市場空間,發(fā)現(xiàn)市場空間超過兩千億。預(yù)計到2025年國內(nèi)AIGC市場空間可達(dá)403.52億元,到2030年市場空間可達(dá)2175.58億元,未來幾年市場有望迎來爆發(fā)式成長。
在AIGC領(lǐng)域,文字、圖片滲透率有望快速提升,但視頻、直播等受限于技術(shù)迭代滲透率較慢。目前AI在文本和圖像生成領(lǐng)域技術(shù)已相對成熟,同時微軟、百度等科技大廠有望將AI技術(shù)應(yīng)用到業(yè)務(wù)生態(tài)中,有望推動在線辦公、搜索引擎等應(yīng)用場景的滲透率提升。然而,在直播、影視以及音視頻等領(lǐng)域,由于AI生成技術(shù)處于初級階段,且下游用戶對內(nèi)容要求較高,我們認(rèn)為短期內(nèi)滲透率提升幅度較低。
AIGC 國內(nèi)理論市場空間測算
四、ChatGPT 面世即成頂流,性能持續(xù)提升商業(yè)化價值不斷放大
OpenAI 在 2022 年 11 月 30 日發(fā)布了 ChatGPT,這是一款對話式 AI 新模型,能夠進(jìn)行人機(jī)交互的問題回答、文本寫作以及代碼編寫等功能。該模型使用了 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu),并通過維基百科以及大量真實(shí)語料庫的數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)了接近人類的交流水平。ChatGPT 的出現(xiàn)標(biāo)志著生成式 AI 領(lǐng)域的突破性進(jìn)展,也讓 ChatGPT 成為了一個備受關(guān)注的話題。
ChatGPT 實(shí)現(xiàn)交互問答
ChatGPT是一種具備自我學(xué)習(xí)能力的人工智能模型,自面世以來,其性能不斷得到提升。在2023年1月30日,OpenAI官方宣布,ChatGPT通過新一輪的更新,其準(zhǔn)確性和真實(shí)性得到了顯著提升,并且已經(jīng)具備了比較基礎(chǔ)的數(shù)學(xué)計算能力。經(jīng)過使用者的測試,目前ChatGPT的數(shù)學(xué)計算能力接近小學(xué)生水平,雖然相較其代碼和文本寫作相比差距甚遠(yuǎn),但進(jìn)步非常明顯。ChatGPT在數(shù)學(xué)領(lǐng)域的計算能力逐漸形成,反映出模型的自我學(xué)習(xí)能力以及模型遷移能力出色。
ChatGPT 日活用戶數(shù)爆發(fā)式增長
微軟計劃推出一系列基于人工智能技術(shù)的應(yīng)用服務(wù),其中ChatGPT有望在實(shí)際應(yīng)用中持續(xù)成長。據(jù)悉,OpenAI公司于2023年2月2日宣布推出付費(fèi)試點(diǎn)訂閱計劃ChatGPT Plus,每月定價為20美元。該付費(fèi)版功能包括高峰時段免排隊(duì)、快速響應(yīng)以及優(yōu)先獲得新功能和改進(jìn)等。同時,OpenAI方面仍將提供對ChatGPT的免費(fèi)訪問權(quán)限。
此外,微軟還推出了集成ChatGPT的全新Bing搜索服務(wù)和集成AI輔助的Edge瀏覽器。新版Bing帶有一個擴(kuò)展的聊天框,它現(xiàn)在不僅可以回答事實(shí)問題和為用戶提供各種鏈接,還可以在ChatGPT的幫助下為用戶即時生成各種個性化的規(guī)劃、建議、分析等,解決更復(fù)雜的搜索問題。
微軟新版搜索引擎可根據(jù)問題內(nèi)容提供完整解答及方案建議
五、ChatGPT 以 GPT+RLHF 模型為核心支撐,為 AIGC 發(fā)展指明方向
ChatGPT結(jié)合海量訓(xùn)練數(shù)據(jù)和Transformer框架,通過RLHF模型提升交互聊天能力,實(shí)現(xiàn)了對自然語言的深度建模。Transformer架構(gòu)為自然語言理解領(lǐng)域帶來顛覆性變革,應(yīng)用到NLP、CV、生物、化學(xué)等多領(lǐng)域。谷歌在2017年提出了完全基于Self-Attention機(jī)制的Transformer架構(gòu),取得了機(jī)器翻譯任務(wù)上的顛覆性進(jìn)步。Transformer由編碼器和解碼器組成,各自由若干個編碼/解碼模塊堆疊而成,每個模塊包含Multi-Head Attention層、全連接層等功能不同的工作層。相比于之前的框架,Transformer架構(gòu)除了在計算的時間復(fù)雜度更優(yōu)外,還有3大優(yōu)勢:
1、可直接計算點(diǎn)乘結(jié)果,并行度高:對于數(shù)據(jù)序列 x1,x2……xn ,self-attention 可 以直接計算任意兩節(jié)點(diǎn)的點(diǎn)乘結(jié)果,而 RNN 必須按照順序從 x1 計算到 xn。
2、一步計算,解決長時依賴問題:處理序列信息使,通常用要經(jīng)過的路徑長度衡量 性能,CNN 需要增加卷積層數(shù)來擴(kuò)大視野,RNN 只能逐個進(jìn)行計算,而 self-attention 只需 要一步矩陣計算就可以,更好地解決長時依賴問題。
3、模型更可解釋:self-attention 模型更可解釋,attention 結(jié)果的分布可反映該模型 學(xué)習(xí)到了一些語法和語義信息。
Transformer 核心框架
RHFL模型是一種預(yù)訓(xùn)練語言模型,通過人類反饋進(jìn)一步微調(diào)以符合人類偏好,從而直接優(yōu)化模型。Open AI采用了RHFL作為ChatGPT的核心訓(xùn)練方式,稱其為“能有效提升通用人工智能系統(tǒng)與人類意圖對齊的技術(shù)”。RHFL的訓(xùn)練包括三個核心步驟:首先進(jìn)行預(yù)訓(xùn)練語言模型,然后對模型根據(jù)提示生成的文本進(jìn)行質(zhì)量標(biāo)注,由人工標(biāo)注者按偏好從最佳到最差進(jìn)行排名,利用標(biāo)注文本訓(xùn)練獎勵模型,從而學(xué)習(xí)到了人類對于模型根據(jù)給定提示生成的文本序列的偏好性。最后,使用強(qiáng)化學(xué)習(xí)進(jìn)行微調(diào),確保模型輸出合理連貫的文本片段,并且基于獎勵模型對模型輸出的評估分?jǐn)?shù)提升文本的生成質(zhì)量。
RHFL 模型核心框架
推理-知識-學(xué)習(xí)-創(chuàng)造
AIGC重塑人工智能未來
一、復(fù)盤三次人工智能浪潮,AI 從科研向細(xì)分產(chǎn)業(yè)生態(tài)加速滲透
人工智能技術(shù)的發(fā)展可以被分為三次浪潮,每次浪潮都有其獨(dú)特的特點(diǎn)和發(fā)展趨勢。隨著AIGC的崛起,我們有望迎來第四次人工智能浪潮。
第一次浪潮主要集中在20世紀(jì)50年代至70年代,其核心是推理能力的形成。在這個時期,人工智能技術(shù)主要依靠符號邏輯和規(guī)則系統(tǒng)來實(shí)現(xiàn)推理和決策。然而,這種方法的局限性在于它需要大量的手動編程和規(guī)則制定,難以應(yīng)對復(fù)雜的現(xiàn)實(shí)問題。
第二次浪潮主要發(fā)生在20世紀(jì)80年代至90年代,其核心是知識儲備的建立。在這個時期,人工智能技術(shù)開始利用專家系統(tǒng)和知識圖譜等方法來構(gòu)建知識庫,以便更好地處理復(fù)雜的問題。然而,這種方法的局限性在于它需要大量的人工干預(yù)和知識輸入,難以應(yīng)對大規(guī)模的數(shù)據(jù)和變化。
第三次浪潮主要發(fā)生在21世紀(jì)初至今,其核心是自我學(xué)習(xí)能力的提升。在這個時期,人工智能技術(shù)開始利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法來實(shí)現(xiàn)自我學(xué)習(xí)和優(yōu)化,以便更好地處理大規(guī)模的數(shù)據(jù)和復(fù)雜的問題。然而,這種方法的局限性在于它需要大量的數(shù)據(jù)和計算資源,難以應(yīng)對數(shù)據(jù)隱私和安全等問題。
未來,我們有望進(jìn)入到自我創(chuàng)造的階段,即第四次人工智能浪潮。在這個階段,人工智能技術(shù)將能夠自主地生成新的知識和創(chuàng)造性的解決方案,從而實(shí)現(xiàn)真正的智能化。AIGC作為一家領(lǐng)先的人工智能公司,有望引領(lǐng)這一浪潮的發(fā)展,并為人類帶來更多的創(chuàng)新和進(jìn)步。
歷次人工智能浪潮及代表性成就梳理
1、第一次 AI 浪潮,對人類神經(jīng)元機(jī)制的模擬實(shí)現(xiàn)機(jī)器推理能力
計算機(jī)的誕生催生了學(xué)術(shù)界對人工智能的大規(guī)模探索,第一次 AI 浪潮來襲。1946 年第一代電子計算機(jī)誕生,這一階段馮·諾依曼結(jié)構(gòu)為現(xiàn)代計算機(jī)的體系架構(gòu)奠定了基礎(chǔ),而圖靈機(jī)的思想則論證了現(xiàn)代計算機(jī)的計算模式和計算能力,開啟了人類在現(xiàn)代人工智能領(lǐng)域不斷探索的旅程。馮·諾依曼模擬了人類大腦記憶存儲與提取的工作機(jī)制,為計算機(jī)和人工智能奠定了堅(jiān)實(shí)基礎(chǔ)。
上世紀(jì) 40 年代,馮·諾依曼提出了計算機(jī)的邏輯結(jié)構(gòu),其主要特點(diǎn)包括程序以二進(jìn)制代碼存放在存儲器中、所有指令由操作碼和地址碼組成、指令在存儲過程中按照執(zhí)行順序進(jìn)行存儲等。馮·諾依曼結(jié)構(gòu)將人類的神經(jīng)系統(tǒng)與計算機(jī)結(jié)合在一起,大幅提升了計算機(jī)的運(yùn)算效率,為人工智能的發(fā)展提供了保障。
馮·諾依曼結(jié)構(gòu)模擬人類記憶存儲的模式
Rosenblatts受生物神經(jīng)網(wǎng)絡(luò)啟發(fā),提出了一種人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這成為了現(xiàn)代神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的重要基礎(chǔ)。感知機(jī)的工作原理可以理解為生物神經(jīng)網(wǎng)絡(luò)中的信號作用。信號經(jīng)過樹突傳遞到細(xì)胞核的過程中,信號會發(fā)生變化。感知機(jī)模型在模型的“輸入”位置添加神經(jīng)元節(jié)點(diǎn),構(gòu)成“輸入單元”。它會為每一個屬性指定一個權(quán)重w,對屬性值和權(quán)重的乘積求和,將結(jié)果值與閾值比較,從而判定正負(fù)樣本結(jié)果。然而,由于感知機(jī)模型只能解決線性問題,面對異或問題時無能為力。這也導(dǎo)致了第一次人工智能研究在上世紀(jì)70年代進(jìn)入低潮期。
Rosenblatt 感知機(jī)模型
2、第二次 AI 浪潮,人工智能擁有知識儲備,專家系統(tǒng)為代表性產(chǎn)物
在20世紀(jì)80年代,第二次人工智能浪潮到來,其核心發(fā)展為讓計算機(jī)學(xué)習(xí)大量專業(yè)知識。研究人員將專家的知識、言論以及經(jīng)驗(yàn)等數(shù)據(jù)輸入到計算機(jī),使其成為專家系統(tǒng)。專家系統(tǒng)可以預(yù)測在一定條件下某種解的概率。由于當(dāng)時計算機(jī)已有巨大容量,專家系統(tǒng)有可能從數(shù)據(jù)中得出規(guī)律。
在這一階段,多層感知機(jī)、反向傳播算法、神經(jīng)網(wǎng)絡(luò)的出現(xiàn)極大程度地提升了計算機(jī)的計算及邏輯推理能力,為深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)模型奠定了重要基礎(chǔ)。同時,專家系統(tǒng)的出現(xiàn)賦予了人工智能知識屬性,并進(jìn)行了一系列的商用嘗試。多層感知機(jī)強(qiáng)調(diào)模擬人類腦神經(jīng)的復(fù)雜連接,使人工智能實(shí)現(xiàn)解決非線性問題的處理能力。多層感知機(jī)可至少分成輸入層、隱藏層和輸出層這三層,隱藏層可根據(jù)需要建多層且每層都可以有多個節(jié)點(diǎn),相鄰層的各個節(jié)點(diǎn)都互相連接。隱藏層和輸出層具備計算加權(quán)和激活函數(shù)處理的功能,實(shí)現(xiàn)數(shù)據(jù)信息的向前傳遞和分析。
多層感知機(jī)(MLP)模型
多層感知機(jī)的突破在于使用激活函數(shù),它可以在隱藏層中使用不同的激活函數(shù)來對數(shù)據(jù)進(jìn)行非線性化處理,從而使得計算機(jī)具備擬合任何連續(xù)函數(shù)的能力,大幅提升了計算機(jī)的計算能力。1986年,Geoffrey Hinton等人提出了多層感知機(jī)(MLP)與反向傳播(BP)訓(xùn)練相結(jié)合的理念,將人類基于結(jié)果誤差反饋反哺邏輯推理的思想融入AI。BP算法的基本思想是用誤差的導(dǎo)數(shù)(梯度)調(diào)整,并通過誤差的梯度做反向傳播,更新模型權(quán)重,以降低學(xué)習(xí)誤差并擬合學(xué)習(xí)目標(biāo)。
反向傳播(BP)模型
第二次 AI 浪潮中,專家系統(tǒng)模擬人類專家的知識和經(jīng)驗(yàn)解決特定領(lǐng)域的問題,實(shí)現(xiàn) 了人工智能從理論研究走向?qū)嶋H應(yīng)用、從一般推理策略探討轉(zhuǎn)向運(yùn)用專門知識的重大突 破。并且機(jī)器學(xué)習(xí)(特別是神經(jīng)網(wǎng)絡(luò))探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法,在大量的實(shí) 際應(yīng)用中也開始慢慢復(fù)蘇。
專家系統(tǒng)作為人工智能的重要分支,在這一時期逐步滲透到細(xì)分行業(yè)的實(shí)際場景解決 特定任務(wù)。第二次 AI 浪潮期間,專家系統(tǒng)應(yīng)用到數(shù)學(xué)、物理、化學(xué)、醫(yī)學(xué)、地質(zhì)等細(xì)分 行業(yè),能夠輔助科研人員解決化學(xué)分子結(jié)構(gòu)、疾病診斷、地質(zhì)分析等特定任務(wù)。這一時期 專家系統(tǒng)的特點(diǎn)包含:(1)單學(xué)科的專業(yè)性;(2)系統(tǒng)結(jié)構(gòu)完整,移植性好;(3)具有一 定的推理解釋功能,透明性好;(4)采用啟發(fā)式推理和不精確推理;(5)用產(chǎn)生式規(guī)則、 框架和語義網(wǎng)絡(luò)表達(dá)知識;
專家系統(tǒng)商業(yè)價值顯現(xiàn),在企業(yè)生產(chǎn)決策過程中發(fā)揮重大作用。1980 年,美國卡耐基 梅隆大學(xué)與 DEC 公司合作研發(fā)的 XCON 專家系統(tǒng),運(yùn)用計算機(jī)系統(tǒng)配置的知識,依據(jù)用 戶的定貨,選出最合適的系統(tǒng)部件(如 CPU 型號、操作系統(tǒng)種類及相應(yīng)型號,存儲器和外 部設(shè)備等),并且能夠給出優(yōu)化意見以構(gòu)成一個完整的系統(tǒng)。XCON 可以給出一個系統(tǒng)配 置的清單和這些部件裝配關(guān)系的圖,以便技術(shù)人員進(jìn)行裝配。在這一時期,除 DEC 公司 外,美國杜邦、通用汽車和波音等公司在也在生產(chǎn)決策中借助專家系統(tǒng)的輔助,1986 年美 國 AI 相關(guān)軟硬件銷售額達(dá)到 4.25 億美元,人工智能技術(shù)逐漸走出科研院所,進(jìn)入到企業(yè) 的實(shí)際業(yè)務(wù)場景中。
XCON 專家系統(tǒng)核心架構(gòu)
在AI模型算法研究領(lǐng)域,對人類腦神經(jīng)的信號處理和思考機(jī)制的模擬進(jìn)一步加深,代表性產(chǎn)物包含了CNN、RNN等神經(jīng)網(wǎng)絡(luò)模型。其中,1982年,John Hopfield提出了一種結(jié)合存儲系統(tǒng)和二元系統(tǒng)的神經(jīng)網(wǎng)絡(luò),即Hopfield網(wǎng)絡(luò)。這種模型保證了向局部極小的收斂,由于每個神經(jīng)元的輸出均連接到其它神經(jīng)元的輸入,模型能夠通過訓(xùn)練從某一殘缺的信息聯(lián)想到所屬的完整信息。因此,Hopfield模型在模擬人類記憶儲存和聯(lián)想方面做出了重大貢獻(xiàn),同時也勾勒了未來RNN模型的雛形。
Hopfield Network 模型
Yann LeCun提出了CNN模型,并成功驗(yàn)證了其商業(yè)可行性。1989年,LeCun結(jié)合反向傳播算法和權(quán)值共享的卷積神經(jīng)層發(fā)明了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)。CNN通常由輸入層、卷積層、池化(Pooling)層和全連接層組成。卷積層負(fù)責(zé)提取圖像中的局部特征,池化層用來大幅降低參數(shù)量級,全連接層則類似傳統(tǒng)神經(jīng)網(wǎng)絡(luò)部分輸出想要的結(jié)果。CNN成功應(yīng)用到美國郵局的手寫字符識別系統(tǒng)中,在此基礎(chǔ)上于1998年誕生了穩(wěn)定可商業(yè)應(yīng)用的CNN模型LeNet-5。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型
三、第三次 AI 浪潮,數(shù)據(jù)爆炸背景下,AI 進(jìn)入學(xué)習(xí)時代
隨著人類進(jìn)入互聯(lián)網(wǎng)時代,數(shù)據(jù)量呈現(xiàn)爆炸式成長,同時大數(shù)據(jù)技術(shù)的成熟為人工智能的發(fā)展注入了新動能。PC互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的到來推動了人類活動數(shù)據(jù)量的快速增長,為AI模型的訓(xùn)練提供了有價值的原料。同時,圍繞大數(shù)據(jù)、云計算等領(lǐng)域的技術(shù)迭代使得人工智能模型的計算效率、成本等方面都得到了大幅優(yōu)化,為商業(yè)化應(yīng)用打開了空間。
根據(jù)海外學(xué)者論文《Modeling and Simulation Strategies for Performance Evaluation of Cloud Computing Systems》,自2000年以來,全球產(chǎn)生的數(shù)據(jù)量呈現(xiàn)爆炸式增長,到2007年已接近300EB。在針對大規(guī)模數(shù)據(jù)計算領(lǐng)域,2003年,Google公布了3篇大數(shù)據(jù)奠基性論文,為大數(shù)據(jù)存儲及分布式處理的核心問題提供了思路:非結(jié)構(gòu)化文件分布式存儲(GFS)、分布式計算(MapReduce)及結(jié)構(gòu)化數(shù)據(jù)存儲(BigTable),并奠定了現(xiàn)代大數(shù)據(jù)技術(shù)的理論基礎(chǔ)。
1986-2007 年全球數(shù)據(jù)量變化趨勢(單位:EB)
Geoffrey Hinton等人提出了深度學(xué)習(xí)的概念,這掀起了第三次人工智能熱潮。深度學(xué)習(xí)的本質(zhì)是使用多個隱藏層網(wǎng)絡(luò)結(jié)構(gòu),通過大量的向量計算,學(xué)習(xí)數(shù)據(jù)內(nèi)在信息的高階表示。相較于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)模型具有更優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)得到的特征對數(shù)據(jù)有更本質(zhì)的刻畫,有利于可視化或分類。其次,深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度可以通過“逐層初始化”(layer-wise pre-training)來有效克服,因此模型精調(diào)的效率得以大大提升。
AlexNet 神經(jīng)網(wǎng)絡(luò)模型
深度學(xué)習(xí)的出現(xiàn)標(biāo)志著計算機(jī)實(shí)現(xiàn)了基于數(shù)據(jù)的學(xué)習(xí)和挖掘分析能力,AI能夠挖掘復(fù)雜信息中包含的關(guān)聯(lián)關(guān)系。2012年,AlexNet神經(jīng)網(wǎng)絡(luò)獲得ImageNet大賽冠軍,標(biāo)志著AI在圖像識別領(lǐng)域的突破性成就。在計算機(jī)視覺領(lǐng)域的競賽ImageNet中,AlexNet以提升10%的錯誤率的進(jìn)步力壓第二名以SIFT+FV、LBP+FV、GIST+FV、CSIFT+FV等組合特征的算法。AlexNet基于卷積神經(jīng)網(wǎng)絡(luò)CNN模型,在數(shù)據(jù)、算法及算力層面均有較大改進(jìn),創(chuàng)新地應(yīng)用了Data Augmentation、ReLU、Dropout和LRN等方法,并使用GPU加速網(wǎng)絡(luò)訓(xùn)練。之后圖像識別領(lǐng)域AI模型均在此基礎(chǔ)上進(jìn)行優(yōu)化,并且識別準(zhǔn)確度超越了人類水平。
AlexNet 實(shí)現(xiàn)深度學(xué)習(xí)在圖像識別領(lǐng)域的重大突破
AlphaGo是一種具備深度學(xué)習(xí)能力的人工智能,它可以結(jié)合人類專家比賽中學(xué)到的棋譜,以及在自我對弈中進(jìn)行強(qiáng)化學(xué)習(xí)。在2016年,AlphaGo在圍棋競技中擊敗了李世石,這標(biāo)志著人工智能具備了自我迭代和學(xué)習(xí)強(qiáng)化的能力。AlphaGo的深度學(xué)習(xí)模型可以分為策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò),分別解決了圍棋中的“下一步最佳策略”和“下一步后的勝率”兩個問題。通過學(xué)習(xí)人類棋譜和自我對弈,AlphaGo不斷調(diào)整策略以提升棋力。AlphaGo較好地模擬了人類棋手對于圍棋落子的直覺判斷。由于圍棋存在的廣度和深度,計算機(jī)無法模擬計算所有的可能性。AlphaGo通過策略網(wǎng)絡(luò)減少搜索廣度,即每一步搜索少量節(jié)點(diǎn),而通過價值網(wǎng)絡(luò)減少搜索深度,無需將棋局下到底即可得出當(dāng)前局勢的判斷。
在AlphaGo的基礎(chǔ)上,谷歌公司推出了迭代版本AlphaGo Zero,增強(qiáng)了人工智能在面對人類棋譜中未出現(xiàn)過的局勢時的自我推理和學(xué)習(xí)能力,標(biāo)志著人工智能的自我學(xué)習(xí)具備了一定的遷移能力。
AlphaGo 包含價值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)兩個深度神經(jīng)網(wǎng)絡(luò)模型
Transformer 架構(gòu)橫空出世,Open AI 發(fā)布的 GPT 模型,AI 進(jìn)入“大模型”時代。GPT 模型利用更大規(guī)模的文本數(shù)據(jù)以及更深層的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)更豐富的文本語義表示,打破了自然語言處理各個任務(wù)之間的壁壘,使得搭建一個面向特定任務(wù)的自然語言模型不再需要非常多的任務(wù)北京,只需要根據(jù)任務(wù)的輸入和輸出形式應(yīng)用預(yù)訓(xùn)練模型便可達(dá)到滿意效果。
NLP 模型的搭建只需要“無監(jiān)督預(yù)訓(xùn)練+有監(jiān)督的精調(diào)”兩階段:(1)生成式預(yù)訓(xùn)練:在大規(guī)模文本數(shù)據(jù)上訓(xùn)練一個高容量的語言模型,以學(xué)習(xí)更豐富的上下文信息;(2)判別式任務(wù)精調(diào):將預(yù)訓(xùn)練好的模型適配到下游任務(wù)中,并使用有標(biāo)注數(shù)據(jù)學(xué)習(xí)判別式任務(wù)。
從 GPT 到 GPT-2 和 GPT-3,參數(shù)提升和訓(xùn)練數(shù)據(jù)積累提升模型工作性能。到了 GPT-2 階段,Open AI 將自然語言模型定義為要完成零樣本無監(jiān)督多任務(wù)學(xué)習(xí)的目標(biāo),即預(yù)訓(xùn)練好的模型可以直接用于下游任務(wù)。GPT-2 模型在學(xué)習(xí)更廣泛的數(shù)據(jù)信息,增加了模型的維度參數(shù)后,不需要針對特定的任務(wù)修改模型,將任務(wù)也作為提示詞,和文本一起輸入預(yù)訓(xùn)練好的模型。
承接 GPT-2 的核心思想,到了 GPT-3,模型參數(shù)量達(dá)到了 1750 億,在不進(jìn)行微調(diào)的情況下可以在多個 NLP 基準(zhǔn)上達(dá)到最先進(jìn)的性能。GPT 模型的演進(jìn)為國內(nèi)外 AI 大廠提供了重要的借鑒意義,即通過優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)輸入和模型復(fù)雜度的增加來提升模型性能,而未來 AI 以少樣本乃至無樣本學(xué)習(xí)為核心目標(biāo)。
GPT,GPT-2,GPT-3 模型對比
AI大模型在任務(wù)準(zhǔn)確度和場景泛化性方面有顯著提升?;诖?,可以提煉出針對不同實(shí)際場景的AI小模型,以完成特定任務(wù),從而降低AI商業(yè)化部署的成本,提高訓(xùn)練速度。其中,Transformer架構(gòu)和GAN模型為現(xiàn)在的語言文本生成和圖像生成奠定了基礎(chǔ)。
GAN模型參考博弈學(xué)習(xí)理論,通過內(nèi)部兩個模型的互相博弈,實(shí)現(xiàn)圖像視頻的AI自動生成。生成式對抗網(wǎng)絡(luò)(GAN)是近年來復(fù)雜分布上無監(jiān)督學(xué)習(xí)最具前景的方法之一。模型通過框架中兩個模塊:生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生輸出。判別模型負(fù)責(zé)判斷一個實(shí)例是真實(shí)的還是模型生成;而生成模型負(fù)責(zé)生成實(shí)例來騙過判別模型。兩個模型對抗中最達(dá)到平衡,即生成模型生成的實(shí)例與真實(shí)的沒有區(qū)別,判別模型無法區(qū)分輸入數(shù)據(jù)是生成的還是原始真實(shí)的數(shù)據(jù)。
生成式對抗網(wǎng)絡(luò)(GAN)模型原理
GAN 模型是一種應(yīng)用廣泛的人工智能底層框架,可用于逼真圖片生成、圖片翻譯、3D 建模等領(lǐng)域。然而,早期的 GAN 模型存在一些問題,如收斂不穩(wěn)定、容易受到部分圖片樣本欺騙等,導(dǎo)致初期生成的圖像可能存在失真問題,適用范圍相對局限。盡管如此,隨著技術(shù)的不斷發(fā)展和改進(jìn),GAN 模型已經(jīng)成為了 AIGC 重要的底層框架之一。
四、第四次 AI 浪潮,AIGC 從文本拓展至圖像及音視頻領(lǐng)域,商業(yè)化空間打開
AIGC 在圖片、音視頻領(lǐng)域的模型在大模型基礎(chǔ)上持續(xù)優(yōu)化,性能趨向商用化需求,空間有望打開。我們認(rèn)為以 ChatGPT 為代表,AI 將進(jìn)入創(chuàng)造(創(chuàng)作)時代,引領(lǐng)第四次人工智能浪潮。AIGC 以自動化生產(chǎn)和高效為兩大特點(diǎn),目前已經(jīng)可以自動生成文字、圖片、音頻、視頻,甚至 3D 模型和代碼。未來大量數(shù)字原生內(nèi)容有望由 AI 協(xié)助完成創(chuàng)作。底層技術(shù)的突破使 AIGC 商業(yè)落地成為可能,模型迭代推動 AI 生成文字和圖片質(zhì)量實(shí)現(xiàn)質(zhì)的提升。在圖像生成領(lǐng)域,AIGC 的模型已經(jīng)實(shí)現(xiàn)了質(zhì)的飛躍,為AI生成高質(zhì)量圖像提供了更多可能性。
AI 圖像生成模型發(fā)展梳理
Diffusion模型參考了熱力學(xué)原理,大幅提高了生成圖像的穩(wěn)定性、準(zhǔn)確性以及計算效率。該模型的靈感來自于非平衡熱力學(xué),訓(xùn)練過程中緩慢地將隨機(jī)噪聲添加到數(shù)據(jù)中,然后通過反轉(zhuǎn)這個噪聲過程來學(xué)習(xí)恢復(fù)數(shù)據(jù)。與GAN模型不同,擴(kuò)散模型不依賴于生成與對抗兩個模型的博弈,因此學(xué)習(xí)結(jié)果更加穩(wěn)定,并且模型的并行性和擴(kuò)展性更好。之后推出的Stable Diffusion模型在計算效率上顯著提升,滿足企業(yè)級和消費(fèi)級的使用需求。
CLIP模型打破了傳統(tǒng)分類器的界限,可以在不需要額外訓(xùn)練集的情況下,以良好的性能完成各種計算機(jī)視覺任務(wù)。該模型對問題進(jìn)行了重新定義,不再預(yù)測文本標(biāo)簽,取而代之的是預(yù)測圖像與文本相匹配的可能性大小。在大規(guī)模數(shù)據(jù)集上完成的訓(xùn)練后,該模型能夠?qū)W習(xí)到圖像的各方面信息。在圖像生成領(lǐng)域,這兩個模型的結(jié)合可以幫助我們生成更加穩(wěn)定、準(zhǔn)確的圖像。
幾種圖像生成模型特點(diǎn)對比
Make-A-Video 模型是一種基于文本和圖像智能生成視頻的人工智能技術(shù)。該技術(shù)繼承了圖像生成模型的核心技術(shù),通過對文本語義和圖像對應(yīng)關(guān)系的學(xué)習(xí),結(jié)合視頻幀序列的訓(xùn)練,實(shí)現(xiàn)了連貫運(yùn)動且高分辨率的高質(zhì)量視頻生成。然而,由于模型訓(xùn)練量要求過大,目前該技術(shù)只能實(shí)現(xiàn)幾秒鐘的短視頻生成。未來,隨著模型的迭代和優(yōu)化,有望實(shí)現(xiàn)更長時間和更高質(zhì)量的視頻生成。
Make-A-Video 實(shí)現(xiàn) AI 自動生成短視頻
賦能千行百業(yè)
引領(lǐng)數(shù)字化未來
AIGC產(chǎn)業(yè)鏈已初步形成,其最上層為算力層,為算法層提供算力支持;第二層為算法基礎(chǔ)層,通過數(shù)據(jù)收集、標(biāo)注、注釋為算法中間層提供原材料;第三層為算法中間層,通過AI模型開發(fā)、訓(xùn)練生成垂直化、場景化、個性化的模型;最后層級為應(yīng)用層,利用人工智能生成內(nèi)容,包括文字、圖片、音視頻等服務(wù)內(nèi)容。
預(yù)計AIGC將朝著標(biāo)準(zhǔn)化SAAS服務(wù)模式發(fā)展,隨著兼具大模型和多模態(tài)的AIGC模型加速生成新的技術(shù)平臺,SAAS有望加速落地,相關(guān)應(yīng)用層可通過鏈接平臺相關(guān)算法從而打開海量應(yīng)用市場。此外,目前OPEN商業(yè)模式即API接口收費(fèi),公司通過提供相關(guān)AIGC代碼,提供自動圖形模型或語言模型生成等產(chǎn)品,用戶通過其API接口接入,并支付平臺費(fèi)用獲取相關(guān)圖像、語言、代碼調(diào)整服務(wù),OpenAI可獲得付費(fèi)訂閱式的SAAS費(fèi)用,該商業(yè)模式用戶粘性極強(qiáng)。
AIGC產(chǎn)業(yè)雛形
一、搜索引擎
Microsoft Bing是由微軟推出的搜索引擎,于2009年5月28日正式上線。截至2013年5月,Bing已成為北美地區(qū)第二大搜索引擎,市場份額達(dá)到29.3%。Bing集成了網(wǎng)頁、圖片、視頻、詞典、翻譯、資訊、地圖等全球信息搜索服務(wù),并引入了AIGC的搜索引擎,使搜索更便捷、溝通更高效、功能更多元,且AI答案的可靠性得到提升。
最近,Bing推出了一款新版,加入了AI輔助功能。用戶可以通過點(diǎn)擊搜索欄的“聊天”選項(xiàng),通過與AI聊天的方式獲得答案或建議,還可以通過和搜索框?qū)υ拋碚{(diào)整答案,從而達(dá)到更精準(zhǔn)的搜索效果。不同于ChatGPT,新版Bing同時提供引用來源,提高答案可靠度。此外,新版必應(yīng)不僅具有傳統(tǒng)搜索引擎功能,也可以像智能語音助手一樣根據(jù)用戶需求生成出行計劃,及完成如寫詩、創(chuàng)作短篇小說等ChatGPT的傳統(tǒng)藝能。
新版Microsoft Edge功能于2月8日發(fā)布,將加入AI聊天和相關(guān)寫作功能。除聊天功能外,這些寫作功能可以有效幫助用戶對長文章歸納總結(jié)提煉重點(diǎn)、對比篩選文章內(nèi)容以及創(chuàng)造新內(nèi)容。此外,新版Bing可以協(xié)助用戶生成內(nèi)容,包括電子郵件、規(guī)劃旅行等。
引入ChatGPT功能的BING主頁界面 用戶可以和新版BING搜索引擎交流
二、新聞媒體
BuzzFeed是一家致力于從數(shù)百個新聞博客那里獲取訂閱源,為用戶提供方便瀏覽當(dāng)天網(wǎng)上最熱門事件的新聞聚合網(wǎng)站。該網(wǎng)站被譽(yù)為媒體行業(yè)的顛覆者。
現(xiàn)在,BuzzFeed計劃利用AIGC技術(shù)來有效代替人類對已有信息進(jìn)行語言整合和文字輸出,與資訊平臺類的數(shù)字媒體高度適配。據(jù)澎湃新聞報道,BuzzFeed于1月底宣布將使用OpenAI開放的API協(xié)助創(chuàng)作內(nèi)容,并計劃在2023年將把由AI創(chuàng)造的內(nèi)容從研發(fā)階段轉(zhuǎn)變?yōu)楹诵臉I(yè)務(wù)的一部分。具體來說,BuzzFeed將利用人工智能技術(shù)創(chuàng)建面向用戶的個性測驗(yàn),并根據(jù)用戶反應(yīng)生成個性化的文本內(nèi)容。人工智能將協(xié)助創(chuàng)作過程,加強(qiáng)部分內(nèi)容創(chuàng)作,而人類則扮演提供想法、“文化貨幣”和“靈感提示”的角色。
BuzzFeed頁面
三、客戶管理
LivePerson是一家網(wǎng)絡(luò)交易業(yè)務(wù)的領(lǐng)先供應(yīng)商,提供一種云技術(shù)平臺,幫助企業(yè)通過多種渠道(包括網(wǎng)站、社交媒體和移動設(shè)備)主動與消費(fèi)者聯(lián)系。該平臺提供交談、語音和內(nèi)容交付等多種聯(lián)系方式,是客戶參與解決方案的全球領(lǐng)導(dǎo)者。公司的交易業(yè)務(wù)通過各種消費(fèi)者和商業(yè)數(shù)據(jù)(包括歷史、行為、業(yè)務(wù)驅(qū)動和第三方數(shù)據(jù))的信息來源提煉,每一筆交易的背后都有著專業(yè)的分析和對于消費(fèi)者需求和商業(yè)目標(biāo)之間的實(shí)時信息支持。
此外,LivePerson在2022年9月與人工智能企業(yè)Afiniti合作,提高服務(wù)質(zhì)量降本增效。根據(jù)美國商業(yè)資訊,LivePerson在引入AI技術(shù)后,品牌方可以在幾毫秒內(nèi)根據(jù)歷史數(shù)據(jù)模式將個人與客服人員匹配,考慮因素包括客戶的產(chǎn)品使用情況、使用年限,以及過去與該公司聯(lián)系的原因。該過程還考慮了客服人員信息,例如他們?nèi)绾翁幚眍愃频男畔⒒樱员M可能達(dá)成積極的客戶-客服人員體驗(yàn),獲得有效結(jié)果。
LivePerson主頁截圖
四、數(shù)字人
2020年,百度推出了國內(nèi)首個可交互虛擬偶像“度曉曉”,具備視覺識別能力和最自然的交流方式,讓搜索過程和結(jié)果反饋更接近人類真實(shí)的溝通體驗(yàn)。度曉曉可以輕松知道人類已有記錄的所有知識,為用戶提供權(quán)威且精準(zhǔn)的知識服務(wù)。在與用戶的交互中,度曉曉能夠默默學(xué)習(xí)人類的思維實(shí)現(xiàn)自我進(jìn)化。2021年,百度與榮耀聯(lián)合打造了國內(nèi)首個虛擬偶像AIGC單曲《每分 每秒 每天》,由度曉曉與龔俊數(shù)字人聯(lián)合演唱。數(shù)字人在電商直播、新聞播報、接待指引和展覽展示等領(lǐng)域均有已落地的應(yīng)用,越來越多的企業(yè)使用和打造AI虛擬數(shù)字人,市場前景十分廣闊。
五、游戲
AIGC(Artificial Intelligence Game Character)是一種基于人工智能技術(shù)的游戲角色,它可以在游戲中自主地行動、思考和決策,從而提高游戲的趣味性和挑戰(zhàn)性。以下是AIGC在游戲領(lǐng)域的應(yīng)用:
1、智能對戰(zhàn)
AIGC可以作為游戲中的對手,通過學(xué)習(xí)和適應(yīng)玩家的行為,提高游戲的難度和挑戰(zhàn)性。
2、智能伙伴
AIGC可以作為游戲中的隊(duì)友或伙伴,與玩家合作完成任務(wù),提供更加真實(shí)的游戲體驗(yàn)。
3、智能敵人
AIGC可以作為游戲中的敵人,通過學(xué)習(xí)和適應(yīng)玩家的行為,提高游戲的難度和挑戰(zhàn)性。
4、智能NPC
AIGC可以作為游戲中的非玩家角色,與玩家進(jìn)行互動,提供更加真實(shí)的游戲體驗(yàn)。
5、智能劇情
AIGC可以通過學(xué)習(xí)和適應(yīng)玩家的行為,自主地生成游戲劇情,提高游戲的趣味性和可玩性。
AIGC:助力廠商實(shí)現(xiàn)
數(shù)字化轉(zhuǎn)型的利器
我們認(rèn)為AIGC的出世將會產(chǎn)生革命性的影響,并有望賦能千行百業(yè)。為此,我們梳理了三條路徑圖,積極地推薦以下三條投資主線:
第一條主線是具備算力基礎(chǔ)的廠商,受益標(biāo)的為寒武紀(jì)、商湯、海光信息、浪潮信息、中科曙光、景嘉微、藍(lán)海大腦等。這些公司都具備強(qiáng)大的算力基礎(chǔ),能夠?yàn)锳IGC的發(fā)展提供有力的支撐。
第二條主線是具備AI算法商業(yè)落地的廠商,重點(diǎn)推薦科大訊飛、拓爾思等。此外,漢王科技、海天瑞聲、云從科技等公司也將受益于AIGC的發(fā)展。
第三條主線是AIGC相關(guān)技術(shù)儲備的應(yīng)用廠商,受益標(biāo)的為百度、同花順、三六零、金山辦公等。這些公司都擁有豐富的AIGC技術(shù)儲備,能夠在應(yīng)用領(lǐng)域中發(fā)揮重要作用。
一、科大訊飛:自然語言處理的全球龍頭廠商
科大訊飛于2022年初發(fā)布了“訊飛超腦 2030 計劃”,旨在成為“全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者”。該計劃是公司的核心戰(zhàn)略,旨在構(gòu)建基于認(rèn)知的人機(jī)協(xié)作、自我進(jìn)化的復(fù)雜系統(tǒng),讓機(jī)器人感官超越人類,具備自主進(jìn)化的能力,打造可持續(xù)自主進(jìn)化的復(fù)雜智能系統(tǒng),助力機(jī)器人走進(jìn)千家萬戶。
該計劃分為三個階段性里程碑:第一階段(2022-2023)推出可養(yǎng)成的寵物玩具、仿生動物等軟硬件一體機(jī)器人,同期推出專業(yè)數(shù)字虛擬人家族,擔(dān)當(dāng)老師、醫(yī)生等角色;第二階段(2023-2025)推出自適應(yīng)行走的外骨骼機(jī)器人和陪伴數(shù)字虛擬人家族,老人通過外骨骼機(jī)器人能夠?qū)崿F(xiàn)正常行走和運(yùn)動,同期推出面向青少年的抑郁癥篩查平臺;第三階段(2025-2030)最終推出懂知識、會學(xué)習(xí)的陪伴機(jī)器人和自主學(xué)習(xí)虛擬人家族,全面進(jìn)入家庭。
“訊飛超腦”計劃和里程表
二、漢王科技:人工智能領(lǐng)域領(lǐng)先者
漢王科技是一家成立于1998年的人工智能領(lǐng)域領(lǐng)先者,專注于人臉識別、大數(shù)據(jù)、智能交互技術(shù)、產(chǎn)品及服務(wù)的提供。公司以核心技術(shù)為基礎(chǔ),面向市場需求,已形成了以識別技術(shù)為核心的、針對不同細(xì)分市場的軟硬件產(chǎn)品系列,既有通用產(chǎn)品,如e典筆、漢王電紙書、漢王筆、文本王、名片通、繪圖板等。公司主營業(yè)務(wù)分為四類:
筆智能交互業(yè)務(wù)、文本大數(shù)據(jù)業(yè)務(wù)、人臉及生物試別與相關(guān)AI終端。其中,筆智能交互業(yè)務(wù)是公司的核心業(yè)務(wù)之一,公司在該領(lǐng)域的技術(shù)主要分為電磁觸控及電容觸控兩大類,是全球僅有的兩家擁有無線無源電磁觸控自主知識產(chǎn)權(quán)的企業(yè)之一。此項(xiàng)業(yè)務(wù)包括數(shù)字繪畫、電容筆、無紙化簽章等。
文本大數(shù)據(jù)業(yè)務(wù)則依托 AI 文本圖像識別技術(shù)、NLP 技術(shù)、RPA技術(shù)平臺,在各行業(yè)賽道中尋找數(shù)字化、智能化的落地場景,包括智慧司法、智慧檔案、智慧人文、智慧教育、智慧金融等。
人臉及生物試別與相關(guān)AI終端則是公司的另一重要業(yè)務(wù),涉及人臉識別、指紋識別、虹膜識別等技術(shù),為各行業(yè)提供安全、便捷的身份認(rèn)證解決方案。
漢王科技相關(guān)大數(shù)據(jù)產(chǎn)品及解決方案
三、拓爾思: 全文檢索技術(shù)的始創(chuàng)者
拓爾思成立于1993年,是一家領(lǐng)先的大數(shù)據(jù)、人工智能和數(shù)據(jù)安全產(chǎn)品及服務(wù)提供商。公司主要核心業(yè)務(wù)包括軟件平臺產(chǎn)品研發(fā)、行業(yè)應(yīng)用系統(tǒng)解決方案和大數(shù)據(jù)SaaS/DaaS云服務(wù)三大板塊,涵蓋大數(shù)據(jù)、人工智能、互聯(lián)網(wǎng)內(nèi)容管理、網(wǎng)絡(luò)信息安全和互聯(lián)網(wǎng)營銷等領(lǐng)域方向。
公司技術(shù)實(shí)力雄厚,人工智能領(lǐng)域方面,公司是國內(nèi)最早從事自然語言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域都具備自主可控的底層技術(shù)。在大數(shù)據(jù)方面,數(shù)據(jù)采集、挖掘、分析等底層技術(shù)均實(shí)現(xiàn)技術(shù)可控。
公司行業(yè)領(lǐng)域覆蓋廣,由于公司人工智能和大數(shù)據(jù)核心技術(shù)具有跨行業(yè)/領(lǐng)域的通用普適性,因此公司技術(shù)產(chǎn)品和服務(wù)所支持的業(yè)務(wù)應(yīng)用落地場景眾多,涵蓋多個行業(yè)/領(lǐng)域,大型或頭部企業(yè)級客戶超過8000家,廣泛覆蓋于金融、制造、能源、互聯(lián)網(wǎng)、傳媒、政府、公共安全等領(lǐng)域。
拓爾思數(shù)據(jù)應(yīng)用相關(guān)產(chǎn)品
四、云從科技: 人機(jī)協(xié)同生態(tài)體系賦能商
云從科技是一家專注于提高人機(jī)操作系統(tǒng)和行業(yè)解決方案的人工智能企業(yè)。公司致力于推進(jìn)人工智能產(chǎn)業(yè)化進(jìn)程和各行業(yè)的轉(zhuǎn)型升級。為此,公司通過業(yè)務(wù)、硬件設(shè)備、軟件應(yīng)用,為客戶提供數(shù)字化、智能化的人工智能服務(wù)。同時,公司基于人機(jī)協(xié)同操作系統(tǒng),賦能金融、出行、商業(yè)等場景。為了實(shí)現(xiàn)這一目標(biāo),公司自主研發(fā)了融合人工智能技術(shù)的人機(jī)協(xié)同操作系統(tǒng)和部分AIoT設(shè)備。
公司的人機(jī)操作系統(tǒng)是一款自主研發(fā)的人工智能應(yīng)用操作系統(tǒng),包含AIoT設(shè)備、人工智能算法和引擎、AI模型和訓(xùn)練等核心模塊。該系統(tǒng)實(shí)現(xiàn)了AI能力的自動部署、監(jiān)控和邊端感知。通過底層AI業(yè)務(wù)流程引擎和決策支持系統(tǒng),該系統(tǒng)優(yōu)化了人機(jī)交互體驗(yàn),提升了業(yè)務(wù)流程執(zhí)行效率,讓人機(jī)具有決策功能。該系統(tǒng)包含人機(jī)協(xié)同和整體操作系統(tǒng)、“輕舟平臺”的服務(wù)平臺及配套AI應(yīng)用的SaaS服務(wù)。
2、人工智能解決方案
云從科技提供面向智慧金融、智慧治理、智慧出行、智慧商業(yè)四個領(lǐng)域的綜合解決方案,基于自主研發(fā)的人機(jī)操作系統(tǒng)及其應(yīng)用產(chǎn)品和AIoT硬件設(shè)備。同時,我們還提供該領(lǐng)域的定制化軟件開發(fā)服務(wù),以滿足客戶的個性化需求。我們致力于為客戶提供高效、智能、安全的解決方案,幫助客戶實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和業(yè)務(wù)升級。
云從科技產(chǎn)品服務(wù)體系
五、海天瑞聲: AI訓(xùn)練數(shù)據(jù)服務(wù)領(lǐng)軍者
海天瑞聲是中國領(lǐng)先的訓(xùn)練數(shù)據(jù)專業(yè)提供商,專注于為人工智能產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。公司的訓(xùn)練數(shù)據(jù)涵蓋智能語音、計算機(jī)視覺、自然語言等多個核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能駕駛、智慧城市等多種創(chuàng)新應(yīng)用場景。
公司的產(chǎn)品和服務(wù)已獲得阿里巴巴、騰訊、百度、科大訊飛、??低?/u>、微軟、亞馬遜、三星等國內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個人助手、智能音箱、語音導(dǎo)航、搜索服務(wù)、智能駕駛、機(jī)器翻譯等多種人工智能產(chǎn)品相關(guān)算法模型的訓(xùn)練過程中。
公司具備多重技術(shù)領(lǐng)先性,包括算法與數(shù)據(jù)處理技術(shù)并用、工具和平臺共建、在語音語言學(xué)基礎(chǔ)研究方面有深厚積累等,公司可提供數(shù)據(jù)的一站式解決方案,廣泛支持復(fù)雜的算法數(shù)據(jù)標(biāo)注需求。
云從科技產(chǎn)品服務(wù)體系
AIGC未來發(fā)展方向
一、AI 發(fā)展帶動基礎(chǔ)數(shù)據(jù)市場成長,高質(zhì)量標(biāo)注數(shù)據(jù)決定模型訓(xùn)練效果
隨著AI模型的發(fā)展,訓(xùn)練數(shù)據(jù)的需求不斷增加,而數(shù)據(jù)標(biāo)注和結(jié)構(gòu)化處理則成為將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值的關(guān)鍵步驟。隨著AI與各個產(chǎn)業(yè)的結(jié)合越來越緊密,AI商業(yè)化程度進(jìn)入新階段,企業(yè)對AI在商業(yè)化落地中的表現(xiàn)要求越來越高。為了保證AI算法的識別精度,數(shù)據(jù)標(biāo)注的質(zhì)量也變得至關(guān)重要。
AIGC向圖像、語音、文字等多維數(shù)據(jù)延伸,AI基礎(chǔ)數(shù)據(jù)服務(wù)與治理賽道有望受益加速成長。數(shù)據(jù)服務(wù)利用數(shù)據(jù)采集與標(biāo)注工具處理非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)治理則使用數(shù)據(jù)治理的各模塊管理多源異構(gòu)數(shù)據(jù),提高數(shù)據(jù)質(zhì)量并形成數(shù)據(jù)資產(chǎn)。高質(zhì)量的數(shù)據(jù)可供各行業(yè)AI廠商訓(xùn)練模型,并支撐各場景商業(yè)化產(chǎn)品的落地。
目前,數(shù)據(jù)標(biāo)注仍以人工為主,但行業(yè)正向智能化和去人工化方向發(fā)展,標(biāo)注數(shù)據(jù)生產(chǎn)效率與AI模型進(jìn)步協(xié)同共振。不同于計算機(jī)視覺領(lǐng)域AI模型訓(xùn)練所用的圖像數(shù)據(jù),NLP模型訓(xùn)練的數(shù)據(jù)往往來自于半結(jié)構(gòu)化或非結(jié)構(gòu)化的信息,目前無法實(shí)現(xiàn)AI算法模型的自動化標(biāo)注。目前主流的實(shí)現(xiàn)路徑是人工標(biāo)注與智能標(biāo)注協(xié)同方案,即人工完成一小部分的數(shù)據(jù)標(biāo)注,再借助算法模型對剩余數(shù)據(jù)進(jìn)行標(biāo)注,通過人工對部分難例數(shù)據(jù)樣本的二次標(biāo)注后,最終形成高質(zhì)量的標(biāo)注數(shù)據(jù)。
AI 訓(xùn)練數(shù)據(jù)智能標(biāo)注服務(wù)實(shí)現(xiàn)路徑
二、場景模型持續(xù)簡化以提升訓(xùn)練速度,控制成本滿足商業(yè)化應(yīng)用需求
大型模型的微調(diào)和維護(hù)成本過高,這是目前大型模型廠商在面對用戶需求時所面臨的問題。如果僅提供推理服務(wù),成本可以大幅降低,但是模型精度會受到較大的犧牲,從而降低大型模型的競爭力。此外,AI項(xiàng)目通常需要將模型部署到終端,對算力的要求非常高,因此國內(nèi)外大廠及研究院所均致力于對預(yù)訓(xùn)練模型進(jìn)行“瘦身”。
模型蒸餾和遷移學(xué)習(xí)成為AI領(lǐng)域的研究新方向,可以大幅優(yōu)化終端模型計算的時效性并節(jié)約算力成本。知識蒸餾是一種新的概念,類似于學(xué)校中的教學(xué)行為,可以有效地壓縮預(yù)訓(xùn)練模型的大小。知識蒸餾包含已訓(xùn)練的Teacher Model和待訓(xùn)練的Student Model,通過知識蒸餾和遷移學(xué)習(xí),學(xué)生網(wǎng)絡(luò)可以擁有與教師網(wǎng)絡(luò)相似和相近的計算性能。知識蒸餾可以在基于高度復(fù)雜的大型模型訓(xùn)練基礎(chǔ)上,提升細(xì)分任務(wù)小模型的計算精度,同時也可以有效降低模型延遲,并且壓縮網(wǎng)絡(luò)參數(shù)。
基于知識蒸餾思想改進(jìn)BERT預(yù)訓(xùn)練模型,實(shí)現(xiàn)模型的簡化和速度的提升。Distilled BERT模型直接將BERT的部分參數(shù)作為初始化,模型參數(shù)只有BERT的約40%,但速度快提升60%,同時保留了97%的語言理解能力。我們認(rèn)為,在人工智能通往商業(yè)化應(yīng)用的道路上,早期專注于增加數(shù)據(jù)量、計算能力或者訓(xùn)練過程的優(yōu)化方式可能不再適用,未來各大廠商需要計算與預(yù)測性能之間做出權(quán)衡,探索如何利用更少的數(shù)據(jù)與計算資源,幫助模型實(shí)現(xiàn)性能提升。
三、AI 應(yīng)用落地拉動算力需求,AI 基礎(chǔ)設(shè)施市場規(guī)模有望加速成長
高算力支持是訓(xùn)練AI大規(guī)模商業(yè)化的基礎(chǔ),AI基礎(chǔ)設(shè)施市場有望迎來爆發(fā)。微軟入資OpenAI后雙方達(dá)成多年的合作協(xié)議,OpenAI接入微軟的Azure云平臺開發(fā)AI技術(shù)。高算力的底層基礎(chǔ)設(shè)施是完成對海量數(shù)據(jù)處理、訓(xùn)練的基礎(chǔ)。我們認(rèn)為AI技術(shù)發(fā)展逐漸成熟,數(shù)字化基礎(chǔ)設(shè)施不斷建設(shè)完善,將拉升AI芯片、AI服務(wù)器的市場需求。AI商業(yè)化應(yīng)用的加速落地,將推動我國AI基礎(chǔ)設(shè)施市場規(guī)模的加速成長。
我國 AI 芯片市場規(guī)模趨勢
根據(jù)《2022-2023中國人工智能計算力發(fā)展評估報告》,全球AI服務(wù)器市場規(guī)模預(yù)計將在2026年達(dá)到347.1億美元,五年復(fù)合增長率為17.3%。這一市場規(guī)模的加速成長,將有望為國內(nèi)細(xì)分賽道的龍頭廠商帶來更多的機(jī)遇和收益。中商產(chǎn)業(yè)研究院的數(shù)據(jù)預(yù)計,到2023年,我國的AI芯片市場規(guī)模將達(dá)到1206億元,云計算市場規(guī)模將達(dá)到6975億元,同比分別增長41.9%和47.0%。AI基礎(chǔ)設(shè)施市場規(guī)模也將快速成長。
我國云計算市場規(guī)模趨勢
總結(jié)
隨著人工智能技術(shù)的不斷發(fā)展,智能化時代已經(jīng)到來。在這個時代,人工智能技術(shù)已經(jīng)成為了各行各業(yè)的重要工具,為企業(yè)和個人帶來了許多新的機(jī)遇。其中,AIGC(Artificial Intelligence and Global Citizenship)作為一種新型的人工智能技術(shù),更是為智能化時代的發(fā)展帶來了新的機(jī)遇。
AIGC是一種基于人工智能技術(shù)的全球公民意識,它通過智能化的方式來推動全球公民意識的發(fā)展。在AIGC的幫助下,人們可以更好地理解全球公民意識的重要性,并且更好地參與到全球公民意識的建設(shè)中來。同時,AIGC也可以通過智能化的方式來幫助企業(yè)和個人更好地適應(yīng)智能化時代的發(fā)展。
在智能化時代,AIGC為企業(yè)和個人帶來了許多新的機(jī)遇。首先,AIGC可以幫助企業(yè)更好地適應(yīng)智能化時代的發(fā)展。通過AIGC的幫助,企業(yè)可以更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設(shè)中來。這樣,企業(yè)就可以更好地適應(yīng)智能化時代的發(fā)展,并且更好地滿足消費(fèi)者的需求。
其次,AIGC也為個人帶來了許多新的機(jī)遇。在智能化時代,個人需要具備更多的技能和知識,才能更好地適應(yīng)智能化時代的發(fā)展。通過AIGC的幫助,個人可以更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設(shè)中來。這樣,個人就可以更好地適應(yīng)智能化時代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢想。
除此之外,AIGC還可以為智能化時代的發(fā)展帶來許多新的機(jī)遇。首先,AIGC可以幫助人們更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設(shè)中來。這樣,人們就可以更好地理解全球公民意識的重要性,并且更好地推動全球公民意識的發(fā)展。其次,AIGC還可以通過智能化的方式來幫助人們更好地適應(yīng)智能化時代的發(fā)展。這樣,人們就可以更好地適應(yīng)智能化時代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢想。
總之,AIGC與人工智能技術(shù)一起,為智能化時代的發(fā)展帶來了許多新的機(jī)遇。通過AIGC的幫助,企業(yè)和個人可以更好地適應(yīng)智能化時代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢想。同時,AIGC也可以通過智能化的方式來推動全球公民意識的發(fā)展,為全球公民意識的建設(shè)帶來新的機(jī)遇。因此,我們應(yīng)該更加重視AIGC與人工智能技術(shù)的發(fā)展,為智能化時代的發(fā)展做出更大的貢獻(xiàn)。
審核編輯黃宇
-
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238900 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5506瀏覽量
121265 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1563瀏覽量
7796 -
AIGC
+關(guān)注
關(guān)注
1文章
363瀏覽量
1558
發(fā)布評論請先 登錄
相關(guān)推薦
評論