“當(dāng)前人工智能(AI)的發(fā)展正處于從1.0到2.0的過渡期,從技術(shù)革命上去講,也就是從做單一的算法開發(fā)到體系架構(gòu)搭建的過渡?!?/p>
3月7日,原騰訊杰出科學(xué)家、騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合負(fù)責(zé)人賈佳亞,向澎湃新聞記者分享了人工智能發(fā)展階段的思考,他認(rèn)為,現(xiàn)在的AI技術(shù)基本上以單點(diǎn)突破為主,每一個細(xì)分的小領(lǐng)域都有很多的研究,算法是其中的重要組成部分。
賈佳亞是香港中文大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)系終身教授,是計(jì)算機(jī)視覺、人工智能、計(jì)算機(jī)圖形與計(jì)算影像學(xué)領(lǐng)域國際權(quán)威專家。
據(jù)媒體報(bào)道,賈佳亞培養(yǎng)出了多位在人工智能領(lǐng)域的新秀,其中包括商湯科技聯(lián)合創(chuàng)始人兼CEO徐立。
離開騰訊后,賈佳亞選擇創(chuàng)業(yè)之路,于2019年底設(shè)立AI公司思謀科技,主要方向?yàn)槿斯?a target="_blank">智能和5G技術(shù)在智能制造和高清視頻領(lǐng)域的應(yīng)用,目前已獲Pre-A輪融資,并正進(jìn)行全球范圍內(nèi)的招聘工作。
賈佳亞
在人工智能1.0階段,AI技術(shù)基本上以單點(diǎn)突破為主,每一個細(xì)分的小領(lǐng)域都有很多的研究,算法是其中的重要組成部分。AI的能力體現(xiàn)在“接受數(shù)據(jù)—研發(fā)人員設(shè)計(jì)算法—調(diào)試—得到結(jié)果—再反饋”的流程上。它的核心競爭力還是各類高效、創(chuàng)新的算法,通過不斷迭代,發(fā)展出新的“CPU”,但每一種“CPU”都只能做一種特定的運(yùn)算。
而人工智能2.0階段,AI在架構(gòu)上需要建立真正的完整系統(tǒng),而不是一個個孤立的“CPU”計(jì)算單元的單個算法。這個完整體系中的許多服務(wù)模塊不參與核心算法設(shè)計(jì)或者調(diào)試,但這些服務(wù)模塊可以作為短期或者長期存儲,加速運(yùn)算、加快數(shù)據(jù)流,以實(shí)現(xiàn)僅需少量研發(fā)人員卻能取得他們以往需要耗費(fèi)大量時間和工作量(如5倍以上)的結(jié)果。賈佳亞認(rèn)為,這種系統(tǒng)性的方法與實(shí)踐是AI 2. 0的最核心要素。
舉例來說,當(dāng)前工業(yè)所需要的AI是遠(yuǎn)遠(yuǎn)復(fù)雜過現(xiàn)有的單個算法,在人臉大領(lǐng)域,五官存在很多共性,但在工業(yè)領(lǐng)域,數(shù)據(jù)五花八門,采集方式多不勝數(shù),所以很難有一個算法或者一套數(shù)據(jù)是保證有效的。但賈佳亞認(rèn)為,工業(yè)、農(nóng)業(yè)、流通和零售等行業(yè),才是拉動并評價AI更實(shí)質(zhì)、更廣域發(fā)展的“必考題”。
賈佳亞希望,帶領(lǐng)行業(yè)進(jìn)入新的AI的構(gòu)架時代,擺脫現(xiàn)在極重算法的模式,轉(zhuǎn)向體系化構(gòu)建解決AI里面數(shù)據(jù)特征多種類,研發(fā)重復(fù)投入的核心問題。
“我們有信心在短期內(nèi)實(shí)現(xiàn)系統(tǒng)產(chǎn)出效果在投入不變的情況下有大的提升?!辟Z佳亞稱。
以下為賈佳亞文章《人工智能 2.0革命,技術(shù)究竟該如何變革?》
一場科技革命的發(fā)生,是科學(xué)理論、知識系統(tǒng)、方法應(yīng)用、實(shí)踐迭代等各方面的巨大進(jìn)步。當(dāng)人們預(yù)言人工智能時代將是第四次工業(yè)革命時,人工智能似乎被定下了“無所不能”的基調(diào)。
對于一件事物的狂熱,經(jīng)過時間推移,會帶來理性回歸。如今對人工智能概念的認(rèn)知由狂熱遐想回歸理性實(shí)踐。當(dāng)群體和環(huán)境回歸理性后,國家、社會包括許許多多個體仍然選擇高度重視并看好人工智能的技術(shù),正如近日國家又發(fā)出加快 5G 網(wǎng)絡(luò)、數(shù)據(jù)中心、人工智能等“新基建”的聲音。
人工智能之于各行各業(yè),如同計(jì)算機(jī)之于電子電器
如今與當(dāng)年境況相似,人們肯定人工智能技術(shù),但對人工智能的功能和應(yīng)用不了解。如同早年第一次接觸計(jì)算機(jī),我懷著敬畏心,但并知道它究竟能做什么。1984年的蘋果計(jì)算機(jī),到現(xiàn)今30多年歷史,計(jì)算機(jī)從功能到形態(tài),每年都仍有非常顯著的變化。直到對其能力、功能和應(yīng)用做到了如指掌,我才體會到它真正的能力和魅力。順勢,我也開發(fā)了適用需求的很多應(yīng)用。
計(jì)算機(jī)是所有電子電器甚至是穿戴設(shè)備里的基本元素,硬件的能力范疇也有了無邊界的擴(kuò)展。計(jì)算機(jī)之于現(xiàn)代電子設(shè)備,猶如人工智能之于各行各業(yè),AI也將在未來成為不可或缺的基石型技術(shù)。
AI技術(shù)變革從1.0到2.0,是單一算法到體系架構(gòu)搭建
當(dāng)前人工智能的發(fā)展正處于從1.0到2.0的過渡期,從技術(shù)革命上去講,也就是從做單一的算法開發(fā)到體系架構(gòu)搭建的過渡。現(xiàn)在的AI技術(shù)基本上以單點(diǎn)突破為主,每一個細(xì)分的小領(lǐng)域都有很多的研究,算法是其中的重要組成部分。當(dāng)我們把每一個小而有效的算法看成是小的定制化計(jì)算單元(computing unit),它們便是為了完成某一項(xiàng)特定任務(wù)而存在。這些小的計(jì)算模塊就像是計(jì)算機(jī)里面的CPU,擁有計(jì)算能力,通常一個團(tuán)隊(duì)手頭只有某一個或某幾個處理特定任務(wù)的“CPU”。所以當(dāng)任務(wù)發(fā)生改變時,團(tuán)隊(duì)就只能重新編寫和制造出一個新的“CPU”結(jié)構(gòu)來應(yīng)對新的任務(wù),這便是現(xiàn)在AI的工作方式,也就是我們稱為的AI 1.0。所以這樣的工作方式下,AI的能力體現(xiàn)在“接受數(shù)據(jù)—研發(fā)人員設(shè)計(jì)算法—調(diào)試—得到結(jié)果—再反饋”的流程上。它的核心競爭力還是各類高效、創(chuàng)新的算法,通過不斷迭代,發(fā)展出新的“CPU”,但每一種“CPU”都只能做一種特定的運(yùn)算。
那為什么我們的計(jì)算機(jī)在面對不同的任務(wù)時,卻僅有一個CPU就可以完成各類任務(wù)?這個區(qū)別在于計(jì)算機(jī)里面除了CPU,還有硬盤用于存儲,內(nèi)存用于快速存儲,緩存用于更快速的內(nèi)容累積和高效訪問等。除此之外,為了讓系統(tǒng)能運(yùn)行起來還需要有總線和其它的職能部件。雖然它們看起來沒有像CPU那么重要,也不參與直接運(yùn)算,但正是有了這些看似簡單卻不可缺少的部分,才使得一臺計(jì)算機(jī)真正成為一臺通用性的計(jì)算機(jī),承擔(dān)并完成各類任務(wù)。
某種程度上,思謀在思考和實(shí)踐AI的整體性創(chuàng)新和升級上,正類似于在構(gòu)建一臺計(jì)算機(jī)、一個能用、好用、易用的完整計(jì)算系統(tǒng)。這就要求AI在架構(gòu)上需要建立真正的完整系統(tǒng),而不是一個個孤立的“CPU”計(jì)算單元的單個算法。這個完整體系中的許多服務(wù)模塊不參與核心算法設(shè)計(jì)或者調(diào)試,但是這些服務(wù)模塊可以作為短期或者長期存儲,加速運(yùn)算、加快數(shù)據(jù)流,以實(shí)現(xiàn)僅需少量研發(fā)人員卻能取得他們以往需要耗費(fèi)大量時間和工作量(如5倍以上)的結(jié)果。 所以我相信這種系統(tǒng)性的方法與實(shí)踐是AI 2. 0的最核心要素,那么對于視覺AI 2.0 的體系結(jié)構(gòu)突破,也是思謀重要的差異化體現(xiàn)。
視覺AI的發(fā)展,以需求為根本,強(qiáng)結(jié)合場景是重中之重
科技的進(jìn)步會以滿足社會發(fā)展需求為根本和內(nèi)在的源動力。AI技術(shù)落地的場景,例如遠(yuǎn)程會議中的視頻壓縮、去噪聲、超低和不穩(wěn)帶寬下的編碼技術(shù)、圖像增強(qiáng)這些強(qiáng)結(jié)合,技術(shù)是根本,這些場景對于技術(shù)的需求是不可或缺的。但如果是加臉部掛件就比較弱結(jié)合,相對可有可無,需要慎重務(wù)實(shí)考慮。
所以在前期視覺AI的發(fā)展中,人臉這類和我們生活結(jié)合最緊密的應(yīng)用會獲得直接的關(guān)注和投入。在應(yīng)用上也有美顏美妝、改變年齡這類跟社交媒體直接掛鉤的普遍需求,所以我們做過 “一鍵上妝” 和 “一鍵卸妝” 這類有趣的科技應(yīng)用和發(fā)明。如果用通訊頻段做類比,人臉應(yīng)用就是一個2.5GHz上的信號,因?yàn)榇藨?yīng)用頻段固定,所以我們對它的優(yōu)化已經(jīng)非常好了,我們只要有接收機(jī)接收到它,就可以穩(wěn)定傳輸信號了。
現(xiàn)如今,AI應(yīng)用已經(jīng)突破了人臉的應(yīng)用“頻段”,推廣到了人體姿態(tài)這類問題,且問題都得到了很好的解決,實(shí)現(xiàn)了研發(fā)落地。這可以理解為2.6GHz/2.7GHz這些信號都有了固定的發(fā)送器,設(shè)置好之后,接收器就可以穩(wěn)定工作了。相比于這些固定頻段發(fā)送器,我們關(guān)注的是更具有普適性、更高難度的、多種類高清視頻的理解處理。比如一張自然照片里有人、風(fēng)景、動物和動作,這絕不僅僅是人臉或者人體的識別就能解決的問題,因?yàn)檫@個頻段在不斷變化,接收器也需要不斷移動才能接收到信號。
集中研發(fā)AI 2.0系統(tǒng)化能力就是賦能提效,把開發(fā)的投入以幾何級降低(減少),實(shí)現(xiàn)即使再大量的算法需求也能在有限的技術(shù)團(tuán)隊(duì)和預(yù)算時間條件下完成應(yīng)用開發(fā)
一方面,這類超寬“頻譜”的問題是現(xiàn)在互聯(lián)網(wǎng)上多媒體應(yīng)用的首要方向,具有很強(qiáng)的商業(yè)模式和技術(shù)挑戰(zhàn)性。高清視頻的高速傳播、高清線上線下分布式編輯、5G交互的新商業(yè)方式探索,這些都是很值得我們?yōu)橹度氲?。另一方面,從技術(shù)體系來看,因?yàn)椤俺瑢掝l譜”不固定信號位置,所以它的“發(fā)送”和“接收”成了新的問題?;氐綉?yīng)用本身,視頻的內(nèi)容千變?nèi)f化,內(nèi)容的多樣也就意味著單個算法不能解決所有問題,即便有100種、1000種算法就能保證找到好的方案。因?yàn)檫@1000種算法,還意味著大概1000個優(yōu)秀研發(fā)團(tuán)隊(duì)同時開動才能在預(yù)計(jì)研發(fā)時間里完成任務(wù),或者是100個團(tuán)隊(duì)花10倍的預(yù)計(jì)時間完成任務(wù),這種成本極高的方式在商業(yè)領(lǐng)域都是不能夠接受的。所以在高清媒體方向上,技術(shù)體系上符合我們對于AI 2.0系統(tǒng)化流程的表述:建設(shè)體系化的構(gòu)建并能在如此復(fù)雜的領(lǐng)域做出關(guān)鍵性突破和實(shí)現(xiàn)大規(guī)模部署,也是現(xiàn)有的思謀Media產(chǎn)品的組織研發(fā)與商業(yè)運(yùn)作方向。
工業(yè)、農(nóng)業(yè)、流通和零售等行業(yè)是拉動并評價AI更實(shí)質(zhì)、更廣域發(fā)展的“必考題”。尤其這次疫情,讓大家看到工廠沒人會停工,停工導(dǎo)致經(jīng)濟(jì)停滯,經(jīng)濟(jì)停滯會讓國家進(jìn)入艱難狀況等一系列我們不希望看到的情況。目前制造業(yè)的機(jī)器動作能力都很強(qiáng),但是智能,包括感知和決策,和真正的需求仍有非常大的差距。
再者,當(dāng)前工業(yè)所需要的AI是遠(yuǎn)遠(yuǎn)復(fù)雜過現(xiàn)有的單個算法的。在人臉大領(lǐng)域,五官存在很多共性,但是在工業(yè)領(lǐng)域,數(shù)據(jù)五花八門,采集方式多不勝數(shù),所以很難有一個算法或者一套數(shù)據(jù)是保證有效的。與超高清視頻應(yīng)用相同,1000套算法的需求是1000個團(tuán)隊(duì)做1個月或者1個團(tuán)隊(duì)做1000個月,其中的開銷或者工期不是實(shí)際商業(yè)化過程所能承擔(dān)的。所以集中研發(fā)AI 2.0系統(tǒng)化能力就是賦能提效,把開發(fā)的投入以幾何級降低(減少),實(shí)現(xiàn)即使再大量的算法需求也能在有限的技術(shù)團(tuán)隊(duì)下和在預(yù)算時間條件下完成應(yīng)用開發(fā),這也是思謀從誕生第一天開始的使命所在。
從AI 1.0到2.0,我們還有很長的路要走,也需要很多的科學(xué)家和技術(shù)企業(yè)共同去探索突破。這也是我創(chuàng)立思謀的最初的想法,希望思謀成為波瀾壯闊的以人工智能為核心的科技革命大時代下的重要推動者和變革者。在通往工業(yè)智慧生產(chǎn)、生活品質(zhì)飛躍的未來的道路上,我們需要加速升級和挖掘AI的整體服務(wù)智能,打破現(xiàn)有的思維框架,同時秉承實(shí)干創(chuàng)新的精神,進(jìn)行AI技術(shù)的應(yīng)用、研發(fā)和能力部署,和穩(wěn)健快速的規(guī)?;娜律墶?/p>
責(zé)任編輯:Ct
評論
查看更多