導讀:去年,知乎上一篇討論騰訊技術(shù)的帖子異?;鸨?,討論的主題是當下(2018 年)騰訊的技術(shù)建設(shè)是否處于落后同體量公司的狀態(tài),這篇帖子得到騰訊內(nèi)部以及其他互聯(lián)網(wǎng)公司「碼農(nóng)」的“激情”回復。
當然,也有人反駁,包括騰訊被 diss 的開源情況也有人出來“打抱不平”,表示騰訊已經(jīng)變得越來越開放,開源已在路上,請給它一點時間。
問題是,這些吐槽現(xiàn)在還是真實情況嗎?為找到這個問題的答案,本文將從騰訊的技術(shù)建設(shè)、開源,以及 AI 實力這幾個方面進行分析,來一探究竟。
技術(shù)建設(shè)落后是真實的嗎?
總結(jié)下來,知乎上關(guān)于騰訊技術(shù)建設(shè)落后的吐槽,其中很重要的一點集中在「重復造輪子」相關(guān)的問題上,比如:
1、技術(shù)債務重,文檔查找和共享難,出了技術(shù)問題不知道問誰等問題;
2、技術(shù)氛圍差,各個團隊敝帚自珍,重復造輪子;
3、內(nèi)部賽馬機制導致“沒有收益”的事情沒人愿意做;
當然,對于這些吐槽,知乎上也有不少用戶站出來反駁,比如有騰訊內(nèi)部人員匿名表示,騰訊技術(shù)團隊的總體水平其實并不差,很多獨立的模塊設(shè)計和抽象都比較出色,技術(shù)含量也不低,只是總體上感覺還有很大優(yōu)化空間。而且,騰訊在不斷發(fā)生變化和改進,這從微信和 QQ 產(chǎn)品的體驗中可以感受得到。
注:上述為知乎部分用戶看法,僅做參考,不一定代表真實情況。
全面擁抱開源
在騰訊被吐槽的眾多技術(shù)問題中,「重復造輪子」、分享難等狀況是廣受詬病的問題。針對這些問題,騰訊通過開源將成果在內(nèi)部分享來改善,并追趕 BAT 中其他兩家公司的步伐。那么,它做出了哪些努力呢?
▌發(fā)布開源路線圖
實際上,2010 年騰訊已經(jīng)全面擁抱“開放”戰(zhàn)略,2012 年發(fā)布了第一個對外開源項目。從 2016 年開始,騰訊不斷將內(nèi)部開源項目在 GitHub 上發(fā)布。
近日,騰訊在開源上有了一次大動作,首次全面公開了其整體的開源路線圖。據(jù)了解,基于代碼開放和社區(qū)運營,騰訊的開源路線是通過“三步走”的開源計劃,不斷深化騰訊已有的技術(shù)能力,推動從封閉孤立向協(xié)同開放向社區(qū)開放治理的縱深方向發(fā)展。
具體來說,第一步是內(nèi)部開源協(xié)同。首先拉通內(nèi)部項目和組織,通過部門小團隊作戰(zhàn)或跨部門大團隊作戰(zhàn)的方式協(xié)同推進,以優(yōu)化資源配置的方式集中優(yōu)勢尋求技術(shù)突破。隨后,騰訊建立起篩選機制將代碼開放出來。
第二步是外部代碼開放。優(yōu)化設(shè)計與代碼結(jié)構(gòu),不斷拓展落地場景,有效利用外部貢獻者資源實現(xiàn)資源整合,構(gòu)建技術(shù)影響力。
第三步是社區(qū)開放治理,在這一階段,注重大規(guī)模技術(shù)推廣與應用、開發(fā)者生態(tài)體系構(gòu)建、社區(qū)領(lǐng)袖與領(lǐng)導力培養(yǎng)、全社會研發(fā)資源的優(yōu)化配置四個方面。
據(jù)騰訊開源聯(lián)盟主席、騰訊開源管理辦公室委員、Apache Member 堵俊平透露,騰訊開源將重點關(guān)注 IaaS、容器與云原生、數(shù)據(jù)庫、大數(shù)據(jù)與 AI、中間件、IoT/邊緣計算、小程序生態(tài)等。
▌成立騰訊開源管理辦公室
此外,為更好地服務開源,騰訊特別對內(nèi)成立了開源管理辦公室,下設(shè)項目管理委員會、騰訊開源聯(lián)盟和開源合規(guī)組三大組織,自上而下地傳遞騰訊開源策略,自下而上地落地開源技術(shù)生態(tài)。同時,通過開放的開源評審平臺,孵化和培育優(yōu)秀的自主開源項目。
▌內(nèi)部機制
同時,騰訊內(nèi)部其實有一套自己的開源機制,經(jīng)騰訊技術(shù)管理委員會授權(quán),由騰訊研發(fā)管理職責部門牽頭騰訊法務、合規(guī)、專利、安全等相關(guān)部門,整合為騰訊開源合規(guī)小組,在開源流程、安全、風險、建議方面對騰訊業(yè)務提供專業(yè)服務。合規(guī)小組會幫助開源項目整理第三方組件的引用,通過第三方掃描工具(如 blackduck、fossid等)識別和確認第三方代碼有效性,同時會進行人工篩查,確保第三方使用騰訊代碼時安全可控。
在協(xié)議選取上,合規(guī)小組會對項目的開源許可證進行合規(guī)化的建議,并向業(yè)務推薦開放性的許可協(xié)議。
在文化方面,由研發(fā)管理部 CODE 平臺中心負責組織建設(shè)騰訊代碼文化和內(nèi)部開源,鼓勵騰訊項目首先在騰訊內(nèi)部流動,并對有價值的項目引導和幫助對外開源。
同時,在騰訊技術(shù)管理委員會的授權(quán)下牽頭設(shè)立了“騰訊開源聯(lián)盟”,由不同業(yè)務的技術(shù)專家、負責人、技術(shù)領(lǐng)袖組成開源聯(lián)盟組委會和專家團,在開源文化、開源經(jīng)驗、開源活動等方面對開源項目施以指導和幫助。
在這套機制下,截至 2019 年 6 月,騰訊已在 Github 上發(fā)布 75 個開源項目,包含微信、騰訊云、騰訊游戲、騰訊 AI、騰訊安全等相關(guān)領(lǐng)域,累計在 Github 獲得了 22W+ Star 數(shù)。
目前,騰訊自主開源的項目包括:
Angel:靈活而強大的參數(shù)服務器型分布式機器學習平臺
WeUI:輕量而優(yōu)雅的微信 UI 樣式庫
Wepy:小程序組件化開發(fā)框架
Tars:整套微服務治理和開發(fā)運營一體化解決方案
官網(wǎng)及項目詳情地址:
https://opensource.tencent.com/
官方 GitHub 詳情地址:
https://github.com/Tencent/
關(guān)注騰訊的人應該了解,騰訊還參與貢獻了 Openstack、 KVM、docker、NVDIMM、ceph、HBase、Hadoop、linux、Spark、kubernetes、torrent、dht、goprocinfo、flannel、netlink 等開源社區(qū)和項目,主導發(fā)布了 Hadoop 2.8.4、2.8.5 和 Spark 2.3.2,并將開源項目 Tars、TSeer 和 Angel 分別捐贈 Linux基金會和Linux 深度學習基金會,并將長期于基金會運作。同時,騰訊還是 Linux 基金會、Apache 基金會、Openstack 基金會、MariaDB 基金會及 LF 深度學習基金會的白金會員。
堵俊平表示,騰訊之所以重視開源,原因在于:從外部環(huán)境來看,隨著主流的開發(fā)平臺Linux、Android 等逐漸開源化,IT 產(chǎn)業(yè)想要取得更大的市場份額,擁抱開源是當務之急;從騰F訊內(nèi)部的技術(shù)積累來看,騰訊內(nèi)部已經(jīng)累積了超過 8000 個經(jīng)過用戶驗證的開源項目,可以向開源社區(qū)輸出優(yōu)質(zhì)開源項目;從生態(tài)機遇來看,開源能夠很好地服務于騰訊重點戰(zhàn)略方向,例如作為騰訊云的 Paas、Saas 服務封裝,推動機器學習和人工智能的廣泛應用。
AI 實力哪家強?
如今,AI 已經(jīng)成為一家公司綜合實力不可忽略的一部分,尤其是對于 BAT 來說,AI 在戰(zhàn)略層面的定位很大程度上決定了公司的發(fā)展方向。
在 AI 方面,數(shù)據(jù)顯示,騰訊與百度與阿里相比似乎并不占優(yōu)勢,但仍在有重點地奮力追趕,在一些領(lǐng)域已占有優(yōu)勢。
2018年,CB Insights 的報告挖掘了 BAT 在AI 方面的相關(guān)專利記錄、投資和收益等,全方位描繪了 BAT 的 AI 策略。報告顯示,百度在 AI 領(lǐng)域處于領(lǐng)先地位。BAT 分別著重自動駕駛、智慧城市和醫(yī)療 AI,在政府的大力支持下,BAT 正在向全世界擴張。
首先,在戰(zhàn)略上,百度就早于阿里和騰訊意識到 AI 的重要性,在 2010 年就已經(jīng)在電話會議上討論 AI,時間甚至早于谷歌,而阿里和騰訊都是在近年才提出 AI 戰(zhàn)略。
百度財報顯示,自 2011 年以來,百度就大規(guī)模投入人工智能技術(shù)的研發(fā),最近幾年研發(fā)投入占總收入保持在 15% 左右。
相比之下,騰訊財報顯示,騰訊 2019 年第一季度營收 854.7 億元,同比增長 16%,但收入構(gòu)成中未包含 AI 帶來收入的信息,主要收入來源是增值服務和金融科技及企業(yè)服務,占比分別為 57% 和 25%,網(wǎng)絡(luò)廣告占比 16 %,其他收入占比 2%。
但在學術(shù)研究上,騰訊正在成長為一支“生力軍”,在國際頂級會議上的表現(xiàn)可圈可點,如在今年的 CVPR 會議上,今年騰訊公司共有 58 篇論文入選,其中騰訊 AI Lab 33 篇(含 8 篇oral),騰訊優(yōu)圖實驗室 25 篇,騰訊 AI Lab 入選論文涉及視頻理解、人臉識別、對抗攻擊、視覺-語言描述、模型壓縮和多任務學習等幾大重點研究方向。2018 年,騰訊 AI Lab 在 NIPS(現(xiàn)已更名NeurIPS) 上共有 20 篇論文入選,其中 2 篇被選為亮點論文(Spotlight),其他成績還包括計算機視覺領(lǐng)域頂會 CVPR (21篇)和 ECCV(19篇)、機器學習領(lǐng)域頂會 ICML(16篇)、NLP 領(lǐng)域頂會 EMNLP(16篇),以及語音領(lǐng)域頂會 Interspeech(8篇)等??梢?,騰訊的 AI 學術(shù)研究能力并不落后。
在應用層面,騰訊的成果也很矚目,如發(fā)布了基于多模態(tài)研究的首個“電競虛擬人”,策略協(xié)作型 AI“絕悟”首次亮相KPL決賽,與人類戰(zhàn)隊(超過99%玩家)進行 5V5 水平測試并取得勝利。
在 AI 投資上,BAT 三家都向全球擴擴張,約 44% 的資金流向美國的初創(chuàng)公司,其中騰訊在美國的投資交易最多,參與了 12 項交易。
(來源:CB Insights )
CB Insights 數(shù)據(jù)顯示,在 AI 專利上,百度和阿里在語音領(lǐng)域領(lǐng)先,而騰訊專利則更多與計算機視覺研究相關(guān)。9月6日,騰訊宣布優(yōu)圖實驗室升級為騰訊計算機視覺研發(fā)中心,將加大研發(fā)投入,且不設(shè) KPI,可見其對 CV 開發(fā)的重視程度。幾日后,騰訊 AI Lab 開源了“Tencent ML-Images”數(shù)據(jù)集,作為騰訊開源第58個項目(https://github.com/Tencent),這是騰訊在計算機視覺領(lǐng)域所累積的基礎(chǔ)能力的一次釋放。
當然,三家公司在 AI 應用方面的重心不一,百度在自動駕駛領(lǐng)域領(lǐng)先,如在最近的百度 AI 開發(fā)者大會上公布了開放平臺 Apollo 迭代到 5.0 最新版本,并宣布與吉利在智能網(wǎng)聯(lián)、智能駕駛、智能家居、電子商務等領(lǐng)域達成戰(zhàn)略合作,以及多項落地項目,如在百度大廈和百度科技園試運營的自主泊車,與紅旗攜手打造的中國首條 L4 乘用車前裝產(chǎn)線在長春投產(chǎn)下線,無人駕駛出租車(Robotaxi)項目“Apollo Go”亮相等。這些都是實實在在的進步。
而阿里巴巴的一大優(yōu)勢在于其人工智能云平臺“ET 城市大腦”。據(jù)官網(wǎng)介紹,“ET 城市大腦”背后的團隊為阿里達摩院城市大腦實驗室,華先勝為負責人,張磊為高級研究員,研究方向包括多模態(tài)數(shù)據(jù)感知、城市交通預測與干預、城市大規(guī)模并行異構(gòu)計算、城市復雜環(huán)境感知與理解、城市視覺搜索引擎和城市市政規(guī)劃和公共資源分析。阿里使用城市大腦來處理來自相機、傳感器、社交媒體和政府數(shù)據(jù)等方面的數(shù)據(jù),并使用人工智能算法來預測醫(yī)療保健、城市規(guī)劃、交通管理等方面的結(jié)果,科研實力不容小覷。
相比之下,騰訊則將重點放在 AI 醫(yī)療保健領(lǐng)域。除了大力投資 AI 醫(yī)療企業(yè),騰訊還重點研發(fā)醫(yī)療智能平臺,2017 年 8 月,騰訊發(fā)布了其首個 AI+醫(yī)療影像產(chǎn)品:“騰訊覓影”,可輔助醫(yī)生對肺結(jié)節(jié)、乳腺癌、糖尿病視網(wǎng)膜病變、早期食管癌等疾病進行篩查。截至 2018 年 7 月,騰訊覓影已累計輔助醫(yī)生閱讀醫(yī)學影像超 1 億張,服務超百萬患者,提示高風險病變 15 萬例。同年 11 月,“騰訊覓影”進入了首批國家新一代人工智能開放創(chuàng)新平臺名單,負責建設(shè)醫(yī)療影像國家新一代人工智能開放創(chuàng)新平臺。隨后,騰訊又相繼發(fā)布了首款醫(yī)療AI引擎“騰訊瑞智”和“騰訊超級大腦”,后者將人工智能技術(shù)融入到醫(yī)藥研發(fā)、基因組數(shù)據(jù)分析、導診、疾病篩查、輔助診療、醫(yī)療管理等環(huán)節(jié)。
另一方面,在 AI 開源上,騰訊也在加緊步伐:
(紅框部分為騰訊 AI 相關(guān)開源項目,不完全統(tǒng)計)
圍棋 AI 技術(shù)PhoenixGo,這是騰訊微信翻譯團隊開發(fā)的人工智能圍棋程序,曾在 2018 年以 BensonDarr(昵稱“金毛”)的名義在騰訊野狐圍棋平臺上和全球頂尖職業(yè)棋手、圍棋愛好者及各路圍棋AI 對弈,在 4 月底取得了 200 多連勝,并在福州 2018 人工智能圍棋大賽上奪冠,引起了行業(yè)內(nèi)廣泛關(guān)注。
Tencent ML-Images:2018 年 9 月 底騰訊 AI Lab 開源,由多標簽圖像數(shù)據(jù)集 ML-Images,以及業(yè)內(nèi)目前同類深度學習模型中精度最高的深度殘差網(wǎng)絡(luò) ResNet-101 構(gòu)成。
Angel:基于參數(shù)服務器理念開發(fā)的高性能分布式機器學習平臺。
behaviac:游戲 AI 的開發(fā)框架組建,也是游戲源性的快速設(shè)計工具。
FeatherCNN:高性能神經(jīng)網(wǎng)絡(luò)前向計算庫等。
NeuralClassifier:NeuralNLP的一個子項目,是一款基于PyTorch開發(fā)的深度學習文本分類工具。
看到這里,我們會發(fā)現(xiàn)僅從上述資料中無法找出文章開始提出問題的答案,但還是可以從中得出一些較為客觀的結(jié)果:
市面上存在著對騰訊技術(shù)建設(shè)的質(zhì)疑,但從用戶體驗來講,騰訊的主流產(chǎn)品和技術(shù)研發(fā)并沒有讓用戶失望;
騰訊的開源狀況不如 BAT 其他兩家,因為騰訊在開源上起步晚,但這家公司已經(jīng)在保持開放的態(tài)度,且在奮力追趕之下已經(jīng)有不少項目對業(yè)界產(chǎn)生不小的影響;
騰訊的AI 實力究竟如何也需要從多角度考量,雖然整體上百度的 AI 實力最強,但騰訊在 AI 研發(fā)上是認真的,比如在醫(yī)療影像 AI 領(lǐng)域,騰訊的技術(shù)積累已經(jīng)助力不少優(yōu)質(zhì)項目落地,且背靠充足資金的支持,這是其他 AI 創(chuàng)業(yè)公司無法企及的優(yōu)勢。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11163瀏覽量
103422 -
AI
+關(guān)注
關(guān)注
87文章
31026瀏覽量
269363 -
騰訊
+關(guān)注
關(guān)注
7文章
1656瀏覽量
49478
原文標題:騰訊擁抱開源:首次公布開源路線圖,技術(shù)研發(fā)向共享、復用和開源邁進
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論