前有全球千百萬開發(fā)者的熱烈追捧,后有谷歌爸爸的鼎力支持,TensorFlow從一出生開始就注定不平凡。
而谷歌剛剛宣布將推出TensorBoard.dev預(yù)覽版,用于共享TensorBoard機(jī)器學(xué)習(xí)可視化效果,同時(shí)發(fā)布的還有TensorFlow Enterprise,通過TensorFlow與云團(tuán)隊(duì)之間的協(xié)作來生成云服務(wù)。
根據(jù)谷歌副總裁Megan Kacholia所言,“現(xiàn)在可以托管和跟蹤ML實(shí)驗(yàn),并實(shí)現(xiàn)公開共享,無需設(shè)置,只需上傳日志及共享URL,其他人即可查看實(shí)驗(yàn)及使用TensorBoard所做的一切”。TensorFlow Enterprise旨在為大型企業(yè)提供TensorFlow的優(yōu)化版本,可提供多達(dá)3倍的數(shù)據(jù)讀取改進(jìn)。
作為全球最熱的開源軟件平臺(tái),TensorFlow的大名相信已經(jīng)不需要過多介紹。早在2011年,谷歌大腦團(tuán)隊(duì)作為內(nèi)部機(jī)器學(xué)習(xí)工具而打造的DistBelief就凝聚了一大批谷歌杰出程序員的心血,其中不乏Jeff Dean這樣的天才人物。
2015年11月,以DistBelief為基礎(chǔ),TensorFlow初版正式發(fā)布,立即引發(fā)強(qiáng)烈反響,當(dāng)時(shí)就有報(bào)道將TensorFlow和2008年安卓手機(jī)操作系統(tǒng)的誕生相提并論,更有人稱TensorFlow的發(fā)布標(biāo)志著“谷歌已經(jīng)從一家搜索公司,變成了一家機(jī)器學(xué)習(xí)公司。在未來幾年內(nèi)將在技術(shù)行業(yè)引發(fā)強(qiáng)烈震動(dòng)。”
后來的事實(shí)證明,這個(gè)說法實(shí)際上并不準(zhǔn)確,TensorFlow給技術(shù)行業(yè)帶來的不僅僅是震動(dòng),而是一場全方位的革命。正如MapReduce和Hadoop讓“大數(shù)據(jù)”變得家喻戶曉一樣,過去幾年來,伴隨著機(jī)器學(xué)習(xí)領(lǐng)域的飛躍式發(fā)展,在“機(jī)器學(xué)習(xí)”幾乎成為計(jì)算機(jī)科學(xué)的代名詞的過程中,TensorFlow更是居功至偉。
正值TensorFlow 2.0正式版發(fā)布不久之際,全球開發(fā)者和開源用戶又迎來了另一次歷史性的盛事:首屆TensorFlow World大會(huì)正于美國加州圣克拉拉舉辦。
短暫開場式后,Jeff Dean亮相做開場主題演講。
Jeff Dean:TensorFlow下載量已超4600萬
Jeff Dean表示,盡管芯片的摩爾定律可能面臨終結(jié),但“AI論文數(shù)量”的摩爾定律可能才剛剛起步?,F(xiàn)在,每天都有100篇機(jī)器學(xué)習(xí)領(lǐng)域的新論文誕生。
機(jī)器學(xué)習(xí)使得過去不可能的事情變得可能。語音識(shí)別、圖像識(shí)別翻譯和預(yù)測(cè)上的性能日新月異。2011年,機(jī)器學(xué)習(xí)圖像識(shí)別的錯(cuò)誤率最低大概是26%,到了2016年,這個(gè)數(shù)字就迅速降至4%,錯(cuò)誤率已經(jīng)低于經(jīng)過專業(yè)訓(xùn)練的人類水平(5%)。
在語音識(shí)別和機(jī)器翻譯等其他基于機(jī)器學(xué)習(xí)的領(lǐng)域,也出現(xiàn)了同樣明顯的技術(shù)進(jìn)步。
Jeff Dean在演講中列出了美國國家工程院于2008年發(fā)布的“21世紀(jì)14大工程學(xué)挑戰(zhàn)”。十年后的現(xiàn)在回過頭來看,有些問題已經(jīng)解決,有些看到了解決的希望,有些仍未解決。值得注意的是,在已經(jīng)解決的問題中,機(jī)器學(xué)習(xí)和AI發(fā)揮了不可或缺的作用。
重建和提升城市基礎(chǔ)設(shè)施
交通是城市生活的重要組成部分,在機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺技術(shù)的加持下,自動(dòng)駕駛車輛的性能迅速提升,雷達(dá)、多角度攝像頭和傳感器讓車輛具備實(shí)時(shí)處理來自環(huán)境的原始數(shù)據(jù)的能力。換句話說,車輛能夠在行駛中實(shí)時(shí)快速理解周圍正在發(fā)生的事。
這些都不再是遙不可及的夢(mèng),谷歌旗下的自動(dòng)駕駛車企業(yè)Waymo早已開始路測(cè),從去年開始,Waymo的路測(cè)車輛中坐的是普通的乘客,而且拿掉了安全員。
重塑醫(yī)療信息學(xué)
Jeff Dean認(rèn)為,在醫(yī)療領(lǐng)域,AI技術(shù)的最重要意義在于,將世界級(jí)的專業(yè)醫(yī)學(xué)服務(wù),以極低的成本帶給了世界上更多的人。
以糖尿病視網(wǎng)膜病變?yōu)槔?,這是世界上導(dǎo)致可預(yù)防性致盲的疾病中增長最快的一種,全世界因該病而可能致盲的人群多達(dá)4億。通過每年定期檢查,可以有效防控這種疾病,降低致盲風(fēng)險(xiǎn)。但是做這種檢查需要專業(yè)的眼科醫(yī)生,一般醫(yī)生無法勝任,這導(dǎo)致印度有45%的患者因?yàn)檠劭漆t(yī)生數(shù)量短缺,沒能及時(shí)確診而致盲。
怎么辦?Jeff Dean表示,該病的診斷實(shí)際上可以通過計(jì)算機(jī)視覺來輔助進(jìn)行,訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)“看圖診斷”。診斷結(jié)果很有意思,AI醫(yī)生和人類眼科醫(yī)生平均有60%的幾率給出一致的診斷意見,看上去并不高是吧?如果讓人類醫(yī)生隔幾個(gè)小時(shí)看同一張片子,兩次給出相同診斷意見的概率也只有65%。
這個(gè)問題其實(shí)不難解決。只要增加人類醫(yī)生的數(shù)量,繼續(xù)用標(biāo)記圖像數(shù)據(jù)訓(xùn)練AI模型,最終模型的診斷水平甚至能夠相當(dāng)于甚至超過美國眼科醫(yī)生的平均水平。
NLP終于迎來新范式
前面許多進(jìn)步都依賴于能夠理解文本,而在理解語言方面,最近取得了很大的進(jìn)步。
2017年谷歌研究員提出Transformer模型,這篇論文非常成功,在英語-德語和英語-法語的機(jī)器翻譯中達(dá)到了最高的準(zhǔn)確率,同時(shí)計(jì)算成本降低了10~100倍。
到了2018年,谷歌研究員提出BERT模型,這是一個(gè)強(qiáng)大的預(yù)訓(xùn)練模型,如今已經(jīng)成為一種新的NLP范式。比如在“完形填空”這個(gè)任務(wù)中,它的原理是:
步驟1:使用大量的自我監(jiān)督文本,為“完形填空”任務(wù)預(yù)訓(xùn)練一個(gè)模型
步驟2:使用少量數(shù)據(jù)對(duì)單個(gè)語言任務(wù)的模型進(jìn)行微調(diào)。
在GLUE基準(zhǔn)測(cè)試中,BERT模型在一系列語言任務(wù)中都取得了最好的結(jié)果。
Jeff Dean接著介紹Google在開發(fā)用于科學(xué)發(fā)現(xiàn)的工具方面的進(jìn)展,無論是無人駕駛還是太空探索,都需要有最好的工具,TensorFlow就是其一。
TensorFlow現(xiàn)在已經(jīng)被下載46000000次,被用到各種各樣的任務(wù)當(dāng)中,有些甚至超乎想象。
自動(dòng)化機(jī)器學(xué)習(xí)AutoML
Jeff Dean 接下來介紹了 AutoML。
自動(dòng)化機(jī)器學(xué)習(xí)的目標(biāo)是為計(jì)算機(jī)開發(fā)能夠自動(dòng)解決新的機(jī)器學(xué)習(xí)問題的技術(shù),而不用每次遇到新問題都需要人類機(jī)器學(xué)習(xí)專家干預(yù)。如果我們想要真正的智能系統(tǒng),這是所需要的最基本的能力。AutoML 是使用強(qiáng)化學(xué)習(xí)和進(jìn)化算法設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的新方法。
再如神經(jīng)架構(gòu)搜索(NAS),這也是當(dāng)前研究的一個(gè)熱點(diǎn),它的想法是通過強(qiáng)化學(xué)習(xí)訓(xùn)練模型生成器,然后:
(1)生成10個(gè)模型
(2)訓(xùn)練幾個(gè)小時(shí)
(3)用生成的模型的損失作為強(qiáng)化學(xué)習(xí)信號(hào)
從而提升模型的準(zhǔn)確性,應(yīng)用到自己的任務(wù)中。
通過不斷迭代來找到最優(yōu)的模型,這樣的模型非常有效。
上面是一個(gè)圖像識(shí)別的模型。過去幾年深度學(xué)習(xí)在圖像識(shí)別方面取得了非??焖俚倪M(jìn)展,如下面的折線圖所示,縱軸表示圖像識(shí)別的準(zhǔn)確性,橫軸表示浮點(diǎn)數(shù)量,藍(lán)色線條是AutoML的表現(xiàn),可以看到,模型的準(zhǔn)確性在不斷提高。
Jeff Dean預(yù)測(cè),由于計(jì)算能力的提升,自動(dòng)化機(jī)器學(xué)習(xí)的能力會(huì)不斷增長。
圖像識(shí)別之外,在物體檢測(cè)、機(jī)器翻譯等領(lǐng)域也有同樣的趨勢(shì)。
最后,Jeff Dean總結(jié)了TensorFlow的目標(biāo):
- 大模型,但稀疏激活
- 單個(gè)模型解決多個(gè)任務(wù)
- 通過大模型動(dòng)態(tài)地學(xué)習(xí)和成長路徑
- 模型架構(gòu)根據(jù)需要進(jìn)行調(diào)整
- 利用現(xiàn)有的技能和表示添加新任務(wù)
為什么要選擇TensorFlow 2.0?
谷歌副總裁Megan Kacholia為我們介紹了最新的TensorFlow 2.0。
圖:谷歌副總裁Megan Kacholia
TensorFlow 是一個(gè)端到端開源機(jī)器學(xué)習(xí)平臺(tái)。它擁有一個(gè)包含各種工具、庫和社區(qū)資源的全面靈活生態(tài)系統(tǒng),可以讓研究人員推動(dòng)機(jī)器學(xué)習(xí)領(lǐng)域的先進(jìn)技術(shù)的發(fā)展,并讓開發(fā)者輕松地構(gòu)建和部署由機(jī)器學(xué)習(xí)提供支持的應(yīng)用。
Megan把TensorFlow形容為“一個(gè)完整的生態(tài)系統(tǒng)”,可以幫助開發(fā)者使用機(jī)器學(xué)習(xí)解決棘手的現(xiàn)實(shí)問題。它具備3大特點(diǎn):
1、輕松地構(gòu)建模型
TensorFlow 提供多個(gè)抽象級(jí)別,因此開發(fā)者可以根據(jù)自己的需求選擇合適的級(jí)別??梢允褂酶唠A Keras API 構(gòu)建和訓(xùn)練模型。如果對(duì)更高的靈活性又要求,則可以借助 Eager Execution 進(jìn)行快速迭代和直觀的調(diào)試。對(duì)于大型機(jī)器學(xué)習(xí)訓(xùn)練任務(wù),可以使用 Distribution Strategy API 在不同的硬件配置上進(jìn)行分布式訓(xùn)練,而無需更改模型定義。
2、隨時(shí)隨地進(jìn)行可靠的機(jī)器學(xué)習(xí)生產(chǎn)
TensorFlow 始終提供直接的生產(chǎn)途徑。不管是在服務(wù)器、邊緣設(shè)備還是網(wǎng)絡(luò)上,無論使用何種語言或平臺(tái),TensorFlow 都可以讓開發(fā)者輕松地訓(xùn)練和部署模型。如果需要完整的生產(chǎn)型機(jī)器學(xué)習(xí)流水線,可以使用 TensorFlow Extended (TFX);如果要在移動(dòng)設(shè)備和邊緣設(shè)備上進(jìn)行推斷,可以使用 TensorFlow Lite。如果想在 JavaScript 環(huán)境中訓(xùn)練和部署模型,可以使用 TensorFlow.js 。
本文來自新智元,本文作為轉(zhuǎn)載分享。
-
谷歌
+關(guān)注
關(guān)注
27文章
6171瀏覽量
105487 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132724 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13838瀏覽量
166538 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60537
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論