為什么這三家公司最終都不約而同地放棄 TensorFlow ,而轉(zhuǎn)向了 PyTorch?
深度學(xué)習(xí)框架 PyTorch 憑借其相對(duì)易用性,已經(jīng)滲透到了企業(yè)中。本文提到的三家公司告訴我們,為什么他們選擇 PyTorch 而不是 Google 著名的 TensorFlow 框架。
深度學(xué)習(xí) 是機(jī)器學(xué)習(xí)的一個(gè)子類別,它使用多層神經(jīng)網(wǎng)絡(luò)將歷史上很難完成的機(jī)器任務(wù)——比如 圖像識(shí)別、自然語言處理 和 機(jī)器翻譯——實(shí)現(xiàn)大規(guī)模自動(dòng)化。
自 2015 年以來,TensorFlow 就從 Google 中脫穎而出,在研究和商業(yè)領(lǐng)域成為最受歡迎的開源深度學(xué)習(xí)框架。但是 2016 年從 Facebook 誕生的 PyTorch 由于社區(qū)推動(dòng)的易用性改進(jìn)和越來越廣泛的用例部署,而迅速 趕上TensorFlow。
在汽車行業(yè),PyTorch 的應(yīng)用尤為廣泛——它可以應(yīng)用于 Tesla 和 Lyft Level 5 等公司的實(shí)驗(yàn)性自動(dòng)駕駛系統(tǒng)。該框架也被媒體公司用來對(duì)內(nèi)容進(jìn)行分類和推薦,并在工業(yè)應(yīng)用中支持機(jī)器人。
Facebook AI 的人工智能產(chǎn)品主管 Joe Spisak 告訴 InfoWorld,雖然他對(duì)企業(yè)采用 PyTorch 的人數(shù)增加感到高興,但要擴(kuò)大行業(yè)應(yīng)用范圍,還有很多工作要做。
“MLOps 和 Kubeflow 管道以及這些社區(qū)的支持將會(huì)帶來新一輪的采用浪潮,”他說?!皩?duì)于那些剛起步的人來說,這些工具都相當(dāng)不錯(cuò),它們使用了托管服務(wù)和一些開源的東西,比如 AWS 的 SageMaker 或 Azure ML?!?/p>
Disney:識(shí)別電影中的動(dòng)畫面孔
自 2012 年以來,媒體巨頭 Disney 的工程師和數(shù)據(jù)科學(xué)家一直在構(gòu)建該公司所謂的“內(nèi)容基因組”(Content Genome)的知識(shí)圖譜,將內(nèi)容元數(shù)據(jù)聚合在一起,從而推動(dòng) Disney 龐大的內(nèi)容庫中基于機(jī)器學(xué)習(xí)的搜索和個(gè)性化應(yīng)用。
“這個(gè)元數(shù)據(jù)改進(jìn)了 Disney 故事講述者用于制作內(nèi)容的工具;激發(fā)故事中的迭代創(chuàng)新;通過推薦引擎,數(shù)字導(dǎo)航和內(nèi)容發(fā)現(xiàn)提高用戶體驗(yàn);并實(shí)現(xiàn)了商業(yè)智能?!盌isney 的開發(fā)人員 Miquel±ngel Farré、Anthony Accardo、Marc Junyent、Monica Alfaro 和 Cesc Guitart 在 今年 7 月的一篇博客文章 中寫道。
在這之前,Disney 不得不投資一個(gè)龐大的內(nèi)容注釋項(xiàng)目,求助于其數(shù)據(jù)科學(xué)家,利用深度學(xué)習(xí)的圖像識(shí)別模型,訓(xùn)練一個(gè)自動(dòng)化標(biāo)記管道,以識(shí)別海量的人物,地點(diǎn)和地點(diǎn)圖像。
Disney 的工程師們最初嘗試了包括 TensorFlow 在內(nèi)的各種框架,但在 2019 年,他們決定將 PyTorch 與之結(jié)合起來。工程師們從傳統(tǒng)的 方向梯度直方圖(histogram of oriented gradients,HOG)特征描述器和流行的 支持向量機(jī)(support vector machines,SVM)模型,轉(zhuǎn)向了被稱為 基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(regions with convolutional neural networks,R-CNN)的目標(biāo)檢測(cè)架構(gòu)版本。在處理 Disney 內(nèi)容中常見的真人動(dòng)作、動(dòng)畫和視覺效果的組合時(shí),后者更為有利。
“在動(dòng)畫片中很難定義什么是人臉,所以我們轉(zhuǎn)向深度學(xué)習(xí)方法,使用目標(biāo)檢測(cè)器,并使用遷移學(xué)習(xí)?!盌isney 研究工程師 Monica Alfaro 向 InfoWorld 解釋道。在僅僅處理了幾千張人臉之后,新模型已經(jīng)能夠大致識(shí)別所有三種用例中的人臉。它于 2020 年 1 月投入生產(chǎn)。
她表示:“我們現(xiàn)在只使用一種模型來識(shí)別三種類型的人臉,這對(duì)于像《復(fù)仇者聯(lián)盟》這樣的漫威電影來說是很棒的。因?yàn)樵谶@類電影中,鋼鐵俠和 Tony Stark 或者任何一個(gè)戴面具的角色都需要被識(shí)別出?!?/p>
由于工程師要處理如此大量的視頻數(shù)據(jù)以并行地訓(xùn)練和運(yùn)行模型,所以他們也希望在投入生產(chǎn)階段時(shí),能夠運(yùn)行在昂貴的高性能 GPU 上。
從 CPU 的轉(zhuǎn)變讓工程師可以更快地重新訓(xùn)練和更新模型。它還加快了向 Disney 各個(gè)小組分發(fā)測(cè)試結(jié)果的速度,將處理時(shí)間從一部長篇電影的大約一個(gè)小時(shí)縮短到今天的 5 到 10 分鐘。
“TensorFlow 目標(biāo)檢測(cè)器在生產(chǎn)環(huán)境中會(huì)存在內(nèi)存問題,并且很難更新;而 PyTorch 有同樣的目標(biāo)檢測(cè)器和 Faster-RCNN,因此我們開始使用 PyTorch 來解決所有的問題?!盇lfaro 說。
對(duì)工程團(tuán)隊(duì)來說,這種從一個(gè)框架到另一個(gè)框架的轉(zhuǎn)換也出奇地簡(jiǎn)單?!埃ǜ挠?PyTorch)很容易,因?yàn)樗际莾?nèi)置的,你只需要插入一些功能,就可以快速上手,所以它的學(xué)習(xí)曲線并不陡峭?!盇lfaro 說。
當(dāng)他們遇到任何問題或瓶頸時(shí),充滿活力的 PyTorch 社區(qū)隨時(shí)提供幫助。
Blue River Technology:除草機(jī)器人
Blue River Technology 設(shè)計(jì)了一款機(jī)器人,這種機(jī)器人結(jié)合了數(shù)字尋路、集成攝像頭和計(jì)算機(jī)視覺技術(shù),可以在農(nóng)作物不受影響的情況下,在近乎實(shí)時(shí)的環(huán)境給雜草噴灑除草劑,幫助農(nóng)民更有效地節(jié)約昂貴且可能對(duì)環(huán)境造成破壞的除草劑。
這家位于加利福尼亞州森尼韋爾的公司在 2017 年吸引了重型設(shè)備制造商 John Deere 的關(guān)注,當(dāng)時(shí)該公司以 3.05 億美元的價(jià)格被 收購,目的是將該技術(shù)整合到其農(nóng)業(yè)設(shè)備中。
Blue River Technology 的研究人員利用各種深度學(xué)習(xí)框架進(jìn)行了試驗(yàn),試圖訓(xùn)練計(jì)算機(jī)視覺模型來識(shí)別雜草和農(nóng)作物之間的差異,這對(duì)處理棉花植物來說是一個(gè)巨大的挑戰(zhàn),因?yàn)槊藁ㄖ参锊恍业嘏c雜草相似。
Blue River Technology 的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)主管 Chris Padwick 在他 8 月份的一篇 博客文章 中寫道,訓(xùn)練有素的農(nóng)藝師被征召來執(zhí)行人工圖像標(biāo)注任務(wù),并使用 PyTorch 訓(xùn)練 卷積神經(jīng)網(wǎng)絡(luò)(CNN),以“分析每一幀圖像,并生成像素級(jí)精度的地圖,顯示農(nóng)作物和雜草所在的位置”。
“像其他公司一樣,我們也試過 Caffe、TensorFlow 和 PyTorch,”Padwick 告訴 InfoWorld?!皩?duì)我們來說,這幾乎是一種開箱即用的方法,我們既沒有收到過任何 bug 報(bào)告,也沒有出現(xiàn)過阻塞 bug。在分布式計(jì)算中,它真的很亮眼,它的性能確實(shí)比 TensorFlow 要好,TensorFlow 在數(shù)據(jù)并行方面相當(dāng)復(fù)雜?!?/p>
Padwick 表示,PyTorch 框架的普及和簡(jiǎn)單性使得他在快速招聘新員工方面具有優(yōu)勢(shì)。話雖如此,Padwick 仍然夢(mèng)想著這樣一個(gè)世界:“人們可以在自己喜歡的環(huán)境中進(jìn)行開發(fā)?!庇行┤讼矚g用 Apache MXNet、Darknet 或 Caffe 進(jìn)行研究,但是在生產(chǎn)環(huán)境中,它們只能使用單一語言,而 PyTorch 擁有我們成功所需的一切?!?/p>
Datarock:基于云端的采礦業(yè)圖像分析
Datarock 是由一群地球科學(xué)家創(chuàng)立的澳大利亞初創(chuàng)公司,正在將 計(jì)算機(jī)視覺 技術(shù)應(yīng)用于采礦業(yè)。更具體地說,它的深度學(xué)習(xí)模型正在幫助地質(zhì)學(xué)家比以前更快地分析鉆探巖心樣本圖像。
通常,地質(zhì)學(xué)家會(huì)一厘米一厘米地仔細(xì)研究這些樣品,以評(píng)估礦物學(xué)和結(jié)構(gòu);而工程師則會(huì)尋找諸如斷層、裂縫和巖石質(zhì)量等物理特征。這一過程是緩慢的,而且很容易出現(xiàn)人為錯(cuò)誤。
Datarock 的首席運(yùn)營官 Brenton Crawford 告訴 InfoWorld:“計(jì)算機(jī)可以像工程師一樣看到巖石。如果你能在圖像中看到,我們就可以訓(xùn)練一個(gè)模型去分析它,就像訓(xùn)練一個(gè)人類一樣。”
與 Blue River 類似,Datarock 在生產(chǎn)環(huán)境中使用了 RCNN 模型的一種變體,研究人員轉(zhuǎn)向數(shù)據(jù)增強(qiáng)技術(shù),以便在早期階段收集足夠的訓(xùn)練數(shù)據(jù)。
“在最初的發(fā)現(xiàn)期之后,團(tuán)隊(duì)開始將各種技術(shù)結(jié)合起來,為鉆探巖心圖像創(chuàng)建一個(gè)圖像處理工作流程。這項(xiàng)工作包括開發(fā)一系列深度學(xué)習(xí)模型,能夠?qū)⒃紙D像處理為結(jié)構(gòu)化格式,并分割重要的地質(zhì)信息?!毖芯咳藛T在一篇 博客文章 中寫道。
通過 DataRock 的技術(shù),客戶只需半小時(shí)就能得到結(jié)果,而手工記錄結(jié)果需要五、六小時(shí)。Crawford 說,這樣可以使地質(zhì)學(xué)家不再從事更繁重的工作。但是,“當(dāng)我們將更困難的事情實(shí)現(xiàn)自動(dòng)化時(shí),我們確實(shí)會(huì)受到一些阻力,不得不解釋為什么要把它們作為訓(xùn)練模型和使反饋循環(huán)轉(zhuǎn)動(dòng)的系統(tǒng)的一部分?!?/p>
和許多公司訓(xùn)練深度學(xué)習(xí)計(jì)算機(jī)視覺模型一樣,Datarock 也是從 TensorFlow 開始的,但很快就轉(zhuǎn)向了 PyTorch。
Datarock 的機(jī)器學(xué)習(xí)主管 Duy Tin Truong 告訴 InfoWorld:“一開始我們使用的是 TensorFlow,但是由于某些神秘的原因它會(huì)崩潰?!彼f,“當(dāng)時(shí) PyTorch 和 Detecton2 剛剛發(fā)布,非常符合我們的需求,所以經(jīng)過一些測(cè)試之后,我們發(fā)現(xiàn)它更容易調(diào)試和工作,而且占用的內(nèi)存也更少,所以我們進(jìn)行了轉(zhuǎn)換?!?/p>
Datarock 還報(bào)告說,當(dāng)在 GPU 上運(yùn)行模型時(shí),從 TensorFlow 到 PyTorch 和 Detectron2 的推理性能提高了 4 倍,而在 CPU 上則提高了 3 倍。
Truong 列舉了 PyTorch 不斷增長的社區(qū)、設(shè)計(jì)良好的界面、易于使用和更好的調(diào)試作為切換的理由,并指出,盡管“從界面的角度來看,它們是完全不同的,但如果你懂 TensorFlow,那么切換起來是相當(dāng)容易的,特別是如果你了解 Python 的時(shí)候?!?/p>
作者介紹:
Scott Carey,經(jīng)驗(yàn)豐富的多媒體記者,專注于科技、旅游、體育、文化和社交媒體。目前是記者和編輯,管理著一支由 B2B 記者組成的優(yōu)秀團(tuán)隊(duì),并且具有豐富的數(shù)字技能,在為網(wǎng)絡(luò)和紙媒撰稿、報(bào)道事件、電視記者和電臺(tái)記者方面的經(jīng)驗(yàn)。
責(zé)任編輯:lq
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28562瀏覽量
207707 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121340 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60563
原文標(biāo)題:始于TensorFlow ,終于PyTorch
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論