端到端的AutoML在Kaggle Days上處理表格數(shù)據(jù)
谷歌研究人員最近將一種基于學(xué)習(xí)的方法應(yīng)用于表格數(shù)據(jù),創(chuàng)建了一種可擴(kuò)展的端到端AutoML技術(shù)。AutoML符合三個關(guān)鍵標(biāo)準(zhǔn),包括:
完全自動化:不需要人工干預(yù)。輸入包括數(shù)據(jù)和計算資源,輸出是一個可服務(wù)的TensorFlow模型
廣泛的覆蓋范圍:適用于許多表格數(shù)據(jù)域的任意任務(wù)
高質(zhì)量:模型由AutoML生成,質(zhì)量堪比由ML專家創(chuàng)建的人工模型
AutoML首次參與由74個團(tuán)隊組成的KaggleDays SF Hackathon。該挑戰(zhàn)主要關(guān)于預(yù)測制造缺陷,目標(biāo)是提供有關(guān)材料性能的信息和批量汽車零部件的測試結(jié)果。盡管他們必須與Kaggle master級別的參與者競爭,但谷歌AutoML團(tuán)隊最后仍名列第二。
AutoML在表格數(shù)據(jù)問題中的應(yīng)用是非常令人興奮的。AutoML可以實現(xiàn)能夠解決表格數(shù)據(jù)問題的最先進(jìn)模型。它可以幫助ML社區(qū)解決大量的問題——欺詐檢測、庫存預(yù)測,在商業(yè)零售、供應(yīng)鏈管理、金融、制造、鉛轉(zhuǎn)換等等等。谷歌的目標(biāo)是使ML更具可伸縮性,并加快研究和行業(yè)應(yīng)用程序。
實現(xiàn)魯棒的Winograd模式挑戰(zhàn)結(jié)果的訣竅
研究人員最近證明,對WSCR上現(xiàn)有的LMs進(jìn)行調(diào)參有助于提高LM處理WSC273和WNLI的能力。他們介紹了一種生成大規(guī)模WSC樣本的方法,并用它從英文維基百科創(chuàng)建了一個1100萬的數(shù)據(jù)集。該方法還與WSCR一起用于對預(yù)先訓(xùn)練的BERT LM進(jìn)行調(diào)參。對WSC273和WNLI的準(zhǔn)確率分別達(dá)到72.2%和71.9%,較之前的最優(yōu)水平分別提高了8.5%和6.8%。
由于WSC示例是為了展現(xiàn)像人一樣的常識和推理而開發(fā)的,因此該任務(wù)非常具有挑戰(zhàn)性。在WSC比賽中,兩輪取得90%準(zhǔn)確率的參賽者可獲25,000元大獎。此前最著名的解決方案使用了深度學(xué)習(xí),準(zhǔn)確率為63.7%。
本研究工作是第一個突破WNLI多數(shù)基線的模型。通過對WSCR數(shù)據(jù)集上的BERT語言模型進(jìn)行微調(diào),實現(xiàn)了對WSC和WNLI數(shù)據(jù)集的改進(jìn)。它具有幫助未來Winograd模式挑戰(zhàn)參與者提高WSC和WNLI準(zhǔn)確性的潛力。
通過仿真,探索和總結(jié)建立自動方程式SAE賽車的經(jīng)驗教訓(xùn)
上周晚些時候,一組研究人員公布了他們在開發(fā)模擬自動駕駛算法時的所有探索和經(jīng)驗教訓(xùn),然后將其部署到一輛真實的汽車上。他們的工作特別集中在方程式賽車的學(xué)生無人駕駛競賽上。在這項比賽中,方程式賽車是由學(xué)生設(shè)計并制造的,然后它們要穿過由交通標(biāo)記的看不見的賽道。
論文主要貢獻(xiàn):
端到端設(shè)計和部署一個自治堆棧,可以基于AirSim駕駛一個自定義方程式SAE。
獨(dú)特的擴(kuò)增,顯著改善記錄過程和訓(xùn)練模型
模擬訓(xùn)練系統(tǒng)如何在真實的環(huán)境中部署的詳細(xì)介紹。
對真實應(yīng)用中的人工智能,仿真是一項關(guān)鍵技術(shù)。在自動駕駛汽車上路之前,對其進(jìn)行虛擬驗證尤為必要。對于該領(lǐng)域的研究人員來說,安全性非常重要。本文在各種模擬場景中發(fā)揮了巨大的作用,以幫助未來的自動化軟件達(dá)到更高的標(biāo)準(zhǔn)。
微軟推出開源跨平臺的機(jī)器學(xué)習(xí)框架
微軟最近推出了ML.NET,這是一個用于構(gòu)建自定義機(jī)器學(xué)習(xí)庫解決方案的框架。開發(fā)ML.NET是為了讓開發(fā)人員能夠使用ML框架編寫、測試和部署ML。它當(dāng)前的實現(xiàn)包括2773K行c#代碼和大約74K行c++代碼,這些代碼能夠支持高性能的機(jī)器學(xué)習(xí)應(yīng)用。ML.NET還支持80多個特征設(shè)定器和40個機(jī)器學(xué)習(xí)模型。
開發(fā)人員可以訓(xùn)練ML模型或使用第三方現(xiàn)有模型,并在任何脫機(jī)環(huán)境中運(yùn)行,這意味著他們不需要有數(shù)據(jù)科學(xué)背景(知識)就可以使用該框架。
ML.NET是為了響應(yīng)微軟數(shù)據(jù)科學(xué)家的眾多需求和見解而開發(fā)的,這些數(shù)據(jù)科學(xué)家將使用它來開發(fā)全球數(shù)百萬人使用的服務(wù)和產(chǎn)品。
作為一個免費(fèi)的庫,ML.NET將大型軟件應(yīng)用程序中的ML模型應(yīng)用變得更加容易。該框架以一種易于使用的方式實現(xiàn),即在大型數(shù)據(jù)集上提供可拓展性的同時,還有較高的性能和在單個API數(shù)據(jù)轉(zhuǎn)換下進(jìn)行統(tǒng)一的能力。
隨著ML快速發(fā)展成為現(xiàn)代應(yīng)用程序開發(fā)的核心元素,ML.NET將幫助開發(fā)人員將ML引入相同的技術(shù)堆棧,以便更有效地編寫和共享ML機(jī)制。
利用主動不確定性降低(AUR)增強(qiáng)機(jī)器人和控制RL
對于機(jī)器人與控制,控制器的性能和穩(wěn)定性與模擬器的仿真度有關(guān)。在此背景下,一組研究人員介紹了一種利用系統(tǒng)動力學(xué)的仿真和不確定性量化的方法,能夠以一種有效的方式來學(xué)習(xí)控制器。
他們的方法是從一個在線階段開始的,該階段會評估一些用數(shù)據(jù)生成的仿真。利用訓(xùn)練數(shù)據(jù)和高斯過程(GPs)估計了系統(tǒng)的轉(zhuǎn)變動力學(xué)和獎勵函數(shù)。
然后,通過自適應(yīng)采樣,該方法使用一種有原則的方式對低保真度模型進(jìn)行增強(qiáng)。在離線模式下,該方法則利用強(qiáng)化學(xué)習(xí)、近端策略優(yōu)化(PPO)等無模型方法,提高了模型保真度以及優(yōu)化了控制器策略。
本文結(jié)合了基于模型和無模型方法的優(yōu)點(diǎn),實現(xiàn)了穩(wěn)定控制器的開發(fā),提高了機(jī)器人以及控制器的有效數(shù)據(jù)?,F(xiàn)實世界中的機(jī)器人制造成本高昂。這種研究工作有助于簡化過程,并為復(fù)雜的系統(tǒng)動力學(xué)提供了更好的建模能力。
-
微軟
+關(guān)注
關(guān)注
4文章
6598瀏覽量
104071 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132654
原文標(biāo)題:自動駕駛方程式賽車,微軟發(fā)布機(jī)器學(xué)習(xí)開源框架 | AI一周學(xué)術(shù)
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論