0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種工具將AutoML方法的分析和控制權(quán)給到用戶手中

DPVg_AI_era ? 來源:lq ? 2019-06-23 09:59 ? 次閱讀

MIT、香港科技大學(xué)和浙江大學(xué)的研究人員開發(fā)了一種交互式工具,首次實(shí)現(xiàn)讓用戶對(duì)自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)系統(tǒng)的工作方式和流程進(jìn)行查看和控制,提高系統(tǒng)定制化程度,向打開機(jī)器學(xué)習(xí)“黑盒子”的目標(biāo)邁進(jìn)了一大步。

為特定任務(wù)設(shè)計(jì)機(jī)器學(xué)習(xí)模型(如圖像分類,疾病診斷和股市預(yù)測等)是一個(gè)艱巨而耗時(shí)的過程。研究人員首先要從多種不同的算法中進(jìn)行選擇來構(gòu)建模型。然后在模型開始訓(xùn)練之前,手動(dòng)調(diào)整“超參數(shù)”,確定模型的整體結(jié)構(gòu)。

近期出現(xiàn)的自動(dòng)機(jī)器學(xué)習(xí)(AutoML)系統(tǒng)可以對(duì)算法和超參數(shù)進(jìn)行迭代式的測試和修改,并在此過程中選擇最適合的模型。但系統(tǒng)的運(yùn)行機(jī)制是不透明的,相當(dāng)于一個(gè)“黑盒子”,也就是說系統(tǒng)選擇了什么技術(shù)、什么模型,用戶是看不見的。因此,用戶就可能不信任模型給出的結(jié)果,而且很難根據(jù)自己的搜索需求來對(duì)系統(tǒng)進(jìn)行定制。

定制化AutoML工具:模型自選,超參數(shù)自調(diào)

近日,在ACM CHI計(jì)算系統(tǒng)中人的因素會(huì)議上,麻省理工學(xué)院,香港科技大學(xué)和浙江大學(xué)的研究人員共同研發(fā)出一種工具,將AutoML方法的分析和控制權(quán)給到用戶手中。

該工具名為ATMSeer,它將AutoML系統(tǒng)、數(shù)據(jù)集和有關(guān)用戶任務(wù)的一些信息作為輸入,然后在用戶友好型的界面內(nèi)實(shí)現(xiàn)可視化搜索過程,界面中還能提供更多關(guān)于模型性能的深入信息。

“使用ATMSeer,用戶可以自己選擇和觀察AutoML系統(tǒng)是如何工作的,”該研究論文的共同作者之一Kalyan Veeramachaneni說道,他是麻省理工學(xué)院信息與決策系統(tǒng)實(shí)驗(yàn)室(LIDS)的首席研究科學(xué)家,負(fù)責(zé)將數(shù)據(jù)引入AI團(tuán)隊(duì)。 “用戶可以只選擇一些性能最好的模型,或者結(jié)合其他因素或某些領(lǐng)域的專業(yè)知識(shí),來指導(dǎo)AutoML系統(tǒng)去搜索某些特定模型?!?/p>

在對(duì)AutoML新手的案例研究中,研究人員發(fā)現(xiàn)大約85%使用ATMSeer的人對(duì)系統(tǒng)選擇的模型充滿信心。幾乎所有參與者都表示,該工具讓使用AutoML系統(tǒng)變得更舒服了。

ATMSeer會(huì)生成一個(gè)用戶友好的界面,顯示有關(guān)所選模型性能的深入信息,以及可調(diào)整的算法和參數(shù)的選項(xiàng)。

ATMSeer自動(dòng)機(jī)器學(xué)習(xí)定制化工具的用戶友好型交互界面

“數(shù)據(jù)可視化是實(shí)現(xiàn)人與機(jī)器之間更好協(xié)作的有效方法。ATMSeer體現(xiàn)了這一理念,”論文合作者之一、香港科技大學(xué)的Wang Qianwen說。 “ATMSeer主要會(huì)讓機(jī)器學(xué)習(xí)從業(yè)者受益,無論他們從事什么領(lǐng)域,專業(yè)水平如何,都能獲益。ATMSeer可以緩解手動(dòng)選擇機(jī)器學(xué)習(xí)算法和調(diào)整超參數(shù)的不便?!?/p>

便捷可視化工具實(shí)現(xiàn)“可視即可調(diào)”

ATMSeer工具的核心是一款定制的AutoML系統(tǒng),名為“自動(dòng)調(diào)整模型”(ATM),由Veeramachaneni等研究人員在2017年開發(fā)。與傳統(tǒng)的AutoML系統(tǒng)不同的是,ATM在嘗試擬合模型時(shí)會(huì)對(duì)所有搜索結(jié)果進(jìn)行完整的編目。

ATM將任何數(shù)據(jù)集和編碼預(yù)測任務(wù)作為輸入。系統(tǒng)隨機(jī)選擇算法類別,比如神經(jīng)網(wǎng)絡(luò),決策樹、隨機(jī)森林和邏輯回歸,并選擇模型的超參數(shù),如決策樹的大小或神經(jīng)網(wǎng)絡(luò)層數(shù)等。

然后,系統(tǒng)針對(duì)數(shù)據(jù)集運(yùn)行模型,迭代式調(diào)整超參數(shù),并衡量模型性能。ATM利用掌握到了模型性能來選擇另一個(gè)模型。最后,由系統(tǒng)針對(duì)任務(wù)輸出幾個(gè)表現(xiàn)最理想的模型。

訣竅在于,每個(gè)模型基本上可以被視為帶有一系列變量的數(shù)據(jù)點(diǎn):這里說的變量包含算法,超參數(shù)和性能。在此基礎(chǔ)上,研究人員設(shè)計(jì)了一套系統(tǒng),在指定的圖形和圖表上繪制數(shù)據(jù)點(diǎn)和變量。以此為起點(diǎn),開發(fā)了一系列新技術(shù),能夠?qū)崟r(shí)重新配置數(shù)據(jù)。 “亮點(diǎn)在于,使用這些工具,你能夠可視化的任何東西,都可以修改?!笔访芩拐f。

類似的可視化工具專門用于分析一種特定的機(jī)器學(xué)習(xí)模型,并能夠在有限的搜索空間內(nèi)實(shí)現(xiàn)定制化?!耙虼?,這些工具可以為分析和觀察AutoML的運(yùn)行流程提供了有限的支持,還需要對(duì)許多搜索模型的配置進(jìn)行分析。相比之下,ATMSeer支持分析使用各種算法生成的機(jī)器學(xué)習(xí)模型?!?/p>

將AutoML控制權(quán)交給用戶,使用體驗(yàn)和信心明顯提升

ATMSeer的可視化界面由三部分組成。用戶可以通過控制面板上傳數(shù)據(jù)集和AutoML系統(tǒng),并啟動(dòng)或暫停搜索過程。下圖是一個(gè)概覽面板,顯示了基本統(tǒng)計(jì)數(shù)據(jù),如搜索的算法和超參數(shù)的數(shù)量,還有按降序排列的最佳模型的“排行榜”。Veeramachaneni表示:“如果你不是特別在意技術(shù)細(xì)節(jié)的專家,這可能是你最感興趣的點(diǎn)?!?/p>

ATMSeer包含一個(gè)“AutoML Profiler”,其中的面板包含有關(guān)算法和超參數(shù)的深入信息,這些信息都可以進(jìn)行調(diào)整。面板可以將所有算法類別表示為直方圖形式,用條形圖顯示算法性能分?jǐn)?shù)的分布,范圍為0到10,具體取決于其超參數(shù)。用一個(gè)單獨(dú)的面板呈現(xiàn)散點(diǎn)圖,顯示不同超參數(shù)和算法類型的性能折衷。

對(duì)沒有AutoML經(jīng)驗(yàn)的機(jī)器學(xué)習(xí)專家的案例研究表明,讓用戶掌握控制權(quán)確實(shí)有助于提高AutoML應(yīng)用的性能和效率。對(duì)生物學(xué)、金融等不同科學(xué)領(lǐng)域的13位研究生的研究也表明,確定用戶對(duì)AutoML的搜索的自定義關(guān)鍵有三點(diǎn):搜索的算法數(shù)量、系統(tǒng)運(yùn)行時(shí)間以及查找表現(xiàn)最好的模型。研究人員表示,這些信息可用來為用戶量身定制系統(tǒng)。

研究人員表示,目前對(duì)AutoML的應(yīng)用缺乏足夠的靈活性?!艾F(xiàn)在所有這些信息都集中在一個(gè)地方,如果人們能夠清楚看到幕后發(fā)生的事情,有能力控制這些流程,未來對(duì)AutoML的應(yīng)用將跨入一個(gè)嶄新的階段?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1197

    瀏覽量

    20969
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8425

    瀏覽量

    132769

原文標(biāo)題:MIT、浙大等打造AutoML可視化工具:模型自選、超參數(shù)自調(diào)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一種混合顏料光譜分區(qū)間識(shí)別方法

    古代彩繪顏料的分析是科技考古與文物保護(hù)研究的重要內(nèi)容,高光譜是近年來發(fā)展迅速的新興技術(shù),在物質(zhì)識(shí)別上具有廣泛應(yīng)用,提出一種基于高光譜分區(qū)間的混合顏料識(shí)別方法。 一種混合顏料光譜分區(qū)間識(shí)
    的頭像 發(fā)表于 12-02 16:22 ?98次閱讀
    <b class='flag-5'>一種</b>混合顏料光譜分區(qū)間識(shí)別<b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設(shè)備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發(fā)表于 10-24 14:57 ?678次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

    一種新型電流模式控制集成電路

    電子發(fā)燒友網(wǎng)站提供《一種新型電流模式控制集成電路.pdf》資料免費(fèi)下載
    發(fā)表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b>新型電流模式<b class='flag-5'>控制</b>集成電路

    SensiML開源AutoML解決方案-Piccolo AI發(fā)布

    SensiML強(qiáng)大的Analytics Studio軟件開發(fā)工具的開源版本-Piccolo AI發(fā)布了!Piccolo AI遵循AGPL許可,面向個(gè)人開發(fā)者、研究人員和AI愛好者,旨在AutoML
    的頭像 發(fā)表于 07-22 16:53 ?783次閱讀

    rup是一種什么模型

    的起源可以追溯20世紀(jì)90年代初,當(dāng)時(shí)Rational Software公司開始開發(fā)一種新的軟件開發(fā)方法。這種方法的目標(biāo)
    的頭像 發(fā)表于 07-09 10:13 ?1316次閱讀

    數(shù)據(jù)采集方法有哪些?工具有哪些?

    數(shù)據(jù)采集是數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的基礎(chǔ),它涉及從各種來源收集、整理和存儲(chǔ)數(shù)據(jù)的過程。以下是些常見的數(shù)據(jù)采集方法工具,以及它們的特點(diǎn)和應(yīng)用場
    的頭像 發(fā)表于 07-01 15:35 ?1410次閱讀

    伺服電機(jī)最簡單控制方法是什么

    伺服電機(jī)是一種高精度、高響應(yīng)速度的電機(jī),廣泛應(yīng)用于工業(yè)自動(dòng)化、機(jī)器人、航空航天等領(lǐng)域。伺服電機(jī)的控制方法有很多種,這里我們介紹一種最簡單、
    的頭像 發(fā)表于 06-05 15:49 ?817次閱讀

    功率分析儀的使用方法和注意事項(xiàng)

    功率分析儀是一種用于測量電能參數(shù)的專業(yè)儀器,廣泛應(yīng)用于電力系統(tǒng)、電力設(shè)備測試、能效評(píng)估等領(lǐng)域。它通過對(duì)高精度電壓、電流信號(hào)的采集,得到高精度的功率等相關(guān)數(shù)值,為工程師和技術(shù)人員提供了強(qiáng)大的測量和分析
    的頭像 發(fā)表于 05-11 16:09 ?2529次閱讀

    一種用于微液滴中單細(xì)胞無標(biāo)記分析的液滴篩選(LSDS)方法

    基于液滴的單細(xì)胞分析一種非常強(qiáng)大的工具,可用于以單細(xì)胞分辨率研究表型和基因組異質(zhì)性,從而解決各種生物問題。
    的頭像 發(fā)表于 03-26 11:17 ?579次閱讀
    <b class='flag-5'>一種</b>用于微液滴中單細(xì)胞無標(biāo)記<b class='flag-5'>分析</b>的液滴篩選(LSDS)<b class='flag-5'>方法</b>

    直流斬波電路是一種什么變換電路的方法

    直流斬波電路是電子技術(shù)中的一種重要變換電路方法。在直流斬波電路中,通過控制電路開關(guān)的通斷,可以實(shí)現(xiàn)直流電壓的轉(zhuǎn)換和變換,直流電壓按定的規(guī)
    的頭像 發(fā)表于 03-12 13:50 ?1114次閱讀

    放大電路有哪三基本分析方法?舉例說明

    放大電路是電子電路的重要組成部分,它起到放大信號(hào)的作用。在設(shè)計(jì)和分析放大電路時(shí),有三基本的分析方法:傳輸特性分析、小信號(hào)
    的頭像 發(fā)表于 02-25 15:56 ?3316次閱讀

    gis中常用的空間分析方法

    詳細(xì)介紹GIS中常用的空間分析方法,包括空間插值、緩沖區(qū)分析、空間統(tǒng)計(jì)、領(lǐng)域分析、網(wǎng)絡(luò)分析和多
    的頭像 發(fā)表于 02-25 13:44 ?5821次閱讀

    mapgis如何區(qū)屬性賦值

    MapGIS是款功能強(qiáng)大的地理信息系統(tǒng)軟件,它提供了豐富的功能和工具,使用戶能夠?qū)Φ乩頂?shù)據(jù)進(jìn)行快速、高效的管理和分析。其中個(gè)重要的功能就
    的頭像 發(fā)表于 02-23 17:49 ?2330次閱讀

    主導(dǎo) AI,馬斯克尋求更大控制權(quán);應(yīng)對(duì)法案,蘋果拆分 App Store 謀生存

    ,以及這些變革如何塑造我們的未來世界。 馬斯克欲掌控特斯拉 AI 的未來,要 25% 投票權(quán) 特斯拉 CEO 埃隆·馬斯克近日表示,如果不能達(dá)到至少 25% 的投票控制權(quán),他可能會(huì)在特斯拉之外開發(fā) AI 產(chǎn)品。作為特斯拉最大單
    的頭像 發(fā)表于 01-16 20:55 ?835次閱讀
    主導(dǎo) AI,馬斯克尋求更大<b class='flag-5'>控制權(quán)</b>;應(yīng)對(duì)法案,蘋果拆分 App Store 謀生存

    一種擴(kuò)展Spring控制反轉(zhuǎn)的絕妙方法

    類型等于JSON,我就用JSON解析器,那如果新加個(gè)類型的解析器,是不是調(diào)用的客戶端還要修改呢?這顯然太耦合了,本文就介紹一種方法,服務(wù)定位模式Service Locator Pattern來解決,它幫助我們消除緊耦合實(shí)現(xiàn)及其依賴性,并提出
    的頭像 發(fā)表于 01-10 09:41 ?484次閱讀