0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種工具將AutoML方法的分析和控制權給到用戶手中

DPVg_AI_era ? 來源:lq ? 2019-06-23 09:59 ? 次閱讀

MIT、香港科技大學和浙江大學的研究人員開發(fā)了一種交互式工具,首次實現(xiàn)讓用戶對自動化機器學習(AutoML)系統(tǒng)的工作方式和流程進行查看和控制,提高系統(tǒng)定制化程度,向打開機器學習“黑盒子”的目標邁進了一大步。

為特定任務設計機器學習模型(如圖像分類,疾病診斷和股市預測等)是一個艱巨而耗時的過程。研究人員首先要從多種不同的算法中進行選擇來構建模型。然后在模型開始訓練之前,手動調整“超參數(shù)”,確定模型的整體結構。

近期出現(xiàn)的自動機器學習(AutoML)系統(tǒng)可以對算法和超參數(shù)進行迭代式的測試和修改,并在此過程中選擇最適合的模型。但系統(tǒng)的運行機制是不透明的,相當于一個“黑盒子”,也就是說系統(tǒng)選擇了什么技術、什么模型,用戶是看不見的。因此,用戶就可能不信任模型給出的結果,而且很難根據(jù)自己的搜索需求來對系統(tǒng)進行定制。

定制化AutoML工具:模型自選,超參數(shù)自調

近日,在ACM CHI計算系統(tǒng)中人的因素會議上,麻省理工學院,香港科技大學和浙江大學的研究人員共同研發(fā)出一種工具,將AutoML方法的分析和控制權給到用戶手中。

該工具名為ATMSeer,它將AutoML系統(tǒng)、數(shù)據(jù)集和有關用戶任務的一些信息作為輸入,然后在用戶友好型的界面內實現(xiàn)可視化搜索過程,界面中還能提供更多關于模型性能的深入信息。

“使用ATMSeer,用戶可以自己選擇和觀察AutoML系統(tǒng)是如何工作的,”該研究論文的共同作者之一Kalyan Veeramachaneni說道,他是麻省理工學院信息與決策系統(tǒng)實驗室(LIDS)的首席研究科學家,負責將數(shù)據(jù)引入AI團隊。 “用戶可以只選擇一些性能最好的模型,或者結合其他因素或某些領域的專業(yè)知識,來指導AutoML系統(tǒng)去搜索某些特定模型?!?/p>

在對AutoML新手的案例研究中,研究人員發(fā)現(xiàn)大約85%使用ATMSeer的人對系統(tǒng)選擇的模型充滿信心。幾乎所有參與者都表示,該工具讓使用AutoML系統(tǒng)變得更舒服了。

ATMSeer會生成一個用戶友好的界面,顯示有關所選模型性能的深入信息,以及可調整的算法和參數(shù)的選項。

ATMSeer自動機器學習定制化工具的用戶友好型交互界面

“數(shù)據(jù)可視化是實現(xiàn)人與機器之間更好協(xié)作的有效方法。ATMSeer體現(xiàn)了這一理念,”論文合作者之一、香港科技大學的Wang Qianwen說。 “ATMSeer主要會讓機器學習從業(yè)者受益,無論他們從事什么領域,專業(yè)水平如何,都能獲益。ATMSeer可以緩解手動選擇機器學習算法和調整超參數(shù)的不便?!?/p>

便捷可視化工具實現(xiàn)“可視即可調”

ATMSeer工具的核心是一款定制的AutoML系統(tǒng),名為“自動調整模型”(ATM),由Veeramachaneni等研究人員在2017年開發(fā)。與傳統(tǒng)的AutoML系統(tǒng)不同的是,ATM在嘗試擬合模型時會對所有搜索結果進行完整的編目。

ATM將任何數(shù)據(jù)集和編碼預測任務作為輸入。系統(tǒng)隨機選擇算法類別,比如神經網絡,決策樹、隨機森林和邏輯回歸,并選擇模型的超參數(shù),如決策樹的大小或神經網絡層數(shù)等。

然后,系統(tǒng)針對數(shù)據(jù)集運行模型,迭代式調整超參數(shù),并衡量模型性能。ATM利用掌握到了模型性能來選擇另一個模型。最后,由系統(tǒng)針對任務輸出幾個表現(xiàn)最理想的模型。

訣竅在于,每個模型基本上可以被視為帶有一系列變量的數(shù)據(jù)點:這里說的變量包含算法,超參數(shù)和性能。在此基礎上,研究人員設計了一套系統(tǒng),在指定的圖形和圖表上繪制數(shù)據(jù)點和變量。以此為起點,開發(fā)了一系列新技術,能夠實時重新配置數(shù)據(jù)。 “亮點在于,使用這些工具,你能夠可視化的任何東西,都可以修改?!笔访芩拐f。

類似的可視化工具專門用于分析一種特定的機器學習模型,并能夠在有限的搜索空間內實現(xiàn)定制化?!耙虼?,這些工具可以為分析和觀察AutoML的運行流程提供了有限的支持,還需要對許多搜索模型的配置進行分析。相比之下,ATMSeer支持分析使用各種算法生成的機器學習模型?!?/p>

將AutoML控制權交給用戶,使用體驗和信心明顯提升

ATMSeer的可視化界面由三部分組成。用戶可以通過控制面板上傳數(shù)據(jù)集和AutoML系統(tǒng),并啟動或暫停搜索過程。下圖是一個概覽面板,顯示了基本統(tǒng)計數(shù)據(jù),如搜索的算法和超參數(shù)的數(shù)量,還有按降序排列的最佳模型的“排行榜”。Veeramachaneni表示:“如果你不是特別在意技術細節(jié)的專家,這可能是你最感興趣的點?!?/p>

ATMSeer包含一個“AutoML Profiler”,其中的面板包含有關算法和超參數(shù)的深入信息,這些信息都可以進行調整。面板可以將所有算法類別表示為直方圖形式,用條形圖顯示算法性能分數(shù)的分布,范圍為0到10,具體取決于其超參數(shù)。用一個單獨的面板呈現(xiàn)散點圖,顯示不同超參數(shù)和算法類型的性能折衷。

對沒有AutoML經驗的機器學習專家的案例研究表明,讓用戶掌握控制權確實有助于提高AutoML應用的性能和效率。對生物學、金融等不同科學領域的13位研究生的研究也表明,確定用戶對AutoML的搜索的自定義關鍵有三點:搜索的算法數(shù)量、系統(tǒng)運行時間以及查找表現(xiàn)最好的模型。研究人員表示,這些信息可用來為用戶量身定制系統(tǒng)。

研究人員表示,目前對AutoML的應用缺乏足夠的靈活性。“現(xiàn)在所有這些信息都集中在一個地方,如果人們能夠清楚看到幕后發(fā)生的事情,有能力控制這些流程,未來對AutoML的應用將跨入一個嶄新的階段?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 可視化
    +關注

    關注

    1

    文章

    1220

    瀏覽量

    21448
  • 機器學習
    +關注

    關注

    66

    文章

    8471

    瀏覽量

    133713

原文標題:MIT、浙大等打造AutoML可視化工具:模型自選、超參數(shù)自調

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    一種永磁電機用轉子組件制作方法

    一種永磁電機所使用的轉子組件,是由磁鋼與芯軸組裝而成,產品工作轉速80 000 r /mi n,磁鋼相對于芯軸的同軸度要小于O.015 mm?,F(xiàn)有的裝配方法是:先在芯軸兩端面制作中心孔,然后直接
    發(fā)表于 03-25 15:20

    I2C的主控制權限由MSP430轉交給Cypress CY65215,如何進行操作?

    DLPDLCR3310EVM 目前我們希望I2C的主控制權限由MSP430轉交給Cypress CY65215,主要目的是希望能夠借助PC的USB端口,實現(xiàn)針對LED和其他些參數(shù)的控制
    發(fā)表于 02-17 06:26

    嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-Linux內核移植之內核啟動流程

    關于內核啟動流程涉及內容較多而且復雜,過度的分析意義不大,因此,這里不做詳細講解,只做個大概的介紹。初學者只做了解,有定基礎的可以深入理解。內核鏡像被uboot加載到內存空間之后,獲得控制
    發(fā)表于 01-07 09:20

    飛凌嵌入式ElfBoard ELF 1板卡-Linux內核移植之內核啟動流程

    關于內核啟動流程涉及內容較多而且復雜,過度的分析意義不大,因此,這里不做詳細講解,只做個大概的介紹。初學者只做了解,有定基礎的可以深入理解。 內核鏡像被uboot加載到內存空間之后,獲得
    發(fā)表于 01-06 09:51

    一種混合顏料光譜分區(qū)間識別方法

    古代彩繪顏料的分析是科技考古與文物保護研究的重要內容,高光譜是近年來發(fā)展迅速的新興技術,在物質識別上具有廣泛應用,提出一種基于高光譜分區(qū)間的混合顏料識別方法一種混合顏料光譜分區(qū)間識
    的頭像 發(fā)表于 12-02 16:22 ?256次閱讀
    <b class='flag-5'>一種</b>混合顏料光譜分區(qū)間識別<b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發(fā)表于 10-24 14:57 ?1149次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

    一種新型電流模式控制集成電路

    電子發(fā)燒友網站提供《一種新型電流模式控制集成電路.pdf》資料免費下載
    發(fā)表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b>新型電流模式<b class='flag-5'>控制</b>集成電路

    pwm逆變電路的控制方法有哪三

    PWM逆變電路是一種直流電轉換為交流電的電路,廣泛應用于電力電子領域。PWM(Pulse Width Modulation,脈沖寬度調制)是一種常用的控制
    的頭像 發(fā)表于 08-08 15:04 ?1878次閱讀

    SensiML開源AutoML解決方案-Piccolo AI發(fā)布

    SensiML強大的Analytics Studio軟件開發(fā)工具的開源版本-Piccolo AI發(fā)布了!Piccolo AI遵循AGPL許可,面向個人開發(fā)者、研究人員和AI愛好者,旨在AutoML
    的頭像 發(fā)表于 07-22 16:53 ?895次閱讀

    rup是一種什么模型

    的起源可以追溯20世紀90年代初,當時Rational Software公司開始開發(fā)一種新的軟件開發(fā)方法。這種方法的目標
    的頭像 發(fā)表于 07-09 10:13 ?1837次閱讀

    數(shù)據(jù)采集方法有哪些?工具有哪些?

    數(shù)據(jù)采集是數(shù)據(jù)分析和數(shù)據(jù)科學的基礎,它涉及從各種來源收集、整理和存儲數(shù)據(jù)的過程。以下是些常見的數(shù)據(jù)采集方法工具,以及它們的特點和應用場
    的頭像 發(fā)表于 07-01 15:35 ?2063次閱讀

    plc是一種什么的電子裝置

    PLC(Programmable Logic Controller,可編程邏輯控制器)是一種廣泛應用于工業(yè)自動化領域的電子裝置。它具有高度的靈活性和可靠性,能夠實現(xiàn)各種復雜的控制任務。本文
    的頭像 發(fā)表于 06-13 09:29 ?1373次閱讀

    伺服電機最簡單控制方法是什么

    伺服電機是一種高精度、高響應速度的電機,廣泛應用于工業(yè)自動化、機器人、航空航天等領域。伺服電機的控制方法有很多種,這里我們介紹一種最簡單、
    的頭像 發(fā)表于 06-05 15:49 ?1126次閱讀

    音頻信號分析儀測量帶寬的方法

    信號分析儀測量帶寬的原理主要基于傅里葉變換(Fourier Transform)。傅里葉變換是一種時域信號轉換為頻域信號的數(shù)學方法,可以
    的頭像 發(fā)表于 06-03 16:38 ?1315次閱讀

    功率分析儀的使用方法和注意事項

    功率分析儀是一種用于測量電能參數(shù)的專業(yè)儀器,廣泛應用于電力系統(tǒng)、電力設備測試、能效評估等領域。它通過對高精度電壓、電流信號的采集,得到高精度的功率等相關數(shù)值,為工程師和技術人員提供了強大的測量和分析
    的頭像 發(fā)表于 05-11 16:09 ?3158次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品