0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款基準(zhǔn)測量工具的雛形——MLPerf

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-05-09 05:41 ? 次閱讀

AI基準(zhǔn)大戰(zhàn)已經(jīng)開始。

5月2日,由各大領(lǐng)先的科技公司和大學(xué)組成的團(tuán)隊(duì)發(fā)布了一款基準(zhǔn)測量工具的雛形——MLPerf,其目的是測量各種AI框架和芯片中不同機(jī)器學(xué)習(xí)任務(wù)的訓(xùn)練速度和推理時間。

在這一任務(wù)的參與者中,有許多知名公司和大學(xué),其中既有谷歌、英特爾、百度、AMD這樣的巨頭,也有一些AI硬件創(chuàng)企,例如SambaNova和Wave Computing。同時還有世界頂尖大學(xué):斯坦福大學(xué)、哈佛大學(xué)、加州大學(xué)伯克利分校、明尼蘇達(dá)大學(xué)和多倫多大學(xué)。

MLPerf的誕生是小部分公司自我組織進(jìn)行產(chǎn)品對比的結(jié)果。上周,RiseML的博客對比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特爾發(fā)表博客,展示了為機(jī)器翻譯所用的RNN的數(shù)據(jù),題目稱“英特爾Xeon大規(guī)模處理器表現(xiàn)出令人驚訝的推理性能”。這種對比會給人一些參考,但通常也會讓人覺得供應(yīng)商自認(rèn)為比其他廠商優(yōu)越。而一個標(biāo)準(zhǔn)化的基準(zhǔn)可以讓測試簡單化,得到人們想要的結(jié)果。

除此之外,想要跟蹤記錄各大公司和創(chuàng)企的芯片制造以及軟件更新是非常困難的,更不要說在市場的夸大作用下還能進(jìn)行真實(shí)評估了。某些芯片廠商經(jīng)常承諾達(dá)到了革命性的提速,但從來不透露產(chǎn)品規(guī)格(咳咳,英特爾注意)。

在很長一段時間內(nèi),人們都在討論是否有必要設(shè)立一個有意義的AI基準(zhǔn)。支持者認(rèn)為,標(biāo)準(zhǔn)的缺失限制了AI的應(yīng)用。MLPerf的推動者之一吳恩達(dá)表示:“AI正在改變多個行業(yè),但是為了發(fā)揮它最大的潛能,我們?nèi)孕枰斓挠布蛙浖??!敝С终邆兿M鶞?zhǔn)的確立能幫助AI開發(fā)者創(chuàng)造出更好的產(chǎn)品,讓使用者充分了解所需產(chǎn)品。

MLPerf聲明它的基礎(chǔ)目標(biāo)是:

用公平、有幫助的測量方法加速機(jī)器學(xué)習(xí)的發(fā)展

對各競爭系統(tǒng)進(jìn)行公平對比,以鼓勵機(jī)器學(xué)習(xí)的發(fā)展

保證讓所有人都能參與基準(zhǔn)評比

既服務(wù)于商業(yè)群體,也服務(wù)于研究領(lǐng)域

基準(zhǔn)要可復(fù)制,確保結(jié)果的可靠

MLPerf是仿效過去其他的基準(zhǔn)測試,例如SPEC(The Standard Performance Evaluation Corporation)。該基準(zhǔn)于1988年由一家計算公司的財團(tuán)提出,它有效提高了通用計算的速度。而MLPerf結(jié)合了此前許多基準(zhǔn)的標(biāo)準(zhǔn),例如SPEC的程序,SORT用于對比和培育新思想的方法,DeepBench對軟件應(yīng)用的評估,以及DAWNBench的精確度標(biāo)準(zhǔn)。

Intersect360的CEO Addison Snell注意到:“現(xiàn)在許多企業(yè)都想部署AI,所以推出一套中立的基準(zhǔn)非常重要,尤其在多種技術(shù)爭相競爭的時代。但是,AI領(lǐng)域多種多樣,我不禁懷疑是否最后只剩一種標(biāo)準(zhǔn)。想想五年前人們對大數(shù)據(jù)和分析的熱情,盡管人人都想定義它,但是至今也沒有一個通用的衡量標(biāo)準(zhǔn)。我認(rèn)為AI也會面臨這種情況?!?/p>

Hyperion研究公司的高級研究副總裁Steve Conway認(rèn)為:“MLPerf是一款有用、優(yōu)秀的工具。因?yàn)榻┠暌恢比鄙籴槍I賣雙方的真正標(biāo)準(zhǔn)。這個基準(zhǔn)似乎是針對人工智能早期問題指定的,大多都是有邊界問題。后來我們需要其他標(biāo)準(zhǔn),因?yàn)槿斯ぶ悄荛_始出現(xiàn)了無邊界的問題。有邊界的問題比較簡單,如語音、圖像識別或游戲。而無界線問題包括癌癥診斷和閱讀磁核共振報告;現(xiàn)在,人工智能能為復(fù)雜問題提出推薦方案了?!?/p>

MLPerf現(xiàn)已在GitHub上發(fā)布,但仍處于初期階段,為α版本,未來將在許多方面得到改進(jìn)。目前,MLPerf套件上能進(jìn)行測試的有七個方面:

每個參考都提供了以下內(nèi)容:至少在一個框架中實(shí)現(xiàn)模型的代碼;一個可在container中運(yùn)行基準(zhǔn)測試的Dockerfile;一個可下載適當(dāng)數(shù)據(jù)集的腳本;一個可以運(yùn)行并計時模型訓(xùn)練的腳本;數(shù)據(jù)集、模型和機(jī)器設(shè)置的文檔記錄。

根據(jù)GitHub上的記錄,基準(zhǔn)測試已經(jīng)在以下配置中進(jìn)行測試:

16個CPU,一個NVIDIA P100

Ubuntu 16.04,包括具有NVIDIA支持的docker

600GB的硬盤(盡管很多基準(zhǔn)要求的硬盤更?。?/p>

在這樣一個年輕的市場,如果有更多的AI基準(zhǔn)出現(xiàn),那將變得很有趣。例如,斯坦福大學(xué)是MLPerf的其中一個成員,他最近運(yùn)行了第一個DAWNBenchv1深度學(xué)習(xí)結(jié)果。

斯坦福報道說:“2018年4月20日表示第一個衡量深度學(xué)習(xí)端到端性能的基準(zhǔn)和競爭的開始:測量深度學(xué)習(xí)任務(wù)達(dá)到最佳精確度時所需要的時間和成本是多少,以及在這個最先進(jìn)的精確度水平下進(jìn)行推理的成本是多少。對端到端性能的關(guān)注提供了一種客觀的方法,用于對計算框架、硬件、優(yōu)化算法、超參數(shù)設(shè)置以及影響性能的其他因素進(jìn)行標(biāo)準(zhǔn)化?!?/p>

DAWN的一個競爭對手——fast.ai(一家提供人工智能培訓(xùn)和開發(fā)人工智能軟件工具的初創(chuàng)公司)在HPCwire上宣傳它的產(chǎn)品性能。所以這些基準(zhǔn)很重要,應(yīng)該認(rèn)真對待,像MLPerf這樣的工具能幫助清除AI產(chǎn)品對比中的干擾因素。

“基準(zhǔn)提高了產(chǎn)品可信度,并展示了更好的性能或能帶來更多益處的地方。如果你正在考慮為一個數(shù)百萬美元的項(xiàng)目使用硬件加速器或軟件框架,那么你會不會更喜歡’榜上有名’的產(chǎn)品?”谷歌工程師Peter Mattson表示。

MLPerf希望用可復(fù)制的、公平可靠的基準(zhǔn)測量方法來推動機(jī)器學(xué)習(xí)行業(yè)和研究的發(fā)展。產(chǎn)品之間的對比還應(yīng)促進(jìn)供應(yīng)商和學(xué)者之間的競爭。同時還應(yīng)該為沒人提供做實(shí)驗(yàn)的條件,讓更多人參與其中。

Mattson補(bǔ)充道:“基準(zhǔn)在短期內(nèi)很重要,因?yàn)椴还苁菍ρ邪l(fā)公司還是想要購買產(chǎn)品的公司來說,硬件是一項(xiàng)巨大的投資。長期來看,基準(zhǔn)有助于研究者和供應(yīng)商將性能作為共同的發(fā)展目標(biāo),這樣才能解鎖更多機(jī)器學(xué)習(xí)的能量,造福更多人。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269217
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8420

    瀏覽量

    132687
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121207
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    645

原文標(biāo)題:MLPerf——機(jī)器學(xué)習(xí)新基準(zhǔn)能否驅(qū)動AI向前?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    MLCommons推出AI基準(zhǔn)測試0.5版

    開放式機(jī)器學(xué)習(xí)工程聯(lián)盟 MLCommons 在美國加州當(dāng)?shù)貢r間公布推出適用于消費(fèi)類 PC 的 AI 性能的 MLPerf Client 基準(zhǔn)測試的 0.5 版,這是該測試的第個公開版本
    的頭像 發(fā)表于 12-12 16:47 ?324次閱讀

    ADS131A04內(nèi)部基準(zhǔn)電壓有毛刺是怎么回事?

    目前在使用ADS131A04設(shè)計一款數(shù)據(jù)采集電路,使用內(nèi)部基準(zhǔn)電壓2.442V,使用TPS79133給ADS131供電。 1.在ADC采集數(shù)據(jù)的時候?qū)REFP引腳電壓測量發(fā)現(xiàn)有
    發(fā)表于 12-03 06:06

    一款高性能內(nèi)網(wǎng)穿透工具——P2link

    P2link是一款面向高性能需求的內(nèi)網(wǎng)穿透工具,采用了P2P技術(shù)和穿透協(xié)議,各節(jié)點(diǎn)(用戶或設(shè)備)可以直接進(jìn)行數(shù)據(jù)傳輸和通信,而不需要通過中心服務(wù)器,能夠?qū)崿F(xiàn)局域網(wǎng)內(nèi)部設(shè)備與外網(wǎng)的快速、高效連接
    的頭像 發(fā)表于 11-08 10:59 ?636次閱讀
    <b class='flag-5'>一款</b>高性能內(nèi)網(wǎng)穿透<b class='flag-5'>工具</b>——P2link

    如果設(shè)計一款桌面的機(jī)器玩具,最吸引人的外觀與功能要有哪些?

    初步設(shè)想制作如下其中一款,有感興趣的朋友可以幫提提意見。 A一款圓敦敦的音響狀的“個人日程助手”,具備番茄鬧鐘、音樂播放、減壓交互、語言對話、工作日報生成。 B一款迷你瓦利機(jī)器人,有
    發(fā)表于 10-19 18:25

    DaVinci系統(tǒng)級基準(zhǔn)測試測量

    電子發(fā)燒友網(wǎng)站提供《DaVinci系統(tǒng)級基準(zhǔn)測試測量.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 11:32 ?0次下載
    DaVinci系統(tǒng)級<b class='flag-5'>基準(zhǔn)</b>測試<b class='flag-5'>測量</b>

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試五項(xiàng)性能全球第

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準(zhǔn)測試成績。浪潮信息分布式存儲平臺AS13000G7表現(xiàn)出
    的頭像 發(fā)表于 09-28 16:46 ?219次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲<b class='flag-5'>基準(zhǔn)</b>測試五項(xiàng)性能全球第<b class='flag-5'>一</b>

    具有低側(cè)基準(zhǔn)個IDAC電流源的三線PT100 RTD測量電路

    電子發(fā)燒友網(wǎng)站提供《具有低側(cè)基準(zhǔn)個IDAC電流源的三線PT100 RTD測量電路.pdf》資料免費(fèi)下載
    發(fā)表于 09-23 12:35 ?1次下載
    具有低側(cè)<b class='flag-5'>基準(zhǔn)</b>和<b class='flag-5'>一</b>個IDAC電流源的三線PT100 RTD<b class='flag-5'>測量</b>電路

    TPS手指觸感測量一款可以精準(zhǔn)測量力和時間變化的系統(tǒng)

    TPS手指觸感測量一款可以精準(zhǔn)測量力和時間變化的系統(tǒng) 它是一款高靈敏度傳感器,采用高敏感電容式壓力傳感器,能夠精確感知手指與物體接觸時的微小壓力變化,甚至可以檢測到非常細(xì)微的觸感差異,
    發(fā)表于 09-13 09:46

    Adobe將推出一款人工智能視頻生產(chǎn)工具

    Adobe即將在今年晚些時候震撼發(fā)布其最新力作——Adobe Firefly Video Model,一款專為創(chuàng)意專業(yè)人士打造的生成式視頻創(chuàng)作與編輯神器。作為Firefly圖像生成系列的新成員,該工具以測試版形式率先亮相,旨在通過人工智能技術(shù),為視頻創(chuàng)作領(lǐng)域帶來前所未有的
    的頭像 發(fā)表于 09-12 16:37 ?491次閱讀

    精密串聯(lián)基準(zhǔn)中的噪聲測量技術(shù)

    電子發(fā)燒友網(wǎng)站提供《精密串聯(lián)基準(zhǔn)中的噪聲測量技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 10:16 ?0次下載
    精密串聯(lián)<b class='flag-5'>基準(zhǔn)</b>中的噪聲<b class='flag-5'>測量</b>技術(shù)

    如何設(shè)計一款50HZ陷波電路?

    如何設(shè)計一款50HZ陷波電路,有現(xiàn)成的參考電路設(shè)計嗎
    發(fā)表于 07-30 06:12

    Synopsys推出一款低功耗靜態(tài)規(guī)則檢查工具—VCLP

    VCLP(VC Low Power)是Synopsys提供的一款低功耗靜態(tài)規(guī)則檢查工具,它能夠幫助驗(yàn)證和清潔IEEE 1801 Unified Power Format (UPF)低功耗設(shè)計意圖,并確保UPF中的功耗意圖與實(shí)現(xiàn)
    的頭像 發(fā)表于 04-15 11:25 ?2495次閱讀
    Synopsys推出<b class='flag-5'>一款</b>低功耗靜態(tài)規(guī)則檢查<b class='flag-5'>工具</b>—VCLP

    一款適合嵌入式工程師使用的在線工具

    一款適合嵌入式工程師使用的在線工具,工具有如下功能,如下圖所示: 1. 報文校驗(yàn)功能,如下圖所示 2. UDP服務(wù)端測試工具:該UDP服務(wù)端
    發(fā)表于 04-09 22:20

    安森美推出一款基于PLECS的具有獨(dú)特功能的領(lǐng)先在線仿真工具

    Elite Power仿真工具是安森美(onsemi)推出的一款基于PLECS的具有獨(dú)特功能的領(lǐng)先在線仿真工具,適用于軟/硬開關(guān)應(yīng)用,使工程師在開發(fā)周期的早期階段,
    的頭像 發(fā)表于 03-20 09:58 ?676次閱讀

    使用LTC6655系列作為基準(zhǔn)源設(shè)計一款采集器,如何測量設(shè)計后基準(zhǔn)源的1/f噪聲?

    最近在設(shè)計中使用LTC6655系列作為基準(zhǔn)源設(shè)計一款采集器,LTC6655的datasheet的理論值為
    發(fā)表于 01-08 07:09