0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能預(yù)處理建構(gòu)模塊加速大數(shù)據(jù)機(jī)器學(xué)習(xí)算法案例解讀

NJ90_gh_bee81f8 ? 2017-12-06 16:30 ? 次閱讀

IBM蘇黎世實(shí)驗(yàn)室(IBM Zurich)的研究人員開發(fā)出通用的人工智能(AI)預(yù)處理建構(gòu)模塊,據(jù)稱可較現(xiàn)有方法加速大數(shù)據(jù)(Big Data)機(jī)器學(xué)習(xí)算法至少10倍以上。

在日前于美國(guó)加州長(zhǎng)灘舉行的神經(jīng)信息處理系統(tǒng)大會(huì)(NIPS 2017)上,IBM在發(fā)表這種新途徑時(shí)解釋,它采用了數(shù)學(xué)對(duì)偶性(duality),在Big Data串流中精心挑選能發(fā)揮效用的項(xiàng)目,并略過其余無效的選項(xiàng)。

IBM Zurich研究人員Celestine Dünner說:“我們的動(dòng)機(jī)在于,當(dāng)缺少足夠的內(nèi)存來為Big Data機(jī)器學(xué)習(xí)保存所有的數(shù)據(jù)時(shí),如何使用硬件加速器,如繪圖處理器(GPU)和現(xiàn)場(chǎng)可編程數(shù)組(FPGA)?!盋elestine Dünner同時(shí)也是這一算法的共同發(fā)明人。

IBM Zurich數(shù)學(xué)家Thomas Parnell則表示:“我們應(yīng)該算是最先提供了可加速10倍的通用解決方案。特別是針對(duì)傳統(tǒng)的線性機(jī)器學(xué)習(xí)模型(目前廣泛用于規(guī)模太大而無法用于神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的數(shù)據(jù)集),我們?cè)谧罴褏⒖挤桨傅幕A(chǔ)上建置相關(guān)技術(shù),并展示了至少10倍的加速方案?!?/p>

IBM蘇黎世研究人員Thomas Parnell和Celestine Dünner討論在NIPS 2017發(fā)表的預(yù)處理算法。

在一開始的展示中,研究人員使用Nvidia Quadro M4000 GPU搭配8GB內(nèi)存,在容量約30GB的4萬張照片數(shù)據(jù)集上進(jìn)行訓(xùn)練——該照片數(shù)據(jù)集采用支持向量機(jī)器(SVM)的算法,先將影像解析為各種類別以進(jìn)行辨識(shí)。SVM算法還可為所學(xué)習(xí)的模型建立幾何式解讀,這和無法證實(shí)其結(jié)論的神經(jīng)網(wǎng)絡(luò)是不一樣的。IBM的數(shù)據(jù)預(yù)處理方法讓該算法可在不到1分鐘的時(shí)間完成執(zhí)行,比目前采用有限內(nèi)存訓(xùn)練的方法更快10倍。

該技術(shù)的關(guān)鍵在于對(duì)每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行預(yù)處理,查看它是不是已經(jīng)處理數(shù)據(jù)點(diǎn)的數(shù)學(xué)對(duì)偶。如果是的話,那么算法就會(huì)自動(dòng)略過,這個(gè)過程在數(shù)據(jù)集進(jìn)行處理時(shí)變得越來越頻繁出現(xiàn)。Dünner說:“我們?cè)诿總€(gè)數(shù)據(jù)點(diǎn)以進(jìn)行處理以前,我們先計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的重要性,再以測(cè)量對(duì)偶差距大小的方式進(jìn)行處理?!?/p>

Parnell說,“如果你的問題適于放在加速器的內(nèi)存空間,那么在內(nèi)存內(nèi)部執(zhí)行將會(huì)獲得更好的結(jié)果。因此,我們的結(jié)果只適用于Big Data的問題。它不僅能讓運(yùn)行時(shí)間加快10倍以上,而且如果在云端執(zhí)行時(shí),也不必付出太多的成本?!?/p>

隨著Big Data數(shù)據(jù)集越滾越大,這種節(jié)省時(shí)間和成本的預(yù)處理算法將會(huì)變得越來越重要。IBM指出,為了顯示其基于對(duì)偶性的算法能夠處理任意大小的數(shù)據(jù)集,該公司在NIPS上展示了8GPU的版本,它能處理網(wǎng)頁(yè)廣告的十億次點(diǎn)擊數(shù)據(jù)。

研究人員正進(jìn)一步開發(fā)該算法,期望在不久部署于IBM BlueMix Cloud——稱為基于對(duì)偶差距(duality-gap)的異質(zhì)學(xué)習(xí),適用于包括社群媒體、在線營(yíng)銷、目標(biāo)式廣告、查找電信數(shù)據(jù)模式以及欺詐檢測(cè)等Big Data數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1759

    瀏覽量

    74731
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47409

    瀏覽量

    238923
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    32500

原文標(biāo)題:這是一個(gè)讓基于GPU的AI訓(xùn)練加速10倍的神奇算法

文章出處:【微信號(hào):gh_bee81f890fc1,微信公眾號(hào):面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類機(jī)器人能夠在人類社會(huì)中有效
    發(fā)表于 12-24 00:33

    人工智能推理及神經(jīng)處理的未來

    人工智能行業(yè)所圍繞的是一個(gè)受技術(shù)進(jìn)步、社會(huì)需求和監(jiān)管政策影響的動(dòng)態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語言處理和計(jì)算機(jī)視覺方面的技術(shù)進(jìn)步,加速
    的頭像 發(fā)表于 12-23 11:18 ?262次閱讀
    <b class='flag-5'>人工智能</b>推理及神經(jīng)<b class='flag-5'>處理</b>的未來

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和
    的頭像 發(fā)表于 11-15 09:19 ?511次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的一場(chǎng)革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨(dú)特的優(yōu)勢(shì)和重要性,發(fā)揮著不可或缺的作用。通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等
    發(fā)表于 11-14 16:39

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法
    發(fā)表于 10-24 17:22 ?2507次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識(shí)。特別是書中提到的基于大數(shù)據(jù)機(jī)器學(xué)習(xí)的能源管理系統(tǒng),通過實(shí)時(shí)監(jiān)測(cè)和分析能源數(shù)據(jù),實(shí)現(xiàn)了能源的高效利用和智能
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V和Arm內(nèi)核及其定制的機(jī)器學(xué)習(xí)和浮點(diǎn)運(yùn)算單元,用于處理復(fù)雜的人工智能圖像處理任務(wù)。 四、未來發(fā)展趨勢(shì) 隨著
    發(fā)表于 09-28 11:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速
    發(fā)表于 07-29 17:05

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)
    的頭像 發(fā)表于 07-09 15:57 ?486次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的
    的頭像 發(fā)表于 07-02 11:25 ?1133次閱讀

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 04-04 08:41 ?345次閱讀

    科達(dá)嘉電感器在大數(shù)據(jù)人工智能領(lǐng)域被廣泛應(yīng)用

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算
    的頭像 發(fā)表于 02-29 13:56 ?493次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    聯(lián)網(wǎng)ARM開發(fā) NB-IoT開發(fā)及實(shí)戰(zhàn) 七:python工程師,人工智能工程師 python語法基礎(chǔ) python核心編程 基于OpenCV的機(jī)器視覺開發(fā) 嵌入式人工智能滲入生活的方方面面,廣泛應(yīng)用
    發(fā)表于 02-26 10:17

    科達(dá)嘉電感器廣泛應(yīng)用于大數(shù)據(jù)人工智能領(lǐng)域?yàn)锳I賦能

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算
    的頭像 發(fā)表于 02-23 17:29 ?852次閱讀