0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:李倩 ? 2018-11-09 15:45 ? 次閱讀

移動互聯(lián)網(wǎng)時代,人類生產(chǎn)的新數(shù)據(jù)正以指數(shù)級別增長,數(shù)據(jù)中心越來越大,并消耗著地球上難以想象的巨大能耗,但人類依然可能面臨著“數(shù)據(jù)無處存放”的境地。

因此,讓文件變小一點,這絕對是個值得投資的點子。

神劇《硅谷》劇組就選中了這個點子。在劇中,幾個主角的得以創(chuàng)業(yè)成功的核心算法——“魔笛”即是選中了“壓縮”這一多數(shù)人都能理解但對技術要求頗高的領域:允許用戶在線將圖片壓縮至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引發(fā)了不少跟風打造屬于自己的“魔笛手”,此外,包括谷歌等人工智能巨頭公司近年來也在這個領域頻頻發(fā)力。

2016年,谷歌相關團隊推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的圖像壓縮技術。希望以人工智能技術作為壓縮路徑,將圖片大小壓縮到源文件的1/4, 但基本不會改變圖片的清晰度。

盡管引來如此高的關注,但很多人還是不認可它會在未來的發(fā)展中取得壓倒性的優(yōu)勢。谷歌的RAISR算法也被不好業(yè)內認識吐槽說“壓縮一張圖片耗時久”、“壓縮后圖片清晰度沒有那么高”等等。

谷歌機器學習工程師、Jetpac創(chuàng)始人Pete Warden近期發(fā)布了一篇文章,認為在短期內壓縮算法可能會成為機器學習應用最可能出現(xiàn)的殺手級應用的領域,他從“壓縮”這一技術的起源開始,希望告訴大家問什么壓縮技術的前景是如此的廣闊。

大數(shù)據(jù)文摘對這篇文章進行了編譯。

OSDI上的一篇文章“神經(jīng)自適應型內容感知互聯(lián)網(wǎng)視頻傳輸”激發(fā)了我對這一領域的興趣。

這篇文章告訴我們:通過神經(jīng)網(wǎng)絡,在帶寬相同的條件下,用戶體驗將能提高43%,或者在帶寬縮減17%的條件下可以保持體驗的質量基本不變。還有其他同類的論文將類似方法運用在了生成壓縮或自適應圖像壓縮等方面。他們都展示出了驚人的成果。那么,為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

我們尚未擁有性能配套的計算設備

上文所提到的所有方法都需要相對較大的神經(jīng)網(wǎng)絡,并且所需的計算量與像素數(shù)量成正比。這意味著大型圖片文件或每秒幀數(shù)較高的視頻文件可能需要比當前廣泛使用的移動設備更強的計算能力。

現(xiàn)行的大多數(shù)CPU每秒僅能處理百億級的運算,而在高清視頻上用機器學習進行壓縮很輕易便能達到十倍于此的計算量。

當然,好消息是目前我們已經(jīng)有了一些硬件解決方案,比如Edge TPU等,可以讓我們看到未來達到更多計算量的可能性。我期待這種壓縮方法能夠運用到各種類型文件的壓縮轉換上,從視頻到圖像,到音頻,乃至更多充滿想象力的方式。

自然語言是終極壓縮目標

近來機器學習在自然語言處理中取得了大量有趣的成果。這是另一個讓我覺得機器學習是較為優(yōu)越的壓縮轉換途徑的原因。

如果你稍稍觀察,便會發(fā)現(xiàn)字幕其實是將聲音壓縮為圖像的一種形式。我一直想做一個項目,試圖創(chuàng)造出一種相機,每秒生成一幀字幕,并將所有字幕逐一按行輸出至一個日志文件中。由此便可簡單記錄下基于相機的拍攝內容隨時間的推移而發(fā)生的故事,這可以被定義為一個敘事類的傳感器。

我將這一技術歸類到壓縮方法中的原因是你可以通過生成性的神經(jīng)網(wǎng)絡將字幕還原為圖像。盡管重新生成的圖像不會跟原圖像完全一致,但也能夠從原圖像繼承一些信息。如果你希望結果與原圖像盡可能接近,你也可以從風格化方面考慮,例如為每個場景生成簡圖。這些技術的共同特征在于他們提取出了輸入文件中對于我們人類重要的部分,并省略了余下的部分。

不僅僅是圖像

語言世界也有類似的趨勢。語音識別正在迅速改進,合成語音的能力也在迅速提高。識別可以看作是將音頻壓縮為自然語言文本的過程,而合成則恰好相反。你可以想象將對話高度壓縮為自然語言文字而非音頻。誠然,我們不需要達到那種要求,但似乎通過擴展我們對于表達的認知類型,我們可以實現(xiàn)在低帶寬情況下的更好的結果。

我甚至還發(fā)現(xiàn)一些有趣的將機器學習應用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(遞歸神經(jīng)網(wǎng)絡)展示了神經(jīng)網(wǎng)絡對某些模板進行模仿的優(yōu)越性,而對于壓縮技術來說,預測也是相同的道理。考慮到普通的HTML頁面有不少冗余,這一情況下GZIP壓縮方法似乎有很大機率能被機器學習改進,盡管我認為這沒有機器學習對文本的處理那么容易。

對于壓縮的研究已立項撥款

在我創(chuàng)業(yè)期間,營銷失敗的經(jīng)歷讓我學到了一件事:如果已經(jīng)有一筆預算要購買你所推銷的產(chǎn)品,該產(chǎn)品的銷售會容易得多。預算的存在意味著公司在是否應該花錢購買解決方案上已經(jīng)贏得了艱難的斗爭,現(xiàn)在唯一的問題是購買哪種解決方案。

這也是我認為機器學習可以在這個領域取得巨大突破的原因之一,因為制造商已經(jīng)擁有專門用于視頻和音頻壓縮的工程師、資金和芯片。如果我們能夠證明將機器學習添加到現(xiàn)有解決方案中能夠以一些可度量的方式(例如質量、速度或功耗)改進它們,那么它們將被快速采用。

帶寬將會花費用戶和運營商的大量的成本,質量和電池壽命將會成為產(chǎn)品的賣點,因此采用機器學習改進壓縮的優(yōu)勢將比其他運用更為顯而易見。

許多激動人心的研究表明這種方式將會非常高效,而且我樂觀地認為還有許多應用尚未被發(fā)掘。我希望機器學習在壓縮中的應用將發(fā)展成為一門核心技術。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6171

    瀏覽量

    105504
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4773

    瀏覽量

    100861
  • 機器學習
    +關注

    關注

    66

    文章

    8423

    瀏覽量

    132744

原文標題:被《硅谷》選中的“壓縮算法”,為什么說下一個機器學習殺手應用將由此誕生

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?117次閱讀

    Linux文件壓縮打包的各種姿勢

    1.文件打包與壓縮 1.什么是文件壓縮? 將多個文件或目錄合并成為一個特殊的文件。比如: 搬家…
    的頭像 發(fā)表于 12-02 09:25 ?229次閱讀

    什么是安川電機?安川電機主要廣泛應用在哪些方面?

    安川電機(Yaskawa Electric Corporation)是一家日本跨國公司,成立于1915年,總部位于日本北九州市。安川電機是全球領先的工業(yè)自動化和控制產(chǎn)品制造商之一,其產(chǎn)品廣泛
    的頭像 發(fā)表于 10-25 09:40 ?510次閱讀

    異步電機主要應用在哪些方面

    異步電機,也稱為感應電機,是一種交流電機,其轉子(或稱為轉子)不與定子磁場同步旋轉。這種電機因其結構簡單、成本低廉、維護方便、運行可靠等優(yōu)點,在工業(yè)和日常生活中得到了廣泛的應用。以下是異步電機的一些
    的頭像 發(fā)表于 10-22 16:13 ?1146次閱讀

    請問PGA2500可以應用在駐極體放大電路中嘛?

    我現(xiàn)在要用駐極體做一個語音錄音及回放的電路,不知道pga2500可不可以應用在駐極體的前置放大電路中。
    發(fā)表于 09-19 07:24

    差動放大器通常是應用在什么場合?

    請問下差動放大器通常是應用在什么場合?
    發(fā)表于 09-19 06:35

    OPA241一般應用在什么場合?OPA241能否放大微小電流信號?

    OPA241一般應用在什么場合? 電路中的傳感器輸出信號為0-300nA,嘗試過很多次,使用OPA241無法放大該信號,輸出端無輸出,請問有人遇到類似情況嗎? 一些說明(請見下圖): 1)傳感器
    發(fā)表于 09-14 07:23

    遙感可以應用在哪些方面

    遙感技術是一種通過衛(wèi)星、飛機或其他載體上的傳感器,從遠距離獲取地球表面信息的技術。它在多個領域有著廣泛的應用,以下是一些主要的應用領域,以及每個領域的簡要介紹: 環(huán)境監(jiān)測 :遙感技術可以用來監(jiān)測森林
    的頭像 發(fā)表于 09-04 14:36 ?1327次閱讀

    求助,請問TLV2464cpwr通用運放有應用在audio上的典型電路嗎?

    TLV2464cpwr通用運放有應用在audio上的典型電路嗎?
    發(fā)表于 08-08 08:20

    定華雷達知識講堂:雷達物位計為何廣泛應用于水泥廠

    雷達物位計為何廣泛應用于水泥廠? 雷達物位計應用在測量顆粒狀物料上,在水泥廠原料大多是顆粒狀物料,個別是塊料,如石灰石、原煤、頁巖等,其半成品熟料也是顆粒狀物料,儲存在庫或倉里,都存
    的頭像 發(fā)表于 07-04 15:43 ?224次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發(fā)表于 07-01 11:40 ?1423次閱讀

    智慧安防綜合平臺應用在哪些場景

    平臺應用在哪些場景?下面我們就一起來看看吧! 首先,在城市安全管理方面,智慧安防綜合平臺可用于公共區(qū)域監(jiān)測,例如道路交通監(jiān)控、城市監(jiān)控中心、公園和廣場安全,有效預防和處理交通事故、違規(guī)行為、治安事件等。此外,
    的頭像 發(fā)表于 06-14 15:23 ?626次閱讀

    變頻器主要應用在哪些方面

    變頻器作為現(xiàn)代工業(yè)自動化領域的核心設備之一,其應用廣泛,涉及到多個行業(yè)和領域。變頻器通過調節(jié)電機的轉速,實現(xiàn)對生產(chǎn)設備的精確控制,從而提高了生產(chǎn)效率、降低了能源消耗,并優(yōu)化了設備的運行性能。本文將詳細探討變頻器在各個方面的主要應用,并結合實際案例和數(shù)據(jù)進行深入分析。
    的頭像 發(fā)表于 05-28 17:28 ?1.1w次閱讀

    應用在隔離的IGBT模塊中的光電耦合器

    應用在隔離的IGBT模塊中的光電耦合器 IGBT(Insulated Gate Bipolar Transistor),絕緣柵雙極型晶體管,是由BJT(雙極型三極管)和MOS(絕緣柵型場效應管
    的頭像 發(fā)表于 04-29 11:39 ?642次閱讀
    <b class='flag-5'>應用在</b>隔離的IGBT模塊中的光電耦合器

    虛擬現(xiàn)實技術應用在哪些方面

    技術在各個領域都有廣泛的應用,包括娛樂、教育、醫(yī)療、工業(yè)等。在本文中,我們將詳細討論虛擬現(xiàn)實技術在不同領域的應用。 娛樂領域 在娛樂領域,虛擬現(xiàn)實技術的應用非常廣泛。通過虛擬現(xiàn)實設備,玩家可以將自己置身于游戲世界中,身臨其境地體
    的頭像 發(fā)表于 01-15 09:31 ?2424次閱讀