0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí):三張拉面圖,就能識別出每碗拉面在哪家出品

DPVg_AI_era ? 來源:未知 ? 作者:伍文輝 ? 2018-03-30 16:01 ? 次閱讀

只要三張拉面圖,就能識別出每碗拉面是在41家不同拉面店中的哪家制作出來。數(shù)據(jù)科學(xué)家Kenji Doi開發(fā)了一種拉面專家AI分類器,它能辨別出不同拉面之間的細(xì)微差異。這背后,是谷歌AutoML Vision提供的ML模型。

看下面的三碗拉面。你能相信機(jī)器學(xué)習(xí)(ML)模型能以95%的準(zhǔn)確率識別出每碗拉面是在41家拉面店中的哪家制作的么?數(shù)據(jù)科學(xué)家Kenji Doi開發(fā)了一種拉面專家AI分類器,它能辨別出不同拉面之間的細(xì)微差異。

拉面Jiro是日本最受歡迎的連鎖餐廳之一,因?yàn)樗呐淞稀⒚鏃l和湯的價格都很便宜。這個連鎖餐廳在東京有41家分店,每家店都有基本相同的菜單。

正如你在照片中所看到的,對于一個剛剛接觸拉面的人來說,幾乎不可能知道每碗面的制作材料是什么,因?yàn)樗鼈兛雌饋韼缀跏且粯拥?。你不相信自己可以通過看這些照片來辨別這些面到底屬于41家餐館的哪一家。

Kenji想知道深度學(xué)習(xí)是否能幫助解決這個問題。他從網(wǎng)絡(luò)上收集了48,244張Jiro做的拉面的圖片。在刪除了不適合進(jìn)行模型訓(xùn)練的照片之后(比如重復(fù)照片或沒有拉面的照片),他為每個餐館準(zhǔn)備了大約1,170張照片,也就是48000張帶有商店標(biāo)簽的照片。

AutoML Vision達(dá)到了94.5%的準(zhǔn)確率

當(dāng)Kenji正在研究這個問題時,他了解到Google剛剛發(fā)布了AutoML Vision的alpha版本。

AutoML Vision允許用戶在不具備設(shè)計(jì)ML模型的專業(yè)知識的情況下使用自己的圖像定制ML模型。首先,你要做的就是上傳圖像文件進(jìn)行模型訓(xùn)練,并確保上傳數(shù)據(jù)具有正確的標(biāo)簽。一旦完成了定制模型的訓(xùn)練,您就可以輕松地將其應(yīng)用到到可擴(kuò)展的服務(wù)平臺上,以便通過自動擴(kuò)展擁有的資源來滿足實(shí)際需求。整個過程是為那些不具備專業(yè)ML知識的非數(shù)據(jù)科學(xué)家設(shè)計(jì)的。

AutoML Vision訓(xùn)練、部署和服務(wù)自定義ML模型的過程

當(dāng)Kenji獲得了AutoML Vision的alpha版本后,他試了一下。他發(fā)現(xiàn)用帶有商店標(biāo)簽的拉面照片作為數(shù)據(jù)集訓(xùn)練模型時,F(xiàn)值可以達(dá)到94.5%,其中精確率未94.8%,召回率為94.5%。

使用AutoML Vision(高級模式)的拉面店分類器的混淆矩陣(行=實(shí)際店鋪,欄=預(yù)測店鋪)

通過觀察上圖的混淆矩陣,您可以看到AutoML Vision在每個測試樣例中,僅僅對幾個樣本做出了錯誤的分類。

這怎么可能?每個照片使用AutoML檢測區(qū)別是什么?Kenji想知道ML模型如何能準(zhǔn)確地識別出拉面對應(yīng)的商店。起初,他認(rèn)為模型是在看碗,或桌子的顏色或形狀。但是,正如你在上面的照片中所看到的,即使每個商店在他們的照片中使用了相同的碗和桌子設(shè)計(jì),這個模型也非常準(zhǔn)確。Kenji的新理論是,該模型精確地能夠區(qū)分肉塊和澆頭的細(xì)微差別。他計(jì)劃繼續(xù)在AutoML上做實(shí)驗(yàn),看看他的理論是否正確。

數(shù)據(jù)科學(xué)的自動化技術(shù)

在嘗試AutoML Vision之前,Kenji花了相當(dāng)多的時間來為他的拉面分類項(xiàng)目建立自己的ML模型。他仔細(xì)地選擇了一個通過Inception,ResNetSE-ResNeXt獲得的一個集合模型,構(gòu)建了一個數(shù)據(jù)增強(qiáng)設(shè)置,在超參數(shù)調(diào)優(yōu)上耗費(fèi)了很長的時間,如改變學(xué)習(xí)率等,并引入他積累的知識作為一個專家知識。

但是,通過AutoML Vision,Kenji發(fā)現(xiàn)他唯一需要做的就是上傳圖片并點(diǎn)擊“訓(xùn)練”按鈕,僅此而已。通過AutoML Vision,他不費(fèi)吹灰之力就能夠訓(xùn)練一個ML模型。

標(biāo)記圖像集的示例。借助AutoML Vision,您只需上傳帶有標(biāo)簽的圖像即可開始使用

當(dāng)使用AutoML Vision訓(xùn)練一個模型時,有兩種模式任你選擇:基本模式或高級模式。在基本模式下,AutoML Vision可以在18分鐘之內(nèi)完成Kenji的訓(xùn)練數(shù)據(jù)。在高級模式下用了將近24個小時。在這兩種情況下,他都沒有執(zhí)行任何超參數(shù)調(diào)優(yōu)、數(shù)據(jù)擴(kuò)充或嘗試不同的ML模型類型。一切都是自動化處理,不需要擁有相關(guān)的專業(yè)知識。

據(jù)Kenji說,“在基本模式下無法獲得最優(yōu)的準(zhǔn)確性,但是可以在很短的時間內(nèi)得到一個粗略的結(jié)果。而高級模式可以在用戶不進(jìn)行任何優(yōu)化或具備任何學(xué)習(xí)技能的情況下獲得最優(yōu)的精度。這樣看來,這個工具肯定會提高數(shù)據(jù)科學(xué)家的生產(chǎn)力。數(shù)據(jù)科學(xué)家們已經(jīng)為我們的客戶進(jìn)行了太多的人工智能解答,因此,我們必須盡快將深度學(xué)習(xí)應(yīng)用到PoCs上。有了AutoML Vision,數(shù)據(jù)科學(xué)家就不需要為了獲得最優(yōu)的模型結(jié)果花很長時間來培訓(xùn)和優(yōu)化模型獲。這意味著即使只有擁有限數(shù)量的數(shù)據(jù)科學(xué)家,企業(yè)也可以擴(kuò)大他們的人工智能產(chǎn)業(yè)。”

他喜歡AutoML Vision還有因?yàn)槠淞硗庖粋€特點(diǎn):“AutoML Vision太酷了,你可以在訓(xùn)練后使用它的在線預(yù)測功能。而這項(xiàng)任務(wù)對于數(shù)據(jù)科學(xué)家來說通常是特別耗時的,因?yàn)楸仨氁獙⒛P筒渴鸬缴a(chǎn)服務(wù)環(huán)境中后,再對其進(jìn)行管理?!?/p>

以90%的準(zhǔn)確率將商品進(jìn)行品牌分類

AutoML Vision在另一個不同的用例中也證明了它的能力:對產(chǎn)品進(jìn)行品牌分類。Mercari是日本最受歡迎的銷售APP之一,它在美國也受到越來越多人的青睞,它一直在嘗試通過閃頻的圖片自動識別其品牌。

Mercari官網(wǎng)

在日本,Mercari推出了一款名為Mercari MAISONZ的新App,用于銷售品牌商品。Mercari在這款應(yīng)用中開發(fā)了自己的ML模型,在用戶的圖片上傳界面中,該模型可以對12個主要品牌的商品進(jìn)行分類。該模型使用了VGG16在TensorFlow上的遷移學(xué)習(xí),準(zhǔn)確率達(dá)到75%。

正如ML模型預(yù)測的那樣,用戶上傳圖片界面顯示了品牌名稱

而當(dāng)Mercari在AutoML Vision的高級模式下嘗試用5000個訓(xùn)練來進(jìn)行訓(xùn)練,它達(dá)到了91.3%的準(zhǔn)確率。這比他們現(xiàn)有的模型高出了15%。

Mercari的AutoML Vision模型(高級模式)的準(zhǔn)確性分?jǐn)?shù)(精確度/召回率)

Mercari的AutoML Vision模型的混淆矩陣(高級模式)

對AutoML Vision的近距離觀察

Mercari的數(shù)據(jù)科學(xué)家Shuhei Fujiwara對這個結(jié)果感到非常驚訝,他說:“我無法想象谷歌是如何做到如此高精度的!”

用于大規(guī)模圖像分類和對象檢測的AutoML

高級模式里面,除了轉(zhuǎn)移學(xué)習(xí)還有什么呢?實(shí)際上,其中還包括谷歌的學(xué)習(xí)技術(shù),特別是NASNet。

NASNet使用ML來優(yōu)化ML:元級ML模型試圖為特定的訓(xùn)練數(shù)據(jù)集獲得最佳的深度學(xué)習(xí)模型。這才是高級模式的秘密,它代表了谷歌的“人工智能”哲學(xué)。這項(xiàng)技術(shù)可以讓用戶在不用長時間學(xué)習(xí)人工智能的情況下,充分地利用最先進(jìn)的深度學(xué)習(xí)能力。

Shuhei還很喜歡這項(xiàng)服務(wù)的用戶界面。“它很容易使用,你不需要對超參數(shù)優(yōu)化做任何的人工處理,而且在UI上的一個混淆矩陣也為用戶來帶了方便,因?yàn)樗梢詭椭脩艨焖贆z查模型的準(zhǔn)確性。該服務(wù)還允許你將最耗時的人工標(biāo)記工作交給谷歌。因此,我們正在等待公測版本取代現(xiàn)有的自動化版本,這樣就可以將其部署到生產(chǎn)環(huán)境中了?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6172

    瀏覽量

    105518
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47387

    瀏覽量

    238900
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132757

原文標(biāo)題:【谷歌云AutoML Vision官方教程】手把手教會訓(xùn)練模型解決計(jì)算機(jī)視覺問題,準(zhǔn)確率達(dá)94.5%

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何選擇云原生機(jī)器學(xué)習(xí)平臺

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺因其彈性擴(kuò)展、高效部署、低成本運(yùn)營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?122次閱讀

    ASR和機(jī)器學(xué)習(xí)的關(guān)系

    自動語音識別(ASR)技術(shù)的發(fā)展一直是人工智能領(lǐng)域的一個重要分支,它使得機(jī)器能夠理解和處理人類語言。隨著機(jī)器學(xué)習(xí)(ML)技術(shù)的迅猛發(fā)展,ASR系統(tǒng)的性能和準(zhǔn)確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?344次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?443次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)中的首要任務(wù)之一。EDA可以幫助
    的頭像 發(fā)表于 11-13 10:42 ?326次閱讀

    用EDA做了一校園卡但是發(fā)現(xiàn)學(xué)校大門刷不進(jìn)去,學(xué)校內(nèi)充當(dāng)飯卡時能正常識別,不知道哪里出問題了

    但是還是沒弄明白原因。 用手機(jī)帶的NFC功能和學(xué)校的付款機(jī)器都能識別出焊上去的芯片,唯獨(dú)有一些門禁,尤其是大門門禁閘機(jī)識別不出來 懇請大佬們幫忙解答一下,比較急,不勝感激
    發(fā)表于 10-27 20:51

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這者不僅構(gòu)成了模型學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?4309次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機(jī)器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning, DL)已成為
    的頭像 發(fā)表于 07-03 18:22 ?1327次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1423次閱讀

    特斯拉面臨庫存危機(jī)

    車市內(nèi)卷嚴(yán)重;車企之間競爭激烈,似乎特斯拉的日子也不太好過了,不僅僅是大刀闊斧的裁員10%,而且?guī)齑娣e壓問題開始越加凸顯。 據(jù)外媒報道,特斯拉官方公布的統(tǒng)計(jì)數(shù)據(jù)顯示:特斯拉在2024年的第一季度,共生產(chǎn)新車433371輛,銷售了386810輛,還有46561輛新車成了庫存積壓。 在特斯拉的得克薩斯超級工廠周圍停車場已經(jīng)停得滿滿當(dāng)當(dāng);根據(jù)SkyFi提供的衛(wèi)星圖像顯示:特斯拉停車場停放著大量庫存成品車。 網(wǎng)友評論稱即使在太空中也能通過感受到特斯
    的頭像 發(fā)表于 06-12 17:38 ?844次閱讀

    機(jī)器學(xué)習(xí)入門:基本概念介紹

    機(jī)器學(xué)習(xí)(GraphMachineLearning,簡稱GraphML)是機(jī)器學(xué)習(xí)的一個分支,專注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中,數(shù)據(jù)
    的頭像 發(fā)表于 05-16 08:27 ?521次閱讀
    <b class='flag-5'>圖</b><b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門:基本概念介紹

    國內(nèi)哪家的FPGA適合初學(xué)者

    如題,想著手學(xué)習(xí)FPGA的話,國內(nèi)哪家的比較好,更適合初學(xué)者學(xué)習(xí)?這方面的經(jīng)驗(yàn),是一點(diǎn)都沒。
    發(fā)表于 04-14 19:17

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個熱門領(lǐng)域,涉及到多個行業(yè)和領(lǐng)域,例如語音識別機(jī)器翻譯、圖像識別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是
    的頭像 發(fā)表于 04-04 08:41 ?343次閱讀

    基于CYUSB3014做了一塊USB3.0的開發(fā)板,怎么樣能讓FX3被識別出USB3.0呢?

    運(yùn)行,但是不能使用USB3.0功能了。請問我應(yīng)該怎么樣能讓FX3被識別出USB3.0呢?謝謝!麻煩了。?
    發(fā)表于 02-28 08:14

    特斯拉面臨4680電池生產(chǎn)挑戰(zhàn)

     針對這一現(xiàn)象,筆者特意了解到,自2023年下半年開始,特斯拉已經(jīng)引進(jìn)了兩家來自中國二線電池制造商生產(chǎn)的正極極片,這些電池還將送往其位于美國得克薩斯州的工廠進(jìn)行后續(xù)加工處理。
    的頭像 發(fā)表于 01-23 14:31 ?612次閱讀

    如何使用Python進(jìn)行圖像識別的自動學(xué)習(xí)自動訓(xùn)練?

    如何使用Python進(jìn)行圖像識別的自動學(xué)習(xí)自動訓(xùn)練? 使用Python進(jìn)行圖像識別的自動學(xué)習(xí)和自動訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用
    的頭像 發(fā)表于 01-12 16:06 ?609次閱讀