0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)標(biāo)注是人類與AI合作最完美的途徑之一

lhl545545 ? 來源:自動駕駛說 ? 作者:自動駕駛說 ? 2020-06-18 14:14 ? 次閱讀

眾所周知,機(jī)器學(xué)習(xí)主要分為兩類:監(jiān)督學(xué)習(xí)(supervised learning)與無監(jiān)督學(xué)習(xí)(unsupervised learning)。而監(jiān)督學(xué)習(xí)離不開數(shù)據(jù)標(biāo)注(data labeling),也就是依靠人工找到groundtruth。燒錢速度有多快?近年來,我們注意到,數(shù)據(jù)標(biāo)注創(chuàng)業(yè)公司層出不窮。只要在圖片中標(biāo)注一輛汽車,只需一秒鐘,就能輕輕松松一美元進(jìn)賬。標(biāo)注一段幾十秒視頻中的汽車,就能幾百美元進(jìn)賬。數(shù)據(jù)標(biāo)注的成本與需求都在節(jié)節(jié)攀升。據(jù)市場研究預(yù)測,到2023年,數(shù)據(jù)標(biāo)注市場將達(dá)到10億美元的規(guī)模。這些數(shù)據(jù)標(biāo)注公司一般會開發(fā)出基本的物體識別算法,然后在人工成本較低的地區(qū)招人,培訓(xùn)他們,讓他們找到機(jī)器識別中的錯(cuò)誤,改正之后提交。比如,一些總部在硅谷的公司會在比較偏遠(yuǎn)的州建立分部,進(jìn)行數(shù)據(jù)標(biāo)注。也有很多公司將業(yè)務(wù)外包給數(shù)據(jù)標(biāo)注公司,這些公司的員工一般在非洲國家、印度或者其他人工成本較低的國家。對數(shù)據(jù)需求量大的公司,每個(gè)月支付給外包公司上百萬美元,才能滿足開發(fā)需求。數(shù)據(jù)標(biāo)注不僅消耗資金,也是訓(xùn)練模型中最耗時(shí)的環(huán)節(jié)。從數(shù)據(jù)采集到最終標(biāo)識,很可能要等待一個(gè)月的時(shí)間。嚴(yán)重影響了開發(fā)進(jìn)度。因此,很多無人駕駛公司開始研究數(shù)據(jù)標(biāo)識,希望不再依賴人力與第三方公司。

印度數(shù)據(jù)標(biāo)注公司iMerit數(shù)據(jù)標(biāo)注無處不在訓(xùn)練無人駕駛的模型就需要理解各種障礙物的含義,就離不開數(shù)據(jù)標(biāo)識。無人駕駛的數(shù)據(jù)標(biāo)識主要可以用兩個(gè)維度來看。第一個(gè)維度是2D和3D的分別。2D一般指通過攝像頭捕捉到的數(shù)據(jù),3D指激光雷達(dá)捕捉到的數(shù)據(jù)。第二個(gè)維度是語義分割(semantic segmentation)與畫框(bounding box)的分別。

3D語義分割的例子魚和熊掌不可兼得數(shù)據(jù)標(biāo)注的難點(diǎn)主要來源于兩個(gè)方面:速度與質(zhì)量。速度慢了就滿足不了模型訓(xùn)練的需求,而太快就會影響質(zhì)量,質(zhì)量低了就會影響模型的準(zhǔn)確性。在資源有限的情況下,速度與質(zhì)量往往魚和熊掌不可兼得。我們可以通過兩種手段來解決這一矛盾:合理的流程和更自動化的機(jī)器學(xué)習(xí)技術(shù)。首先來看流程。數(shù)據(jù)標(biāo)識速度慢,或是質(zhì)量低,其實(shí)很多時(shí)候不是技術(shù)的問題,而是流程的問題。數(shù)據(jù)從采集到產(chǎn)出,首先要被“篩選”,分發(fā)到數(shù)據(jù)標(biāo)識人員的手上,然后被標(biāo)識,標(biāo)識的結(jié)果再被傳回來,最后需要抽檢,保證質(zhì)量。這些步驟中很多地方需要改進(jìn)。比如,哪類數(shù)據(jù)應(yīng)該被篩選?質(zhì)量不合格的標(biāo)識該怎么辦?是否要退回重做?重做又需要時(shí)間,不重做就意味著需要更多的數(shù)據(jù)。對于資金不夠充足的公司,改進(jìn)流程往往是最合適的手段。從技術(shù)方面來看,近年來,AutoML(Automated Machine Learning)的概念越來越火,即端到端的全自動機(jī)器學(xué)習(xí)技術(shù),可以自主調(diào)參,自主評估模型,從而縮短模型訓(xùn)練的周期。但是,AutoML不是萬能的。至少在未來幾年里,我們都無法擺脫對人工數(shù)據(jù)標(biāo)識的依賴。我們需要找到一種人機(jī)共生的方式,將人類對機(jī)器的幫助最大化。

歐洲數(shù)據(jù)標(biāo)識市場中,人工標(biāo)識的占比始終占大多數(shù)人機(jī)共生(Human-in-the-Loop)2020-2030這十年,將是人類探索與AI合作機(jī)會的十年。數(shù)據(jù)標(biāo)注就是人類與AI合作最完美的途徑之一。利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行視覺探測,雖然成本低、速度快,但是往往有一定的錯(cuò)誤率。這時(shí),就需要人類介入,告訴機(jī)器錯(cuò)在了哪里。機(jī)器會記住這些人類提供的回饋信息,進(jìn)一步訓(xùn)練自己的模型,避免下次在類似場景中犯同樣的錯(cuò)誤,從而形成了一個(gè)循環(huán)。比如,AI探測結(jié)果是,某個(gè)交通信號燈的顏色是紅色,而人類檢查后發(fā)現(xiàn)應(yīng)該是綠色,就通過某個(gè)前端工具點(diǎn)擊“錯(cuò)誤”。開發(fā)團(tuán)隊(duì)要盡快找到模型最需要的反饋信息,為人類標(biāo)注員提供一個(gè)工具,將人類的反饋快速分享給機(jī)器。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7077

    瀏覽量

    89161
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31054

    瀏覽量

    269406
  • 無人駕駛
    +關(guān)注

    關(guān)注

    98

    文章

    4072

    瀏覽量

    120613
收藏 人收藏

    評論

    相關(guān)推薦

    AI自動圖像標(biāo)注工具SpeedDP將是數(shù)據(jù)標(biāo)注行業(yè)發(fā)展的重要引擎

    利用AI模型訓(xùn)練打造的深度學(xué)習(xí)算法開發(fā)平臺SpeedDP,就可以替代人工進(jìn)行海量的圖像數(shù)據(jù)標(biāo)注。相比于人工,SpeedDP具有多個(gè)優(yōu)勢。更快熟練的人工標(biāo)注
    的頭像 發(fā)表于 01-02 17:53 ?125次閱讀
    <b class='flag-5'>AI</b>自動圖像<b class='flag-5'>標(biāo)注</b>工具SpeedDP將是<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>行業(yè)發(fā)展的重要引擎

    標(biāo)貝數(shù)據(jù)標(biāo)注在智能駕駛訓(xùn)練中的落地案例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)
    的頭像 發(fā)表于 12-24 15:17 ?490次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>在智能駕駛訓(xùn)練中的落地案例

    AI數(shù)據(jù)服務(wù)在智能駕駛訓(xùn)練中的應(yīng)用實(shí)例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智
    的頭像 發(fā)表于 12-24 15:14 ?217次閱讀

    AI智能體逼真模擬人類行為

    近日,據(jù)外媒最新報(bào)道,斯坦福大學(xué)、華盛頓大學(xué)與Google DeepMind的科研團(tuán)隊(duì)攜手合作,成功開發(fā)出種能夠高度逼真模擬人類行為的AI智能體。 該智能體的構(gòu)建得益于研究團(tuán)隊(duì)將詳細(xì)
    的頭像 發(fā)表于 11-26 10:24 ?381次閱讀

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)已成為支撐自動駕駛熱潮必不可少的環(huán)。本文將以數(shù)據(jù)標(biāo)注的視角,
    的頭像 發(fā)表于 11-22 15:07 ?922次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)已成為支撐自動駕駛熱潮必不可少的環(huán)。本文將以數(shù)據(jù)標(biāo)注的視角,
    的頭像 發(fā)表于 11-22 14:58 ?606次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    工具型AI標(biāo)注平臺SpeedDP工作流程是怎樣的?

    SpeedDP作為個(gè)工具型AI平臺,它能提供從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測試驗(yàn)證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。平
    的頭像 發(fā)表于 11-19 01:02 ?335次閱讀
    工具型<b class='flag-5'>AI</b><b class='flag-5'>標(biāo)注</b>平臺SpeedDP工作流程是怎樣的?

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    學(xué)科之間的交叉融合,形成了種全新的科學(xué)研究范式。AI技術(shù)打破了學(xué)科壁壘,使得物理學(xué)、化學(xué)、生物學(xué)、天文學(xué)等領(lǐng)域的研究者能夠共享數(shù)據(jù)和算法,共同解決復(fù)雜問題。這種跨學(xué)科的合作不僅拓寬了
    發(fā)表于 10-14 09:12

    螞蟻數(shù)科發(fā)布AI賦能新一代數(shù)據(jù)標(biāo)注產(chǎn)品

    在近日舉行的2024 Incluison·外灘大會上,螞蟻數(shù)科憑借其技術(shù)創(chuàng)新的深厚底蘊(yùn),正式推出了新AI數(shù)據(jù)標(biāo)注產(chǎn)品,旨在為企業(yè)客戶提供全方位、智能化的
    的頭像 發(fā)表于 09-10 16:04 ?490次閱讀

    SpeedDP! 超便利AI自動圖像標(biāo)注工具 功能豐富、省時(shí)省力

    使用者快速進(jìn)行人、車、船等數(shù)據(jù)集的標(biāo)注。SpeedDP依靠YOLO系列算法來檢測模型,實(shí)現(xiàn)“標(biāo)注”和“目標(biāo)檢測”,并且還提供豐富的算
    的頭像 發(fā)表于 08-30 12:59 ?298次閱讀
    SpeedDP! 超便利<b class='flag-5'>AI</b>自動圖像<b class='flag-5'>標(biāo)注</b>工具   功能豐富、省時(shí)省力

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    ,企業(yè)和組織應(yīng)明確告知用戶他們的數(shù)據(jù)如何被收集和使用,并提供選擇退出的選項(xiàng),這是尊重和保護(hù)個(gè)人隱私權(quán)的基本要求。 跨國界的合作對于建立全球統(tǒng)AI倫理標(biāo)準(zhǔn)至關(guān)重要。不同國家和地區(qū)
    發(fā)表于 07-16 15:07

    微鏈道愛加入元腦生態(tài),將打造AI視覺標(biāo)注訓(xùn)練體機(jī)

    北京2024年7月8日?/美通社/ --?近日,北京微鏈道愛科技有限公司(簡稱"微鏈道愛")與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將共同打造AI視覺標(biāo)注訓(xùn)練體機(jī),支持高效的
    的頭像 發(fā)表于 07-08 15:31 ?405次閱讀

    標(biāo)貝數(shù)據(jù)采集標(biāo)注在自動駕駛場景中落地應(yīng)用實(shí)例

    高質(zhì)量AI數(shù)據(jù)做支撐。標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)領(lǐng)域多年,在自動駕駛數(shù)據(jù)采集標(biāo)注領(lǐng)域中有著多個(gè)成功
    的頭像 發(fā)表于 05-28 14:22 ?617次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b>采集<b class='flag-5'>標(biāo)注</b>在自動駕駛場景中落地應(yīng)用實(shí)例

    奧特曼稱相信AI無法替代人類

    奧特曼稱相信AI無法替代人類 AI對于人類的威脅直有很多討論,各有不同觀點(diǎn),很多人對于科幻電影中的場景
    的頭像 發(fā)表于 01-19 11:43 ?884次閱讀