0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是數(shù)據(jù)標注?數(shù)據(jù)如何標注?

倩倩 ? 來源:今日頭條 ? 2020-07-17 09:39 ? 次閱讀

數(shù)據(jù)標注是大多數(shù)人工智能的基礎(chǔ),它決定了機器學習深度學習模型的質(zhì)量。今天的數(shù)據(jù)呈現(xiàn)指數(shù)級的爆發(fā),比如僅在2018年,就產(chǎn)生了超過30 ZB的數(shù)據(jù)。而在在任何人工智能項目中,對于數(shù)據(jù)科學家而言,數(shù)據(jù)問題都是其中的癥結(jié)所在。

什么是數(shù)據(jù)標注?

訓(xùn)練機器學習和深度學習模型,需要豐富的數(shù)據(jù),以便將其用于部署,訓(xùn)練和調(diào)整模型。訓(xùn)練機器學習和深度學習模型需要大量經(jīng)過仔細標注的數(shù)據(jù)。標注原始數(shù)據(jù)并準備將其應(yīng)用于機器學習模型和其他AI工作流,被稱為數(shù)據(jù)標注。根據(jù)相關(guān)統(tǒng)計,數(shù)據(jù)整理在AI項目中消耗了80%以上的時間。

數(shù)據(jù)如何標注?

如今,大多數(shù)數(shù)據(jù)都沒有標注。帶標簽的數(shù)據(jù),意味著標注或注釋目標模型的數(shù)據(jù),以便可以預(yù)測。通常,數(shù)據(jù)標注包括數(shù)據(jù)標注,注釋,審核,分類,轉(zhuǎn)錄和處理。

標注的數(shù)據(jù)突出顯示某些特征,并根據(jù)這些特征對其進行分類,可以通過模型分析其模式以預(yù)測新的目標。例如,對于自動駕駛汽車中的計算機視覺,AI專業(yè)人員或數(shù)據(jù)標注者可以使用視頻標注工具來指示路牌的位置,并通過行人和其他車輛的位置來訓(xùn)練模型。

數(shù)據(jù)標注中包含的一系列任務(wù):

豐富數(shù)據(jù)的工具

質(zhì)量保證

流程迭代

管理數(shù)據(jù)標簽

培訓(xùn)新的數(shù)據(jù)標簽

項目計劃

成功指標

流程運作

AI專業(yè)人員的數(shù)據(jù)標簽挑戰(zhàn)?

在典型的AI項目中,專業(yè)人員在進行數(shù)據(jù)標注時會遇到以下幾個方面的挑戰(zhàn)。

數(shù)據(jù)標簽質(zhì)量低下。數(shù)據(jù)標簽質(zhì)量低可能有很多原因。其中最突出的原因之一是任何企業(yè)或工作流程確實三個決定因素:人員,流程和技術(shù)。

無法擴展數(shù)據(jù)標注操作。當數(shù)據(jù)量不斷增長并且業(yè)務(wù)或項目需要擴展其容量時,由于大多數(shù)企業(yè)都在內(nèi)部標記數(shù)據(jù),因此它們通常也難以擴展其數(shù)據(jù)標注任務(wù)。

難以承受的成本和不存在的結(jié)果。企業(yè)和AI項目經(jīng)理通常雇用高薪數(shù)據(jù)科學家和AI專業(yè)人士或一組業(yè)余人員來處理數(shù)據(jù)標簽,而企業(yè)需要承擔高昂的人工成本,當然企業(yè)也會面臨數(shù)據(jù)標簽不確定所帶來的問題,所以合適的專業(yè)人員至關(guān)重要。

質(zhì)量保證。進行質(zhì)量檢查可以為數(shù)據(jù)標注過程提供重要價值,尤其是在機器學習模型測試和驗證的迭代階段。

誰來標注數(shù)據(jù)?

相關(guān)調(diào)查顯示,2019年,企業(yè)在數(shù)據(jù)標簽上的支出超過17億美元。到2024年,這一數(shù)字將達到41億美元。進行數(shù)據(jù)標注工作,除了雇傭?qū)I(yè)的數(shù)據(jù)科學家和AI專家之外,還可以考慮通過其他方式。

雇員。這包括雇用包括AI專業(yè)人員在內(nèi)的全職或兼職員工,參與AI項目的各個方面,其中之一是數(shù)據(jù)標注。

托管團隊。他們是經(jīng)驗豐富,且訓(xùn)練有素的數(shù)據(jù)標簽團隊。

承包商。他們包括自由職業(yè)者和臨時工。

眾包。企業(yè)可以使用第三方平臺一次性尋找數(shù)據(jù)標注團隊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47387

    瀏覽量

    238899
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    46028
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5506

    瀏覽量

    121265
收藏 人收藏

    評論

    相關(guān)推薦

    AI自動圖像標注工具SpeedDP將是數(shù)據(jù)標注行業(yè)發(fā)展的重要引擎

    AI大浪潮下,許多企業(yè)都在不斷借助AI來提升自己的行業(yè)競爭力,數(shù)據(jù)標注企業(yè)也不例外,傳統(tǒng)人工標注效率不足的弊端困擾了多年,如今新的“引擎”就在眼前,他們當然不會放過這個機會。針對這樣的需求,慧視光電
    的頭像 發(fā)表于 01-02 17:53 ?125次閱讀
    AI自動圖像<b class='flag-5'>標注</b>工具SpeedDP將是<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>行業(yè)發(fā)展的重要引擎

    數(shù)據(jù)標注技術(shù)助力智能物流效率提升

    智能物流作為現(xiàn)代供應(yīng)鏈管理的重要組成部分,正經(jīng)歷著飛速發(fā)展。為了在復(fù)雜多變的市場環(huán)境下提升運營效率,物流企業(yè)開始借助先進技術(shù)來優(yōu)化流程。標貝科技的數(shù)據(jù)標注技術(shù)為智能物流的發(fā)展提供了新的動力,其應(yīng)用場
    的頭像 發(fā)表于 12-27 15:37 ?92次閱讀

    淺析數(shù)據(jù)標注技術(shù)在智能物流中的應(yīng)用

    智能物流作為現(xiàn)代供應(yīng)鏈管理的重要組成部分,正經(jīng)歷著飛速發(fā)展。為了在復(fù)雜多變的市場環(huán)境下提升運營效率,物流企業(yè)開始借助先進技術(shù)來優(yōu)化流程。標貝科技的數(shù)據(jù)標注技術(shù)為智能物流的發(fā)展提供了新的動力,其應(yīng)用場
    的頭像 發(fā)表于 12-27 15:33 ?129次閱讀
    淺析<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>技術(shù)在智能物流中的應(yīng)用

    標貝數(shù)據(jù)標注在智能駕駛訓(xùn)練中的落地案例

    標貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點云標注以及3D&2D融合等標注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標注、障
    的頭像 發(fā)表于 12-24 15:17 ?490次閱讀
    標貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>在智能駕駛訓(xùn)練中的落地案例

    標貝數(shù)據(jù)標注案例分享:車載語音系統(tǒng)數(shù)據(jù)標注

    的作用。一般來說,車載語音識別系統(tǒng)主要分為前端和后端兩個部分,本文將針對前端語音信號數(shù)據(jù)采集標注進行實例講解。
    的頭像 發(fā)表于 12-24 14:24 ?140次閱讀
    標貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>案例分享:車載語音系統(tǒng)<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>

    軟通動力入選《人工智能數(shù)據(jù)標注產(chǎn)業(yè)圖譜》

    近日,由中國信息通信研究院、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟牽頭,聯(lián)合中國電信集團、沈陽市數(shù)據(jù)局、保定高新區(qū)等70多家單位編制完成并發(fā)布了《人工智能數(shù)據(jù)標注產(chǎn)業(yè)圖譜》。
    的頭像 發(fā)表于 12-03 10:18 ?171次閱讀

    tvp7002這個器件數(shù)據(jù)手冊標注的供電電壓是1.9V,使用1.8V的話有影響嗎?

    您好,想問下tvp7002這個器件數(shù)據(jù)手冊標注的供電電壓是1.9V(典型值),1.8V最低值,那我這邊由于這一路電源需要跟他人芯片共電源,所以只能是1.8V,這樣的話會有影響嗎?謝謝
    發(fā)表于 12-02 08:01

    標貝科技:自動駕駛中的數(shù)據(jù)標注類別分享

    的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù)已成為支撐自動駕駛熱潮必不可少的一環(huán)。本文將以數(shù)據(jù)標注的視角,通過標貝科技自研平臺標貝
    的頭像 發(fā)表于 11-22 15:07 ?922次閱讀
    標貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>類別分享

    標貝科技:自動駕駛中的數(shù)據(jù)標注類別分享

    的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù)已成為支撐自動駕駛熱潮必不可少的一環(huán)。本文將以數(shù)據(jù)標注的視角,通過標貝科技自研平臺標貝
    的頭像 發(fā)表于 11-22 14:58 ?606次閱讀
    標貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>類別分享

    工具型AI標注平臺SpeedDP工作流程是怎樣的?

    SpeedDP作為一個工具型AI平臺,它能提供從數(shù)據(jù)標注、模型訓(xùn)練、測試驗證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。平臺所需算法并不是固定的,使用者可以根據(jù)自身實際應(yīng)用場景進行
    的頭像 發(fā)表于 11-19 01:02 ?335次閱讀
    工具型AI<b class='flag-5'>標注</b>平臺SpeedDP工作流程是怎樣的?

    螞蟻數(shù)科發(fā)布AI賦能新一代數(shù)據(jù)標注產(chǎn)品

    在近日舉行的2024 Incluison·外灘大會上,螞蟻數(shù)科憑借其技術(shù)創(chuàng)新的深厚底蘊,正式推出了新一代AI數(shù)據(jù)標注產(chǎn)品,旨在為企業(yè)客戶提供全方位、智能化的數(shù)據(jù)解決方案。這款產(chǎn)品的問世,標志著螞蟻數(shù)科在AI
    的頭像 發(fā)表于 09-10 16:04 ?490次閱讀

    SpeedDP! 超便利AI自動圖像標注工具 功能豐富、省時省力

    使用者快速進行人、車、船等數(shù)據(jù)集的一鍵標注。SpeedDP依靠YOLO系列算法來檢測模型,實現(xiàn)“一鍵標注”和“目標檢測”,并且還提供豐富的算法參數(shù)設(shè)置接口,滿足不
    的頭像 發(fā)表于 08-30 12:59 ?298次閱讀
    SpeedDP! 超便利AI自動圖像<b class='flag-5'>標注</b>工具   功能豐富、省時省力

    你了解貼片電感上標注的數(shù)字含義嗎?

    你了解貼片電感上標注的數(shù)字含義嗎?
    的頭像 發(fā)表于 08-17 14:30 ?854次閱讀
    你了解貼片電感上<b class='flag-5'>標注</b>的數(shù)字含義嗎?

    標貝數(shù)據(jù)采集標注在自動駕駛場景中落地應(yīng)用實例

    高質(zhì)量AI數(shù)據(jù)做支撐。標貝科技深耕AI數(shù)據(jù)服務(wù)領(lǐng)域多年,在自動駕駛數(shù)據(jù)采集標注領(lǐng)域中有著多個成功案例,在自動駕駛場景中,數(shù)據(jù)采集和
    的頭像 發(fā)表于 05-28 14:22 ?617次閱讀
    標貝<b class='flag-5'>數(shù)據(jù)</b>采集<b class='flag-5'>標注</b>在自動駕駛場景中落地應(yīng)用實例

    led發(fā)光模塊的地線可以標注為什么

    LED發(fā)光模塊是一種常見的電子元件,用于將電能轉(zhuǎn)化為光能。地線是模塊中一個重要的接線點,起到連接模塊與地面的作用,以確保電路的正常工作。本文將詳細介紹LED發(fā)光模塊的地線標注的原因和意義,以及
    的頭像 發(fā)表于 01-24 14:53 ?819次閱讀