精品日韩国产欧美视频,国产免费无码视频全部完,日韩无码免费不卡网

眾所周知，機(jī)器學(xué)習(xí)主要分為兩類：監(jiān)督學(xué)習(xí)（supervised learning）與無監(jiān)督學(xué)習(xí)（unsupervised learning）。而監(jiān)督學(xué)習(xí)離不開數(shù)據(jù)標(biāo)注（data labeling），也就是依靠人工找到groundtruth。燒錢速度有多快？近年來，我們注意到，數(shù)據(jù)標(biāo)注創(chuàng)業(yè)公司層出不窮。只要在圖片中標(biāo)注一輛汽車，只需一秒鐘，就能輕輕松松一美元進(jìn)賬。標(biāo)注一段幾十秒視頻中的汽車，就能幾百美元進(jìn)賬。數(shù)據(jù)標(biāo)注的成本與需求都在節(jié)節(jié)攀升。據(jù)市場研究預(yù)測，到2023年，數(shù)據(jù)標(biāo)注市場將達(dá)到10億美元的規(guī)模。這些數(shù)據(jù)標(biāo)注公司一般會開發(fā)出基本的物體識別算法，然后在人工成本較低的地區(qū)招人，培訓(xùn)他們，讓他們找到機(jī)器識別中的錯(cuò)誤，改正之后提交。比如，一些總部在硅谷的公司會在比較偏遠(yuǎn)的州建立分部，進(jìn)行數(shù)據(jù)標(biāo)注。也有很多公司將業(yè)務(wù)外包給數(shù)據(jù)標(biāo)注公司，這些公司的員工一般在非洲國家、印度或者其他人工成本較低的國家。對數(shù)據(jù)需求量大的公司，每個(gè)月支付給外包公司上百萬美元，才能滿足開發(fā)需求。數(shù)據(jù)標(biāo)注不僅消耗資金，也是訓(xùn)練模型中最耗時(shí)的環(huán)節(jié)。從數(shù)據(jù)采集到最終標(biāo)識，很可能要等待一個(gè)月的時(shí)間。嚴(yán)重影響了開發(fā)進(jìn)度。因此，很多無人駕駛公司開始研究數(shù)據(jù)標(biāo)識，希望不再依賴人力與第三方公司。

印度數(shù)據(jù)標(biāo)注公司iMerit數(shù)據(jù)標(biāo)注無處不在訓(xùn)練無人駕駛的模型就需要理解各種障礙物的含義，就離不開數(shù)據(jù)標(biāo)識。無人駕駛的數(shù)據(jù)標(biāo)識主要可以用兩個(gè)維度來看。第一個(gè)維度是2D和3D的分別。2D一般指通過攝像頭捕捉到的數(shù)據(jù)，3D指激光雷達(dá)捕捉到的數(shù)據(jù)。第二個(gè)維度是語義分割（semantic segmentation）與畫框（bounding box）的分別。

3D語義分割的例子魚和熊掌不可兼得數(shù)據(jù)標(biāo)注的難點(diǎn)主要來源于兩個(gè)方面：速度與質(zhì)量。速度慢了就滿足不了模型訓(xùn)練的需求，而太快就會影響質(zhì)量，質(zhì)量低了就會影響模型的準(zhǔn)確性。在資源有限的情況下，速度與質(zhì)量往往魚和熊掌不可兼得。我們可以通過兩種手段來解決這一矛盾：合理的流程和更自動化的機(jī)器學(xué)習(xí)技術(shù)。首先來看流程。數(shù)據(jù)標(biāo)識速度慢，或是質(zhì)量低，其實(shí)很多時(shí)候不是技術(shù)的問題，而是流程的問題。數(shù)據(jù)從采集到產(chǎn)出，首先要被“篩選”，分發(fā)到數(shù)據(jù)標(biāo)識人員的手上，然后被標(biāo)識，標(biāo)識的結(jié)果再被傳回來，最后需要抽檢，保證質(zhì)量。這些步驟中很多地方需要改進(jìn)。比如，哪類數(shù)據(jù)應(yīng)該被篩選？質(zhì)量不合格的標(biāo)識該怎么辦？是否要退回重做？重做又需要時(shí)間，不重做就意味著需要更多的數(shù)據(jù)。對于資金不夠充足的公司，改進(jìn)流程往往是最合適的手段。從技術(shù)方面來看，近年來，AutoML（Automated Machine Learning）的概念越來越火，即端到端的全自動機(jī)器學(xué)習(xí)技術(shù)，可以自主調(diào)參，自主評估模型，從而縮短模型訓(xùn)練的周期。但是，AutoML不是萬能的。至少在未來幾年里，我們都無法擺脫對人工數(shù)據(jù)標(biāo)識的依賴。我們需要找到一種人機(jī)共生的方式，將人類對機(jī)器的幫助最大化。

歐洲數(shù)據(jù)標(biāo)識市場中，人工標(biāo)識的占比始終占大多數(shù)人機(jī)共生（Human-in-the-Loop）2020-2030這十年，將是人類探索與AI合作機(jī)會的十年。數(shù)據(jù)標(biāo)注就是人類與AI合作最完美的途徑之一。利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行視覺探測，雖然成本低、速度快，但是往往有一定的錯(cuò)誤率。這時(shí)，就需要人類介入，告訴機(jī)器錯(cuò)在了哪里。機(jī)器會記住這些人類提供的回饋信息，進(jìn)一步訓(xùn)練自己的模型，避免下次在類似場景中犯同樣的錯(cuò)誤，從而形成了一個(gè)循環(huán)。比如，AI探測結(jié)果是，某個(gè)交通信號燈的顏色是紅色，而人類檢查后發(fā)現(xiàn)應(yīng)該是綠色，就通過某個(gè)前端工具點(diǎn)擊“錯(cuò)誤”。開發(fā)團(tuán)隊(duì)要盡快找到模型最需要的反饋信息，為人類標(biāo)注員提供一個(gè)工具，將人類的反饋快速分享給機(jī)器。
責(zé)任編輯:pj

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴