0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)標(biāo)注工:訓(xùn)練AI,被AI替代

甲子光年 ? 來源:甲子光年 ? 2023-07-18 16:29 ? 次閱讀

增長和淘汰同時(shí)進(jìn)行。

前景和覆滅同時(shí)存在,數(shù)據(jù)標(biāo)注從業(yè)者代延從未如此矛盾。

30歲的內(nèi)蒙古人代延在今年初創(chuàng)業(yè),組建了一個(gè)近30人的線上標(biāo)注團(tuán)隊(duì)。此前代延曾在數(shù)據(jù)標(biāo)注的眾包平臺做了兩年??梢苑Q為是“熟工”的他,對眼下的局面既期待又緊張。

他從年初就關(guān)注到ChatGPT。從AI企業(yè)注冊量的粗暴增長上,代延看到了AI的行業(yè)爆火與數(shù)據(jù)標(biāo)注的創(chuàng)業(yè)機(jī)會(huì)。天眼查數(shù)據(jù)顯示,僅今年一季度就新增注冊17萬家人工智能相關(guān)企業(yè),目前總計(jì)已有267萬家。

他想象著自己能跟隨行業(yè)共進(jìn),公司未來能發(fā)展到100人的規(guī)模。但眼下的現(xiàn)狀卻難以支撐他的期盼:數(shù)據(jù)標(biāo)注的圈子很快被沖破——大量標(biāo)注需求、標(biāo)注工人和中間商一同涌入,單價(jià)更低了。

就像工程隊(duì)接觸不到有建筑需求的甲方,只能從承包方手上接項(xiàng)目一樣,代延接觸的工價(jià)因項(xiàng)目層層轉(zhuǎn)手越壓越低。他拒絕干一天只能拿到30元的標(biāo)注項(xiàng)目。

與此同時(shí),代延還面臨著標(biāo)注業(yè)沒有職業(yè)晉升、沒有合同保障、被拖款也投訴無門的窘迫。他自嘲:“我們就是新時(shí)代的數(shù)據(jù)民工?!?/p>

但這并不是問題的全部。更大的問題在于,自動(dòng)化標(biāo)注也正在吞噬他們手上僅有的項(xiàng)目。由代延這樣的數(shù)據(jù)標(biāo)注員訓(xùn)練的AI,正在人類監(jiān)督中自我學(xué)習(xí),進(jìn)行自標(biāo)注。

自動(dòng)化標(biāo)注將極大減少企業(yè)成本,也成為數(shù)據(jù)標(biāo)注市場上最被看好的方向。

代延不得不為“AI可能完全取代人”做準(zhǔn)備。他帶著團(tuán)隊(duì)同時(shí)做文本標(biāo)注類別的教輔標(biāo)注和3D點(diǎn)云標(biāo)注項(xiàng)目。一個(gè)是文字,一個(gè)是圖片視頻。代延做好了一個(gè)項(xiàng)目如果被AI顛覆,就立馬帶著團(tuán)隊(duì)轉(zhuǎn)型去另一個(gè)領(lǐng)域的打算。

此外,團(tuán)隊(duì)人數(shù)也要精簡。代延劃掉了腦海中想象的百人公司規(guī)模。他認(rèn)為最終或許只會(huì)保留20人的熟手團(tuán)隊(duì)。

這些由數(shù)據(jù)標(biāo)注員一手訓(xùn)練的AI,一邊讓他們夢想著賺得更多,同時(shí)逼著他們做好被顛覆的打算。

1.標(biāo)注,讓AI睜眼看世界

為了讓機(jī)器像人一樣理解文字、語音、圖片,人類創(chuàng)造了一個(gè)機(jī)器的學(xué)習(xí)鏈條:采集物理世界的實(shí)物圖像和聲音,對數(shù)據(jù)進(jìn)行標(biāo)注、清洗,將數(shù)據(jù)轉(zhuǎn)換為一串串代碼后輸送給機(jī)器。

AI學(xué)者認(rèn)為,三歲嬰兒通過眼睛“拍攝”了數(shù)億張圖片,反復(fù)認(rèn)識世界。所以只要給機(jī)器灌輸足夠多的數(shù)據(jù),也能讓機(jī)器從學(xué)會(huì)識字、認(rèn)句子,最終理解語言背后的深意。

標(biāo)注圖集ImageNet上有1500萬張圖片,這個(gè)數(shù)據(jù)集幫助無數(shù)AI企業(yè)獲得在計(jì)算機(jī)視覺上的突破,比如人臉識別、搜圖看看。

為了搭建ImageNet,全球167個(gè)國家的近5萬名數(shù)據(jù)標(biāo)注工一起標(biāo)注了兩年半,他們都來自眾包平臺Mechanical Turk。

標(biāo)注要求十分簡單,MTurk常見的工作內(nèi)容就是區(qū)分照片的顏色,或者對圖像中出現(xiàn)的動(dòng)物進(jìn)行分類,或是用一個(gè)個(gè)方框框定選定對象,標(biāo)注其名稱:這是蛋糕、這是汽車、這是一朵云等等。

ce5cd240-253e-11ee-962d-dac502259ad0.png

圖/整數(shù)智能

該平臺上的20萬名零工分布在人力成本低廉的非洲和東南亞,甚至形成了特色「數(shù)據(jù)標(biāo)注村」。他們標(biāo)記的數(shù)據(jù)支撐著科技企業(yè)在AI上的探索。

而中國的上百萬名標(biāo)注員分布在貴州、山西、山東、河南等省份的二三線城市,并逐步向人力成本更低的縣城滲透。他們或是依賴線上眾包平臺,或是加入線下的數(shù)據(jù)標(biāo)注公司和標(biāo)注基地。

標(biāo)注內(nèi)容根據(jù)場景區(qū)分為文本、圖像和語音,對應(yīng)著幫助機(jī)器獲得識字、識圖和聽聲音的功能。

早期的標(biāo)注項(xiàng)目集中在互聯(lián)網(wǎng)企業(yè),主要標(biāo)注語音和文本?,F(xiàn)在則轉(zhuǎn)向自動(dòng)駕駛企業(yè)標(biāo)注由激光雷達(dá)掃描獲得的3D場景,比如點(diǎn)云標(biāo)注;或是更垂直的文本和語音標(biāo)注方向:幫助教育公司的大模型提供教輔類標(biāo)注數(shù)據(jù);或是為醫(yī)療機(jī)構(gòu)的大模型提供校對后的醫(yī)療數(shù)據(jù)。

當(dāng)AI邁入2.0時(shí)代,ChatGPT驚艷了投資者、企業(yè)家和創(chuàng)業(yè)者,大家對AI的期待已經(jīng)不僅僅是死板地識別文本、語音和圖片的信息了。人們還希望AI能像人一樣真正理解事物之間的聯(lián)系,識別微小的區(qū)別和動(dòng)作背后的情緒,主動(dòng)地分辨和搜集信息。

比如讓自動(dòng)駕駛汽車區(qū)分前方是一個(gè)空扁的塑料袋,而不是一塊顏色體積相近的石頭;讓游泳池旁的攝像頭不再只是記錄泳池旁發(fā)生了什么,而是理解發(fā)生了什么,在有人溺水時(shí)發(fā)出警報(bào)。

這些依然需要依賴數(shù)據(jù)標(biāo)注,并且對標(biāo)注提出更高的要求——更垂直、更精確、更節(jié)約。

標(biāo)注市場的熱潮也由此開始。

2.“訂單多到做不過來”

很難有數(shù)據(jù)直接說明新的標(biāo)注需求激增,但這并不難判斷。因?yàn)閮H2023年一季度,中國就新增了17萬家人工智能企業(yè),而只要是用到AI的公司,就勢必有數(shù)據(jù)標(biāo)注的需求。

需求很快傳導(dǎo)至數(shù)據(jù)標(biāo)注市場。在數(shù)據(jù)標(biāo)注從業(yè)者聚集的貼吧內(nèi),一天能刷新出十幾條項(xiàng)目招人的帖子,包括且不限于文本標(biāo)注、錄題審核、無人機(jī)售賣視頻標(biāo)注、2D檢測桿、3D點(diǎn)云等從文本到圖片視頻的標(biāo)注項(xiàng)目。

一位從業(yè)多年的數(shù)據(jù)標(biāo)注工作者察覺到,今年的無人車標(biāo)注項(xiàng)目有所增加,而由AI2.0熱催生的垂直領(lǐng)域大模型創(chuàng)業(yè),讓原本沒落的文本標(biāo)注項(xiàng)目細(xì)分至不同賽道,也增加了小眾的數(shù)據(jù)標(biāo)注的需求。

在需求的推動(dòng)下,成立新團(tuán)隊(duì)淘金的不止代延。山東東營的張唯在去年底也開始投身數(shù)據(jù)標(biāo)注創(chuàng)業(yè),半年發(fā)展為一個(gè)十幾人的小團(tuán)隊(duì)。依靠當(dāng)?shù)卣难a(bǔ)貼和扶持,張唯的公司不僅獲得免費(fèi)的辦公室,政府還幫忙拉通甲方資源。

項(xiàng)目訂單不少,從最初十幾萬的項(xiàng)目到最近的40萬訂單,緊迫的交付任務(wù)讓張唯更積極地尋找標(biāo)注工:前幾天,張唯僅一天就添置了6臺電腦。

在河南鄭州,一家做數(shù)據(jù)標(biāo)注的眾包平臺正遷移至能容納百人的兩層辦公樓。它們在門口招牌、辦公室里都寫上公司的定位:“AI人工智能大數(shù)據(jù)研發(fā)基地”“重復(fù)的數(shù)據(jù)清洗,是為了你的AI更智能”。

“標(biāo)注項(xiàng)目訂單多到做不過來?!逼湄?fù)責(zé)人說。

熱錢也久違地進(jìn)入了標(biāo)注公司的口袋。數(shù)據(jù)標(biāo)注龍頭海天瑞聲,在今年的3~5月股價(jià)最高漲了4倍。

根據(jù)36氪消息,今年以來B輪及以前的十余家數(shù)據(jù)標(biāo)注平臺,集體迎來了接近100%增幅的高估值。從去年下半年開始,自動(dòng)標(biāo)注公司陸續(xù)獲得新融資。

2022年9月,博登智能獲得千萬元融資;12月,星塵數(shù)據(jù)完成A輪融資5000萬元,相距上一次2018年6月獲得融資已經(jīng)時(shí)隔4年半。

2023年4月,數(shù)據(jù)標(biāo)注解決方案公司「愷望數(shù)據(jù)」獲得新一輪戰(zhàn)略融資;6月,AI數(shù)據(jù)公司「整數(shù)智能」獲得數(shù)千萬Pre A輪融資。

他們斗志昂揚(yáng)地打出替代人工標(biāo)注的口號:“重構(gòu)數(shù)據(jù)標(biāo)簽生產(chǎn)”“自動(dòng)化產(chǎn)線+規(guī)?;肆Α薄按蚱谱詣?dòng)駕駛標(biāo)注的手工模式”。

顯然,資本市場也正重新關(guān)注這個(gè)新興領(lǐng)域。

3.更卷,也更嚴(yán)格

數(shù)據(jù)標(biāo)注的鏈條由三部分組成。

上游:1~150人的數(shù)據(jù)標(biāo)注公司、線上散兵和小作坊。

中游:數(shù)據(jù)服務(wù)商,一類是承接上下游的中介方眾包平臺,一類是企業(yè)為穩(wěn)定投入產(chǎn)業(yè)而選擇自建標(biāo)注基地。

下游:科技公司、行業(yè)企業(yè)、AI公司、科研單位,在2018年左右以互聯(lián)網(wǎng)企業(yè)為主導(dǎo),現(xiàn)在轉(zhuǎn)至車企、自動(dòng)駕駛企業(yè)。

行業(yè)普遍采取分包模式,即先由甲方企業(yè)發(fā)標(biāo),第三方服務(wù)商參與競標(biāo),競標(biāo)成功后進(jìn)入企業(yè)的供應(yīng)商梯隊(duì),其中核心供應(yīng)商能享受優(yōu)先任務(wù)選擇權(quán)和更多訂單。

企業(yè)對核心供應(yīng)商的要求是擁有至少30人的交付團(tuán)隊(duì),成熟的訂單交付經(jīng)驗(yàn),建立培訓(xùn)體系、把控交付質(zhì)量和數(shù)量的能力。穩(wěn)定的生產(chǎn)團(tuán)隊(duì),最終導(dǎo)向讓公司更有競爭力的低報(bào)價(jià)。

然而,管控團(tuán)隊(duì)帶來的低價(jià)優(yōu)勢已然被打亂?!敖衲旮倶?biāo)慘烈!”一位服務(wù)商告訴「甲子光年」,“一個(gè)項(xiàng)目我們報(bào)200元,有人報(bào)80元一天。”

最終項(xiàng)目由報(bào)價(jià)低的團(tuán)隊(duì)拿下,最后卻回到更成熟的團(tuán)隊(duì)手上?!八麄兺瓴怀捎直患追睫D(zhuǎn)回給我們,但價(jià)格已經(jīng)上不去了?!?/p>

由于代延的線上團(tuán)隊(duì)不直接接觸甲方。所以市面上多級分包層層壓價(jià)的混亂局面,讓他們倍感壓力。

數(shù)據(jù)標(biāo)注是資源型行業(yè),誰能拿到和甲方的合作誰就有優(yōu)勢。代延透露,一些個(gè)體注冊公司后,謊稱有40-50人的專業(yè)團(tuán)隊(duì),以極低的價(jià)格參與投標(biāo),拿下項(xiàng)目后,拆分成4-5份分給不同的團(tuán)隊(duì),小團(tuán)隊(duì)再往下分,層層抽傭,中間商賺到差價(jià),分給數(shù)據(jù)標(biāo)注工的計(jì)件價(jià)越來越低。

只要有人接盤,就會(huì)一直螺旋向下。

「甲子光年」得到的一份價(jià)格表顯示,從2D標(biāo)注到3D激光點(diǎn)云標(biāo)注,標(biāo)注項(xiàng)目單價(jià)一般為0.5~1.5元/框。代延曾接到過打了對折的單框價(jià),“至少轉(zhuǎn)過四五手了”。

單價(jià)內(nèi)卷直接導(dǎo)致標(biāo)注人員的薪資縮水。代延和團(tuán)隊(duì)屬于半全職狀態(tài),團(tuán)隊(duì)成員多為寶媽、大學(xué)生、自由職業(yè)者和職高學(xué)生,每天拉框6小時(shí)。保持著這樣的狀態(tài),代延在2022年疫情期間,每月有4~5千元的收入。

“有電腦、有電就能操作”,這是數(shù)據(jù)標(biāo)注招人貼中常見的吸引人入行的話。過去,這一度是數(shù)據(jù)標(biāo)注行業(yè)最顯著的優(yōu)勢。但今天這種優(yōu)勢卻讓整個(gè)行業(yè)陷入內(nèi)卷?,F(xiàn)在代延每月收入只有2~3千元。

雖然收入降低,但工作量并沒有下降。恰恰相反,數(shù)據(jù)標(biāo)注的工作更加復(fù)雜與細(xì)致。

數(shù)據(jù)標(biāo)注的資深從業(yè)者們更懷念互聯(lián)網(wǎng)時(shí)期的標(biāo)注市場:單框價(jià)格高3倍,項(xiàng)目量大。一個(gè)60~70人的團(tuán)隊(duì),能拿到月入30萬的業(yè)績?!艾F(xiàn)在市場上都是產(chǎn)值(單人每天標(biāo)注產(chǎn)生的價(jià)值)不到百元的項(xiàng)目,以前一天大幾百?!币晃粡臉I(yè)者說。

那時(shí)的項(xiàng)目操作簡單且沒有要求,比如給無人車做2D場景標(biāo)注,對圖片中的車輛拉框時(shí),只要能框住就行,沒有要求。

但現(xiàn)在不同,“貼合度”是甲方最看重的驗(yàn)收標(biāo)準(zhǔn)?!叭ツ赀€要求誤差在5~7毫米,今年就要3~5毫米了。誤差要求越來越小?!贝诱f。

人工智能學(xué)者吳恩達(dá)多次強(qiáng)調(diào),有標(biāo)注的高質(zhì)量數(shù)據(jù)才能釋放人工智能的價(jià)值,高質(zhì)量數(shù)據(jù)越多,人工智能的發(fā)展就會(huì)越快。

在無人車的標(biāo)注數(shù)據(jù)中,表現(xiàn)為矩形框與標(biāo)注對象的貼合度,貼合度越高算法精度越高,算法對車輛的控制越精準(zhǔn)。

高質(zhì)量的文本標(biāo)注項(xiàng)目,表現(xiàn)為語義理解的正確性、答題的正確率等。正確率越高,被訓(xùn)練的大模型越聰明。

熟手才能保證數(shù)據(jù)交付又快又好。代延曾經(jīng)讓一個(gè)新手參與核驗(yàn)ChatGPT做完的數(shù)學(xué)題是否完整、邏輯是否正確、語言能否被小學(xué)生理解。新手標(biāo)注的7500個(gè)數(shù)據(jù)因正確率太低,被甲方要求返工,代延和同事花了十幾天才糾正完。

數(shù)據(jù)標(biāo)注越來越不是一個(gè)沒門檻的活。復(fù)雜的語音標(biāo)注,醫(yī)療、法律、金融等專業(yè)數(shù)據(jù)集標(biāo)注生產(chǎn),更需要有學(xué)科知識儲備的專業(yè)人才做專業(yè)標(biāo)注。

代延認(rèn)為,以無人車項(xiàng)目為例,新人成為2D標(biāo)注熟手需要做3個(gè)月,成為3D熟手需要練習(xí)4~6個(gè)月。

這種練習(xí)是指,訓(xùn)練拉框的精確度,用鼠標(biāo)在電腦的標(biāo)注頁面一氣呵成拉出一個(gè)矩形框,能準(zhǔn)確蓋住標(biāo)注對象,不踩線、不漏點(diǎn),甚至是嚴(yán)絲合縫。

只是,當(dāng)機(jī)器開始自學(xué),替代人為機(jī)器做標(biāo)注,人們花費(fèi)時(shí)間訓(xùn)練的技能還有意義嗎?

4.替代危機(jī)

代延意識到AI在靠近,是從前段時(shí)間做的圖片標(biāo)注項(xiàng)目中。

這是一個(gè)代延做了兩年的老項(xiàng)目——識圖。數(shù)據(jù)標(biāo)注工需要識別圖片中的文字并打印出來,價(jià)格是8毛/張。代延標(biāo)注的數(shù)據(jù),被喂入了識圖模型中?,F(xiàn)在,這一模型已經(jīng)熟練地識別圖片中的文字。代延的標(biāo)注工作開始被縮減為訂正和審核。難度下降了,標(biāo)注單價(jià)也下跌了。

被人類用標(biāo)注訓(xùn)練的AI,正在替代人力的標(biāo)注工作。在蘇黎世大學(xué)的調(diào)查報(bào)告中,研究人員通過實(shí)測發(fā)現(xiàn),ChatGPT在15項(xiàng)標(biāo)注任務(wù)中的處理能力高于眾包人員。大模型嵌入眾包平臺的進(jìn)度條也被拉快了。洛桑聯(lián)邦理工學(xué)院之后的研究發(fā)現(xiàn),已有超過30%的眾包標(biāo)注者在處理文本標(biāo)注時(shí)使用了大模型。

AI無疑比人工更省時(shí)省力:研究人員表示,ChatGPT的單位成本只相當(dāng)于MTurk的1/20。

代延也做好了這條業(yè)務(wù)線隨時(shí)會(huì)被“更完善的AI”取代的準(zhǔn)備。他把未來押寶在更有技能要求的自動(dòng)駕駛標(biāo)注中。

但自動(dòng)駕駛標(biāo)注也正被AI侵入。相比人工的拉框方式,自動(dòng)化標(biāo)注只需要內(nèi)置大模型,進(jìn)行參數(shù)設(shè)置后,原本需要手動(dòng)標(biāo)注的矩形框會(huì)自動(dòng)生成。目前唯一的問題是,生成的矩形框有踩線、貼合度太低等質(zhì)量問題,需要人工逐一檢驗(yàn)。

效率的提升讓車企驚喜。理想在使用大模型2.0進(jìn)行自動(dòng)化標(biāo)定,效率是人的1000倍;特斯拉一直在積極推進(jìn)自動(dòng)標(biāo)注的進(jìn)展,比如在2022年6月裁撤了200名為特斯拉標(biāo)注視頻,以改進(jìn)輔助系統(tǒng)的美國員工,因?yàn)樘厮估淖詣?dòng)標(biāo)注能力大幅改善,標(biāo)注10000個(gè)不到60秒的視頻,只需要大模型運(yùn)行一周,而不再需要人工標(biāo)注幾個(gè)月。

AI數(shù)據(jù)公司整數(shù)智能的創(chuàng)始人林群書說,越來越多的車企和AIGC企業(yè)采用大模型產(chǎn)品做自動(dòng)化標(biāo)注,營收正在大幅增長。他們最新的動(dòng)作是在新加坡建立研發(fā)分部。

但對于自動(dòng)化標(biāo)注的增長,第三方服務(wù)商沒那么樂觀。河南一家眾包平臺的項(xiàng)目經(jīng)理說,自動(dòng)化標(biāo)注還不能取代60%以上的標(biāo)注需求,只能作為輔助標(biāo)注工具,處理單一或特定數(shù)據(jù),提升人效。

另一家數(shù)據(jù)標(biāo)注公司的產(chǎn)品經(jīng)理認(rèn)為,自動(dòng)標(biāo)注只能過濾簡單的基礎(chǔ)數(shù)據(jù),還不能像人一樣從復(fù)雜有爭議的場景中精確識別物體。這也是數(shù)據(jù)標(biāo)注市場,如今依然是以自動(dòng)駕駛標(biāo)注數(shù)據(jù)為主導(dǎo)的原因。

不過大家也認(rèn)同,未來的數(shù)據(jù)標(biāo)注將從重人力轉(zhuǎn)向重技術(shù)的趨勢。

總之,不是被同行“卷死”,就是被技術(shù)“卷死”。但坐以待斃肯定不行,數(shù)據(jù)標(biāo)注的第三方公司在尋找未來的出路。

代延的計(jì)劃是緊跟市場,保持警惕,隨時(shí)裁員,同時(shí)向做自動(dòng)化標(biāo)注工具的方向發(fā)展。一家眾包平臺的創(chuàng)始人在和同行交流時(shí)說,未來不能堆人力,要有研發(fā)能力。

對于個(gè)人呢?行業(yè)里流傳的職場路徑是,新手標(biāo)注工——熟手標(biāo)注工——標(biāo)注項(xiàng)目管理員/經(jīng)理——甲方公司數(shù)據(jù)分析師,最終實(shí)現(xiàn)月薪上萬的晉升。

代延認(rèn)識的數(shù)據(jù)標(biāo)注工沒人在朝這個(gè)方向走,他們要么停留在原地,要么退出,最好的情況是建立自己的標(biāo)注團(tuán)隊(duì),像代延這樣,不過他也沒有覺得更輕松。

一邊是AI風(fēng)口帶來的項(xiàng)目需求增長,一邊是更混亂的競價(jià)、更低的人均產(chǎn)值和正迅速成長的AI。兩種情緒是交織的,AI會(huì)帶來無限機(jī)遇,AI也會(huì)淘汰“我們”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1086

    瀏覽量

    40496
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31054

    瀏覽量

    269406
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1563

    瀏覽量

    7796

原文標(biāo)題:數(shù)據(jù)標(biāo)注工:訓(xùn)練AI,被AI替代|甲子光年

文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI自動(dòng)圖像標(biāo)注工具SpeedDP將是數(shù)據(jù)標(biāo)注行業(yè)發(fā)展的重要引擎

    利用AI模型訓(xùn)練打造的深度學(xué)習(xí)算法開發(fā)平臺SpeedDP,就可以替代人工進(jìn)行海量的圖像數(shù)據(jù)標(biāo)注。相比于人工,SpeedDP具有多個(gè)優(yōu)勢。更快
    的頭像 發(fā)表于 01-02 17:53 ?125次閱讀
    <b class='flag-5'>AI</b>自動(dòng)圖像<b class='flag-5'>標(biāo)注</b>工具SpeedDP將是<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>行業(yè)發(fā)展的重要引擎

    標(biāo)貝數(shù)據(jù)標(biāo)注在智能駕駛訓(xùn)練中的落地案例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動(dòng)駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線
    的頭像 發(fā)表于 12-24 15:17 ?490次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>在智能駕駛<b class='flag-5'>訓(xùn)練</b>中的落地案例

    AI數(shù)據(jù)服務(wù)在智能駕駛訓(xùn)練中的應(yīng)用實(shí)例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動(dòng)駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線
    的頭像 發(fā)表于 12-24 15:14 ?217次閱讀

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過程中,大量的計(jì)算工作集中在矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓(xùn)練
    的頭像 發(fā)表于 12-19 17:54 ?148次閱讀

    工具型AI標(biāo)注平臺SpeedDP工作流程是怎樣的?

    SpeedDP作為一個(gè)工具型AI平臺,它能提供從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測試驗(yàn)證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。平
    的頭像 發(fā)表于 11-19 01:02 ?335次閱讀
    工具型<b class='flag-5'>AI</b><b class='flag-5'>標(biāo)注</b>平臺SpeedDP工作流程是怎樣的?

    AI大模型的訓(xùn)練數(shù)據(jù)來源分析

    AI大模型的訓(xùn)練數(shù)據(jù)來源廣泛且多元化,這些數(shù)據(jù)源對于構(gòu)建和優(yōu)化AI模型至關(guān)重要。以下是對AI大模
    的頭像 發(fā)表于 10-23 15:32 ?729次閱讀

    如何訓(xùn)練自己的AI大模型

    訓(xùn)練AI大模型之前,需要明確自己的具體需求,比如是進(jìn)行自然語言處理、圖像識別、推薦系統(tǒng)還是其他任務(wù)。 二、數(shù)據(jù)收集與預(yù)處理 數(shù)據(jù)收集 根據(jù)任務(wù)需求,收集并準(zhǔn)備好足夠的
    的頭像 發(fā)表于 10-23 15:07 ?1908次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    訓(xùn)練和推理提供了強(qiáng)大的算力支持,使得AI在科學(xué)研究中的應(yīng)用更加廣泛和深入。 3. 數(shù)據(jù)驅(qū)動(dòng)的研究范式 第二章還強(qiáng)調(diào)了數(shù)據(jù)AI for S
    發(fā)表于 10-14 09:16

    螞蟻數(shù)科發(fā)布AI賦能新一代數(shù)據(jù)標(biāo)注產(chǎn)品

    在近日舉行的2024 Incluison·外灘大會(huì)上,螞蟻數(shù)科憑借其技術(shù)創(chuàng)新的深厚底蘊(yùn),正式推出了新一代AI數(shù)據(jù)標(biāo)注產(chǎn)品,旨在為企業(yè)客戶提供全方位、智能化的數(shù)據(jù)解決方案。這款產(chǎn)品的問世
    的頭像 發(fā)表于 09-10 16:04 ?490次閱讀

    蘋果承認(rèn)使用谷歌芯片來訓(xùn)練AI

    蘋果公司最近在一篇技術(shù)論文中披露,其先進(jìn)的人工智能系統(tǒng)Apple Intelligence背后的兩個(gè)關(guān)鍵AI模型,是在谷歌設(shè)計(jì)的云端芯片上完成預(yù)訓(xùn)練的。這一消息標(biāo)志著在尖端AI訓(xùn)練領(lǐng)域
    的頭像 發(fā)表于 07-30 17:03 ?743次閱讀

    AI訓(xùn)練的基本步驟

    AI(人工智能)訓(xùn)練是一個(gè)復(fù)雜且系統(tǒng)的過程,它涵蓋了從數(shù)據(jù)收集到模型部署的多個(gè)關(guān)鍵步驟。以下是對AI訓(xùn)練過程的詳細(xì)闡述,包括每個(gè)步驟的具體內(nèi)
    的頭像 發(fā)表于 07-17 16:57 ?2209次閱讀

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    權(quán)的保護(hù)必須置于核心位置。隨著越來越多的個(gè)人信息用于訓(xùn)練和運(yùn)行AI系統(tǒng),如何保護(hù)這些信息不被濫用成為了一項(xiàng)艱巨的任務(wù)。加強(qiáng)數(shù)據(jù)加密技術(shù)、
    發(fā)表于 07-16 15:07

    ai大模型和ai框架的關(guān)系是什么

    數(shù)據(jù)和計(jì)算資源來進(jìn)行訓(xùn)練AI大模型的主要特點(diǎn)包括: 1.1 參數(shù)數(shù)量大:AI大模型的參數(shù)數(shù)量通常在數(shù)百萬到數(shù)十億之間,這使得它們能夠捕捉到更復(fù)雜的
    的頭像 發(fā)表于 07-16 10:07 ?4w次閱讀

    微鏈道愛加入元腦生態(tài),將打造AI視覺標(biāo)注訓(xùn)練一體機(jī)

    北京2024年7月8日?/美通社/ --?近日,北京微鏈道愛科技有限公司(簡稱"微鏈道愛")與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將共同打造AI視覺標(biāo)注訓(xùn)練一體機(jī),支持高效的數(shù)據(jù)
    的頭像 發(fā)表于 07-08 15:31 ?405次閱讀

    AI自動(dòng)化標(biāo)注崛起,數(shù)據(jù)標(biāo)注員要失業(yè)了?

    AI訓(xùn)練AI
    的頭像 發(fā)表于 01-24 13:06 ?296次閱讀