0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能算法的演進升級需要高質(zhì)量數(shù)據(jù)作為支撐

倩倩 ? 來源:騰訊網(wǎng) ? 作者:騰訊網(wǎng) ? 2021-01-28 13:37 ? 次閱讀

AI 數(shù)據(jù)是推動人工智能落地發(fā)展的核心基礎(chǔ),是人工智能技術(shù)應(yīng)用和發(fā)展的基石。人工智能的大規(guī)模應(yīng)用需要利用海量數(shù)據(jù)對模型進行訓(xùn)練,可以說,沒有高質(zhì)量的數(shù)據(jù)就沒有人工智能的大規(guī)模應(yīng)用。可以說,AI 數(shù)據(jù)基礎(chǔ)設(shè)施已經(jīng)成為AI 新基建的重要支撐。

國家工業(yè)信息安全發(fā)展研究中心最新發(fā)布的《2020年AI新基建發(fā)展白皮書》中指出,人工智能算法的演進升級需要高質(zhì)量數(shù)據(jù)作為支撐。經(jīng)過清洗標(biāo)注、去掉噪聲數(shù)據(jù)的高質(zhì)量數(shù)據(jù)集比未經(jīng)過處理的數(shù)據(jù)集更適合人工智能算法進行訓(xùn)練。質(zhì)量不斷提升的數(shù)據(jù)集已經(jīng)成為人工智能技術(shù)發(fā)展的重要推動力,高質(zhì)量AI數(shù)據(jù)正驅(qū)動人工智能算法更加智能化。

回顧過去,早期的數(shù)據(jù)標(biāo)注行業(yè)曾長期處于粗放的發(fā)展模式,數(shù)據(jù)粗制、混亂、復(fù)用的情況屢見不鮮;但隨著AI與各個產(chǎn)業(yè)結(jié)合得愈加緊密,AI商業(yè)化程度進入新的高度,行業(yè)屬性較強的垂直領(lǐng)域加速落地,數(shù)據(jù)標(biāo)注的需求正逐漸轉(zhuǎn)向個性化、場景化和準確化,數(shù)據(jù)服務(wù)供應(yīng)商的技術(shù)實力、精細化管理能力、流程把控能力不斷提升,數(shù)據(jù)標(biāo)注行業(yè)走向?qū)I(yè)化、精細化、定制化。

這也意味著必須有能力超群的代表站出來,重新定義數(shù)據(jù)標(biāo)注行業(yè)的規(guī)則。

目前,數(shù)據(jù)標(biāo)注行業(yè)的企業(yè)機構(gòu)主要分為三類:第一類是AI公司內(nèi)部的標(biāo)注部門,第二類是數(shù)據(jù)標(biāo)注眾包平臺,第三類是以場景化、高精度數(shù)據(jù)采集和標(biāo)注見長的公司。

第一種形式顧名思義,科技企業(yè)自身有數(shù)據(jù)采集標(biāo)注需求,大量數(shù)據(jù)標(biāo)注任務(wù)由公司內(nèi)部完成。

第二種是眾包平臺,以亞馬遜眾包平臺Mechanical Turk為代表,基本按照“需求公司——眾包平臺——多個互聯(lián)網(wǎng)用戶”的模式完成。

第三種是以云測數(shù)據(jù)為代表的,專門從事高精度、場景化數(shù)據(jù)采集和標(biāo)注的第三方企業(yè)。

與其他數(shù)據(jù)標(biāo)注公司不同的是,云測數(shù)據(jù)更強調(diào)高精準度的場景化的數(shù)據(jù)服務(wù)。其CTO陳冠誠認為,“通過云測數(shù)據(jù)的服務(wù),企業(yè)可以將自己算法的識別精度推到一個新的高度,進而落地成為產(chǎn)品被用戶使用,而沉淀的用戶數(shù)據(jù)以及用戶在分享過程中逐漸產(chǎn)生的更多互聯(lián)網(wǎng)數(shù)據(jù),則會讓整個數(shù)據(jù)庫演變成大數(shù)據(jù)生態(tài)?!?/p>

實際上,這所體現(xiàn)的正是對數(shù)據(jù)質(zhì)量的把控能力和對場景深度的還原能力。

以云測數(shù)據(jù)為例,為進一步滿足場景化數(shù)據(jù)的需求,首創(chuàng)了“數(shù)據(jù)場景實驗室”進行相應(yīng)的場景化數(shù)據(jù)生產(chǎn),以滿足AI行業(yè)應(yīng)用場景逐漸趨于長尾和碎片化的趨勢;并從幫助客戶梳理數(shù)據(jù)需求出發(fā),通過自建數(shù)據(jù)標(biāo)注基地和自研的數(shù)據(jù)標(biāo)注平臺進行數(shù)據(jù)的全流程把控,在保證數(shù)據(jù)的質(zhì)量、效率和隱私安全的前提下,來幫助AI企業(yè)或部門快速構(gòu)建核心數(shù)據(jù)壁壘,加速AI產(chǎn)業(yè)化落地的進程。

舍恩伯格在他的《大數(shù)據(jù)時代》中預(yù)言:“數(shù)據(jù)可以量化一切,文字變成了數(shù)據(jù),方位變成了數(shù)據(jù),溝通變成了數(shù)據(jù),直到萬物的數(shù)據(jù)化。

當(dāng)下,數(shù)據(jù)價值驅(qū)動的數(shù)字經(jīng)濟正成為推動社會前進的主要模式,由各種AI等創(chuàng)新技術(shù)驅(qū)動的數(shù)字化轉(zhuǎn)型成為了新基建的核心。“新基建”的東風(fēng)促使我國人工智能、5G、工業(yè)互聯(lián)網(wǎng)等行業(yè)迎來大規(guī)模提速發(fā)展機遇期,AI數(shù)據(jù)作為新的生產(chǎn)要素聲名漸顯,以云測數(shù)據(jù)為代表的深耕數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注的人工智能數(shù)據(jù)服務(wù)商將進一步助力AI產(chǎn)業(yè)生態(tài)的完善。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4623

    瀏覽量

    93110
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47500

    瀏覽量

    239221
  • 數(shù)字經(jīng)濟
    +關(guān)注

    關(guān)注

    2

    文章

    1058

    瀏覽量

    18314
收藏 人收藏

    評論

    相關(guān)推薦

    標(biāo)貝科技:AI基礎(chǔ)數(shù)據(jù)服務(wù),人工智能行業(yè)發(fā)展的底層支撐

    隨著不同大模型在語言理解及生成等領(lǐng)域的出色表現(xiàn),大模型別后的規(guī)模規(guī)律不斷強化數(shù)據(jù)在要提升AI性能上的關(guān)鍵作用,AI數(shù)據(jù)服務(wù)可加速高質(zhì)量數(shù)據(jù)的獲取與標(biāo)注,推動AI算法的創(chuàng)新與持續(xù)優(yōu)化,是
    的頭像 發(fā)表于 11-14 18:32 ?293次閱讀
    標(biāo)貝科技:AI基礎(chǔ)<b class='flag-5'>數(shù)據(jù)</b>服務(wù),<b class='flag-5'>人工智能</b>行業(yè)發(fā)展的底層<b class='flag-5'>支撐</b>

    嵌入式和人工智能究竟是什么關(guān)系?

    應(yīng)用場景。例如,在智能家居領(lǐng)域,嵌入式系統(tǒng)可以控制各種智能設(shè)備,如智能燈泡、智能空調(diào)等,而人工智能則可以實現(xiàn)對這些設(shè)備的
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    了電力的實時平衡和優(yōu)化,有效降低了電網(wǎng)的運行成本和故障率。 此外,書中還討論了人工智能在能源科學(xué)研究中的挑戰(zhàn)和機遇。這些挑戰(zhàn)包括數(shù)據(jù)質(zhì)量算法優(yōu)化、隱私保護等方面,而機遇則體現(xiàn)在技術(shù)創(chuàng)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)律。 2. 高性能
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)、深度學(xué)習(xí)等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不
    發(fā)表于 10-14 09:12

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對AI for Science的技術(shù)支撐進行解讀。
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    四川將人工智能納入首個創(chuàng)新工程,助力高質(zhì)量發(fā)展

    四川作為我國“東數(shù)西算”工程的重要節(jié)點,擁有兩家國家級算力平臺,1100多家人工智能企業(yè),以及27所設(shè)有人工智能相關(guān)專業(yè)的高校。因此,四川將發(fā)展人工智能視為推進
    的頭像 發(fā)表于 05-28 09:56 ?455次閱讀

    云知聲入選中國信通院《數(shù)字醫(yī)療產(chǎn)品及服務(wù)高質(zhì)量發(fā)展全景圖》

    3月15日,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟醫(yī)學(xué)人工智能委員會2024年第一次工作會在??谡匍_,會上發(fā)布首批《數(shù)字醫(yī)療產(chǎn)品及服務(wù)高質(zhì)量發(fā)展全景圖》與《數(shù)字醫(yī)療產(chǎn)品及服務(wù)高質(zhì)量發(fā)展案例集》,憑借
    的頭像 發(fā)表于 03-15 19:23 ?2183次閱讀

    北斗芯片產(chǎn)業(yè)的高質(zhì)量發(fā)展之路

    導(dǎo)航定位協(xié)會副會長、深圳華大北斗科技股份有限公司董事長兼總經(jīng)理孫中亮認為:北斗芯片產(chǎn)業(yè)作為科技自立自強的排頭兵更是北斗產(chǎn)業(yè)發(fā)展的底座,同樣需要高質(zhì)量發(fā)展,同樣需要走以科技創(chuàng)新為驅(qū)動力,推動產(chǎn)業(yè)創(chuàng)新和產(chǎn)業(yè)
    的頭像 發(fā)表于 03-15 14:03 ?416次閱讀
    北斗芯片產(chǎn)業(yè)的<b class='flag-5'>高質(zhì)量</b>發(fā)展之路

    科達嘉電感器在大數(shù)據(jù)人工智能領(lǐng)域被廣泛應(yīng)用

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得
    的頭像 發(fā)表于 02-29 13:56 ?508次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17

    科達嘉電感器廣泛應(yīng)用于大數(shù)據(jù)人工智能領(lǐng)域為AI賦能

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得
    的頭像 發(fā)表于 02-23 17:29 ?867次閱讀

    穩(wěn)中創(chuàng)新?產(chǎn)業(yè)升級?高質(zhì)量發(fā)展 | 聯(lián)誠發(fā)高質(zhì)量發(fā)展工作推進會議召開

    2月21日下午,聯(lián)誠發(fā)LCF以“穩(wěn)中創(chuàng)新?產(chǎn)業(yè)升級?高質(zhì)量發(fā)展”為主題的企業(yè)高質(zhì)量發(fā)展工作推進大會在聯(lián)誠發(fā)深圳總部隆重召開。擂起奮進催征的戰(zhàn)鼓,爭分奪秒搶抓寶貴春光,明確企業(yè)重點目標(biāo)任務(wù),全力以赴
    的頭像 發(fā)表于 02-22 11:33 ?487次閱讀
    穩(wěn)中創(chuàng)新?產(chǎn)業(yè)<b class='flag-5'>升級</b>?<b class='flag-5'>高質(zhì)量</b>發(fā)展 | 聯(lián)誠發(fā)<b class='flag-5'>高質(zhì)量</b>發(fā)展工作推進會議召開

    中國電信推動人工智能全面應(yīng)用

    人工智能作為新質(zhì)生產(chǎn)力的一環(huán),將帶來全要素生產(chǎn)率的提高,同時,加速實現(xiàn)顯著的效率變革和動力變革,并推動企業(yè)高質(zhì)量發(fā)展。
    的頭像 發(fā)表于 01-29 14:12 ?843次閱讀