0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

盤點(diǎn)達(dá)摩院在AI技術(shù)上的重大進(jìn)展

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-24 09:08 ? 次閱讀

2017 年 10 月的杭州云棲大會(huì)上,阿里巴巴正式宣布成立達(dá)摩院,未來三年將投入將超過 1000 億人民幣用于基礎(chǔ)科學(xué)和顛覆式技術(shù)創(chuàng)新研究。達(dá)摩院官網(wǎng)正式上線后,我們看到達(dá)摩院重點(diǎn)布局機(jī)器智能、數(shù)據(jù)計(jì)算、機(jī)器人、金融科技以及X實(shí)驗(yàn)室五大領(lǐng)域,相應(yīng)設(shè)置有 14 個(gè)實(shí)驗(yàn)室,共有近 70 名海內(nèi)外專家坐鎮(zhèn)。

AI 技術(shù)是達(dá)摩院目前重金押注的技術(shù)領(lǐng)域之一,即將成立兩年,人們可能都比較好奇達(dá)摩院在AI上到底布局了哪些技術(shù)領(lǐng)域?又在哪些技術(shù)方向上取得了突破?本文將一一盤點(diǎn)達(dá)摩院在AI技術(shù)上的重大進(jìn)展。

阿里AI 的技術(shù)發(fā)展及平臺(tái)建設(shè)

阿里擁有全面的 AI 技術(shù)布局,涵蓋語音智能、語言技術(shù)、機(jī)器視覺、決策智能等方向,建成了完善的機(jī)器智能算法體系, 不僅囊括語音、視覺、自然語言理解、無人駕駛等技術(shù)應(yīng)用領(lǐng)域,還不斷深化AI基礎(chǔ)設(shè)施建設(shè),重金投入研發(fā)AI芯片、超大規(guī)模機(jī)器學(xué)習(xí)平臺(tái),并建成了單日數(shù)據(jù)處理量突破 600PB 的超大計(jì)算平臺(tái)。

下面,我們主要圍繞語音智能、語言技術(shù)、機(jī)器視覺三大技術(shù)領(lǐng)域與平臺(tái)化建設(shè)的最新發(fā)展與成績(jī),一覽阿里 AI 技術(shù)這兩年的進(jìn)展。

(一)語音智能

語音識(shí)別

2018年6月,阿里達(dá)摩院開源了自主開發(fā)的新一代語音識(shí)別模型(DFSMN),在世界最大的免費(fèi)語音識(shí)別數(shù)據(jù)庫(kù) LibriSpeech 上進(jìn)行公開測(cè)試。對(duì)比目前業(yè)界使用最為廣泛的 LSTM 模型,DFSMN 語音識(shí)別模型訓(xùn)練速度更快、識(shí)別準(zhǔn)確率更高?;?DFSMN 模型,阿里 AI 又研發(fā)了 DFSMN-CTC 模型,語音錯(cuò)誤率大幅下降,解碼效率提升6倍。

此外,阿里巴巴機(jī)器智能技術(shù)實(shí)驗(yàn)室正在研發(fā)高工業(yè)噪聲環(huán)境下的語音識(shí)別及傳輸技術(shù)。以后,眾多車間工人將告別“通訊靠吼”的境況,簡(jiǎn)單的交流言語會(huì)轉(zhuǎn)換成文字。目前,在85分貝工業(yè)噪聲下,可以實(shí)現(xiàn)將一米處正常音量語音轉(zhuǎn)換為文字,準(zhǔn)確率達(dá)94.6%,能夠解決大部分工廠里的噪聲聾問題。這項(xiàng)工作仍在繼續(xù),未來團(tuán)隊(duì)希望可以實(shí)現(xiàn) 95 分貝工業(yè)噪聲下進(jìn)行語音識(shí)別。

阿里巴巴工程師正在調(diào)試AI語音識(shí)別系統(tǒng)

語音交互

目前,阿里語音 AI 每日調(diào)用量已達(dá)1.8 億次。

2019 年 7 月,阿里開源人機(jī)對(duì)話模型 ESIM。ESIM 是一個(gè)解決多輪對(duì)話回復(fù)問題的原創(chuàng)模型,通過給對(duì)話機(jī)器人裝上實(shí)時(shí)搜索并理解人類真實(shí)意圖的“雷達(dá)”系統(tǒng),實(shí)現(xiàn)對(duì)對(duì)話歷史的實(shí)時(shí)檢索,自動(dòng)去除多余信息的干擾,給出人類期待的回復(fù)。

例如當(dāng)人們線上購(gòu)物時(shí),提出要一件M號(hào)的黑色裙子,智能機(jī)器人通過對(duì)庫(kù)存情況的實(shí)時(shí)檢索,發(fā)現(xiàn)并答復(fù)用戶沒有黑色M號(hào)的裙子。用戶接著問,“那有白色的嗎?”此時(shí)傳統(tǒng)模型訓(xùn)練出的AI客服很難判斷用戶是要問“這件裙子是否有白色款”還是“有沒有白色的M號(hào)裙子”,無法給出準(zhǔn)確回復(fù)。

阿里 AI 通過對(duì)用戶對(duì)話上下文的檢索,明確用戶的核心在于尺寸而非顏色,很快給出有沒有白色M號(hào)裙子的準(zhǔn)確回復(fù)。

這項(xiàng)技術(shù)未來將會(huì)被應(yīng)用到人機(jī)交互的多個(gè)場(chǎng)景:智能語音點(diǎn)餐機(jī)能夠更準(zhǔn)確地理解人們的真實(shí)意圖,提高點(diǎn)單成功率;導(dǎo)航軟件能更容易聽懂人們的語音請(qǐng)求,少走冤枉路;家里的智能音箱能夠更快做出反應(yīng),節(jié)省等待時(shí)間。

語音合成

阿里達(dá)摩院機(jī)器智能實(shí)驗(yàn)室自主研發(fā)的基于翻譯的合成技術(shù) Knowledge-Aware Neural TTS(KAN-TTS)深度融合了目前主流的端到端 TTS 技術(shù)和傳統(tǒng) TTS 技術(shù),同時(shí)系統(tǒng)構(gòu)建了基于不同領(lǐng)域的深層知識(shí)。并針對(duì) CPU 部署的框架設(shè)計(jì)進(jìn)行優(yōu)化,提供高效、便捷的部署能力,另外還改進(jìn)了 20 多項(xiàng)關(guān)鍵算法,從多個(gè)方面改進(jìn)了語音合成。

傳統(tǒng)語音合成定制需要10小時(shí)以上的數(shù)據(jù)錄制和標(biāo)注,對(duì)錄音人和錄音環(huán)境要求很高。從啟動(dòng)定制到最終交付,項(xiàng)目周期長(zhǎng)成本高。阿里利用 Multi-Speaker Model 與 Speaker-aware Advanced Transfer Learning 相結(jié)合的方法,將語音合成定制成本降低 10 倍以上,周期壓縮 3 倍以上。也就是說,用 1 小時(shí)有效錄音數(shù)據(jù)和不到兩個(gè)月制作周期,就能完成一次標(biāo)準(zhǔn) TTS 定制。

這也意味著,普通用戶定制“AI聲音”的門檻更低。只需手機(jī)錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。阿里 AI 做到這一點(diǎn),主要基于自動(dòng)數(shù)據(jù)檢查、自動(dòng)標(biāo)注方法和對(duì)海量用戶場(chǎng)景的利用。阿里已經(jīng)對(duì)外提供開箱即用的 TTS 解決方案,共有通用、客服、童聲、英文和方言 5 個(gè)場(chǎng)景的 34 種聲音供選擇?;谛乱淮夹g(shù),阿里還提高了設(shè)備端離線 TTS 的效果。這在超低資源設(shè)備端的 TTS 服務(wù)中非常有用,比如當(dāng)人們駕車行駛于信號(hào)微弱區(qū)域時(shí)避免語音導(dǎo)航“掉線”。

除了在語音識(shí)別、語音交互與語音合成等領(lǐng)域的進(jìn)展,在聲紋識(shí)別領(lǐng)域,阿里達(dá)摩院研發(fā)了聲紋無監(jiān)督聚類技術(shù),推出分布式語音交互模組,用于阿里云 IoT 聯(lián)合阿里達(dá)摩院發(fā)布的分布式語音交互解決方案中,方案除了語音交互模組外,還包括語音自學(xué)習(xí)平臺(tái)、對(duì)話平臺(tái)以及阿里云 IoT 智能人居平臺(tái),打通了上下游平臺(tái)串聯(lián)、端云一體能力,縮短智能人居環(huán)境開發(fā)周期,同時(shí)還具備強(qiáng)擴(kuò)展能力。

(二)自然語言處理

機(jī)器翻譯

2017 年的 WMT 競(jìng)賽,大多數(shù)系統(tǒng)是基于 RNN 和 LSTM,包括最終獲得冠軍的系統(tǒng)也是基于此。僅僅過了一年時(shí)間,各大機(jī)構(gòu)都爭(zhēng)先使用 Transformer。達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室資深算法專家陳博興帶領(lǐng)的達(dá)摩院機(jī)器翻譯團(tuán)隊(duì),在此次比賽中,基于 Transformer 結(jié)構(gòu), Self-Attention、Multi-head Attention 等技術(shù),進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn),充分利用詞語位置信息,提出高度并行化、能捕捉層次化信息的神經(jīng)網(wǎng)絡(luò),全面提升了機(jī)器翻譯的性能。

去年,AI科技大本營(yíng)也邀請(qǐng)了阿里巴巴機(jī)器智能技術(shù)實(shí)驗(yàn)室阿里巴巴翻譯平臺(tái)翻譯模型組負(fù)責(zé)人于恒做了公開課分享:《Transformer 新型神經(jīng)網(wǎng)絡(luò)在機(jī)器翻譯中的應(yīng)用 | 公開課筆記》

目前,達(dá)摩院機(jī)器翻譯技術(shù)團(tuán)隊(duì)已實(shí)現(xiàn)了 48 個(gè)語言翻譯方向,支持俄、西、法、阿、土,泰、印尼、越南等多種語言翻譯;其中電商覆蓋了大部分語向和場(chǎng)景,超越谷歌和亞馬遜,日調(diào)用量達(dá)到 17.9 億次。阿里的機(jī)器翻譯技術(shù)除了應(yīng)用于電商全鏈路服務(wù)之外,還廣泛應(yīng)用于菜鳥物流通關(guān)、阿里云國(guó)際社區(qū)、飛豬旅行翻譯助手、釘釘社交口語翻譯等一系列產(chǎn)品。

QA 任務(wù) & 機(jī)器閱讀

傳統(tǒng) AI 閱讀需要某一領(lǐng)域的專業(yè)人士準(zhǔn)備好問答數(shù)據(jù),AI 回答也僅限于該領(lǐng)域,例如金融領(lǐng)域的人工智能無法回答物流領(lǐng)域的問題。阿里研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型能夠模擬人類在做閱讀理解問題時(shí)的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。模型可以在捕捉問題和文章中特定區(qū)域關(guān)聯(lián)的同時(shí),借助分層策略,逐步集中注意力,使答案邊界清晰;另一方面,為避免過于關(guān)注細(xì)節(jié),采用融合方式將全局信息加入注意力機(jī)制,進(jìn)行適度糾正,確保關(guān)注點(diǎn)正確。

比如,4300 萬字的《大英百科全書》,阿里 AI 可以在毫秒內(nèi)閱讀完,并根據(jù)自己的理解快速回答涉及書中不同領(lǐng)域的不同問題。例如亞洲有多少個(gè)國(guó)家?美國(guó)第五任總統(tǒng)是誰?恐龍是什么時(shí)候消失的?機(jī)器人可以分別迅速給出答案,無懼“連環(huán)追擊”。

阿里還提出了基于“融合結(jié)構(gòu)化信息 BERT 模型”的“深度級(jí)聯(lián)機(jī)器閱讀模型”,可以模仿人類閱讀理解的過程,先對(duì)文檔進(jìn)行快速瀏覽,判斷,然后針對(duì)相應(yīng)段落進(jìn)行精讀,并根據(jù)“自己的理解”回答問題。

常識(shí)推理可以說是難度最高的 NLP 任務(wù)之一,深度學(xué)習(xí)領(lǐng)軍人物之一、圖靈獎(jiǎng)獲得者 Yann LeCun 曾有斷言:最聰明的AI在常識(shí)方面也不如貓。

阿里巴巴達(dá)摩院語音實(shí)驗(yàn)室還提出了 AMS 方法,顯著提升 BERT 模型的常識(shí)推理能力。AMS 方法使用與 BERT 相同的模型,僅預(yù)訓(xùn)練 BERT,在不提升模型計(jì)算量的情況下,將 CommonsenseQA 數(shù)據(jù)集上的準(zhǔn)確率提升了 5.5%,達(dá)到 62.2%。

語義識(shí)別

2019 年 4 月 1 日愚人節(jié)之際,阿里巴巴發(fā)布了這項(xiàng)旨在粉碎網(wǎng)絡(luò)謠言和假新聞的AI技術(shù)——“AI謠言粉碎機(jī)”。其算法模型由阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室研發(fā),依靠深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù),通過對(duì)信息的多維度和多角度分析,團(tuán)隊(duì)設(shè)計(jì)了一整套包含發(fā)布信息、社交畫像、回復(fù)者立場(chǎng)、回復(fù)信息、傳播路徑在內(nèi)的綜合判定系統(tǒng),首次把謠言識(shí)別和社交用戶觀點(diǎn)識(shí)別打通,并做交叉分析,目前在特定場(chǎng)景中的準(zhǔn)確率已經(jīng)達(dá)到 81%,最快能夠在 1 秒內(nèi)判定新聞的真實(shí)性。

(三)機(jī)器視覺

醫(yī)療影像分析

2017 年 7 月,國(guó)際權(quán)威肺結(jié)節(jié)檢測(cè)大賽 LUNA16 要求選手對(duì) 888 份肺部 CT 樣本進(jìn)行分析,尋找其中的肺結(jié)節(jié)。樣本共包含 1186 個(gè)肺結(jié)節(jié),75% 以上為小于 10mm 的小結(jié)節(jié)。最終,阿里云 ET 在 7 個(gè)不同誤報(bào)率下發(fā)現(xiàn)的肺結(jié)節(jié)平均召回率達(dá)到 89.7%。(召回率指在樣本數(shù)據(jù)中成功發(fā)現(xiàn)的結(jié)節(jié)占比,下圖顯示了 ET 在不同誤報(bào)次數(shù)下的召回率情況。)

(FROC曲線)

其背后的技術(shù)由阿里巴巴 iDST視覺計(jì)算團(tuán)隊(duì)完成,負(fù)責(zé)人華先勝介紹,與常用的兩階段檢測(cè)方法不同,他們創(chuàng)新性地使用了單階段方法,全程無須人工干預(yù)。機(jī)器全自動(dòng)讀取病人的 CT 序列,直接輸出檢測(cè)到的肺結(jié)節(jié)。在模型結(jié)構(gòu)設(shè)計(jì)上,ET 針對(duì) CT 切片的特性,采用多通道、異構(gòu)三維卷積融合算法、有效地利用多異構(gòu)模型的互補(bǔ)性來處理和檢測(cè)在不同形態(tài)上的肺結(jié)節(jié) CT 序列,提高了對(duì)不同尺度肺結(jié)節(jié)的敏感性;同時(shí)使用了帶有反卷積結(jié)構(gòu)的網(wǎng)絡(luò)和多任務(wù)學(xué)習(xí)的訓(xùn)練策略,提高了檢測(cè)的準(zhǔn)確度。比賽中,團(tuán)隊(duì)克服了一系列挑戰(zhàn):如結(jié)節(jié)模態(tài)復(fù)雜問題,早期的結(jié)節(jié)?。ㄐ∮?0mm),傳統(tǒng)的機(jī)器學(xué)習(xí)和用于自然圖像的深度學(xué)習(xí)網(wǎng)絡(luò)通常難以湊效。

肝結(jié)節(jié)的準(zhǔn)確測(cè)量可以輔助醫(yī)生做出決策和治療方案。但肝結(jié)節(jié)形態(tài)多樣,即使是同一個(gè)病人,結(jié)節(jié)的大小、形狀都不一樣,從而導(dǎo)致結(jié)節(jié)間灰度分布差異大、或與周圍組織灰度相似,甚至沒有清晰的邊界。

阿里則通過對(duì) CT 圖像層間信息和層內(nèi)信息融合的網(wǎng)絡(luò)結(jié)構(gòu)分析,解決肝結(jié)節(jié)類別多樣性的問題。采用基于原子卷積的空間金字塔池化(Atrous Spatial Pyramid Pooling)、亞像素卷積(Sub Pixel Convolution)及多特征融合等技術(shù)。華先勝表示,目前團(tuán)隊(duì)研究范圍已經(jīng)覆蓋肺、肝、骨、心臟、腦等部位的疾病,涉及影像分析、自然語言處理、設(shè)備信號(hào)處理等相關(guān)技術(shù),部分技術(shù)已經(jīng)落地到實(shí)際的醫(yī)療診斷中。

超大規(guī)模圖像識(shí)別 & 圖像搜索

2019年6月,在被譽(yù)為人工智能世界杯的 WebVision 競(jìng)賽要求參賽的 AI 模型將 1,600 萬張圖片精準(zhǔn)分類到 5,000 個(gè)類目中。相比于經(jīng)過人工標(biāo)注完畢的 ImageNet 數(shù)據(jù)集,WebVision 所用數(shù)據(jù)集直接從互聯(lián)網(wǎng)爬取,沒有經(jīng)過人工標(biāo)注,含有較多噪音,且數(shù)據(jù)類別的數(shù)量組成極大不平衡,AI 的識(shí)別難度更高。

阿里 AI 引入了構(gòu)建類別語義標(biāo)簽關(guān)系的模型,并采用輔助信息模型進(jìn)行圖像去噪的深度學(xué)習(xí)技術(shù),以及阿里自研的可以支持?jǐn)?shù)十億圖片分類訓(xùn)練的超大平臺(tái)。最終,阿里 AI 以 82.54% 的識(shí)別準(zhǔn)確率,擊敗全世界 150 多支參賽隊(duì)獲得冠軍,目前該技術(shù)可以識(shí)別超過 100 萬種物理實(shí)體。

2019 年 7 月,在 CVPR 2019 舉辦的 LPIRC(低功耗圖像識(shí)別挑戰(zhàn)賽)中,阿里 AI 獲得在線圖像分類任務(wù)第一名,以 23ms 的單張圖片分類速度,在 10 分鐘內(nèi)分類 20,000張圖像。在挑戰(zhàn)賽使用的訓(xùn)練數(shù)據(jù)集上,實(shí)現(xiàn)了 67.4% 的分類精度,比官方提供的基準(zhǔn)線高3.5%。

視覺對(duì)話

視覺對(duì)話是近年來快速崛起的 AI 研究方向,目的在于教會(huì)機(jī)器用自然語言與人類討論視覺內(nèi)容。如果說視覺識(shí)別技術(shù),讓機(jī)器具備了視覺能力;那么視覺對(duì)話技術(shù),則使機(jī)器擁有了對(duì)真實(shí)視覺世界的理解與推斷能力,意味著 AI 的認(rèn)知能力將邁上新的臺(tái)階。

(視覺對(duì)話中,AI可以從容應(yīng)對(duì)人類提問,左為AI,右為人類)

傳統(tǒng)的視覺 AI 主要針對(duì)目標(biāo)的檢測(cè)和識(shí)別,例如識(shí)別出圖片是否是一只貓,但對(duì)復(fù)雜場(chǎng)景中目標(biāo)之間的邏輯關(guān)系理解、推理能力較弱,無法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復(fù)雜問題,也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。

阿里 AI 提出了“遞歸探索對(duì)話模型”,綜合集成了圖像識(shí)別、關(guān)系推理與自然語言理解三大能力,通過高效利用標(biāo)注信息學(xué)習(xí)出模仿人類認(rèn)知復(fù)雜場(chǎng)景的思維方式,能夠有效識(shí)別圖片里的實(shí)體以及它們之間的關(guān)系,推理出圖片所描述的事件內(nèi)容,并通過對(duì)上下文進(jìn)行有效建模,理解人類提出的問題及真實(shí)意圖,給出自然準(zhǔn)確的回復(fù)。

未來,視覺對(duì)話技術(shù)將被應(yīng)用在人機(jī)交互的諸多場(chǎng)景中。地震后在廢墟中尋找幸存者的救援機(jī)器人,能更加及時(shí)、高效地綜合指揮指令和場(chǎng)景信息作出行動(dòng);視障人士可以通過提問AI理解網(wǎng)絡(luò)照片中的內(nèi)容,了解自身所處的周圍環(huán)境;無人駕駛車輛對(duì)影響因子的意圖理解會(huì)更為準(zhǔn)確,乘客的乘坐體驗(yàn)更好。

(四)阿里 AI 的基礎(chǔ)平臺(tái)建設(shè)

機(jī)器學(xué)習(xí)平臺(tái) PAI3.0

在 AI 應(yīng)用技術(shù)上的不斷探索之外,阿里不斷深化 AI 基礎(chǔ)設(shè)施建設(shè)。機(jī)器學(xué)習(xí)平臺(tái)為人工智能發(fā)展提供深度學(xué)習(xí)數(shù)據(jù)處理和模型訓(xùn)練的一站式服務(wù),阿里研發(fā)了大規(guī)模分布式機(jī)器學(xué)習(xí)平臺(tái) PAI,讓企業(yè)和開發(fā)者擁有便捷的人工智能開發(fā)能力,大幅降低使用人工智能的成本。該平臺(tái)是國(guó)內(nèi)首個(gè)集數(shù)據(jù)處理、建模、離線預(yù)測(cè)、在線預(yù)測(cè)為一體的機(jī)器學(xué)習(xí)平臺(tái),提供 100 余種算法組件,支持千億特征、萬億模型和萬億樣本乃至 PB 級(jí)的數(shù)據(jù)訓(xùn)練,為傳統(tǒng)機(jī)器學(xué)習(xí)提供上百種算法和大規(guī)模分布式計(jì)算的服務(wù)。

分布式深度學(xué)習(xí)框架 XDL

2018 年杭州云棲大會(huì)上,針對(duì)廣告、搜索、推薦等典型數(shù)據(jù)處理場(chǎng)景,發(fā)布自研新一代工業(yè)級(jí)分布式深度學(xué)習(xí)框架——XDL,關(guān)注的核心是這些場(chǎng)景下高維稀疏數(shù)據(jù)的性能。

分布式計(jì)算引擎 Maxcompute

大規(guī)模算力是支撐的機(jī)器智能高效應(yīng)用的基礎(chǔ)。阿里擁有豐富的異構(gòu)計(jì)算平臺(tái)和自研的大規(guī)模分布式計(jì)算引擎(Maxcompute),包括超大規(guī)模批量計(jì)算、超高并發(fā)實(shí)時(shí)計(jì)算、復(fù)雜圖數(shù)據(jù)推理計(jì)算三類,綜合性能上領(lǐng)先現(xiàn)有開源引擎 30%,整體成本降低 20%。在 2018 年雙十一,MaxCompute 單日數(shù)據(jù)處理量突破 600 PB。

移動(dòng)端輕量級(jí)的深度神經(jīng)網(wǎng)絡(luò)推理引擎 MNN

基于淘寶和達(dá)摩院的研究成果,阿里 2017 年開始組建 MNN 團(tuán)隊(duì)。2019 年 5 月,阿里開源了首個(gè)移動(dòng) AI 項(xiàng)目——輕量級(jí)的深度神經(jīng)網(wǎng)絡(luò)推理引擎MNN(Mobile Neural Network),具有輕量、通用、高性能、易用性特征。MNN 提供模型轉(zhuǎn)換和計(jì)算推理兩大功能,模型轉(zhuǎn)換功能幫助開發(fā)者兼容不同的訓(xùn)練框架,如 TensorFlow(Lite)、ONNX 等;計(jì)算推理部分應(yīng)用了多種優(yōu)化方法,高效推理。MNN 可用在智能手機(jī)、IoT 設(shè)備等端側(cè)加載深度神經(jīng)網(wǎng)絡(luò)模型,可應(yīng)用于阿里手機(jī)淘寶、手機(jī)天貓、優(yōu)酷等 20 多個(gè)應(yīng)用,覆蓋直播、短視頻、搜索推薦、商品圖像搜索、互動(dòng)營(yíng)銷、權(quán)益發(fā)放、安全風(fēng)控等場(chǎng)景。

達(dá)摩院:阿里 AI 發(fā)展的“總樞紐”

雖然阿里在人工智能賽道的起步不算最早,不過等到AI風(fēng)口在2015年前后起勢(shì),阿里也儲(chǔ)備了相當(dāng)分量的AI人才。兩年前,阿里組建達(dá)摩院,全面升級(jí)人工智能的技術(shù)、商業(yè)布局。某種程度上,達(dá)摩院的組建是阿里人工智能組織力量的重大升級(jí),奠定了這兩年阿里AI技術(shù)飛速發(fā)展的基礎(chǔ)。

當(dāng)然,技術(shù)能否帶來經(jīng)濟(jì)社會(huì)生活的改變,能否帶來商業(yè)化場(chǎng)景大規(guī)模落地,才是技術(shù)價(jià)值的最終體現(xiàn)。在人工智能領(lǐng)域,技術(shù)應(yīng)用的商業(yè)化是衡量?jī)r(jià)值的唯一標(biāo)準(zhǔn),而阿里產(chǎn)業(yè)AI目前已遍及醫(yī)療、金融、制造、司法、交通、環(huán)保、教育、零售等領(lǐng)域。

領(lǐng)先的算法技術(shù)、AI 應(yīng)用的系統(tǒng)集成能力、AI 產(chǎn)業(yè)生態(tài)構(gòu)建能力、海量用戶場(chǎng)景、開源技術(shù)生態(tài)、大規(guī)模研發(fā)投入和頂級(jí)人才團(tuán)隊(duì)以及自身的AI商業(yè)化模式是阿里 AI 取得現(xiàn)有成績(jī)的關(guān)鍵組成部分,而阿里達(dá)摩院無疑是將這些因子串聯(lián)起來的“總樞紐”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31338

    瀏覽量

    269746
  • 阿里達(dá)摩院
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    3362

原文標(biāo)題:阿里達(dá)摩院做AI這兩年

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    腦機(jī)接口重大進(jìn)展,AI模仿讓患者發(fā)聲!上游芯片技術(shù)不斷研發(fā)

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,腦機(jī)接口技術(shù)又取得重大進(jìn)展,美國(guó)加州大學(xué)戴維斯分校健康中心開發(fā)出一款新型腦機(jī)接口(BCI),可將腦信號(hào)轉(zhuǎn)化為語音,準(zhǔn)確率高達(dá)97%。該團(tuán)隊(duì)一名因肌萎縮側(cè)索硬化癥
    的頭像 發(fā)表于 08-17 00:03 ?7394次閱讀
    腦機(jī)接口<b class='flag-5'>重大進(jìn)展</b>,<b class='flag-5'>AI</b>模仿讓患者發(fā)聲!上游芯片<b class='flag-5'>技術(shù)</b>也<b class='flag-5'>在</b>不斷研發(fā)

    使用獨(dú)立ADC和使用MCU的內(nèi)部ADC來實(shí)現(xiàn)模數(shù)轉(zhuǎn)換,有什么性能、技術(shù)上的區(qū)別嗎?

    使用獨(dú)立ADC和使用MCU的內(nèi)部ADC來實(shí)現(xiàn)模數(shù)轉(zhuǎn)換,有什么性能、技術(shù)上的區(qū)別嗎? 二者有沒有各自的優(yōu)劣勢(shì)?
    發(fā)表于 11-22 06:10

    AMD發(fā)布10億參數(shù)開源AI模型OLMo

    AMD公司近日宣布了一項(xiàng)重大進(jìn)展,推出了首個(gè)完全開放的10億參數(shù)語言模型系列——AMD OLMo。這一舉措為開發(fā)者和研究人員提供了強(qiáng)大的AI研究工具,有助于推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展。
    的頭像 發(fā)表于 11-12 18:08 ?476次閱讀

    AI大模型的最新研究進(jìn)展

    AI大模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)
    的頭像 發(fā)表于 10-23 15:19 ?530次閱讀

    Anthropic人工智能領(lǐng)域取得重大突破

     10月23日消息,美國(guó)當(dāng)?shù)貢r(shí)間周二,人工智能初創(chuàng)企業(yè)Anthropic宣布了一項(xiàng)重大進(jìn)展。這家由前OpenAI高管創(chuàng)立并獲得亞馬遜支持的公司,人工智能領(lǐng)域取得了新的突破,其研發(fā)的AI智能體已經(jīng)具備了與人類相當(dāng)?shù)哪芰Γ梢圆僮?/div>
    的頭像 發(fā)表于 10-23 14:56 ?501次閱讀

    開啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    操作系統(tǒng)標(biāo)準(zhǔn)化的最新進(jìn)展。 華為計(jì)算產(chǎn)業(yè)戰(zhàn)略規(guī)劃總監(jiān)周明耀論壇做了“華為AI軟硬件積累及
    發(fā)表于 08-30 17:24

    阿里達(dá)摩發(fā)布玄鐵R908 CPU

    杭州第四屆RISC-V中國(guó)峰會(huì)上,阿里達(dá)摩再次展現(xiàn)技術(shù)實(shí)力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標(biāo)志著玄鐵系列
    的頭像 發(fā)表于 08-23 16:27 ?1038次閱讀

    蘋果最新消息 韋德布什上調(diào)蘋果目標(biāo)價(jià) 庫(kù)克:將繼續(xù)AI技術(shù)上投資

    加大AI投入之后的表現(xiàn)。 庫(kù)克:將繼續(xù)AI技術(shù)上投資 此前我們已經(jīng)都知道蘋果公司放棄了電動(dòng)汽車項(xiàng)目轉(zhuǎn)而加大對(duì)人工智能的投資;積極擁抱人工
    的頭像 發(fā)表于 08-02 16:55 ?562次閱讀

    特斯拉推動(dòng)4680電池技術(shù)上的決心與努力有目共睹

    近期關(guān)于特斯拉可能放棄自研4680電池及其技術(shù)路線的傳聞,實(shí)則是對(duì)市場(chǎng)動(dòng)態(tài)的誤解。實(shí)際,特斯拉推動(dòng)4680電池技術(shù)上的決心與努力有目共睹,這一創(chuàng)新不僅代表了動(dòng)力電池領(lǐng)域的新高度,也
    的頭像 發(fā)表于 07-05 15:28 ?1594次閱讀

    阿里達(dá)摩提出“知識(shí)鏈”框架,降低大模型幻覺

    近日,阿里巴巴達(dá)摩(湖畔實(shí)驗(yàn)室)攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu),共同推出了大模型知識(shí)鏈(CoK)框架。該框架不僅可實(shí)時(shí)檢索異構(gòu)知識(shí)源,還能逐步糾正推理錯(cuò)誤,有效提高了大模型回答知識(shí)型問題時(shí)的準(zhǔn)確率,并顯著降低了所謂的“幻覺
    的頭像 發(fā)表于 05-10 11:46 ?722次閱讀

    達(dá)摩牽頭成立“無劍聯(lián)盟”,探索RISC-V產(chǎn)業(yè)合作新范式

    及機(jī)構(gòu),帶來了玄鐵RISC-V電力、5G通信、機(jī)器人、金融等不同行業(yè)涌現(xiàn)的應(yīng)用創(chuàng)新,基于玄鐵RISC-V處理器的筆記本電腦“如意BOOK”首次亮相,達(dá)摩當(dāng)日宣布發(fā)起成立“無劍聯(lián)盟”。硅谷芯片傳奇
    發(fā)表于 03-14 16:56 ?397次閱讀
    <b class='flag-5'>達(dá)摩</b><b class='flag-5'>院</b>牽頭成立“無劍聯(lián)盟”,探索RISC-V產(chǎn)業(yè)合作新范式

    蘋果CEO庫(kù)克預(yù)告重大AI計(jì)劃

    今年的蘋果年度股東大會(huì)上,公司CEO蒂姆·庫(kù)克(Tim Cook)向投資者和公眾透露了公司人工智能領(lǐng)域的重大進(jìn)展。庫(kù)克明確表示,蘋果在AI技術(shù)上
    的頭像 發(fā)表于 03-05 11:02 ?753次閱讀

    泰凌微電子、谷歌與和眾科技的Matter聯(lián)合項(xiàng)目取得重大進(jìn)展

    近日,Telink(泰凌微電子)、Google(谷歌)、HooRii Technology(和眾科技)共同參與的Matter聯(lián)合項(xiàng)目宣布取得重大進(jìn)展。單臺(tái)MatterOTBR設(shè)備下,成功掛載了超過100臺(tái)Matter over Thread設(shè)備,這一數(shù)字相較于之前的限制
    的頭像 發(fā)表于 02-26 09:27 ?970次閱讀

    阿里達(dá)摩北京公司新增AI業(yè)務(wù)

    阿里巴巴達(dá)摩(北京)科技有限公司近日進(jìn)行了工商變更,經(jīng)營(yíng)范圍有所調(diào)整。具體來說,公司去除了智聯(lián)網(wǎng)、芯片技術(shù)、量子計(jì)算等數(shù)據(jù)通信、電子產(chǎn)品、軟件和硬件技術(shù)及產(chǎn)品的研究、開發(fā)等業(yè)務(wù),而新
    的頭像 發(fā)表于 02-23 11:39 ?1089次閱讀

    阿里達(dá)摩在上海成立新公司,聚焦人工智能與軟件開發(fā)

    天眼查信息顯示,達(dá)摩(上海)科技有限公司已正式成立,法定代表人為張建鋒,注冊(cè)資本為1000萬人民幣。該公司由阿里巴巴旗下阿里巴巴達(dá)摩(杭州)科技有限公司全資持股。
    的頭像 發(fā)表于 02-04 10:52 ?1063次閱讀