0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一臺有道翻譯王包括多少種AI技術(shù)?

Tensorflowers ? 來源:未知 ? 作者:李倩 ? 2018-11-20 11:02 ? 次閱讀

2018 年 9 月 6 日下午,網(wǎng)易有道在 AI 開放日上發(fā)布了全新一代有道翻譯王 2.0 Pro。隨后在 9 月 20 日舉辦的Google開發(fā)者大會上,有道技術(shù)總監(jiān)林會杰分享了端側(cè) AI 在智能硬件產(chǎn)品上的重要性,并且現(xiàn)場演示了有道翻譯王基于端側(cè) AI技術(shù)實(shí)現(xiàn)的全離線語音翻譯功能。與云側(cè) AI 相比,端側(cè) AI 具有無網(wǎng)絡(luò)延遲、更高的穩(wěn)定性、數(shù)據(jù)隱私性、響應(yīng)實(shí)時(shí)性, 這些特性使得端側(cè) AI 滿足超低延遲場景,如文檔掃描、AR 翻譯、實(shí)時(shí)語音翻譯等。

在這場發(fā)布會之前,有道技術(shù)團(tuán)隊(duì)已經(jīng)在移動端離線 AI 技術(shù)上做了很多努力和探索。尤其是在端側(cè) AI 部分應(yīng)用了 Google 發(fā)布的 TensorFlow Lite,本文將介紹有道翻譯王的 AI 技術(shù),以及 TensorFlowLite 在有道翻譯王上的應(yīng)用。

有道翻譯王主要用到的 AI 技術(shù)有 OCR(光學(xué)字符識別)、NMT(神經(jīng)機(jī)器翻譯)、ASR(自動語音識別)、TTS(語音合成)。這些技術(shù)滿足了一個翻譯機(jī)的基本要求,通過在 TensorFlow Lite 框架上實(shí)現(xiàn)和加速,使得應(yīng)用效果更加優(yōu)異。

一臺有道翻譯王包括多少種 AI 技術(shù)?

OCR

光學(xué)字符識別(Optical Character Recognition,OCR)是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進(jìn)行識別,并以文本的形式返回。有道 OCR 主要分為兩個部分,一個是檢測部分,另一個是識別部分。檢測部分是指在一張圖片上尋找文字所在區(qū)域并框選出來,然后將標(biāo)出的區(qū)域送入識別部分從而得出結(jié)果。

NMT

近年來,深度學(xué)習(xí)技術(shù)的發(fā)展為解決上述挑戰(zhàn)提供了新的思路。將深度學(xué)習(xí)應(yīng)用于機(jī)器翻譯任務(wù)的方法大致分為兩類:

仍以統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)為框架,只是利用神經(jīng)網(wǎng)絡(luò)來改進(jìn)其中的關(guān)鍵模塊,如語言模型、調(diào)序模型等;

不再以統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)為框架,而是直接用神經(jīng)網(wǎng)絡(luò)將源語言映射到目標(biāo)語言,即端到端的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(End-to-End Neural Machine Translation,End-to-End NMT),簡稱為 NMT 模型。

ASR

自動語音識別技術(shù) ( Automatic Speech Recognition,ASR ) 是一種將人的語音轉(zhuǎn)換為文本的技術(shù)。語音識別是一個多學(xué)科交叉的領(lǐng)域,它與聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號處理理論、信息論、計(jì)算機(jī)科學(xué)等眾多學(xué)科緊密相連。由于語音信號的多樣性和復(fù)雜性,語音識別系統(tǒng)目前只能在一定的限制條件下獲得滿意的性能,或者說只能應(yīng)用于某些特定的場合。

TTS

語音合成(Text To Speech,TTS)技術(shù)將文本轉(zhuǎn)化為聲音,目前廣泛應(yīng)用于語音助手、智能音箱、地圖導(dǎo)航等場景。TTS 的實(shí)現(xiàn)涉及到語言學(xué)、語音學(xué)的諸多復(fù)雜知識,因合成技術(shù)的區(qū)別,不同的 TTS 系統(tǒng)在準(zhǔn)確性、自然度、清晰度、還原度等方面也有著不一樣的表現(xiàn)。

以上這些 AI 技術(shù)會用到 CNN、RNN 等神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)會用到較為常用的算子,如卷積層、全連接層、池化層、Relu 層。由于 TensorFlow 工作流程相對容易,API 穩(wěn)定,兼容性好,并且 TensorFlow 與 Numpy 完美結(jié)合,使其較為容易上手,所以我們在訓(xùn)練模型時(shí)主要采用 TensorFlow 框架,可以大大的降低成本和節(jié)省精力。

有道首個運(yùn)用 TensorFlow Lite 技術(shù)的智能硬件設(shè)備

TensorFlow Lite 簡介

TensorFlow Lite 是 TensorFlow 針對移動和嵌入式設(shè)備的輕量級解決方案。它為設(shè)備上的機(jī)器學(xué)習(xí)預(yù)測降低了延遲,減小了二進(jìn)制大小。TensorFlow Lite 還支持硬件加速的 Android NNAPI。這樣一來,就對算法的開發(fā)和部署有了很大的優(yōu)勢。

TensorFlow Lite 優(yōu)勢

輕量級:允許小 binarysize和快速初始化/啟動的設(shè)備端機(jī)器學(xué)習(xí)模型進(jìn)行推斷。

跨平臺:運(yùn)行時(shí)的設(shè)計(jì)使其可以在不同的平臺上運(yùn)行,如目前支持的 Android 和 iOS

快速:專為移動設(shè)備進(jìn)行優(yōu)化,包括大幅提升模型加載時(shí)間,支持硬件加速。

TensorFlow Lite 集成 Android 項(xiàng)目

(1)首先添加 TensorFlowLite 庫到項(xiàng)目中:

compile ‘org.tensorflow:tensorflow-lite:+’

(2)然后導(dǎo)入 TFliteinterpreter:

import org.tensorflow.lite.Interpreter;

(3)這樣就可以創(chuàng)建一個 Interpreter:

protected Interpreter tflite;

tflite = new Interpreter(loadModelFile(activity));

(4)載入模型函數(shù)示例:

/** Memory-map the model file in Assets. */

private MappedByteBuffer loadModelFile(Activity activity) throwsIOException {

AssetFileDescriptor fileDescriptor =activity.getAssets().openFd(getModelPath());

FileInputStream inputStream = newFileInputStream(fileDescriptor.getFileDescriptor());

FileChannel fileChannel = inputStream.getChannel(); long startOffset = fileDescriptor.getStartOffset();

long declaredLength = fileDescriptor.getDeclaredLength();

return fileChannel.map(FileChannel.MapMode.READ_ONLY, startOffset,declaredLength);

}

(5)執(zhí)行模型:

tflite.run(imgData, labelProbArray);

模型速度測試及比較

我們測試了常用的深度學(xué)習(xí)模型在 TensorFlow 和 TensorFlow Lite 上的運(yùn)行速度, 模型分別為 InceptionV3、MobileNetV1、MobileNetV2。

同時(shí),在 TensorFlow Lite 平臺上,對浮點(diǎn)模型和量化模型進(jìn)行速度測試比較。

TensorFlow 和 TensorFlow Lite 具有良好的通用性,除此之外,對于專有硬件平臺,我們還對比了高通公司的SNPE ( Snapdragon Neural Processing Engine),測試InceptionV3 模型運(yùn)行在驍龍 835 芯片CPUGPU、DSP 上的速度。

測試有道 OCR Detection 模型在 TensorFlow、TensorFlow Lite 和高通 SPNE 上的運(yùn)行情況。

由此可見,SNPE 的 CPU 運(yùn)行速度要比 TensorFlow 的 CPU 速度慢了很多,但是在DSP 上的運(yùn)行速度明顯優(yōu)于 CPU 和 GPU。雖然各大芯片廠商積極推出了高效能的神經(jīng)網(wǎng)絡(luò)處理器(NPU),但在模型轉(zhuǎn)換和平臺集成方面不盡如人意,其通用性和便利性遠(yuǎn)遠(yuǎn)不如 TensorFlow Lite。

TensorFlow Lite + 有道翻譯王 探索更多可能性

近年來,網(wǎng)易有道在 AI 領(lǐng)域已經(jīng)做出了很多嘗試和探索,積累了很多經(jīng)驗(yàn),同時(shí)也創(chuàng)造了很多價(jià)值。隨著深度學(xué)習(xí)的模型所需算力的增加,在移動端流暢運(yùn)行模型則成為了一大挑戰(zhàn),為了解決這一大問題,各大硬件廠商推出神經(jīng)網(wǎng)絡(luò)加速芯片,軟件廠商也通過各種優(yōu)化來提高速度。Google 也為此做出了努力, 推出了 TensorFlow Lite,優(yōu)化了模型體積,提高了運(yùn)行速度,還可以通過NNAPI 實(shí)現(xiàn)硬件加速。

由于 TensorFlow Lite 具有良好的通用性,可以適應(yīng)多種不同的硬件平臺,所以在模型適配上節(jié)省了很多成本。目前 TensorFlow Lite 對 LSTM 的支持在不斷完善,有道未來打算進(jìn)一步完成相關(guān)模型的遷移和適配。同時(shí)也希望 TensorFlow Lite 能通過 Android NNAPI 可以集成更多的硬件平臺,包括 Google 最新發(fā)布的 Edge TPU 等, 充分利用不同硬件平臺的神經(jīng)網(wǎng)絡(luò)芯片加速,從而能夠使得更多的 AI 技術(shù)能夠更加高效率、低功耗、低延遲的運(yùn)行在各種智能硬件設(shè)備上,真正實(shí)現(xiàn)讓 AI 無處不在。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    14928
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    329

    瀏覽量

    60600
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1289

    瀏覽量

    24419

原文標(biāo)題:當(dāng) TensorFlow Lite 遇到有道翻譯王 2.0 Pro

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI助力實(shí)時(shí)翻譯耳機(jī)

    你是否曾經(jīng)因?yàn)檎Z言障礙而無法與外國人順暢交流?或者在旅行中因?yàn)檎Z言不通而錯過了些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術(shù)的發(fā)展,實(shí)時(shí)翻譯耳機(jī)可以幫你輕松解決這些問題。 1 什么是實(shí)時(shí)
    的頭像 發(fā)表于 01-24 11:14 ?280次閱讀
    <b class='flag-5'>AI</b>助力實(shí)時(shí)<b class='flag-5'>翻譯</b>耳機(jī)

    企業(yè)AI解決方案包括哪些內(nèi)容

    企業(yè)AI解決方案是一種集成了人工智能技術(shù)的綜合性方案,旨在提高企業(yè)運(yùn)營效率、降低成本、優(yōu)化業(yè)務(wù)流程,并提升企業(yè)的整體競爭力。那么,企業(yè)AI解決方案
    的頭像 發(fā)表于 01-10 10:15 ?93次閱讀

    一臺電腦是否可以同時(shí)連接兩ADS1263EVM-PDK并且同時(shí)控制?

    一臺電腦是否可以同時(shí)連接兩ADS1263EVM-PDK并且同時(shí)控制?
    發(fā)表于 12-20 06:36

    IMAX攜手Camb.AI實(shí)現(xiàn)影院實(shí)時(shí)語言翻譯

    內(nèi)容和精彩紀(jì)錄片精準(zhǔn)地本地化為多達(dá)140語言,以滿足全球不同地區(qū)觀眾的多樣化需求。傳統(tǒng)配音方式不僅成本高昂,而且耗時(shí)較長,難以滿足快速變化的市場需求。而Camb.AI的DubStudio平臺則憑借其先進(jìn)的人工智能技術(shù),承諾能夠
    的頭像 發(fā)表于 11-26 13:55 ?447次閱讀

    手搓一臺家庭用直流電焊機(jī)

    家庭總有小修小補(bǔ),一臺家庭用電焊機(jī)必不可少,過程簡單又不失興趣可以試!,
    的頭像 發(fā)表于 10-09 08:20 ?584次閱讀
    手搓<b class='flag-5'>一臺</b>家庭用直流電焊機(jī)

    提升工作效率,從共用一臺屏幕開始

    在數(shù)字化辦公的時(shí)代,我們經(jīng)常需要在多臺電腦之間切換工作。但是,頻繁切換不僅影響效率,還容易讓人分心。那么,有沒有一種方法,可以讓兩臺電腦共用一臺屏幕,從而提升工作效率呢?答案是肯定的!今天,就讓
    的頭像 發(fā)表于 10-08 14:27 ?203次閱讀

    多個網(wǎng)站放在同一臺服務(wù)器ip有什么影響?

    將多個網(wǎng)站放在同一臺服務(wù)器上,使用同個IP地址,可能會有以下影響: 1、資源共享:多個網(wǎng)站共享同一臺服務(wù)器的資源,如CPU、內(nèi)存、存儲空間和帶寬。如果其中個網(wǎng)站流量或資源消耗突然增
    的頭像 發(fā)表于 09-12 11:15 ?707次閱讀

    主機(jī)托管是多個用戶共享一臺服務(wù)器嗎?有什么優(yōu)勢

    主機(jī)托管并不是多個用戶共享一臺服務(wù)器。主機(jī)托管是一種服務(wù),客戶可以將自己的硬件服務(wù)器托管給服務(wù)商,并享受專業(yè)的服務(wù)器托管服務(wù)。這種服務(wù)包括穩(wěn)定的網(wǎng)絡(luò)帶寬、恒溫、防塵、防火、防潮、防靜電等環(huán)境保障。
    的頭像 發(fā)表于 08-13 14:45 ?308次閱讀

    組態(tài)一臺FX5u之間無線通信你見過嗎?快速了解

    方式。本方案以2組態(tài)和1三菱FX5u PLC為例,介紹多臺組態(tài)與PLC的無線以太網(wǎng)通信實(shí)現(xiàn)過程。在本方案中采用了三菱PLC無線通訊終端——DTD419MB,作為實(shí)現(xiàn)無線通訊的硬
    的頭像 發(fā)表于 08-08 10:28 ?341次閱讀
    兩<b class='flag-5'>臺</b>組態(tài)<b class='flag-5'>王</b>與<b class='flag-5'>一臺</b>FX5u之間無線通信你見過嗎?快速了解

    力新AI靈犀系列旗艦新品震撼發(fā)布,遙感技術(shù)3.0引行業(yè)熱議!

    、中國建筑金屬結(jié)構(gòu)協(xié)會等協(xié)會負(fù)責(zé)人,WGSNchina中國區(qū)趨勢總監(jiān)門淑萍,以及來自全國數(shù)千名合作伙伴、媒體出席大會,共同見證前“鎖”未見的AI靈犀技術(shù)! 下午14:00,發(fā)布會正式開始,力研究院執(zhí)行院長徐念龍博士做現(xiàn)場發(fā)言并
    的頭像 發(fā)表于 05-22 13:35 ?361次閱讀

    開源項(xiàng)目!設(shè)計(jì)款智能手語翻譯眼鏡

    和精確的手語翻譯。這款智能手語翻譯眼鏡不僅是技術(shù)突破,更是通向無障礙溝通世界的大步。 硬件部分 本項(xiàng)目中,需要
    發(fā)表于 05-20 15:59

    手持式激光焊機(jī)一臺多少錢?

    激光焊機(jī)是一種高科技的焊接設(shè)備,采用高能量密度的激光作為熱源,將焊接速度、質(zhì)量與便利性完美結(jié)合在起。這意味著,您只需擁有一臺激光焊機(jī),就能夠應(yīng)對各種焊接任務(wù),無論是五金鈑金、電子設(shè)備、機(jī)械工程,還是家具制造等,它
    的頭像 發(fā)表于 05-13 10:14 ?1199次閱讀
    手持式激光焊機(jī)<b class='flag-5'>一臺</b>多少錢?

    NanoEdge AI技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    一臺電機(jī)應(yīng)該配多少個IO點(diǎn)?

    以前都是一臺電機(jī)3個IO點(diǎn)——運(yùn)行信號、故障信號、控制輸出,2入1出。
    的頭像 發(fā)表于 02-23 11:24 ?665次閱讀

    Tesla 計(jì)劃斥資 5 億美元建造一臺由 NVIDIA 的 AI GPU 提供支持的 Dojo 超級計(jì)算機(jī)

    ABSTRACT摘要Tesla計(jì)劃斥資5億美元建造一臺由NVIDIA的AIGPU提供支持的Dojo超級計(jì)算機(jī),因此該公司正在加大基于AI的開發(fā)力度。JAEALOT2024年1月27日Tesla計(jì)劃
    的頭像 發(fā)表于 02-19 12:45 ?592次閱讀
    Tesla 計(jì)劃斥資 5 億美元建造<b class='flag-5'>一臺</b>由 NVIDIA 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo 超級計(jì)算機(jī)