0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于本地TensorFlow Lite和AI云服務(wù)的文檔矯正功能

Tensorflowers ? 來源:YXQ ? 2019-06-14 11:35 ? 次閱讀

什么是文檔圖片彎曲矯正?

用戶有時(shí)候會有這種需求痛點(diǎn):看書時(shí)特別喜歡其中的某些段落,想摘抄下來,但發(fā)現(xiàn)篇幅很長,用手機(jī)拍攝的話書本又不能完全鋪平。

手持一份裝訂過的合同,著急發(fā)給老板,卻沒有工具拆開裝訂釘。拍出來的圖里頁面是彎曲的,里邊的文字看起來很費(fèi)勁...

你也不可能隨時(shí)隨地帶著掃描儀。那該怎么辦呢?市面上大部分 APP 是把視角歪掉的圖片矯正為正視圖,如下圖:

在很多場合確實(shí)可以幫助到用戶。但是它只是解決了透視變化的問題。如果是彎曲的頁面,還是不能很好的矯正。

WPS 對這個(gè)需求很上心,希望可以讓用戶做到隨手一拍就獲得完美鋪平的電子文檔。歷經(jīng)幾個(gè)月的開發(fā)周期,結(jié)合了本地 AI 和云端 AI 能力打造了一個(gè)功能:文檔矯正。這個(gè)貼心的功能能讓剛才那些棘手的問題輕松被稿定。直接看效果吧。還是剛才那張拍攝的書本照片,經(jīng)過文檔彎曲矯正后。就可以立刻得到鋪平的圖片,甚至連頁面區(qū)域都給你自動(dòng)裁剪好了,背景干擾全無,完美!

這個(gè)彎曲矯正對于 OCR 識別也有很大的幫助,因?yàn)楹芏?OCR 識別對于文本彎曲的情況下識別會有很多亂碼,經(jīng)過彎曲矯正變成規(guī)規(guī)整整的文本行后,OCR 識別準(zhǔn)確度會大大提高。

以上就是我們新推出的這個(gè)功能的應(yīng)用場景和使用效果。那么下面我們就來聊一聊為什么這個(gè)功能背后是本地 AI 和云端 AI 的結(jié)合。

云+端 AI ,共建文檔矯正功能

目前其他第三方以及我們 WPS 里上一個(gè)版本的文檔矯正都是通過檢測出文檔的邊緣或者四個(gè)角,然后施行透視變化進(jìn)行矯正的。其中的計(jì)算量雖然也會比較大,但現(xiàn)在的移動(dòng)端計(jì)算能力還能夠覆蓋,實(shí)時(shí)檢測預(yù)覽起來也還比較流暢。然而彎曲矯正背后的計(jì)算量非常大,我們不得不將其部署在計(jì)算集群上,通過網(wǎng)絡(luò)傳輸壓縮和加密的原圖以及相應(yīng)的參數(shù)到服務(wù)器上進(jìn)行計(jì)算,然后將計(jì)算結(jié)果傳輸回用戶的手機(jī)端再呈現(xiàn)。這個(gè)過程原本也可以設(shè)計(jì)成全部在云端計(jì)算,那樣我們的工作量就會少很多,但是為了獲得更好的用戶體驗(yàn),能夠讓用戶直觀的看到實(shí)時(shí)檢測的文檔區(qū)域,我們將文檔檢測的部分放在了本地。在用戶開啟相機(jī)進(jìn)行預(yù)覽時(shí)我們的深度學(xué)習(xí)模型就在后臺進(jìn)行運(yùn)行,逐幀去檢測文檔區(qū)域,并將檢測結(jié)果渲染在屏幕上。為了實(shí)現(xiàn)準(zhǔn)確穩(wěn)定的文檔區(qū)域檢測,我們將傳統(tǒng)的邊緣檢測算法升級為深度學(xué)習(xí)模型,隨著模型的不斷迭代,雖然識別效果越來越好,但模型體積也越來越大,計(jì)算量也越來越大。為了兼顧中低端手機(jī)的運(yùn)算能力,我們在網(wǎng)絡(luò)模型設(shè)計(jì)時(shí)做了相應(yīng)的優(yōu)化,參考 SqueezeNet 的結(jié)構(gòu)設(shè)計(jì)了一個(gè) 7 層的卷積神經(jīng)網(wǎng)絡(luò)替代最初采用的更深的開源預(yù)訓(xùn)練網(wǎng)絡(luò),雖然網(wǎng)絡(luò)變淺導(dǎo)致準(zhǔn)確度上稍微有些損失,但速度有大幅提升,內(nèi)存占用也減少不少,這使得低端手機(jī)也能達(dá)到每秒數(shù)幀的速度,而高端手機(jī)則可以達(dá)到每秒 30 幀滿幀的速度。同時(shí)為了彌補(bǔ)準(zhǔn)確度損失帶來的檢測不準(zhǔn)而引起的抖動(dòng),我們在網(wǎng)絡(luò)外邊增加了濾波器,讓檢測結(jié)果在視覺上看起來更穩(wěn)定。

整套網(wǎng)絡(luò)和代碼完成后,我們發(fā)現(xiàn)其實(shí) SDK 包的體積已經(jīng)有一些大了,除了對代碼和依賴庫的精簡,我們還需要對推理框架進(jìn)行精簡。我們需要一套速度快而又輕量級的移動(dòng)端推理框架。我們當(dāng)時(shí)做了很多選擇和嘗試,最后選擇了 Tensorflow Lite。Tensorflow Lite 是 Google 出品的對移動(dòng)端非常友好的深度學(xué)習(xí)框架,其架構(gòu)設(shè)計(jì)和訓(xùn)練部署思路都和 Tensorflow 非常相像,同時(shí)又非常小巧,容易上手。我們直接在 PC 架構(gòu)的訓(xùn)練機(jī)器上訓(xùn)練好模型,經(jīng)過 Google 提供的工具 TOCO 進(jìn)行轉(zhuǎn)化,即可獲得一個(gè)體積很小而且速度很快的手機(jī)端模型,而運(yùn)行的效果和準(zhǔn)確度卻沒有打多少折扣。從模型訓(xùn)練到移動(dòng)端部署的流程非常通暢,這讓我們非常喜歡 Tensorflow Lite 這個(gè)框架,畢竟我們可以減少工程部署的時(shí)間,而把精力更多放在算法優(yōu)化和模型優(yōu)化上。

除了獲取文檔區(qū)域,為了實(shí)現(xiàn)彎曲矯正,我們還設(shè)計(jì)了一整套復(fù)雜的算法系統(tǒng),經(jīng)過評估,我們確定很難在移動(dòng)端進(jìn)行那樣高強(qiáng)度的計(jì)算,于是我們選擇了計(jì)算能力更強(qiáng)的云服務(wù)方案。核心算法部署在計(jì)算集群上可以獲得更充沛的算力,同時(shí)也為該業(yè)務(wù)算法的優(yōu)化和升級預(yù)留了比較大的空間,畢竟現(xiàn)在只是第一版,以后我們還會對其進(jìn)行持續(xù)升級和優(yōu)化。

目前我們的整體設(shè)計(jì)框架是將本地相應(yīng)的 AI 能力封裝成一個(gè) SDK 提供給業(yè)務(wù)方的客戶端,客戶端通過 API 接口調(diào)用 SDK 里相應(yīng)的能力,數(shù)據(jù)和參數(shù)也是通過 API 接口和 SDK 進(jìn)行交互,同時(shí) SDK 也接管了訪問云服務(wù)器的能力,統(tǒng)一的進(jìn)行管理,在保障了信息安全的同時(shí)也有相應(yīng)的容錯(cuò)和異常處理能力。這套系統(tǒng)的流程圖如下所示:

云和端的選擇以及未來的期許

因?yàn)樾枨蟮奶厥庑院筒煌惴ǖ膹?fù)雜程度以及平臺的計(jì)算能力評估,我們因地適宜的選擇了讓一部分計(jì)算在本地利用 TensorFlow Lite 進(jìn)行,一部分計(jì)算放在云端計(jì)算集群上進(jìn)行。相信隨著手機(jī)算力不斷的提升,以后也許單純依靠端上的算力就能完成如此復(fù)雜程度的計(jì)算。那一天應(yīng)該很快到來。當(dāng)然,隨著 5G 的普及,也許以后云端的計(jì)算借助更高帶寬極快速的網(wǎng)絡(luò)傳輸能力也能夠體驗(yàn)到端上的體驗(yàn)。到時(shí)候普通用戶再也感受不到云和端的區(qū)別,那將會給更復(fù)雜更強(qiáng)大的算法更多落地的機(jī)會。我們很期待這些條件更快滿足,我們也會努力帶給大家更多強(qiáng)大好用的算法功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31493

    瀏覽量

    270043
  • 云服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    835

    瀏覽量

    39001
  • TensorFlow Lite
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    645

原文標(biāo)題:金山WPS:基于本地TensorFlow Lite和AI云服務(wù)的文檔矯正功能

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    在阿里Kubernetes容器服務(wù)上打造TensorFlow實(shí)驗(yàn)室

    的定義和訓(xùn)練的收斂趨勢??偨Y(jié)我們可以利用阿里Kubernetes容器服務(wù),輕松的搭建在云端搭建TensorFlow的環(huán)境,運(yùn)行深度學(xué)習(xí)的實(shí)驗(yàn)室,并且利用TensorBoard追蹤訓(xùn)練效果。歡迎大家使用阿里
    發(fā)表于 05-10 10:24

    使用RTL8722DM運(yùn)行 TensorFlow Lite Hello World 示例

    開發(fā)人員可以輕松構(gòu)建和部署學(xué)習(xí)驅(qū)動(dòng)的應(yīng)用程序。TensorFlow Lite而管理微控制器的 TensorFlow Lite (TFL) 專注于機(jī)器電腦數(shù)據(jù)記憶的微控制器和其他設(shè)備上運(yùn)
    發(fā)表于 06-21 15:48

    如何將TensorFlow Lite應(yīng)用程序移植到Arm Cortex-M55系統(tǒng)上

    Fast Model系統(tǒng)上運(yùn)行TensorFlow Lite應(yīng)用程序ARM Fast Model是ARM CPU和系統(tǒng)IP的快速、功能精確的程序員視圖模型。在任何硬件可用之前,您就可以使用Fast
    發(fā)表于 03-31 10:40

    tensorflow lite上的未定義引用是怎么回事?

    我在 LPC55S69 上構(gòu)建了一個(gè) cifar-10 tensorflow lite 項(xiàng)目,在那里我得到了很多與 TensorFlow lite 相關(guān)的未定義引用。在附件里(請用no
    發(fā)表于 04-04 08:09

    是什么導(dǎo)致TensorFlow Lite的NNAPI Delegate被棄用?

    Delegate 和 ONNX Runtime 的 NNAPI Execution Provider 已棄用,未來將被移除。要利用 ML 模型加速,請改用 VX Delegate。是什么導(dǎo)致 TensorFlow Lite 的 NNAPI Delegate 被棄用?是否
    發(fā)表于 04-07 10:25

    tensorflow-lite可以通過NPU加速運(yùn)行嗎?

    你能幫我確定構(gòu)建/安裝所需的最小包,以便 tensorflow-lite 可以通過 NPU 加速運(yùn)行嗎?我知道 NPX 將它捆綁為 packagegroup-imx-ml - 但它包含的內(nèi)容遠(yuǎn)遠(yuǎn)
    發(fā)表于 04-14 08:17

    如何使用meta-imx層中提供的tensorflow-lite編譯圖像?

    我們正在嘗試使用 meta-imx 層中提供的 tensorflow-lite 編譯圖像。我們沒有任何 自定義更改/bbappends (Highlight to read)sources
    發(fā)表于 05-29 06:55

    如何使用pycoral、tensorflow-lite和edgetpu構(gòu)建核心最小圖像?

    如果您能告訴我們?nèi)绾问褂?pycoral、tensorflow-lite 和 edgetpu 構(gòu)建核心最小圖像,我們將不勝感激。
    發(fā)表于 06-05 10:53

    TensorFlow Lite 微控制器

    TensorFlow Lite for Microcontrollers 是 TensorFlow Lite 的一個(gè)實(shí)驗(yàn)性移植版本,它適用于微控制器和其他一些僅有數(shù)千字節(jié)內(nèi)存的設(shè)備。
    的頭像 發(fā)表于 08-05 10:11 ?5w次閱讀
    <b class='flag-5'>TensorFlow</b> <b class='flag-5'>Lite</b> 微控制器

    谷歌推出TensorFlow Lite,可為AI調(diào)整最新模型

    谷歌今天發(fā)布了TensorFlow Lite Model Maker,該工具使用一種稱為轉(zhuǎn)移學(xué)習(xí)的技術(shù),將最先進(jìn)的機(jī)器學(xué)習(xí)模型應(yīng)用于自定義數(shù)據(jù)集。
    的頭像 發(fā)表于 04-15 21:21 ?3262次閱讀

    TensorFlow Lite 構(gòu)建的無人駕駛微型汽車

    今天在 Tensorflow公號看到推文Pixelopolis:由 TensorFlow Lite 構(gòu)建無人駕駛微型汽車 ,作者介紹了他們在今年Google I/O大會上展示的TensorFlot
    的頭像 發(fā)表于 10-19 11:27 ?2162次閱讀
     <b class='flag-5'>TensorFlow</b> <b class='flag-5'>Lite</b> 構(gòu)建的無人駕駛微型汽車

    本地服務(wù)將成為未來服務(wù)的重要選擇

    近日,IDC正式發(fā)布《分布式之 -- 本地服務(wù)市場研究》報(bào)告,從概念與特征、產(chǎn)品與模式、應(yīng)用場景及發(fā)展趨勢等多個(gè)方面,對分布式組合中的
    的頭像 發(fā)表于 01-12 15:02 ?2606次閱讀

    基于TensorFlow Lite的幾項(xiàng)技術(shù)更新

    TensorFlow Lite 版本現(xiàn)已在 TensorFlow Hub 上推出。我們對該版本進(jìn)行了一些可提升準(zhǔn)確率的更新,并使其與硬件加速器兼容,其中包括 GPU 和獲得 Android NN API 支持的其他
    的頭像 發(fā)表于 09-23 15:38 ?2220次閱讀

    Tensorflow Lite 使用與優(yōu)化

    Tensorflow Lite 的基本框架如上。數(shù)據(jù)存儲的結(jié)構(gòu)是Flatbuffer。執(zhí)行上次結(jié)構(gòu)支持Keras 和Estimator和Legacy等等。而下層支持NN API、GP...
    發(fā)表于 01-25 17:48 ?2次下載
    <b class='flag-5'>Tensorflow</b> <b class='flag-5'>Lite</b> 使用與優(yōu)化

    本地服務(wù)器與服務(wù)器哪個(gè)好?

    本地服務(wù)器和服務(wù)器是企業(yè)可以使用的兩種不同的服務(wù)器設(shè)置。主要區(qū)別在于本地
    的頭像 發(fā)表于 05-17 16:56 ?1803次閱讀