0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

將掃描的PDF轉(zhuǎn)換為可搜索的PDF

倩倩 ? 來(lái)源:哲想軟件 ? 作者:哲想軟件 ? 2022-09-19 09:55 ? 次閱讀

將掃描的PDF轉(zhuǎn)換為可搜索的文檔

快速精確的基于神經(jīng)網(wǎng)絡(luò)的引擎

糾正低質(zhì)量掃描

120多種語(yǔ)言

.Net2.0+、.Net5、標(biāo)準(zhǔn)、核心

將掃描的PDF轉(zhuǎn)換為可搜索的PDF

4行代碼,僅此而已

703028b0-37b0-11ed-ba43-dac502259ad0.png

多虧了簡(jiǎn)單的API,您可以使用幾行代碼將掃描的PDF 轉(zhuǎn)換為可搜索的文檔。

順便說(shuō)一句,不僅僅是PDF。將JPEG、多頁(yè)TIFF 或 PNG轉(zhuǎn)換為可搜索的 PDF到您的應(yīng)用程序現(xiàn)在只需幾分鐘,而不是幾小時(shí)或幾天。

閱讀 120多種語(yǔ)言的多種圖像格式

Tesseract.NET SDK 可以準(zhǔn)確識(shí)別120多種語(yǔ)言的文本,支持多語(yǔ)言文本,并且可以通過(guò)訓(xùn)練使用以前未知的語(yǔ)言。支持的標(biāo)準(zhǔn)包括英語(yǔ)、法語(yǔ)、意大利語(yǔ)、德語(yǔ)、西班牙語(yǔ)、阿拉伯語(yǔ)、中文、希伯來(lái)語(yǔ)、日語(yǔ)、俄語(yǔ)、泰語(yǔ)等。

706ea540-37b0-11ed-ba43-dac502259ad0.png

7093750a-37b0-11ed-ba43-dac502259ad0.png

正確的低質(zhì)量掃描

例如,去歪斜輸入過(guò)濾器會(huì)自動(dòng)旋轉(zhuǎn)圖像,因此它是正確的向上和正交的。如果頁(yè)面過(guò)于傾斜,則Tesseract的線(xiàn)分割質(zhì)量會(huì)顯著降低,這會(huì)嚴(yán)重影響OCR 的質(zhì)量。

70cb1e88-37b0-11ed-ba43-dac502259ad0.png

7115b93e-37b0-11ed-ba43-dac502259ad0.png

Patagames OCR SDK 內(nèi)置的用于增強(qiáng)OCR性能的輸入過(guò)濾器包括:二值化、對(duì)比度和對(duì)比度標(biāo)準(zhǔn)化、去偏斜、增強(qiáng)分辨率、腐蝕和擴(kuò)張、膨脹和放氣、反轉(zhuǎn)、移除邊框、旋轉(zhuǎn)、ToGray和白色背景。

為您的.Net 應(yīng)用程序配備OCR 功能的最佳方式

雖然Tesseract 無(wú)疑是迄今為止最好的OCR 庫(kù),但Tesseract.NET SDK是為您的應(yīng)用程序配備文本識(shí)別功能的最佳方式之一。

Tesseract.Net SDK 結(jié)合了易于部署、卓越的識(shí)別精度、快速OCR 和各種輸出選項(xiàng)(包括PDF、HOCR、UNLV和純文本),提供靈活簡(jiǎn)單的API 以及許多高級(jí)和低級(jí)文本識(shí)別程序。

多虧了簡(jiǎn)單的API,您可以用幾行代碼將給定的圖像轉(zhuǎn)換為可搜索的文本。如果您需要更詳細(xì)地了解文本的組成部分,Tesseract.NETSDK API 提供了許多類(lèi)來(lái)檢索單個(gè)字母、單詞、段落甚至字體參數(shù)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • PDF
    PDF
    +關(guān)注

    關(guān)注

    1

    文章

    169

    瀏覽量

    33745
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4808

    瀏覽量

    68812
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    37

    文章

    3285

    瀏覽量

    57779

原文標(biāo)題:Patagames:正方體.NetSDKC# OCR 庫(kù)

文章出處:【微信號(hào):哲想軟件,微信公眾號(hào):哲想軟件】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    EE-133:ADSP-218x的傳統(tǒng)架構(gòu)文件轉(zhuǎn)換為鏈接器描述文件

    電子發(fā)燒友網(wǎng)站提供《EE-133:ADSP-218x的傳統(tǒng)架構(gòu)文件轉(zhuǎn)換為鏈接器描述文件.pdf》資料免費(fèi)下載
    發(fā)表于 01-13 16:34 ?0次下載
    EE-133:<b class='flag-5'>將</b>ADSP-218x的傳統(tǒng)架構(gòu)文件<b class='flag-5'>轉(zhuǎn)換為</b>鏈接器描述文件

    使用pdfDocs提高工作效率,改進(jìn)PDF工作流程

    pdfDocs? 通常PDF文檔很難正確編輯、整理或編輯。這意味著,許多法律專(zhuān)業(yè)人士依靠手工方法復(fù)雜的PDF文檔合并在一起,在MS Word中編輯文本,然后將其轉(zhuǎn)換為
    的頭像 發(fā)表于 12-21 15:31 ?148次閱讀
    使用pdfDocs提高工作效率,改進(jìn)<b class='flag-5'>PDF</b>工作流程

    基于TPS40055的設(shè)計(jì)在15安培時(shí)12V總線(xiàn)轉(zhuǎn)換為1.8V

    電子發(fā)燒友網(wǎng)站提供《基于TPS40055的設(shè)計(jì)在15安培時(shí)12V總線(xiàn)轉(zhuǎn)換為1.8V.pdf》資料免費(fèi)下載
    發(fā)表于 12-16 09:25 ?0次下載
    基于TPS40055的設(shè)計(jì)在15安培時(shí)<b class='flag-5'>將</b>12V總線(xiàn)<b class='flag-5'>轉(zhuǎn)換為</b>1.8V

    基于TPS40051的設(shè)計(jì)12V總線(xiàn)轉(zhuǎn)換為15A時(shí)的1.8V(slup195)

    電子發(fā)燒友網(wǎng)站提供《基于TPS40051的設(shè)計(jì)12V總線(xiàn)轉(zhuǎn)換為15A時(shí)的1.8V(slup195).pdf》資料免費(fèi)下載
    發(fā)表于 12-16 09:19 ?0次下載
    基于TPS40051的設(shè)計(jì)<b class='flag-5'>將</b>12V總線(xiàn)<b class='flag-5'>轉(zhuǎn)換為</b>15A時(shí)的1.8V(slup195)

    識(shí)別QR Code和PDF417的條碼掃描模組

    在當(dāng)今數(shù)字化時(shí)代,條碼掃描技術(shù)作為信息快速獲取與處理的橋梁,扮演著不可或缺的角色。其中,QRCode(二維碼)與PDF417條碼因其各自獨(dú)特的優(yōu)勢(shì),廣泛應(yīng)用于物流追蹤、商品防偽、移動(dòng)支付、票務(wù)系統(tǒng)等
    的頭像 發(fā)表于 12-10 15:31 ?119次閱讀
    識(shí)別QR Code和<b class='flag-5'>PDF</b>417的條碼<b class='flag-5'>掃描</b>模組

    單開(kāi)關(guān)反激式電路+5 VDC轉(zhuǎn)換為+/-12 VDC,適用于RS-232和RS-422

    電子發(fā)燒友網(wǎng)站提供《單開(kāi)關(guān)反激式電路+5 VDC轉(zhuǎn)換為+/-12 VDC,適用于RS-232和RS-422.pdf》資料免費(fèi)下載
    發(fā)表于 10-24 09:40 ?0次下載
    單開(kāi)關(guān)反激式電路<b class='flag-5'>將</b>+5 VDC<b class='flag-5'>轉(zhuǎn)換為</b>+/-12 VDC,適用于RS-232和RS-422

    DN-46高效、低功率DC-DC逆變器5V輸入轉(zhuǎn)換為-3V輸出

    電子發(fā)燒友網(wǎng)站提供《DN-46高效、低功率DC-DC逆變器5V輸入轉(zhuǎn)換為-3V輸出.pdf》資料免費(fèi)下載
    發(fā)表于 10-22 10:20 ?0次下載
    DN-46高效、低功率DC-DC逆變器<b class='flag-5'>將</b>5V輸入<b class='flag-5'>轉(zhuǎn)換為</b>-3V輸出

    通過(guò)數(shù)字隔離器SPI轉(zhuǎn)換為GPIO

    電子發(fā)燒友網(wǎng)站提供《通過(guò)數(shù)字隔離器SPI轉(zhuǎn)換為GPIO.pdf》資料免費(fèi)下載
    發(fā)表于 09-21 10:20 ?0次下載
    通過(guò)數(shù)字隔離器<b class='flag-5'>將</b>SPI<b class='flag-5'>轉(zhuǎn)換為</b>GPIO

    具有平均輸入電流限制的升壓轉(zhuǎn)換簡(jiǎn)化條形碼掃描儀的設(shè)計(jì)應(yīng)用說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《具有平均輸入電流限制的升壓轉(zhuǎn)換簡(jiǎn)化條形碼掃描儀的設(shè)計(jì)應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 09-09 14:33 ?0次下載
    具有平均輸入電流限制的升壓<b class='flag-5'>轉(zhuǎn)換</b>器<b class='flag-5'>將</b>簡(jiǎn)化條形碼<b class='flag-5'>掃描</b>儀的設(shè)計(jì)應(yīng)用說(shuō)明

    使用邏輯和轉(zhuǎn)換優(yōu)化機(jī)械掃描激光雷達(dá)

    電子發(fā)燒友網(wǎng)站提供《使用邏輯和轉(zhuǎn)換優(yōu)化機(jī)械掃描激光雷達(dá).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 09:27 ?0次下載
    使用邏輯和<b class='flag-5'>轉(zhuǎn)換</b>優(yōu)化機(jī)械<b class='flag-5'>掃描</b>激光雷達(dá)

    怎樣模擬量轉(zhuǎn)換為數(shù)字量

    模擬量轉(zhuǎn)換為數(shù)字量的過(guò)程稱(chēng)為模數(shù)轉(zhuǎn)換(Analog-to-Digital Conversion,簡(jiǎn)稱(chēng)ADC)。這個(gè)過(guò)程在現(xiàn)代電子系統(tǒng)中非常常見(jiàn),例如在音頻處理、圖像處理、傳感器信號(hào)處理等領(lǐng)域。 一
    的頭像 發(fā)表于 08-30 09:21 ?1354次閱讀

    10位尋址掃描端口多點(diǎn)尋址IEEE STD 1149.1(JTAG)抽頭收發(fā)器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《10位尋址掃描端口多點(diǎn)尋址IEEE STD 1149.1(JTAG)抽頭收發(fā)器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 05-30 10:18 ?0次下載
    10位<b class='flag-5'>可</b>尋址<b class='flag-5'>掃描</b>端口多點(diǎn)尋址IEEE STD 1149.1(JTAG)抽頭收發(fā)器數(shù)據(jù)表

    Vision_Board_schematic.pdf

    *附件:Vision_Board_schematic.pdf
    發(fā)表于 03-20 15:21

    RA8D1_Datasheet.pdf

    *附件:RA8D1_Datasheet.pdf
    發(fā)表于 03-20 14:19

    如何VCO輸出TTL信號(hào)轉(zhuǎn)換為具有固定幅度的正弦波?

    我有一個(gè)基于 4046 IC 的 VCO 電路,產(chǎn)生隨輸入電壓變化的 TTL。 我想將這個(gè)變頻信號(hào)轉(zhuǎn)換為具有固定幅度(帶寬小于 1MHz)的正弦波。 我嘗試使用RC或LC濾波器,但是,振幅隨頻率
    發(fā)表于 03-01 09:07