成人啪精品视频免费网站,日本久久免费高清国产

TET PDF IFilter支持所有相關(guān)風(fēng)格的PDF輸入

接受的PDF輸入

TET PDF IFilter 支持所有相關(guān)風(fēng)格的PDF 輸入：

直到 AcrobatDC 的所有 PDF版本，包括 ISO32000-1 和 32000-2(PDF 2.0)

無需密碼即可打開文檔的受保護(hù)PDF

修復(fù)損壞的 PDF文檔

國際化

除了西文文本 TETPDF IFilter 完全支持中文、日文和韓文(CJK) 文本。識(shí)別所有CJK 編碼；支持水平和垂直書寫模式。自動(dòng)檢測(cè)文本的區(qū)域設(shè)置ID（語言和區(qū)域標(biāo)識(shí)符）改進(jìn)了Microsoft 的分詞和詞干算法的結(jié)果，這對(duì)于東亞文本尤其重要。

還支持從右到左的語言，例如希伯來語和阿拉伯語。上下文字符形式被規(guī)范化，文本按邏輯順序傳遞。

PDF 不僅僅是一堆頁面

TET PDF IFilter 將 PDF文檔視為容器，其中可能包含比普通頁面更多的信息。TETPDF IFilter 索引 PDF文檔中的所有相關(guān)項(xiàng)目：

頁面內(nèi)容

書簽、注釋（評(píng)論）和表單域中的文本

元數(shù)據(jù)（見下文）

嵌入式 PDF 和PDF 包（組合）以遞歸方式處理，以便可以搜索所有嵌入式PDF 文檔中的文本。

XMP 文檔元數(shù)據(jù)和文檔信息

TET PDF IFilter 中的高級(jí)元數(shù)據(jù)實(shí)現(xiàn)支持元數(shù)據(jù)的Windows 屬性系統(tǒng)。它索引XMP 元數(shù)據(jù)以及標(biāo)準(zhǔn)或自定義文檔信息條目。元數(shù)據(jù)索引可以在多個(gè)級(jí)別上配置：

文檔信息條目、DublinCore 字段和其他常見XMP 屬性映射到Windows shell 屬性，例如標(biāo)題、主題、作者。

TET PDF IFilter 添加了有用的特定于PDF 的偽屬性，例如頁面大小、PDF/A一致性級(jí)別、字體名稱。

可以索引所有相關(guān)的預(yù)定義XMP 屬性。

可以搜索用戶定義的XMP 或基于PDF 的屬性，例如公司特定的分類屬性、數(shù)字簽名或ZUGFeRD/Factur-X 一致性。

TET PDF IFilter 可選擇將元數(shù)據(jù)集成到全文索引中。因此，即使是不支持元數(shù)據(jù)的全文搜索引擎（例如SQL Server）也可以搜索元數(shù)據(jù)。

Unicode 后處理

TET PDF IFilter 支持各種Unicode 后處理步驟，可用于改進(jìn)提取的文本：

折疊保留、刪除或替換字符，例如從不相關(guān)的腳本中刪除標(biāo)點(diǎn)符號(hào)或字符。

分解用一個(gè)或多個(gè)其他字符的等效序列替換一個(gè)字符，例如用它們各自的標(biāo)準(zhǔn)對(duì)應(yīng)物替換窄、寬或垂直的日文字符或拉丁上標(biāo)變體。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴