1. 前言
平時(shí)工作中編寫開(kāi)發(fā)技術(shù)文檔,或者學(xué)生在編寫論文時(shí),經(jīng)常會(huì)上網(wǎng)搜索一些參考文獻(xiàn)、文檔。
比如: 上網(wǎng)搜索相似的內(nèi)容參考一下或者引用別人的一段文字,有時(shí)候看到一篇較好的內(nèi)容想要保存等等。
這個(gè)過(guò)程中會(huì)發(fā)現(xiàn),很多網(wǎng)站的提供的頁(yè)面都是不能復(fù)制粘貼的,或者直接是圖片形式提供,為了方便能獲取這些文字,當(dāng)前就利用華為云提供的 通用文字識(shí)別接口,識(shí)別圖片里的文本內(nèi)容,方便復(fù)制文字。這個(gè)功能QQ上也集成了,使用很方便,這里利用華為云的接口實(shí)現(xiàn)一個(gè)與QQ類似的功能,截圖之后識(shí)別圖片里包含的文本內(nèi)容。
這個(gè)文字識(shí)別接口里不僅僅有通用文字識(shí)別功能,還支持很多其他功能:比如身份證、駕駛證、保險(xiǎn)單、手寫文本、火車票,行駛證.......等等功能。還支持用戶自定義識(shí)別模板,指定需要識(shí)別的關(guān)鍵字段,實(shí)現(xiàn)用戶特定格式圖片的自動(dòng)識(shí)別和結(jié)構(gòu)化提取。
2. 文本識(shí)別接口使用介紹
2.1 開(kāi)通服務(wù)
地址: https://console.huaweicloud.com/ocr/?region=cn-north-4#/ocr/overview
這個(gè)文字識(shí)別服務(wù)是按調(diào)用次數(shù)計(jì)費(fèi)的,每個(gè)用戶每月有1000次的免費(fèi)調(diào)用次數(shù),開(kāi)通服務(wù)后就可以使用。
2.2 接口地址
官網(wǎng)幫助文檔: https://support.huaweicloud.com/api-ocr/ocr_03_0042.html
POST https://{endpoint}/v2/{project_id}/ocr/general-text
示例:
https://ocr.cn-north-4.myhuaweicloud.com/v2/0e5957be8a00f53c2fa7c0045e4d8fbf/ocr/general-text
請(qǐng)求頭:
{
"X-Auth-Token": "******",
"Content-Type": "application/json;charset=UTF-8"
}
請(qǐng)求體:
{
"image": ----這是圖片的bas64編碼
}
響應(yīng)結(jié)果:
{
"result": {
"words_block_count": 13,
"words_block_list": [
{
"words": "撤,還是不撤?",
"location": [
[
43,
39
],
[
161,
39
],
[
161,
60
],
[
43,
60
]
]
},
{
"words": "讓我更驕傲的是公司在大災(zāi)面前的表現(xiàn)。",
"location": [
[
72,
95
],
[
332,
95
],
[
332,
113
],
[
72,
113
]
]
},
{
"words": "2011年3月11日14時(shí)46分,日本東北部海域發(fā)生里氏9.0級(jí)",
"location": [
[
71,
122
],
[
482,
122
],
[
482,
142
],
[
71,
142
]
]
},
{
"words": "地震并引發(fā)海嘯。那一刻,我們正在距離東京100公里的熱海開(kāi)會(huì),",
"location": [
[
41,
149
],
[
481,
149
],
[
481,
171
],
[
41,
171
]
]
},
{
"words": "感覺(jué)“咚”",
"location": [
[
42,
180
],
[
114,
180
],
[
114,
199
],
[
42,
199
]
]
},
{
"words": "地被震了一下。面對(duì)地震,",
"location": [
[
115,
178
],
[
296,
178
],
[
296,
199
],
[
115,
199
]
]
},
{
"words": "大家都很鎮(zhèn)定,",
"location": [
[
300,
179
],
[
400,
179
],
[
400,
197
],
[
300,
197
]
]
},
{
"words": "直到看到電",
"location": [
[
405,
179
],
[
483,
179
],
[
483,
196
],
[
405,
196
]
]
},
{
"words": "視上觸目驚心的畫面:15時(shí) 25 分,海嘯到達(dá)陸前高田市海岸;15時(shí)",
"location": [
[
41,
206
],
[
485,
206
],
[
485,
228
],
[
41,
228
]
]
},
{
"words": "26分,海嘯到達(dá)陸前高田市中心;15時(shí)43分,陸前高田市依稀只能",
"location": [
[
40,
234
],
[
486,
234
],
[
486,
258
],
[
40,
258
]
]
},
{
"words": "看到四層高的市府大樓的屋頂,一瞬間,城鎮(zhèn)就變成了汪洋……對(duì)",
"location"