tencentcloud-sdk-nodejs-ocr 4.1.50 → 4.1.55
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -29,138 +29,20 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
29
29
|
super("ocr.tencentcloudapi.com", "2018-11-19", clientConfig);
|
30
30
|
}
|
31
31
|
/**
|
32
|
-
*
|
33
|
-
|
34
|
-
默认接口请求频率限制:1次/秒。
|
35
|
-
*/
|
36
|
-
async InsuranceBillOCR(req, cb) {
|
37
|
-
return this.request("InsuranceBillOCR", req, cb);
|
38
|
-
}
|
39
|
-
/**
|
40
|
-
* 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
|
41
|
-
|
42
|
-
默认接口请求频率限制:10次/秒。
|
43
|
-
*/
|
44
|
-
async ImageEnhancement(req, cb) {
|
45
|
-
return this.request("ImageEnhancement", req, cb);
|
46
|
-
}
|
47
|
-
/**
|
48
|
-
* 试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。
|
32
|
+
* 题目识别是教育的基础OCR识别能力。可支持扫描、拍照场景的单题题目识别。接口支持印刷体文本、手写体文本及公式的OCR识别和坐标返回,此外,接口还可对题目中的配图位置进行检测并返回坐标位置。适用于智能批改等场景的题目内容识别作为检索输入。
|
49
33
|
|
50
34
|
默认接口请求频率限制:2次/秒。
|
51
35
|
*/
|
52
|
-
async
|
53
|
-
return this.request("
|
54
|
-
}
|
55
|
-
/**
|
56
|
-
* 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
57
|
-
|
58
|
-
默认接口请求频率限制:5次/秒。
|
59
|
-
*/
|
60
|
-
async SmartStructuralOCRV2(req, cb) {
|
61
|
-
return this.request("SmartStructuralOCRV2", req, cb);
|
62
|
-
}
|
63
|
-
/**
|
64
|
-
* 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
|
65
|
-
|
66
|
-
默认接口请求频率限制:5次/秒。
|
67
|
-
*/
|
68
|
-
async EnterpriseLicenseOCR(req, cb) {
|
69
|
-
return this.request("EnterpriseLicenseOCR", req, cb);
|
70
|
-
}
|
71
|
-
/**
|
72
|
-
* 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
|
73
|
-
|
74
|
-
默认接口请求频率限制:10次/秒。
|
75
|
-
*/
|
76
|
-
async BusinessCardOCR(req, cb) {
|
77
|
-
return this.request("BusinessCardOCR", req, cb);
|
78
|
-
}
|
79
|
-
/**
|
80
|
-
* 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
|
81
|
-
|
82
|
-
默认接口请求频率限制:20次/秒。
|
83
|
-
*/
|
84
|
-
async RecognizeOnlineTaxiItineraryOCR(req, cb) {
|
85
|
-
return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb);
|
86
|
-
}
|
87
|
-
/**
|
88
|
-
* 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
|
89
|
-
|
90
|
-
另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
|
91
|
-
|
92
|
-
<table style="width:650px">
|
93
|
-
<thead>
|
94
|
-
<tr>
|
95
|
-
<th width="150">扩展能力</th>
|
96
|
-
<th width="500">能力项</th>
|
97
|
-
</tr>
|
98
|
-
</thead>
|
99
|
-
<tbody>
|
100
|
-
<tr>
|
101
|
-
<td rowspan="2">裁剪功能</td>
|
102
|
-
<td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
|
103
|
-
</tr>
|
104
|
-
<tr>
|
105
|
-
<td>人像照片裁剪(自动抠取身份证头像区域)</td>
|
106
|
-
</tr>
|
107
|
-
<tr>
|
108
|
-
<td rowspan="9">告警功能</td>
|
109
|
-
<td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
|
110
|
-
|
111
|
-
</td>
|
112
|
-
</tr>
|
113
|
-
<tr>
|
114
|
-
<td>身份证边框不完整告警</td>
|
115
|
-
</tr>
|
116
|
-
<tr>
|
117
|
-
<td>身份证复印件告警</td>
|
118
|
-
</tr>
|
119
|
-
<tr>
|
120
|
-
<td>身份证翻拍告警</td>
|
121
|
-
</tr>
|
122
|
-
<tr>
|
123
|
-
<td>身份证框内遮挡告警</td>
|
124
|
-
</tr>
|
125
|
-
<tr>
|
126
|
-
<td>临时身份证告警</td>
|
127
|
-
</tr>
|
128
|
-
<tr>
|
129
|
-
<td>身份证疑似存在PS痕迹告警</td>
|
130
|
-
</tr>
|
131
|
-
<tr>
|
132
|
-
<td>图片模糊告警(可根据图片质量分数判断)</td>
|
133
|
-
</tr>
|
134
|
-
</tbody>
|
135
|
-
</table>
|
136
|
-
|
137
|
-
默认接口请求频率限制:20次/秒。
|
138
|
-
*/
|
139
|
-
async IDCardOCR(req, cb) {
|
140
|
-
return this.request("IDCardOCR", req, cb);
|
36
|
+
async QuestionOCR(req, cb) {
|
37
|
+
return this.request("QuestionOCR", req, cb);
|
141
38
|
}
|
142
39
|
/**
|
143
|
-
*
|
40
|
+
* 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
|
144
41
|
|
145
42
|
默认接口请求频率限制:5次/秒。
|
146
43
|
*/
|
147
|
-
async
|
148
|
-
return this.request("
|
149
|
-
}
|
150
|
-
/**
|
151
|
-
* 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
|
152
|
-
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
|
153
|
-
*/
|
154
|
-
async MLIDCardOCR(req, cb) {
|
155
|
-
return this.request("MLIDCardOCR", req, cb);
|
156
|
-
}
|
157
|
-
/**
|
158
|
-
* 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
|
159
|
-
|
160
|
-
默认接口请求频率限制:20次/秒。
|
161
|
-
*/
|
162
|
-
async VatInvoiceVerifyNew(req, cb) {
|
163
|
-
return this.request("VatInvoiceVerifyNew", req, cb);
|
44
|
+
async TextDetect(req, cb) {
|
45
|
+
return this.request("TextDetect", req, cb);
|
164
46
|
}
|
165
47
|
/**
|
166
48
|
* 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。
|
@@ -238,14 +120,6 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
238
120
|
async GeneralAccurateOCR(req, cb) {
|
239
121
|
return this.request("GeneralAccurateOCR", req, cb);
|
240
122
|
}
|
241
|
-
/**
|
242
|
-
* 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
|
243
|
-
|
244
|
-
默认接口请求频率限制:5次/秒。
|
245
|
-
*/
|
246
|
-
async FlightInvoiceOCR(req, cb) {
|
247
|
-
return this.request("FlightInvoiceOCR", req, cb);
|
248
|
-
}
|
249
123
|
/**
|
250
124
|
* 本接口支持集装箱箱门信息识别,识别字段包括集装箱箱号、类型、总重量、有效承重、容量、自身重量,具备集装箱箱号、类型不完整或者不清晰的告警功能。
|
251
125
|
默认接口请求频率限制:5次/秒。
|
@@ -253,14 +127,6 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
253
127
|
async RecognizeContainerOCR(req, cb) {
|
254
128
|
return this.request("RecognizeContainerOCR", req, cb);
|
255
129
|
}
|
256
|
-
/**
|
257
|
-
* 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
|
258
|
-
|
259
|
-
默认接口请求频率限制:2次/秒。
|
260
|
-
*/
|
261
|
-
async RecognizeTableAccurateOCR(req, cb) {
|
262
|
-
return this.request("RecognizeTableAccurateOCR", req, cb);
|
263
|
-
}
|
264
130
|
/**
|
265
131
|
* 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。
|
266
132
|
|
@@ -318,29 +184,6 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
318
184
|
async RecognizeEncryptedIDCardOCR(req, cb) {
|
319
185
|
return this.request("RecognizeEncryptedIDCardOCR", req, cb);
|
320
186
|
}
|
321
|
-
/**
|
322
|
-
* 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
|
323
|
-
默认接口请求频率限制:5次/秒。
|
324
|
-
*/
|
325
|
-
async MixedInvoiceDetect(req, cb) {
|
326
|
-
return this.request("MixedInvoiceDetect", req, cb);
|
327
|
-
}
|
328
|
-
/**
|
329
|
-
* 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
|
330
|
-
|
331
|
-
默认接口请求频率限制:5次/秒。
|
332
|
-
*/
|
333
|
-
async VehicleRegCertOCR(req, cb) {
|
334
|
-
return this.request("VehicleRegCertOCR", req, cb);
|
335
|
-
}
|
336
|
-
/**
|
337
|
-
* 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
|
338
|
-
|
339
|
-
默认接口请求频率限制:5次/秒。
|
340
|
-
*/
|
341
|
-
async ShipInvoiceOCR(req, cb) {
|
342
|
-
return this.request("ShipInvoiceOCR", req, cb);
|
343
|
-
}
|
344
187
|
/**
|
345
188
|
* 本接口用于识别门头照文字识别结果以及对应分类标签信息
|
346
189
|
默认接口请求频率限制:1次/秒
|
@@ -358,84 +201,76 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
358
201
|
return this.request("MLIDPassportOCR", req, cb);
|
359
202
|
}
|
360
203
|
/**
|
361
|
-
*
|
204
|
+
* 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
|
362
205
|
|
363
206
|
默认接口请求频率限制:5次/秒。
|
364
207
|
*/
|
365
|
-
async
|
366
|
-
return this.request("
|
208
|
+
async TrainTicketOCR(req, cb) {
|
209
|
+
return this.request("TrainTicketOCR", req, cb);
|
367
210
|
}
|
368
211
|
/**
|
369
|
-
*
|
212
|
+
* 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
|
213
|
+
目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
|
370
214
|
|
371
215
|
默认接口请求频率限制:5次/秒。
|
372
216
|
*/
|
373
|
-
async
|
374
|
-
return this.request("
|
217
|
+
async PropOwnerCertOCR(req, cb) {
|
218
|
+
return this.request("PropOwnerCertOCR", req, cb);
|
375
219
|
}
|
376
220
|
/**
|
377
|
-
*
|
221
|
+
* 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
|
378
222
|
|
379
|
-
默认接口请求频率限制:
|
380
|
-
*/
|
381
|
-
async WaybillOCR(req, cb) {
|
382
|
-
return this.request("WaybillOCR", req, cb);
|
383
|
-
}
|
384
|
-
/**
|
385
|
-
* 本接口支持图片内车辆识别代号(VIN)的检测和识别。
|
386
|
-
默认接口请求频率限制:10次/秒。
|
223
|
+
默认接口请求频率限制:5次/秒。
|
387
224
|
*/
|
388
|
-
async
|
389
|
-
return this.request("
|
225
|
+
async InvoiceGeneralOCR(req, cb) {
|
226
|
+
return this.request("InvoiceGeneralOCR", req, cb);
|
390
227
|
}
|
391
228
|
/**
|
392
|
-
*
|
229
|
+
* 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
|
393
230
|
|
394
|
-
默认接口请求频率限制:
|
231
|
+
默认接口请求频率限制:5次/秒。
|
395
232
|
*/
|
396
|
-
async
|
397
|
-
return this.request("
|
233
|
+
async HKIDCardOCR(req, cb) {
|
234
|
+
return this.request("HKIDCardOCR", req, cb);
|
398
235
|
}
|
399
236
|
/**
|
400
|
-
*
|
401
|
-
目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
|
237
|
+
* 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
|
402
238
|
|
403
|
-
默认接口请求频率限制:
|
239
|
+
默认接口请求频率限制:10次/秒。
|
404
240
|
*/
|
405
|
-
async
|
406
|
-
return this.request("
|
241
|
+
async PermitOCR(req, cb) {
|
242
|
+
return this.request("PermitOCR", req, cb);
|
407
243
|
}
|
408
244
|
/**
|
409
|
-
*
|
245
|
+
* 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
|
410
246
|
|
411
247
|
默认接口请求频率限制:5次/秒。
|
412
248
|
*/
|
413
|
-
async
|
414
|
-
return this.request("
|
249
|
+
async BusInvoiceOCR(req, cb) {
|
250
|
+
return this.request("BusInvoiceOCR", req, cb);
|
415
251
|
}
|
416
252
|
/**
|
417
|
-
*
|
253
|
+
* 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
|
418
254
|
|
419
255
|
默认接口请求频率限制:10次/秒。
|
420
256
|
*/
|
421
|
-
async
|
422
|
-
return this.request("
|
257
|
+
async EnglishOCR(req, cb) {
|
258
|
+
return this.request("EnglishOCR", req, cb);
|
423
259
|
}
|
424
260
|
/**
|
425
|
-
*
|
261
|
+
* 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
|
426
262
|
|
427
|
-
默认接口请求频率限制:
|
263
|
+
默认接口请求频率限制:5次/秒。
|
428
264
|
*/
|
429
|
-
async
|
430
|
-
return this.request("
|
265
|
+
async SmartStructuralOCR(req, cb) {
|
266
|
+
return this.request("SmartStructuralOCR", req, cb);
|
431
267
|
}
|
432
268
|
/**
|
433
|
-
*
|
434
|
-
|
435
|
-
默认接口请求频率限制:2次/秒。
|
269
|
+
* 本接口用于识别门头照分类标签信息
|
270
|
+
默认接口请求频率限制:1次/秒
|
436
271
|
*/
|
437
|
-
async
|
438
|
-
return this.request("
|
272
|
+
async ClassifyStoreName(req, cb) {
|
273
|
+
return this.request("ClassifyStoreName", req, cb);
|
439
274
|
}
|
440
275
|
/**
|
441
276
|
* 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
|
@@ -446,325 +281,335 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
446
281
|
return this.request("TaxiInvoiceOCR", req, cb);
|
447
282
|
}
|
448
283
|
/**
|
449
|
-
*
|
284
|
+
* 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
|
450
285
|
|
451
286
|
默认接口请求频率限制:5次/秒。
|
452
287
|
*/
|
453
|
-
async
|
454
|
-
return this.request("
|
288
|
+
async RideHailingDriverLicenseOCR(req, cb) {
|
289
|
+
return this.request("RideHailingDriverLicenseOCR", req, cb);
|
455
290
|
}
|
456
291
|
/**
|
457
|
-
|
292
|
+
* 外国人永久居留身份证识别
|
293
|
+
*/
|
294
|
+
async RecognizeForeignPermanentResidentIdCard(req, cb) {
|
295
|
+
return this.request("RecognizeForeignPermanentResidentIdCard", req, cb);
|
296
|
+
}
|
297
|
+
/**
|
298
|
+
* 智能识别并结构化港澳台通行证及来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
|
458
299
|
|
459
|
-
默认接口请求频率限制:
|
300
|
+
默认接口请求频率限制:20次/秒。
|
460
301
|
*/
|
461
|
-
async
|
462
|
-
return this.request("
|
463
|
-
}
|
464
|
-
/**
|
465
|
-
* 获取ocr结果
|
466
|
-
*/
|
467
|
-
async GetOCRResult(req, cb) {
|
468
|
-
return this.request("GetOCRResult", req, cb);
|
302
|
+
async MainlandPermitOCR(req, cb) {
|
303
|
+
return this.request("MainlandPermitOCR", req, cb);
|
469
304
|
}
|
470
305
|
/**
|
471
|
-
*
|
306
|
+
* 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
|
472
307
|
|
473
308
|
默认接口请求频率限制:5次/秒。
|
474
309
|
*/
|
475
|
-
async
|
476
|
-
return this.request("
|
477
|
-
}
|
478
|
-
/**
|
479
|
-
* 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
|
480
|
-
|
481
|
-
默认接口请求频率限制:10次/秒。
|
482
|
-
*/
|
483
|
-
async RecognizeTableOCR(req, cb) {
|
484
|
-
return this.request("RecognizeTableOCR", req, cb);
|
310
|
+
async FlightInvoiceOCR(req, cb) {
|
311
|
+
return this.request("FlightInvoiceOCR", req, cb);
|
485
312
|
}
|
486
313
|
/**
|
487
|
-
*
|
314
|
+
* 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
|
315
|
+
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
|
488
316
|
|
489
|
-
默认接口请求频率限制:
|
317
|
+
默认接口请求频率限制:10次/秒
|
490
318
|
*/
|
491
|
-
async
|
492
|
-
return this.request("
|
319
|
+
async RecognizeThaiIDCardOCR(req, cb) {
|
320
|
+
return this.request("RecognizeThaiIDCardOCR", req, cb);
|
493
321
|
}
|
494
322
|
/**
|
495
|
-
*
|
323
|
+
* 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票等常用标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
|
496
324
|
|
497
325
|
默认接口请求频率限制:5次/秒。
|
498
|
-
*/
|
499
|
-
async DutyPaidProofOCR(req, cb) {
|
500
|
-
return this.request("DutyPaidProofOCR", req, cb);
|
501
|
-
}
|
502
|
-
/**
|
503
|
-
* 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
|
504
|
-
|
505
|
-
适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
|
506
326
|
|
507
|
-
产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
|
508
327
|
|
509
|
-
|
328
|
+
支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表:
|
510
329
|
<table style="width:715px">
|
511
330
|
<thead>
|
512
331
|
<tr>
|
513
|
-
<th style="width:
|
514
|
-
<th style="width:200px"
|
515
|
-
<th
|
516
|
-
<th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
|
332
|
+
<th style="width:200px">SubType 子票种英文</th>
|
333
|
+
<th style="width:200px">TypeDescription子票种中文</th>
|
334
|
+
<th >Type 所属大类票种</th>
|
517
335
|
</tr>
|
518
336
|
</thead>
|
519
337
|
<tbody>
|
520
338
|
<tr>
|
521
|
-
<td>
|
522
|
-
<td
|
523
|
-
<td
|
524
|
-
<td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
|
339
|
+
<td> VatSpecialInvoice</td>
|
340
|
+
<td> 增值税专用发票 </td>
|
341
|
+
<td> 3 </td>
|
525
342
|
</tr>
|
526
343
|
<tr>
|
527
|
-
<td
|
528
|
-
<td>
|
529
|
-
<td>
|
530
|
-
<td>91%</td>
|
344
|
+
<td> VatCommonInvoice</td>
|
345
|
+
<td> 增值税普通发票 </td>
|
346
|
+
<td> 3 </td>
|
531
347
|
</tr>
|
532
348
|
<tr>
|
533
|
-
<td
|
534
|
-
<td
|
535
|
-
<td
|
536
|
-
<td>低</td>
|
349
|
+
<td> VatElectronicCommonInvoice </td>
|
350
|
+
<td> 增值税电子普通发票 </td>
|
351
|
+
<td> 3 </td>
|
537
352
|
</tr>
|
538
353
|
<tr>
|
539
|
-
<td
|
540
|
-
<td
|
541
|
-
<td
|
542
|
-
<td>中文、英文、中英文</td>
|
354
|
+
<td> VatElectronicSpecialInvoice </td>
|
355
|
+
<td> 增值税电子专用发票 </td>
|
356
|
+
<td> 3 </td>
|
543
357
|
</tr>
|
544
358
|
<tr>
|
545
|
-
<td
|
546
|
-
<td
|
547
|
-
<td
|
548
|
-
<td>支持</td>
|
359
|
+
<td> VatElectronicInvoiceBlockchain</td>
|
360
|
+
<td> 区块链电子发票 </td>
|
361
|
+
<td> 3 </td>
|
549
362
|
</tr>
|
550
363
|
<tr>
|
551
|
-
<td
|
552
|
-
<td
|
553
|
-
<td
|
554
|
-
<td>支持</td>
|
364
|
+
<td> VatElectronicInvoiceToll</td>
|
365
|
+
<td> 增值税电子普通发票(通行费)</td>
|
366
|
+
<td> 3 </td>
|
555
367
|
</tr>
|
556
368
|
<tr>
|
557
|
-
<td
|
558
|
-
<td
|
559
|
-
<td
|
560
|
-
|
369
|
+
<td> VatSalesList</td>
|
370
|
+
<td> 增值税销货清单</td>
|
371
|
+
<td> 3 </td>
|
372
|
+
</tr>
|
373
|
+
<tr>
|
374
|
+
<td> VatElectronicSpecialInvoiceFull</td>
|
375
|
+
<td> 电子发票(专用发票)</td>
|
376
|
+
<td> 16 </td>
|
377
|
+
</tr>
|
378
|
+
<tr>
|
379
|
+
<td> VatElectronicInvoiceFull</td>
|
380
|
+
<td> 电子发票(普通发票) </td>
|
381
|
+
<td> 16 </td>
|
382
|
+
</tr>
|
383
|
+
<tr>
|
384
|
+
<td> ElectronicFlightTicketFull</td>
|
385
|
+
<td> 电子发票(机票行程单)</td>
|
386
|
+
<td> 16 </td>
|
387
|
+
</tr>
|
388
|
+
<tr>
|
389
|
+
<td> ElectronicTrainTicketFull</td>
|
390
|
+
<td> 电子发票(铁路电子客票)</td>
|
391
|
+
<td> 16 </td>
|
392
|
+
</tr>
|
393
|
+
<tr>
|
394
|
+
<td> MotorVehicleSaleInvoice </td>
|
395
|
+
<td> 机动车销售统一发票 </td>
|
396
|
+
<td> 12 </td>
|
397
|
+
</tr>
|
398
|
+
<tr>
|
399
|
+
<td> UsedCarPurchaseInvoice </td>
|
400
|
+
<td> 二手车销售统一发票 </td>
|
401
|
+
<td> 12 </td>
|
402
|
+
</tr>
|
403
|
+
<tr>
|
404
|
+
<td> VatInvoiceRoll </td>
|
405
|
+
<td> 增值税普通发票(卷票) </td>
|
406
|
+
<td> 11 </td>
|
407
|
+
</tr>
|
408
|
+
<tr>
|
409
|
+
<td> TaxiTicket </td>
|
410
|
+
<td> 出租车发票 </td>
|
411
|
+
<td> 0 </td>
|
412
|
+
</tr>
|
413
|
+
<tr>
|
414
|
+
<td> QuotaInvoice </td>
|
415
|
+
<td> 定额发票 </td>
|
416
|
+
<td> 1 </td>
|
417
|
+
</tr>
|
418
|
+
<tr>
|
419
|
+
<td> TrainTicket </td>
|
420
|
+
<td> 火车票 </td>
|
421
|
+
<td> 2 </td>
|
422
|
+
</tr>
|
423
|
+
<tr>
|
424
|
+
<td> AirTransport </td>
|
425
|
+
<td> 机票行程单 </td>
|
426
|
+
<td> 5 </td>
|
427
|
+
</tr>
|
428
|
+
<tr>
|
429
|
+
<td> MachinePrintedInvoice </td>
|
430
|
+
<td> 通用机打发票 </td>
|
431
|
+
<td> 8 </td>
|
432
|
+
</tr>
|
433
|
+
<tr>
|
434
|
+
<td> BusInvoice </td>
|
435
|
+
<td> 汽车票 </td>
|
436
|
+
<td> 9 </td>
|
437
|
+
</tr>
|
438
|
+
<tr>
|
439
|
+
<td> ShippingInvoice </td>
|
440
|
+
<td> 轮船票 </td>
|
441
|
+
<td> 10 </td>
|
442
|
+
</tr>
|
443
|
+
<tr>
|
444
|
+
<td> NonTaxIncomeGeneralBill </td>
|
445
|
+
<td> 非税收入通用票据 </td>
|
446
|
+
<td> 15 </td>
|
447
|
+
</tr>
|
448
|
+
<tr>
|
449
|
+
<td> NonTaxIncomeElectronicBill </td>
|
450
|
+
<td> 非税收入一般缴款书(电子) </td>
|
451
|
+
<td> 15 </td>
|
452
|
+
</tr>
|
453
|
+
<tr>
|
454
|
+
<td> TollInvoice </td>
|
455
|
+
<td> 过路过桥费发票 </td>
|
456
|
+
<td> 13 </td>
|
457
|
+
</tr>
|
458
|
+
<tr>
|
459
|
+
<td> MedicalOutpatientInvoice </td>
|
460
|
+
<td> 医疗门诊收费票据(电子) </td>
|
461
|
+
<td> 17 </td>
|
462
|
+
</tr>
|
463
|
+
<tr>
|
464
|
+
<td> MedicalHospitalizedInvoice </td>
|
465
|
+
<td> 医疗住院收费票据(电子) </td>
|
466
|
+
<td> 17 </td>
|
467
|
+
</tr>
|
468
|
+
<tr>
|
469
|
+
<td> TaxPayment </td>
|
470
|
+
<td> 完税凭证 </td>
|
471
|
+
<td> 18 </td>
|
472
|
+
</tr>
|
473
|
+
<tr>
|
474
|
+
<td> CustomsPaymentReceipt </td>
|
475
|
+
<td> 海关缴款 </td>
|
476
|
+
<td> 19 </td>
|
477
|
+
</tr>
|
478
|
+
<tr>
|
479
|
+
<td> BankSlip </td>
|
480
|
+
<td> 银行回单 </td>
|
481
|
+
<td> 20 </td>
|
482
|
+
</tr>
|
483
|
+
<tr>
|
484
|
+
<td> OnlineTaxiItinerary </td>
|
485
|
+
<td> 网约车行程单 </td>
|
486
|
+
<td> 21 </td>
|
487
|
+
</tr>
|
488
|
+
<tr>
|
489
|
+
<td> CustomsDeclaration </td>
|
490
|
+
<td> 海关进/出口货物报关单 </td>
|
491
|
+
<td> 22 </td>
|
492
|
+
</tr>
|
493
|
+
<tr>
|
494
|
+
<td> OverseasInvoice </td>
|
495
|
+
<td> 海外发票 </td>
|
496
|
+
<td> 23 </td>
|
497
|
+
</tr>
|
498
|
+
<tr>
|
499
|
+
<td> ShoppingReceipt </td>
|
500
|
+
<td> 购物小票 </td>
|
501
|
+
<td> 24 </td>
|
502
|
+
</tr>
|
503
|
+
<tr>
|
504
|
+
<td> SaleInventory </td>
|
505
|
+
<td> 销货清单 </td>
|
506
|
+
<td> 25 </td>
|
507
|
+
</tr>
|
508
|
+
<tr>
|
509
|
+
<td> OtherInvoice </td>
|
510
|
+
<td> 其他发票 </td>
|
511
|
+
<td> -1 </td>
|
561
512
|
</tr>
|
562
513
|
</tbody>
|
563
514
|
</table>
|
564
|
-
|
565
|
-
默认接口请求频率限制:20次/秒。
|
566
515
|
*/
|
567
|
-
async
|
568
|
-
return this.request("
|
516
|
+
async RecognizeGeneralInvoice(req, cb) {
|
517
|
+
return this.request("RecognizeGeneralInvoice", req, cb);
|
569
518
|
}
|
570
519
|
/**
|
571
|
-
*
|
520
|
+
* 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
|
572
521
|
|
573
|
-
默认接口请求频率限制:
|
522
|
+
默认接口请求频率限制:1次/秒。
|
574
523
|
*/
|
575
|
-
async
|
576
|
-
return this.request("
|
524
|
+
async InsuranceBillOCR(req, cb) {
|
525
|
+
return this.request("InsuranceBillOCR", req, cb);
|
577
526
|
}
|
578
527
|
/**
|
579
|
-
*
|
580
|
-
|
581
|
-
默认接口请求频率限制:5次/秒。
|
582
|
-
*/
|
583
|
-
async OrgCodeCertOCR(req, cb) {
|
584
|
-
return this.request("OrgCodeCertOCR", req, cb);
|
585
|
-
}
|
586
|
-
/**
|
587
|
-
* 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
|
588
|
-
|
589
|
-
默认接口请求频率限制:5次/秒。
|
590
|
-
*/
|
591
|
-
async TextDetect(req, cb) {
|
592
|
-
return this.request("TextDetect", req, cb);
|
593
|
-
}
|
594
|
-
/**
|
595
|
-
* 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
|
596
|
-
|
597
|
-
默认接口请求频率限制:5次/秒。
|
598
|
-
*/
|
599
|
-
async FinanBillSliceOCR(req, cb) {
|
600
|
-
return this.request("FinanBillSliceOCR", req, cb);
|
601
|
-
}
|
602
|
-
/**
|
603
|
-
* 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
|
604
|
-
|
605
|
-
默认接口请求频率限制:5次/秒。
|
606
|
-
*/
|
607
|
-
async BusInvoiceOCR(req, cb) {
|
608
|
-
return this.request("BusInvoiceOCR", req, cb);
|
609
|
-
}
|
610
|
-
/**
|
611
|
-
* <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
|
612
|
-
|
613
|
-
本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
|
528
|
+
* 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
|
614
529
|
|
615
|
-
默认接口请求频率限制:
|
530
|
+
默认接口请求频率限制:20次/秒。
|
616
531
|
*/
|
617
|
-
async
|
618
|
-
return this.request("
|
532
|
+
async VatInvoiceVerifyNew(req, cb) {
|
533
|
+
return this.request("VatInvoiceVerifyNew", req, cb);
|
619
534
|
}
|
620
535
|
/**
|
621
|
-
*
|
622
|
-
|
536
|
+
* 本接口支持图片内车辆识别代号(VIN)的检测和识别。
|
623
537
|
默认接口请求频率限制:10次/秒。
|
624
538
|
*/
|
625
|
-
async
|
626
|
-
return this.request("
|
627
|
-
}
|
628
|
-
/**
|
629
|
-
* 外国人永久居留身份证识别
|
630
|
-
*/
|
631
|
-
async RecognizeForeignPermanentResidentIdCard(req, cb) {
|
632
|
-
return this.request("RecognizeForeignPermanentResidentIdCard", req, cb);
|
539
|
+
async VinOCR(req, cb) {
|
540
|
+
return this.request("VinOCR", req, cb);
|
633
541
|
}
|
634
542
|
/**
|
635
|
-
*
|
543
|
+
* 本接口支持行驶证主页和副页所有字段的自动定位与识别。
|
636
544
|
|
637
|
-
|
638
|
-
*/
|
639
|
-
async RideHailingDriverLicenseOCR(req, cb) {
|
640
|
-
return this.request("RideHailingDriverLicenseOCR", req, cb);
|
641
|
-
}
|
642
|
-
/**
|
643
|
-
* 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
|
545
|
+
行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
|
644
546
|
|
645
|
-
|
646
|
-
*/
|
647
|
-
async HmtResidentPermitOCR(req, cb) {
|
648
|
-
return this.request("HmtResidentPermitOCR", req, cb);
|
649
|
-
}
|
650
|
-
/**
|
651
|
-
* 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
|
652
|
-
*/
|
653
|
-
async RecognizeGeneralTextImageWarn(req, cb) {
|
654
|
-
return this.request("RecognizeGeneralTextImageWarn", req, cb);
|
655
|
-
}
|
656
|
-
/**
|
657
|
-
* 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
|
547
|
+
行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
|
658
548
|
|
659
|
-
|
660
|
-
*/
|
661
|
-
async SmartStructuralOCR(req, cb) {
|
662
|
-
return this.request("SmartStructuralOCR", req, cb);
|
663
|
-
}
|
664
|
-
/**
|
665
|
-
* 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
|
549
|
+
另外,本接口还支持复印件、翻拍告警功能。
|
666
550
|
|
667
551
|
默认接口请求频率限制:10次/秒。
|
668
552
|
*/
|
669
|
-
async
|
670
|
-
return this.request("
|
553
|
+
async VehicleLicenseOCR(req, cb) {
|
554
|
+
return this.request("VehicleLicenseOCR", req, cb);
|
671
555
|
}
|
672
556
|
/**
|
673
|
-
*
|
557
|
+
* 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
|
674
558
|
|
675
559
|
默认接口请求频率限制:10次/秒。
|
676
560
|
*/
|
677
|
-
async
|
678
|
-
return this.request("
|
679
|
-
}
|
680
|
-
/**
|
681
|
-
* 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
|
682
|
-
|
683
|
-
默认接口请求频率限制:5次/秒。
|
684
|
-
*/
|
685
|
-
async EstateCertOCR(req, cb) {
|
686
|
-
return this.request("EstateCertOCR", req, cb);
|
687
|
-
}
|
688
|
-
/**
|
689
|
-
* 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
|
690
|
-
|
691
|
-
默认接口请求频率限制:20次/秒。
|
692
|
-
*/
|
693
|
-
async ClassifyDetectOCR(req, cb) {
|
694
|
-
return this.request("ClassifyDetectOCR", req, cb);
|
695
|
-
}
|
696
|
-
/**
|
697
|
-
* 公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物)的印刷体和手写体的公式识别。
|
698
|
-
|
699
|
-
默认接口请求频率限制:2次/秒。
|
700
|
-
*/
|
701
|
-
async RecognizeFormulaOCR(req, cb) {
|
702
|
-
return this.request("RecognizeFormulaOCR", req, cb);
|
561
|
+
async BizLicenseOCR(req, cb) {
|
562
|
+
return this.request("BizLicenseOCR", req, cb);
|
703
563
|
}
|
704
564
|
/**
|
705
|
-
*
|
565
|
+
* 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。
|
706
566
|
|
707
567
|
默认接口请求频率限制:5次/秒。
|
708
568
|
*/
|
709
|
-
async
|
710
|
-
return this.request("
|
711
|
-
}
|
712
|
-
/**
|
713
|
-
* 本接口用于识别门头照分类标签信息
|
714
|
-
默认接口请求频率限制:1次/秒
|
715
|
-
*/
|
716
|
-
async ClassifyStoreName(req, cb) {
|
717
|
-
return this.request("ClassifyStoreName", req, cb);
|
718
|
-
}
|
719
|
-
/**
|
720
|
-
* 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
|
721
|
-
|
722
|
-
默认接口请求频率限制:10次/秒。
|
723
|
-
*/
|
724
|
-
async BankSlipOCR(req, cb) {
|
725
|
-
return this.request("BankSlipOCR", req, cb);
|
569
|
+
async RecognizeGeneralCardWarn(req, cb) {
|
570
|
+
return this.request("RecognizeGeneralCardWarn", req, cb);
|
726
571
|
}
|
727
572
|
/**
|
728
|
-
*
|
573
|
+
* 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
|
729
574
|
|
730
|
-
|
575
|
+
适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
|
731
576
|
|
732
|
-
|
577
|
+
产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
|
733
578
|
|
734
579
|
通用印刷体识别不同版本的差异如下:
|
735
580
|
<table style="width:715px">
|
736
581
|
<thead>
|
737
582
|
<tr>
|
738
583
|
<th style="width:150px"></th>
|
739
|
-
<th
|
740
|
-
<th
|
741
|
-
<th><a href="https://cloud.tencent.com/document/product/866/
|
584
|
+
<th style="width:200px">【荐】通用印刷体识别</th>
|
585
|
+
<th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
|
586
|
+
<th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
|
742
587
|
</tr>
|
743
588
|
</thead>
|
744
589
|
<tbody>
|
745
590
|
<tr>
|
746
591
|
<td> 适用场景</td>
|
747
|
-
<td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
|
748
592
|
<td>适用于所有通用场景的印刷体识别</td>
|
749
593
|
<td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
|
594
|
+
<td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
|
750
595
|
</tr>
|
751
596
|
<tr>
|
752
597
|
<td>识别准确率</td>
|
753
|
-
<td>91%</td>
|
754
598
|
<td>96%</td>
|
755
599
|
<td>99%</td>
|
600
|
+
<td>91%</td>
|
756
601
|
</tr>
|
757
602
|
<tr>
|
758
603
|
<td>价格</td>
|
759
|
-
<td>低</td>
|
760
604
|
<td>中</td>
|
761
605
|
<td>高</td>
|
606
|
+
<td>低</td>
|
762
607
|
</tr>
|
763
608
|
<tr>
|
764
609
|
<td>支持的语言</td>
|
765
|
-
<td>中文、英文、中英文</td>
|
766
610
|
<td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
|
767
611
|
<td>中文、英文、中英文</td>
|
612
|
+
<td>中文、英文、中英文</td>
|
768
613
|
</tr>
|
769
614
|
<tr>
|
770
615
|
<td>自动语言检测</td>
|
@@ -787,60 +632,52 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
787
632
|
</tbody>
|
788
633
|
</table>
|
789
634
|
|
790
|
-
默认接口请求频率限制:10次/秒。
|
791
|
-
*/
|
792
|
-
async GeneralEfficientOCR(req, cb) {
|
793
|
-
return this.request("GeneralEfficientOCR", req, cb);
|
794
|
-
}
|
795
|
-
/**
|
796
|
-
* 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
|
797
|
-
|
798
|
-
产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
|
799
|
-
|
800
635
|
默认接口请求频率限制:20次/秒。
|
801
636
|
*/
|
802
|
-
async
|
803
|
-
return this.request("
|
637
|
+
async GeneralBasicOCR(req, cb) {
|
638
|
+
return this.request("GeneralBasicOCR", req, cb);
|
804
639
|
}
|
805
640
|
/**
|
806
|
-
*
|
641
|
+
* 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
|
807
642
|
|
808
643
|
默认接口请求频率限制:5次/秒。
|
809
644
|
*/
|
810
|
-
async
|
811
|
-
return this.request("
|
645
|
+
async MixedInvoiceOCR(req, cb) {
|
646
|
+
return this.request("MixedInvoiceOCR", req, cb);
|
812
647
|
}
|
813
648
|
/**
|
814
|
-
*
|
649
|
+
* 本接口当前仅支持复杂磅单收发货单抽取,更多强推理场景支持定制咨询。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
815
650
|
|
816
651
|
默认接口请求频率限制:5次/秒。
|
817
652
|
*/
|
818
|
-
async
|
819
|
-
return this.request("
|
653
|
+
async ExtractDocMultiPro(req, cb) {
|
654
|
+
return this.request("ExtractDocMultiPro", req, cb);
|
820
655
|
}
|
821
656
|
/**
|
822
|
-
*
|
657
|
+
* <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
|
823
658
|
|
824
|
-
|
659
|
+
本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
|
660
|
+
|
661
|
+
默认接口请求频率限制:10次/秒。
|
825
662
|
*/
|
826
|
-
async
|
827
|
-
return this.request("
|
663
|
+
async TableOCR(req, cb) {
|
664
|
+
return this.request("TableOCR", req, cb);
|
828
665
|
}
|
829
666
|
/**
|
830
|
-
*
|
667
|
+
* 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
|
831
668
|
|
832
|
-
默认接口请求频率限制:
|
669
|
+
默认接口请求频率限制:10次/秒。
|
833
670
|
*/
|
834
|
-
async
|
835
|
-
return this.request("
|
671
|
+
async ArithmeticOCR(req, cb) {
|
672
|
+
return this.request("ArithmeticOCR", req, cb);
|
836
673
|
}
|
837
674
|
/**
|
838
|
-
*
|
675
|
+
* 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
|
839
676
|
|
840
|
-
默认接口请求频率限制:
|
677
|
+
默认接口请求频率限制:5次/秒。
|
841
678
|
*/
|
842
|
-
async
|
843
|
-
return this.request("
|
679
|
+
async EstateCertOCR(req, cb) {
|
680
|
+
return this.request("EstateCertOCR", req, cb);
|
844
681
|
}
|
845
682
|
/**
|
846
683
|
* 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
|
@@ -859,324 +696,520 @@ class Client extends TencentCloudCommon.AbstractClient {
|
|
859
696
|
return this.request("BankCardOCR", req, cb);
|
860
697
|
}
|
861
698
|
/**
|
862
|
-
|
863
|
-
|
864
|
-
|
865
|
-
|
866
|
-
async CarInvoiceOCR(req, cb) {
|
867
|
-
return this.request("CarInvoiceOCR", req, cb);
|
868
|
-
}
|
869
|
-
/**
|
870
|
-
* 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
|
871
|
-
|
872
|
-
驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
|
873
|
-
|
874
|
-
驾驶证副页:包括证号、姓名、档案编号、记录。
|
875
|
-
|
876
|
-
另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
|
877
|
-
|
878
|
-
电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
|
879
|
-
|
880
|
-
默认接口请求频率限制:10次/秒。
|
881
|
-
*/
|
882
|
-
async DriverLicenseOCR(req, cb) {
|
883
|
-
return this.request("DriverLicenseOCR", req, cb);
|
699
|
+
* 获取ocr的token值
|
700
|
+
*/
|
701
|
+
async GetOCRToken(req, cb) {
|
702
|
+
return this.request("GetOCRToken", req, cb);
|
884
703
|
}
|
885
704
|
/**
|
886
|
-
*
|
705
|
+
* 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
|
887
706
|
|
888
|
-
默认接口请求频率限制:
|
707
|
+
默认接口请求频率限制:5次/秒。
|
889
708
|
*/
|
890
|
-
async
|
891
|
-
return this.request("
|
709
|
+
async EduPaperOCR(req, cb) {
|
710
|
+
return this.request("EduPaperOCR", req, cb);
|
892
711
|
}
|
893
712
|
/**
|
894
|
-
*
|
713
|
+
* 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
|
895
714
|
|
896
715
|
默认接口请求频率限制:5次/秒。
|
897
716
|
*/
|
898
|
-
async
|
899
|
-
return this.request("
|
717
|
+
async EnterpriseLicenseOCR(req, cb) {
|
718
|
+
return this.request("EnterpriseLicenseOCR", req, cb);
|
900
719
|
}
|
901
720
|
/**
|
902
|
-
*
|
721
|
+
* 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
|
903
722
|
|
904
723
|
默认接口请求频率限制:10次/秒。
|
905
724
|
*/
|
906
|
-
async
|
907
|
-
return this.request("
|
725
|
+
async BusinessCardOCR(req, cb) {
|
726
|
+
return this.request("BusinessCardOCR", req, cb);
|
908
727
|
}
|
909
728
|
/**
|
910
|
-
*
|
729
|
+
* 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
|
911
730
|
|
912
|
-
|
731
|
+
另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
|
732
|
+
|
733
|
+
<table style="width:650px">
|
734
|
+
<thead>
|
735
|
+
<tr>
|
736
|
+
<th width="150">扩展能力</th>
|
737
|
+
<th width="500">能力项</th>
|
738
|
+
</tr>
|
739
|
+
</thead>
|
740
|
+
<tbody>
|
741
|
+
<tr>
|
742
|
+
<td rowspan="2">裁剪功能</td>
|
743
|
+
<td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
|
744
|
+
</tr>
|
745
|
+
<tr>
|
746
|
+
<td>人像照片裁剪(自动抠取身份证头像区域)</td>
|
747
|
+
</tr>
|
748
|
+
<tr>
|
749
|
+
<td rowspan="9">告警功能</td>
|
750
|
+
</tr>
|
751
|
+
<tr>
|
752
|
+
<td>身份证边框不完整告警</td>
|
753
|
+
</tr>
|
754
|
+
<tr>
|
755
|
+
<td>身份证复印件告警</td>
|
756
|
+
</tr>
|
757
|
+
<tr>
|
758
|
+
<td>身份证翻拍告警</td>
|
759
|
+
</tr>
|
760
|
+
<tr>
|
761
|
+
<td>身份证框内遮挡告警</td>
|
762
|
+
</tr>
|
763
|
+
<tr>
|
764
|
+
<td>临时身份证告警</td>
|
765
|
+
</tr>
|
766
|
+
<tr>
|
767
|
+
<td>身份证疑似存在PS痕迹告警</td>
|
768
|
+
</tr>
|
769
|
+
<tr>
|
770
|
+
<td>图片模糊告警(可根据图片质量分数判断)</td>
|
771
|
+
</tr>
|
772
|
+
</tbody>
|
773
|
+
</table>
|
774
|
+
|
775
|
+
默认接口请求频率限制:20次/秒。
|
913
776
|
*/
|
914
|
-
async
|
915
|
-
return this.request("
|
777
|
+
async IDCardOCR(req, cb) {
|
778
|
+
return this.request("IDCardOCR", req, cb);
|
916
779
|
}
|
917
780
|
/**
|
918
|
-
*
|
781
|
+
* 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
|
919
782
|
*/
|
920
|
-
async
|
921
|
-
return this.request("
|
783
|
+
async RecognizeGeneralTextImageWarn(req, cb) {
|
784
|
+
return this.request("RecognizeGeneralTextImageWarn", req, cb);
|
922
785
|
}
|
923
786
|
/**
|
924
|
-
|
925
|
-
|
926
|
-
|
927
|
-
|
787
|
+
* 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
|
788
|
+
|
789
|
+
默认接口请求频率限制:5次/秒。
|
790
|
+
*/
|
791
|
+
async InstitutionOCR(req, cb) {
|
792
|
+
return this.request("InstitutionOCR", req, cb);
|
928
793
|
}
|
929
794
|
/**
|
930
|
-
*
|
795
|
+
* 本接口支持识别并提取制式卡证、票据、表单等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
931
796
|
|
932
797
|
默认接口请求频率限制:5次/秒。
|
933
798
|
*/
|
934
|
-
async
|
935
|
-
return this.request("
|
799
|
+
async SmartStructuralOCRV2(req, cb) {
|
800
|
+
return this.request("SmartStructuralOCRV2", req, cb);
|
936
801
|
}
|
937
802
|
/**
|
938
|
-
*
|
803
|
+
* 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
|
804
|
+
|
805
|
+
默认接口请求频率限制:2次/秒。
|
806
|
+
*/
|
807
|
+
async RecognizeTableAccurateOCR(req, cb) {
|
808
|
+
return this.request("RecognizeTableAccurateOCR", req, cb);
|
809
|
+
}
|
810
|
+
/**
|
811
|
+
* 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
|
812
|
+
默认接口请求频率限制:5次/秒。
|
813
|
+
*/
|
814
|
+
async MixedInvoiceDetect(req, cb) {
|
815
|
+
return this.request("MixedInvoiceDetect", req, cb);
|
816
|
+
}
|
817
|
+
/**
|
818
|
+
* 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
|
819
|
+
|
820
|
+
默认接口请求频率限制:5次/秒。
|
821
|
+
*/
|
822
|
+
async VatRollInvoiceOCR(req, cb) {
|
823
|
+
return this.request("VatRollInvoiceOCR", req, cb);
|
824
|
+
}
|
825
|
+
/**
|
826
|
+
* 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
|
827
|
+
|
828
|
+
默认接口请求频率限制:5次/秒。
|
829
|
+
*/
|
830
|
+
async QuotaInvoiceOCR(req, cb) {
|
831
|
+
return this.request("QuotaInvoiceOCR", req, cb);
|
832
|
+
}
|
833
|
+
/**
|
834
|
+
* 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
|
939
835
|
|
940
836
|
默认接口请求频率限制:10次/秒。
|
941
837
|
*/
|
942
|
-
async
|
943
|
-
return this.request("
|
838
|
+
async GeneralHandwritingOCR(req, cb) {
|
839
|
+
return this.request("GeneralHandwritingOCR", req, cb);
|
944
840
|
}
|
945
841
|
/**
|
946
|
-
*
|
842
|
+
* 本接口支持识别并提取制式卡证、票据、表单等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
843
|
+
|
844
|
+
接口别名:SmartStructuralOCRV2
|
947
845
|
|
948
846
|
默认接口请求频率限制:5次/秒。
|
949
847
|
*/
|
950
|
-
async
|
951
|
-
return this.request("
|
848
|
+
async ExtractDocBasic(req, cb) {
|
849
|
+
return this.request("ExtractDocBasic", req, cb);
|
952
850
|
}
|
953
851
|
/**
|
954
|
-
*
|
852
|
+
* 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
|
853
|
+
|
854
|
+
默认接口请求频率限制:20次/秒。
|
855
|
+
*/
|
856
|
+
async RecognizeOnlineTaxiItineraryOCR(req, cb) {
|
857
|
+
return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb);
|
858
|
+
}
|
859
|
+
/**
|
860
|
+
* 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
|
861
|
+
|
862
|
+
默认接口请求频率限制:10次/秒。
|
863
|
+
*/
|
864
|
+
async RecognizeTableOCR(req, cb) {
|
865
|
+
return this.request("RecognizeTableOCR", req, cb);
|
866
|
+
}
|
867
|
+
/**
|
868
|
+
* 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
|
869
|
+
|
870
|
+
默认接口请求频率限制:10次/秒。
|
871
|
+
*/
|
872
|
+
async WaybillOCR(req, cb) {
|
873
|
+
return this.request("WaybillOCR", req, cb);
|
874
|
+
}
|
875
|
+
/**
|
876
|
+
* 本接口专为教育场景设计,可高精度识别中英文手写字符,智能分栏并按阅读顺序分割内容,自动过滤手写与印刷体混排干扰,精准返回词、行、段落及标题的文本与坐标信息。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
955
877
|
|
956
878
|
默认接口请求频率限制:5次/秒。
|
957
879
|
*/
|
958
|
-
async
|
959
|
-
return this.request("
|
880
|
+
async HandwritingEssayOCR(req, cb) {
|
881
|
+
return this.request("HandwritingEssayOCR", req, cb);
|
960
882
|
}
|
961
883
|
/**
|
962
|
-
*
|
963
|
-
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
|
884
|
+
* 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
|
964
885
|
|
965
|
-
默认接口请求频率限制:
|
886
|
+
默认接口请求频率限制:20次/秒。
|
966
887
|
*/
|
967
|
-
async
|
968
|
-
return this.request("
|
888
|
+
async HmtResidentPermitOCR(req, cb) {
|
889
|
+
return this.request("HmtResidentPermitOCR", req, cb);
|
969
890
|
}
|
970
891
|
/**
|
971
|
-
*
|
892
|
+
* 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
|
972
893
|
|
973
894
|
默认接口请求频率限制:5次/秒。
|
895
|
+
*/
|
896
|
+
async TollInvoiceOCR(req, cb) {
|
897
|
+
return this.request("TollInvoiceOCR", req, cb);
|
898
|
+
}
|
899
|
+
/**
|
900
|
+
* 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
|
974
901
|
|
902
|
+
默认接口请求频率限制:20次/秒。
|
903
|
+
*/
|
904
|
+
async ClassifyDetectOCR(req, cb) {
|
905
|
+
return this.request("ClassifyDetectOCR", req, cb);
|
906
|
+
}
|
907
|
+
/**
|
908
|
+
* 公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物)的印刷体和手写体的公式识别。
|
975
909
|
|
976
|
-
|
977
|
-
|
978
|
-
|
979
|
-
|
980
|
-
|
981
|
-
|
982
|
-
|
983
|
-
|
984
|
-
|
985
|
-
|
986
|
-
|
987
|
-
|
988
|
-
|
989
|
-
|
990
|
-
|
991
|
-
|
992
|
-
|
993
|
-
|
994
|
-
|
995
|
-
|
996
|
-
|
997
|
-
|
998
|
-
|
999
|
-
|
1000
|
-
|
1001
|
-
|
1002
|
-
|
1003
|
-
|
1004
|
-
|
1005
|
-
|
1006
|
-
|
1007
|
-
|
1008
|
-
|
1009
|
-
|
1010
|
-
|
1011
|
-
|
1012
|
-
|
1013
|
-
|
1014
|
-
|
1015
|
-
|
1016
|
-
|
1017
|
-
|
1018
|
-
|
1019
|
-
|
1020
|
-
|
1021
|
-
|
1022
|
-
|
1023
|
-
|
1024
|
-
|
1025
|
-
|
1026
|
-
|
1027
|
-
|
1028
|
-
|
1029
|
-
|
1030
|
-
|
1031
|
-
|
1032
|
-
|
1033
|
-
|
1034
|
-
|
1035
|
-
|
1036
|
-
|
1037
|
-
|
1038
|
-
|
1039
|
-
|
1040
|
-
|
1041
|
-
|
1042
|
-
|
1043
|
-
|
1044
|
-
|
1045
|
-
|
1046
|
-
|
1047
|
-
|
1048
|
-
|
1049
|
-
|
1050
|
-
|
1051
|
-
|
1052
|
-
|
1053
|
-
|
1054
|
-
|
1055
|
-
|
1056
|
-
|
1057
|
-
|
1058
|
-
|
1059
|
-
|
1060
|
-
|
1061
|
-
|
1062
|
-
|
1063
|
-
|
1064
|
-
|
1065
|
-
|
1066
|
-
|
1067
|
-
|
1068
|
-
|
1069
|
-
|
1070
|
-
|
1071
|
-
|
1072
|
-
|
1073
|
-
|
1074
|
-
|
1075
|
-
|
1076
|
-
|
1077
|
-
|
1078
|
-
|
1079
|
-
|
1080
|
-
|
1081
|
-
|
1082
|
-
|
1083
|
-
|
1084
|
-
|
1085
|
-
|
1086
|
-
|
1087
|
-
|
1088
|
-
|
1089
|
-
|
1090
|
-
|
1091
|
-
|
1092
|
-
|
1093
|
-
|
1094
|
-
|
1095
|
-
|
1096
|
-
|
1097
|
-
|
1098
|
-
|
1099
|
-
|
1100
|
-
|
1101
|
-
|
1102
|
-
|
1103
|
-
|
1104
|
-
|
1105
|
-
|
1106
|
-
|
1107
|
-
|
1108
|
-
|
1109
|
-
|
1110
|
-
|
1111
|
-
|
1112
|
-
|
1113
|
-
|
1114
|
-
|
1115
|
-
|
1116
|
-
|
1117
|
-
|
1118
|
-
|
1119
|
-
|
1120
|
-
|
910
|
+
默认接口请求频率限制:2次/秒。
|
911
|
+
*/
|
912
|
+
async RecognizeFormulaOCR(req, cb) {
|
913
|
+
return this.request("RecognizeFormulaOCR", req, cb);
|
914
|
+
}
|
915
|
+
/**
|
916
|
+
* 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
|
917
|
+
|
918
|
+
默认接口请求频率限制:5次/秒。
|
919
|
+
*/
|
920
|
+
async SealOCR(req, cb) {
|
921
|
+
return this.request("SealOCR", req, cb);
|
922
|
+
}
|
923
|
+
/**
|
924
|
+
* 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
|
925
|
+
|
926
|
+
默认接口请求频率限制:10次/秒。
|
927
|
+
*/
|
928
|
+
async BankSlipOCR(req, cb) {
|
929
|
+
return this.request("BankSlipOCR", req, cb);
|
930
|
+
}
|
931
|
+
/**
|
932
|
+
* 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
|
933
|
+
|
934
|
+
默认接口请求频率限制:5次/秒。
|
935
|
+
*/
|
936
|
+
async ResidenceBookletOCR(req, cb) {
|
937
|
+
return this.request("ResidenceBookletOCR", req, cb);
|
938
|
+
}
|
939
|
+
/**
|
940
|
+
* 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
|
941
|
+
|
942
|
+
默认接口请求频率限制:20次/秒。
|
943
|
+
*/
|
944
|
+
async RecognizeTravelCardOCR(req, cb) {
|
945
|
+
return this.request("RecognizeTravelCardOCR", req, cb);
|
946
|
+
}
|
947
|
+
/**
|
948
|
+
* 本接口支持OFD格式的增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
|
949
|
+
*/
|
950
|
+
async VerifyOfdVatInvoiceOCR(req, cb) {
|
951
|
+
return this.request("VerifyOfdVatInvoiceOCR", req, cb);
|
952
|
+
}
|
953
|
+
/**
|
954
|
+
* 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
|
955
|
+
|
956
|
+
驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
|
957
|
+
|
958
|
+
驾驶证副页:包括证号、姓名、档案编号、记录。
|
959
|
+
|
960
|
+
另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
|
961
|
+
|
962
|
+
电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
|
963
|
+
|
964
|
+
默认接口请求频率限制:10次/秒。
|
965
|
+
*/
|
966
|
+
async DriverLicenseOCR(req, cb) {
|
967
|
+
return this.request("DriverLicenseOCR", req, cb);
|
968
|
+
}
|
969
|
+
/**
|
970
|
+
* 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
|
971
|
+
|
972
|
+
默认接口请求频率限制:5次/秒。
|
973
|
+
*/
|
974
|
+
async FinanBillOCR(req, cb) {
|
975
|
+
return this.request("FinanBillOCR", req, cb);
|
976
|
+
}
|
977
|
+
/**
|
978
|
+
* 本接口支持识别并提取场景复杂、版式多等结构化场景的字段信息。重点场景包括:金融、医疗、交通、出行、保险。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
979
|
+
|
980
|
+
默认接口请求频率限制:5次/秒。
|
981
|
+
*/
|
982
|
+
async SmartStructuralPro(req, cb) {
|
983
|
+
return this.request("SmartStructuralPro", req, cb);
|
984
|
+
}
|
985
|
+
/**
|
986
|
+
* 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
|
987
|
+
|
988
|
+
默认接口请求频率限制:10次/秒。
|
989
|
+
*/
|
990
|
+
async RecognizeHealthCodeOCR(req, cb) {
|
991
|
+
return this.request("RecognizeHealthCodeOCR", req, cb);
|
992
|
+
}
|
993
|
+
/**
|
994
|
+
* 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
|
995
|
+
|
996
|
+
默认接口请求频率限制:10次/秒。
|
997
|
+
*/
|
998
|
+
async ImageEnhancement(req, cb) {
|
999
|
+
return this.request("ImageEnhancement", req, cb);
|
1000
|
+
}
|
1001
|
+
/**
|
1002
|
+
* 试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。
|
1003
|
+
|
1004
|
+
默认接口请求频率限制:2次/秒。
|
1005
|
+
*/
|
1006
|
+
async QuestionSplitOCR(req, cb) {
|
1007
|
+
return this.request("QuestionSplitOCR", req, cb);
|
1008
|
+
}
|
1009
|
+
/**
|
1010
|
+
* 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
|
1011
|
+
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
|
1012
|
+
*/
|
1013
|
+
async MLIDCardOCR(req, cb) {
|
1014
|
+
return this.request("MLIDCardOCR", req, cb);
|
1015
|
+
}
|
1016
|
+
/**
|
1017
|
+
* 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
|
1018
|
+
|
1019
|
+
默认接口请求频率限制:5次/秒。
|
1020
|
+
*/
|
1021
|
+
async RecognizeMedicalInvoiceOCR(req, cb) {
|
1022
|
+
return this.request("RecognizeMedicalInvoiceOCR", req, cb);
|
1023
|
+
}
|
1024
|
+
/**
|
1025
|
+
* 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
|
1026
|
+
|
1027
|
+
默认接口请求频率限制:10次/秒。
|
1028
|
+
*/
|
1029
|
+
async GeneralFastOCR(req, cb) {
|
1030
|
+
return this.request("GeneralFastOCR", req, cb);
|
1031
|
+
}
|
1032
|
+
/**
|
1033
|
+
* 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
|
1034
|
+
|
1035
|
+
默认接口请求频率限制:10次/秒。
|
1036
|
+
*/
|
1037
|
+
async VatInvoiceOCR(req, cb) {
|
1038
|
+
return this.request("VatInvoiceOCR", req, cb);
|
1039
|
+
}
|
1040
|
+
/**
|
1041
|
+
* 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
|
1042
|
+
|
1043
|
+
默认接口请求频率限制:5次/秒。
|
1044
|
+
*/
|
1045
|
+
async DutyPaidProofOCR(req, cb) {
|
1046
|
+
return this.request("DutyPaidProofOCR", req, cb);
|
1047
|
+
}
|
1048
|
+
/**
|
1049
|
+
* 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
|
1050
|
+
|
1051
|
+
默认接口请求频率限制:5次/秒。
|
1052
|
+
*/
|
1053
|
+
async OrgCodeCertOCR(req, cb) {
|
1054
|
+
return this.request("OrgCodeCertOCR", req, cb);
|
1055
|
+
}
|
1056
|
+
/**
|
1057
|
+
* 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
|
1058
|
+
|
1059
|
+
默认接口请求频率限制:5次/秒。
|
1060
|
+
*/
|
1061
|
+
async FinanBillSliceOCR(req, cb) {
|
1062
|
+
return this.request("FinanBillSliceOCR", req, cb);
|
1063
|
+
}
|
1064
|
+
/**
|
1065
|
+
* 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
|
1066
|
+
|
1067
|
+
默认接口请求频率限制:10次/秒。
|
1068
|
+
*/
|
1069
|
+
async LicensePlateOCR(req, cb) {
|
1070
|
+
return this.request("LicensePlateOCR", req, cb);
|
1071
|
+
}
|
1072
|
+
/**
|
1073
|
+
* 本接口支持识别并提取场景复杂、版式多等结构化场景的字段信息。重点场景包括:金融、医疗、交通、出行、保险。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
|
1074
|
+
|
1075
|
+
接口别名:SmartStructuralPro
|
1076
|
+
|
1077
|
+
默认接口请求频率限制:5次/秒。
|
1078
|
+
*/
|
1079
|
+
async ExtractDocMulti(req, cb) {
|
1080
|
+
return this.request("ExtractDocMulti", req, cb);
|
1081
|
+
}
|
1082
|
+
/**
|
1083
|
+
* 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
|
1084
|
+
|
1085
|
+
适用于快速文本识别场景。
|
1086
|
+
|
1087
|
+
产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
|
1088
|
+
|
1089
|
+
通用印刷体识别不同版本的差异如下:
|
1090
|
+
<table style="width:715px">
|
1091
|
+
<thead>
|
1121
1092
|
<tr>
|
1122
|
-
<
|
1123
|
-
<
|
1124
|
-
<
|
1093
|
+
<th style="width:150px"></th>
|
1094
|
+
<th >通用印刷体识别(精简版)</th>
|
1095
|
+
<th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
|
1096
|
+
<th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
|
1125
1097
|
</tr>
|
1098
|
+
</thead>
|
1099
|
+
<tbody>
|
1126
1100
|
<tr>
|
1127
|
-
<td>
|
1128
|
-
<td
|
1129
|
-
<td
|
1101
|
+
<td> 适用场景</td>
|
1102
|
+
<td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
|
1103
|
+
<td>适用于所有通用场景的印刷体识别</td>
|
1104
|
+
<td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
|
1130
1105
|
</tr>
|
1131
1106
|
<tr>
|
1132
|
-
<td
|
1133
|
-
<td>
|
1134
|
-
<td>
|
1107
|
+
<td>识别准确率</td>
|
1108
|
+
<td>91%</td>
|
1109
|
+
<td>96%</td>
|
1110
|
+
<td>99%</td>
|
1135
1111
|
</tr>
|
1136
1112
|
<tr>
|
1137
|
-
<td
|
1138
|
-
<td
|
1139
|
-
<td
|
1113
|
+
<td>价格</td>
|
1114
|
+
<td>低</td>
|
1115
|
+
<td>中</td>
|
1116
|
+
<td>高</td>
|
1140
1117
|
</tr>
|
1141
1118
|
<tr>
|
1142
|
-
<td
|
1143
|
-
<td
|
1144
|
-
<td
|
1119
|
+
<td>支持的语言</td>
|
1120
|
+
<td>中文、英文、中英文</td>
|
1121
|
+
<td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
|
1122
|
+
<td>中文、英文、中英文</td>
|
1145
1123
|
</tr>
|
1146
1124
|
<tr>
|
1147
|
-
<td
|
1148
|
-
<td
|
1149
|
-
<td
|
1125
|
+
<td>自动语言检测</td>
|
1126
|
+
<td>支持</td>
|
1127
|
+
<td>支持</td>
|
1128
|
+
<td>支持</td>
|
1150
1129
|
</tr>
|
1151
1130
|
<tr>
|
1152
|
-
<td
|
1153
|
-
<td
|
1154
|
-
<td
|
1131
|
+
<td>返回文本行坐标</td>
|
1132
|
+
<td>支持</td>
|
1133
|
+
<td>支持</td>
|
1134
|
+
<td>支持</td>
|
1155
1135
|
</tr>
|
1156
1136
|
<tr>
|
1157
|
-
<td
|
1158
|
-
<td
|
1159
|
-
<td
|
1137
|
+
<td>自动旋转纠正</td>
|
1138
|
+
<td>支持旋转识别,返回角度信息</td>
|
1139
|
+
<td>支持旋转识别,返回角度信息</td>
|
1140
|
+
<td>支持旋转识别,返回角度信息</td>
|
1160
1141
|
</tr>
|
1161
1142
|
</tbody>
|
1162
1143
|
</table>
|
1144
|
+
|
1145
|
+
默认接口请求频率限制:10次/秒。
|
1163
1146
|
*/
|
1164
|
-
async
|
1165
|
-
return this.request("
|
1147
|
+
async GeneralEfficientOCR(req, cb) {
|
1148
|
+
return this.request("GeneralEfficientOCR", req, cb);
|
1166
1149
|
}
|
1167
1150
|
/**
|
1168
|
-
*
|
1151
|
+
* 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
|
1169
1152
|
|
1170
|
-
|
1153
|
+
产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
|
1171
1154
|
|
1172
|
-
|
1155
|
+
默认接口请求频率限制:20次/秒。
|
1156
|
+
*/
|
1157
|
+
async AdvertiseOCR(req, cb) {
|
1158
|
+
return this.request("AdvertiseOCR", req, cb);
|
1159
|
+
}
|
1160
|
+
/**
|
1161
|
+
* 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
|
1173
1162
|
|
1174
|
-
|
1163
|
+
默认接口请求频率限制:5次/秒。
|
1164
|
+
*/
|
1165
|
+
async VehicleRegCertOCR(req, cb) {
|
1166
|
+
return this.request("VehicleRegCertOCR", req, cb);
|
1167
|
+
}
|
1168
|
+
/**
|
1169
|
+
* 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
|
1170
|
+
|
1171
|
+
默认接口请求频率限制:5次/秒。
|
1172
|
+
*/
|
1173
|
+
async CarInvoiceOCR(req, cb) {
|
1174
|
+
return this.request("CarInvoiceOCR", req, cb);
|
1175
|
+
}
|
1176
|
+
/**
|
1177
|
+
* 获取ocr结果
|
1178
|
+
*/
|
1179
|
+
async GetOCRResult(req, cb) {
|
1180
|
+
return this.request("GetOCRResult", req, cb);
|
1181
|
+
}
|
1182
|
+
/**
|
1183
|
+
* 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
|
1184
|
+
|
1185
|
+
默认接口请求频率限制:5次/秒。
|
1186
|
+
*/
|
1187
|
+
async FormulaOCR(req, cb) {
|
1188
|
+
return this.request("FormulaOCR", req, cb);
|
1189
|
+
}
|
1190
|
+
/**
|
1191
|
+
* 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
|
1175
1192
|
|
1176
1193
|
默认接口请求频率限制:10次/秒。
|
1177
1194
|
*/
|
1178
|
-
async
|
1179
|
-
return this.request("
|
1195
|
+
async PassportOCR(req, cb) {
|
1196
|
+
return this.request("PassportOCR", req, cb);
|
1197
|
+
}
|
1198
|
+
/**
|
1199
|
+
* 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
|
1200
|
+
|
1201
|
+
默认接口请求频率限制:5次/秒。
|
1202
|
+
*/
|
1203
|
+
async ShipInvoiceOCR(req, cb) {
|
1204
|
+
return this.request("ShipInvoiceOCR", req, cb);
|
1205
|
+
}
|
1206
|
+
/**
|
1207
|
+
* 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
|
1208
|
+
|
1209
|
+
默认接口请求频率限制:5次/秒。
|
1210
|
+
*/
|
1211
|
+
async RideHailingTransportLicenseOCR(req, cb) {
|
1212
|
+
return this.request("RideHailingTransportLicenseOCR", req, cb);
|
1180
1213
|
}
|
1181
1214
|
}
|
1182
1215
|
exports.Client = Client;
|