tencentcloud-sdk-nodejs-ocr 4.0.1015 → 4.0.1018

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -28,198 +28,12 @@ class Client extends TencentCloudCommon.AbstractClient {
28
28
  super("ocr.tencentcloudapi.com", "2018-11-19", clientConfig);
29
29
  }
30
30
  /**
31
- * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
32
-
33
- 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
34
-
35
- 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
36
-
37
- 通用印刷体识别不同版本的差异如下:
38
- <table style="width:715px">
39
- <thead>
40
- <tr>
41
- <th style="width:150px"></th>
42
- <th style="width:200px">【荐】通用印刷体识别</th>
43
- <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
44
- <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
45
- </tr>
46
- </thead>
47
- <tbody>
48
- <tr>
49
- <td> 适用场景</td>
50
- <td>适用于所有通用场景的印刷体识别</td>
51
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
52
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
53
- </tr>
54
- <tr>
55
- <td>识别准确率</td>
56
- <td>96%</td>
57
- <td>99%</td>
58
- <td>91%</td>
59
- </tr>
60
- <tr>
61
- <td>价格</td>
62
- <td>中</td>
63
- <td>高</td>
64
- <td>低</td>
65
- </tr>
66
- <tr>
67
- <td>支持的语言</td>
68
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
69
- <td>中文、英文、中英文</td>
70
- <td>中文、英文、中英文</td>
71
- </tr>
72
- <tr>
73
- <td>自动语言检测</td>
74
- <td>支持</td>
75
- <td>支持</td>
76
- <td>支持</td>
77
- </tr>
78
- <tr>
79
- <td>返回文本行坐标</td>
80
- <td>支持</td>
81
- <td>支持</td>
82
- <td>支持</td>
83
- </tr>
84
- <tr>
85
- <td>自动旋转纠正</td>
86
- <td>支持旋转识别,返回角度信息</td>
87
- <td>支持旋转识别,返回角度信息</td>
88
- <td>支持旋转识别,返回角度信息</td>
89
- </tr>
90
- </tbody>
91
- </table>
92
-
93
- 默认接口请求频率限制:20次/秒。
94
- */
95
- async GeneralBasicOCR(req, cb) {
96
- return this.request("GeneralBasicOCR", req, cb);
97
- }
98
- /**
99
- * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
100
-
101
- 默认接口请求频率限制:10次/秒。
102
- */
103
- async ImageEnhancement(req, cb) {
104
- return this.request("ImageEnhancement", req, cb);
105
- }
106
- /**
107
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
108
-
109
- 默认接口请求频率限制:5次/秒。
110
- */
111
- async SmartStructuralOCRV2(req, cb) {
112
- return this.request("SmartStructuralOCRV2", req, cb);
113
- }
114
- /**
115
- * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
116
-
117
- 默认接口请求频率限制:5次/秒。
118
- */
119
- async EnterpriseLicenseOCR(req, cb) {
120
- return this.request("EnterpriseLicenseOCR", req, cb);
121
- }
122
- /**
123
- * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
124
-
125
- 默认接口请求频率限制:10次/秒。
126
- */
127
- async BusinessCardOCR(req, cb) {
128
- return this.request("BusinessCardOCR", req, cb);
129
- }
130
- /**
131
- * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
132
-
133
- 默认接口请求频率限制:1次/秒。
134
- */
135
- async InsuranceBillOCR(req, cb) {
136
- return this.request("InsuranceBillOCR", req, cb);
137
- }
138
- /**
139
- * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
140
-
141
- 默认接口请求频率限制:20次/秒。
142
- */
143
- async RecognizeOnlineTaxiItineraryOCR(req, cb) {
144
- return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb);
145
- }
146
- /**
147
- * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
148
-
149
- 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
150
-
151
- <table style="width:650px">
152
- <thead>
153
- <tr>
154
- <th width="150">扩展能力</th>
155
- <th width="500">能力项</th>
156
- </tr>
157
- </thead>
158
- <tbody>
159
- <tr>
160
- <td rowspan="2">裁剪功能</td>
161
- <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
162
- </tr>
163
- <tr>
164
- <td>人像照片裁剪(自动抠取身份证头像区域)</td>
165
- </tr>
166
- <tr>
167
- <td rowspan="9">告警功能</td>
168
- <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
169
-
170
- </td>
171
- </tr>
172
- <tr>
173
- <td>身份证边框不完整告警</td>
174
- </tr>
175
- <tr>
176
- <td>身份证复印件告警</td>
177
- </tr>
178
- <tr>
179
- <td>身份证翻拍告警</td>
180
- </tr>
181
- <tr>
182
- <td>身份证框内遮挡告警</td>
183
- </tr>
184
- <tr>
185
- <td>临时身份证告警</td>
186
- </tr>
187
- <tr>
188
- <td>身份证疑似存在PS痕迹告警</td>
189
- </tr>
190
- <tr>
191
- <td>图片模糊告警(可根据图片质量分数判断)</td>
192
- </tr>
193
- </tbody>
194
- </table>
195
-
196
- 默认接口请求频率限制:20次/秒。
197
- */
198
- async IDCardOCR(req, cb) {
199
- return this.request("IDCardOCR", req, cb);
200
- }
201
- /**
202
- * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
31
+ * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
203
32
 
204
33
  默认接口请求频率限制:5次/秒。
205
34
  */
206
- async TollInvoiceOCR(req, cb) {
207
- return this.request("TollInvoiceOCR", req, cb);
208
- }
209
- /**
210
- * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
211
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
212
- */
213
- async MLIDCardOCR(req, cb) {
214
- return this.request("MLIDCardOCR", req, cb);
215
- }
216
- /**
217
- * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
218
-
219
- 默认接口请求频率限制:20次/秒。
220
- */
221
- async VatInvoiceVerifyNew(req, cb) {
222
- return this.request("VatInvoiceVerifyNew", req, cb);
35
+ async TextDetect(req, cb) {
36
+ return this.request("TextDetect", req, cb);
223
37
  }
224
38
  /**
225
39
  * 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。
@@ -304,14 +118,6 @@ class Client extends TencentCloudCommon.AbstractClient {
304
118
  async RecognizeContainerOCR(req, cb) {
305
119
  return this.request("RecognizeContainerOCR", req, cb);
306
120
  }
307
- /**
308
- * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
309
-
310
- 默认接口请求频率限制:2次/秒。
311
- */
312
- async RecognizeTableAccurateOCR(req, cb) {
313
- return this.request("RecognizeTableAccurateOCR", req, cb);
314
- }
315
121
  /**
316
122
  * 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。
317
123
 
@@ -369,29 +175,6 @@ class Client extends TencentCloudCommon.AbstractClient {
369
175
  async RecognizeEncryptedIDCardOCR(req, cb) {
370
176
  return this.request("RecognizeEncryptedIDCardOCR", req, cb);
371
177
  }
372
- /**
373
- * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
374
- 默认接口请求频率限制:5次/秒。
375
- */
376
- async MixedInvoiceDetect(req, cb) {
377
- return this.request("MixedInvoiceDetect", req, cb);
378
- }
379
- /**
380
- * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
381
-
382
- 默认接口请求频率限制:5次/秒。
383
- */
384
- async VehicleRegCertOCR(req, cb) {
385
- return this.request("VehicleRegCertOCR", req, cb);
386
- }
387
- /**
388
- * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
389
-
390
- 默认接口请求频率限制:5次/秒。
391
- */
392
- async ShipInvoiceOCR(req, cb) {
393
- return this.request("ShipInvoiceOCR", req, cb);
394
- }
395
178
  /**
396
179
  * 本接口用于识别门头照文字识别结果以及对应分类标签信息
397
180
  默认接口请求频率限制:1次/秒
@@ -409,173 +192,44 @@ class Client extends TencentCloudCommon.AbstractClient {
409
192
  return this.request("MLIDPassportOCR", req, cb);
410
193
  }
411
194
  /**
412
- * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
195
+ * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
413
196
 
414
197
  默认接口请求频率限制:5次/秒。
415
198
  */
416
- async VatRollInvoiceOCR(req, cb) {
417
- return this.request("VatRollInvoiceOCR", req, cb);
199
+ async TrainTicketOCR(req, cb) {
200
+ return this.request("TrainTicketOCR", req, cb);
418
201
  }
419
202
  /**
420
- * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
203
+ * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
204
+ 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
421
205
 
422
206
  默认接口请求频率限制:5次/秒。
423
207
  */
424
- async QuotaInvoiceOCR(req, cb) {
425
- return this.request("QuotaInvoiceOCR", req, cb);
208
+ async PropOwnerCertOCR(req, cb) {
209
+ return this.request("PropOwnerCertOCR", req, cb);
426
210
  }
427
211
  /**
428
- * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
212
+ * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
429
213
 
430
- 默认接口请求频率限制:10次/秒。
214
+ 默认接口请求频率限制:5次/秒。
431
215
  */
432
- async WaybillOCR(req, cb) {
433
- return this.request("WaybillOCR", req, cb);
216
+ async InvoiceGeneralOCR(req, cb) {
217
+ return this.request("InvoiceGeneralOCR", req, cb);
434
218
  }
435
219
  /**
436
- * 本接口支持图片内车辆识别代号(VIN)的检测和识别。
437
- 默认接口请求频率限制:10次/秒。
438
- */
439
- async VinOCR(req, cb) {
440
- return this.request("VinOCR", req, cb);
220
+ * 服务已迁移至 [文档解析](https://cloud.tencent.com/document/product/1759/107504),请跳转查看接口文档。该接口支持将图片或PDF文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。
221
+ */
222
+ async ReconstructDocument(req, cb) {
223
+ return this.request("ReconstructDocument", req, cb);
441
224
  }
442
225
  /**
443
- * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
444
-
445
- 默认接口请求频率限制:10次/秒。
446
- */
447
- async GeneralFastOCR(req, cb) {
448
- return this.request("GeneralFastOCR", req, cb);
449
- }
450
- /**
451
- * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
452
- 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
453
-
454
- 默认接口请求频率限制:5次/秒。
455
- */
456
- async PropOwnerCertOCR(req, cb) {
457
- return this.request("PropOwnerCertOCR", req, cb);
458
- }
459
- /**
460
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
461
-
462
- 默认接口请求频率限制:5次/秒。
463
- */
464
- async SmartStructuralPro(req, cb) {
465
- return this.request("SmartStructuralPro", req, cb);
466
- }
467
- /**
468
- * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
469
-
470
- 默认接口请求频率限制:10次/秒。
471
- */
472
- async BizLicenseOCR(req, cb) {
473
- return this.request("BizLicenseOCR", req, cb);
474
- }
475
- /**
476
- * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
477
-
478
- 默认接口请求频率限制:10次/秒。
479
- */
480
- async GeneralHandwritingOCR(req, cb) {
481
- return this.request("GeneralHandwritingOCR", req, cb);
482
- }
483
- /**
484
- * 外国人永久居留身份证识别
485
- */
486
- async RecognizeForeignPermanentResidentIdCard(req, cb) {
487
- return this.request("RecognizeForeignPermanentResidentIdCard", req, cb);
488
- }
489
- /**
490
- * 已上线VatInvoiceVerifyNew,VatInvoiceVerify需要下线,产品在官网已发通告
491
-
492
- 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。
493
-
494
- 默认接口请求频率限制:20次/秒。
495
- */
496
- async VatInvoiceVerify(req, cb) {
497
- return this.request("VatInvoiceVerify", req, cb);
498
- }
499
- /**
500
- * 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
501
-
502
- 默认接口请求频率限制:5次/秒。
503
- */
504
- async TaxiInvoiceOCR(req, cb) {
505
- return this.request("TaxiInvoiceOCR", req, cb);
506
- }
507
- /**
508
- * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
509
-
510
- 默认接口请求频率限制:5次/秒。
511
- */
512
- async InvoiceGeneralOCR(req, cb) {
513
- return this.request("InvoiceGeneralOCR", req, cb);
514
- }
515
- /**
516
- * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
517
-
518
- 默认接口请求频率限制:5次/秒。
519
- */
520
- async RideHailingTransportLicenseOCR(req, cb) {
521
- return this.request("RideHailingTransportLicenseOCR", req, cb);
522
- }
523
- /**
524
- * 智慧表单产品已下线,需要下线相关API
525
-
526
- 支持查询智能表单录入任务的状态。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
527
- */
528
- async GetTaskState(req, cb) {
529
- return this.request("GetTaskState", req, cb);
530
- }
531
- /**
532
- * 获取ocr结果
533
- */
534
- async GetOCRResult(req, cb) {
535
- return this.request("GetOCRResult", req, cb);
536
- }
537
- /**
538
- * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
226
+ * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
539
227
 
540
228
  默认接口请求频率限制:5次/秒。
541
229
  */
542
230
  async HKIDCardOCR(req, cb) {
543
231
  return this.request("HKIDCardOCR", req, cb);
544
232
  }
545
- /**
546
- * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
547
-
548
- 默认接口请求频率限制:10次/秒。
549
- */
550
- async RecognizeTableOCR(req, cb) {
551
- return this.request("RecognizeTableOCR", req, cb);
552
- }
553
- /**
554
- * 智慧表单产品已下线,需要下线相关API
555
-
556
- 本接口可创建智能表单录入任务,支持多个识别图片和PDF的URL上传,返回含有识别内容的操作页面URL。
557
-
558
- 智能表单录入产品提供高准确率的表单识别技术和人工核对工具,支持自定义字段,将识别结果自动填入到自定义条目中,并提供人工操作工具,完成整个表单识别过程。适用性强,可对票据、合同、货单等文件的识别,适用于金融、货代、保险、档案等领域。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
559
- */
560
- async CreateAIFormTask(req, cb) {
561
- return this.request("CreateAIFormTask", req, cb);
562
- }
563
- /**
564
- * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
565
-
566
- 默认接口请求频率限制:5次/秒。
567
- */
568
- async DutyPaidProofOCR(req, cb) {
569
- return this.request("DutyPaidProofOCR", req, cb);
570
- }
571
- /**
572
- * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
573
-
574
- 默认接口请求频率限制:5次/秒。
575
- */
576
- async FlightInvoiceOCR(req, cb) {
577
- return this.request("FlightInvoiceOCR", req, cb);
578
- }
579
233
  /**
580
234
  * 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
581
235
 
@@ -585,62 +239,43 @@ class Client extends TencentCloudCommon.AbstractClient {
585
239
  return this.request("PermitOCR", req, cb);
586
240
  }
587
241
  /**
588
- * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
242
+ * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
589
243
 
590
244
  默认接口请求频率限制:5次/秒。
591
245
  */
592
- async OrgCodeCertOCR(req, cb) {
593
- return this.request("OrgCodeCertOCR", req, cb);
246
+ async BusInvoiceOCR(req, cb) {
247
+ return this.request("BusInvoiceOCR", req, cb);
594
248
  }
595
249
  /**
596
- * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
250
+ * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
597
251
 
598
- 默认接口请求频率限制:5次/秒。
252
+ 默认接口请求频率限制:10次/秒。
599
253
  */
600
- async TextDetect(req, cb) {
601
- return this.request("TextDetect", req, cb);
254
+ async EnglishOCR(req, cb) {
255
+ return this.request("EnglishOCR", req, cb);
602
256
  }
603
257
  /**
604
- * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
258
+ * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
605
259
 
606
260
  默认接口请求频率限制:5次/秒。
607
261
  */
608
- async FinanBillSliceOCR(req, cb) {
609
- return this.request("FinanBillSliceOCR", req, cb);
262
+ async SmartStructuralOCR(req, cb) {
263
+ return this.request("SmartStructuralOCR", req, cb);
610
264
  }
611
265
  /**
612
- * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
613
-
614
- 默认接口请求频率限制:5次/秒。
266
+ * 本接口用于识别门头照分类标签信息
267
+ 默认接口请求频率限制:1次/秒
615
268
  */
616
- async BusInvoiceOCR(req, cb) {
617
- return this.request("BusInvoiceOCR", req, cb);
269
+ async ClassifyStoreName(req, cb) {
270
+ return this.request("ClassifyStoreName", req, cb);
618
271
  }
619
272
  /**
620
- * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
273
+ * 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
621
274
 
622
275
  默认接口请求频率限制:5次/秒。
623
276
  */
624
- async RecognizeMedicalInvoiceOCR(req, cb) {
625
- return this.request("RecognizeMedicalInvoiceOCR", req, cb);
626
- }
627
- /**
628
- * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
629
-
630
- 默认接口请求频率限制:10次/秒。
631
- */
632
- async VatInvoiceOCR(req, cb) {
633
- return this.request("VatInvoiceOCR", req, cb);
634
- }
635
- /**
636
- * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
637
-
638
- 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
639
-
640
- 默认接口请求频率限制:10次/秒。
641
- */
642
- async TableOCR(req, cb) {
643
- return this.request("TableOCR", req, cb);
277
+ async TaxiInvoiceOCR(req, cb) {
278
+ return this.request("TaxiInvoiceOCR", req, cb);
644
279
  }
645
280
  /**
646
281
  * 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
@@ -651,325 +286,40 @@ class Client extends TencentCloudCommon.AbstractClient {
651
286
  return this.request("RideHailingDriverLicenseOCR", req, cb);
652
287
  }
653
288
  /**
654
- * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
655
-
656
- 默认接口请求频率限制:20次/秒。
657
- */
658
- async HmtResidentPermitOCR(req, cb) {
659
- return this.request("HmtResidentPermitOCR", req, cb);
660
- }
661
- /**
662
- * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
663
- */
664
- async RecognizeGeneralTextImageWarn(req, cb) {
665
- return this.request("RecognizeGeneralTextImageWarn", req, cb);
666
- }
667
- /**
668
- * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
289
+ * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
669
290
 
670
291
  默认接口请求频率限制:5次/秒。
671
292
  */
672
- async SmartStructuralOCR(req, cb) {
673
- return this.request("SmartStructuralOCR", req, cb);
674
- }
675
- /**
676
- * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
677
-
678
- 默认接口请求频率限制:10次/秒。
679
- */
680
- async ArithmeticOCR(req, cb) {
681
- return this.request("ArithmeticOCR", req, cb);
293
+ async DutyPaidProofOCR(req, cb) {
294
+ return this.request("DutyPaidProofOCR", req, cb);
682
295
  }
683
296
  /**
684
- * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
297
+ * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
685
298
 
686
- 默认接口请求频率限制:10次/秒。
299
+ 默认接口请求频率限制:20次/秒。
687
300
  */
688
- async LicensePlateOCR(req, cb) {
689
- return this.request("LicensePlateOCR", req, cb);
301
+ async MainlandPermitOCR(req, cb) {
302
+ return this.request("MainlandPermitOCR", req, cb);
690
303
  }
691
304
  /**
692
- * 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
305
+ * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
693
306
 
694
307
  默认接口请求频率限制:5次/秒。
695
308
  */
696
- async EstateCertOCR(req, cb) {
697
- return this.request("EstateCertOCR", req, cb);
309
+ async FlightInvoiceOCR(req, cb) {
310
+ return this.request("FlightInvoiceOCR", req, cb);
698
311
  }
699
312
  /**
700
- * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
313
+ * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
314
+ 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
701
315
 
702
- 默认接口请求频率限制:20次/秒。
316
+ 默认接口请求频率限制:10次/秒
703
317
  */
704
- async ClassifyDetectOCR(req, cb) {
705
- return this.request("ClassifyDetectOCR", req, cb);
318
+ async RecognizeThaiIDCardOCR(req, cb) {
319
+ return this.request("RecognizeThaiIDCardOCR", req, cb);
706
320
  }
707
321
  /**
708
- * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
709
-
710
- 默认接口请求频率限制:5次/秒。
711
- */
712
- async SealOCR(req, cb) {
713
- return this.request("SealOCR", req, cb);
714
- }
715
- /**
716
- * 本接口用于识别门头照分类标签信息
717
- 默认接口请求频率限制:1次/秒
718
- */
719
- async ClassifyStoreName(req, cb) {
720
- return this.request("ClassifyStoreName", req, cb);
721
- }
722
- /**
723
- * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
724
-
725
- 默认接口请求频率限制:10次/秒。
726
- */
727
- async BankSlipOCR(req, cb) {
728
- return this.request("BankSlipOCR", req, cb);
729
- }
730
- /**
731
- * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
732
-
733
- 适用于快速文本识别场景。
734
-
735
- 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
736
-
737
- 通用印刷体识别不同版本的差异如下:
738
- <table style="width:715px">
739
- <thead>
740
- <tr>
741
- <th style="width:150px"></th>
742
- <th >通用印刷体识别(精简版)</th>
743
- <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
744
- <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
745
- </tr>
746
- </thead>
747
- <tbody>
748
- <tr>
749
- <td> 适用场景</td>
750
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
751
- <td>适用于所有通用场景的印刷体识别</td>
752
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
753
- </tr>
754
- <tr>
755
- <td>识别准确率</td>
756
- <td>91%</td>
757
- <td>96%</td>
758
- <td>99%</td>
759
- </tr>
760
- <tr>
761
- <td>价格</td>
762
- <td>低</td>
763
- <td>中</td>
764
- <td>高</td>
765
- </tr>
766
- <tr>
767
- <td>支持的语言</td>
768
- <td>中文、英文、中英文</td>
769
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
770
- <td>中文、英文、中英文</td>
771
- </tr>
772
- <tr>
773
- <td>自动语言检测</td>
774
- <td>支持</td>
775
- <td>支持</td>
776
- <td>支持</td>
777
- </tr>
778
- <tr>
779
- <td>返回文本行坐标</td>
780
- <td>支持</td>
781
- <td>支持</td>
782
- <td>支持</td>
783
- </tr>
784
- <tr>
785
- <td>自动旋转纠正</td>
786
- <td>支持旋转识别,返回角度信息</td>
787
- <td>支持旋转识别,返回角度信息</td>
788
- <td>支持旋转识别,返回角度信息</td>
789
- </tr>
790
- </tbody>
791
- </table>
792
-
793
- 默认接口请求频率限制:10次/秒。
794
- */
795
- async GeneralEfficientOCR(req, cb) {
796
- return this.request("GeneralEfficientOCR", req, cb);
797
- }
798
- /**
799
- * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
800
-
801
- 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
802
-
803
- 默认接口请求频率限制:20次/秒。
804
- */
805
- async AdvertiseOCR(req, cb) {
806
- return this.request("AdvertiseOCR", req, cb);
807
- }
808
- /**
809
- * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
810
-
811
- 默认接口请求频率限制:5次/秒。
812
- */
813
- async TrainTicketOCR(req, cb) {
814
- return this.request("TrainTicketOCR", req, cb);
815
- }
816
- /**
817
- * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
818
-
819
- 默认接口请求频率限制:5次/秒。
820
- */
821
- async ResidenceBookletOCR(req, cb) {
822
- return this.request("ResidenceBookletOCR", req, cb);
823
- }
824
- /**
825
- * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
826
-
827
- 默认接口请求频率限制:20次/秒。
828
- */
829
- async RecognizeTravelCardOCR(req, cb) {
830
- return this.request("RecognizeTravelCardOCR", req, cb);
831
- }
832
- /**
833
- * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
834
-
835
- 默认接口请求频率限制:5次/秒。
836
- */
837
- async InstitutionOCR(req, cb) {
838
- return this.request("InstitutionOCR", req, cb);
839
- }
840
- /**
841
- * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
842
-
843
- 默认接口请求频率限制:10次/秒。
844
- */
845
- async EnglishOCR(req, cb) {
846
- return this.request("EnglishOCR", req, cb);
847
- }
848
- /**
849
- * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
850
-
851
- 默认接口请求频率限制:20次/秒。
852
- */
853
- async RecognizeValidIDCardOCR(req, cb) {
854
- return this.request("RecognizeValidIDCardOCR", req, cb);
855
- }
856
- /**
857
- * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
858
-
859
- 默认接口请求频率限制:10次/秒。
860
- */
861
- async BankCardOCR(req, cb) {
862
- return this.request("BankCardOCR", req, cb);
863
- }
864
- /**
865
- * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
866
-
867
- 默认接口请求频率限制:5次/秒。
868
- */
869
- async CarInvoiceOCR(req, cb) {
870
- return this.request("CarInvoiceOCR", req, cb);
871
- }
872
- /**
873
- * 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
874
-
875
- 驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
876
-
877
- 驾驶证副页:包括证号、姓名、档案编号、记录。
878
-
879
- 另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
880
-
881
- 电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
882
-
883
- 默认接口请求频率限制:10次/秒。
884
- */
885
- async DriverLicenseOCR(req, cb) {
886
- return this.request("DriverLicenseOCR", req, cb);
887
- }
888
- /**
889
- * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
890
-
891
- 默认接口请求频率限制:20次/秒。
892
- */
893
- async MainlandPermitOCR(req, cb) {
894
- return this.request("MainlandPermitOCR", req, cb);
895
- }
896
- /**
897
- * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
898
-
899
- 默认接口请求频率限制:5次/秒。
900
- */
901
- async FormulaOCR(req, cb) {
902
- return this.request("FormulaOCR", req, cb);
903
- }
904
- /**
905
- * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
906
-
907
- 默认接口请求频率限制:10次/秒。
908
- */
909
- async PassportOCR(req, cb) {
910
- return this.request("PassportOCR", req, cb);
911
- }
912
- /**
913
- * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
914
-
915
- 默认接口请求频率限制:5次/秒。
916
- */
917
- async FinanBillOCR(req, cb) {
918
- return this.request("FinanBillOCR", req, cb);
919
- }
920
- /**
921
- * 获取ocr的token值
922
- */
923
- async GetOCRToken(req, cb) {
924
- return this.request("GetOCRToken", req, cb);
925
- }
926
- /**
927
- * 本接口支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
928
- */
929
- async VerifyOfdVatInvoiceOCR(req, cb) {
930
- return this.request("VerifyOfdVatInvoiceOCR", req, cb);
931
- }
932
- /**
933
- * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
934
-
935
- 默认接口请求频率限制:5次/秒。
936
- */
937
- async MixedInvoiceOCR(req, cb) {
938
- return this.request("MixedInvoiceOCR", req, cb);
939
- }
940
- /**
941
- * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
942
-
943
- 默认接口请求频率限制:10次/秒。
944
- */
945
- async RecognizeHealthCodeOCR(req, cb) {
946
- return this.request("RecognizeHealthCodeOCR", req, cb);
947
- }
948
- /**
949
- * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
950
-
951
- 默认接口请求频率限制:5次/秒。
952
- */
953
- async EduPaperOCR(req, cb) {
954
- return this.request("EduPaperOCR", req, cb);
955
- }
956
- /**
957
- * 服务已迁移至 [文档解析](https://cloud.tencent.com/document/product/1759/107504),请跳转查看接口文档。该接口支持将图片或PDF文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。
958
- */
959
- async ReconstructDocument(req, cb) {
960
- return this.request("ReconstructDocument", req, cb);
961
- }
962
- /**
963
- * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
964
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
965
-
966
- 默认接口请求频率限制:10次/秒
967
- */
968
- async RecognizeThaiIDCardOCR(req, cb) {
969
- return this.request("RecognizeThaiIDCardOCR", req, cb);
970
- }
971
- /**
972
- * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
322
+ * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
973
323
 
974
324
  默认接口请求频率限制:5次/秒。
975
325
 
@@ -1126,18 +476,674 @@ class Client extends TencentCloudCommon.AbstractClient {
1126
476
  return this.request("RecognizeGeneralInvoice", req, cb);
1127
477
  }
1128
478
  /**
1129
- * 本接口支持行驶证主页和副页所有字段的自动定位与识别。
1130
-
1131
- 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
1132
-
1133
- 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
1134
-
1135
- 另外,本接口还支持复印件、翻拍告警功能。
479
+ * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
1136
480
 
1137
- 默认接口请求频率限制:10次/秒。
481
+ 默认接口请求频率限制:1次/秒。
1138
482
  */
1139
- async VehicleLicenseOCR(req, cb) {
1140
- return this.request("VehicleLicenseOCR", req, cb);
483
+ async InsuranceBillOCR(req, cb) {
484
+ return this.request("InsuranceBillOCR", req, cb);
485
+ }
486
+ /**
487
+ * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
488
+
489
+ 默认接口请求频率限制:20次/秒。
490
+ */
491
+ async VatInvoiceVerifyNew(req, cb) {
492
+ return this.request("VatInvoiceVerifyNew", req, cb);
493
+ }
494
+ /**
495
+ * 本接口支持图片内车辆识别代号(VIN)的检测和识别。
496
+ 默认接口请求频率限制:10次/秒。
497
+ */
498
+ async VinOCR(req, cb) {
499
+ return this.request("VinOCR", req, cb);
500
+ }
501
+ /**
502
+ * 本接口支持行驶证主页和副页所有字段的自动定位与识别。
503
+
504
+ 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
505
+
506
+ 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
507
+
508
+ 另外,本接口还支持复印件、翻拍告警功能。
509
+
510
+ 默认接口请求频率限制:10次/秒。
511
+ */
512
+ async VehicleLicenseOCR(req, cb) {
513
+ return this.request("VehicleLicenseOCR", req, cb);
514
+ }
515
+ /**
516
+ * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
517
+
518
+ 默认接口请求频率限制:10次/秒。
519
+ */
520
+ async BizLicenseOCR(req, cb) {
521
+ return this.request("BizLicenseOCR", req, cb);
522
+ }
523
+ /**
524
+ * 智慧表单产品已下线,需要下线相关API
525
+
526
+ 支持查询智能表单录入任务的状态。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
527
+ */
528
+ async GetTaskState(req, cb) {
529
+ return this.request("GetTaskState", req, cb);
530
+ }
531
+ /**
532
+ * 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。
533
+ */
534
+ async RecognizeGeneralCardWarn(req, cb) {
535
+ return this.request("RecognizeGeneralCardWarn", req, cb);
536
+ }
537
+ /**
538
+ * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
539
+
540
+ 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
541
+
542
+ 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
543
+
544
+ 通用印刷体识别不同版本的差异如下:
545
+ <table style="width:715px">
546
+ <thead>
547
+ <tr>
548
+ <th style="width:150px"></th>
549
+ <th style="width:200px">【荐】通用印刷体识别</th>
550
+ <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
551
+ <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
552
+ </tr>
553
+ </thead>
554
+ <tbody>
555
+ <tr>
556
+ <td> 适用场景</td>
557
+ <td>适用于所有通用场景的印刷体识别</td>
558
+ <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
559
+ <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
560
+ </tr>
561
+ <tr>
562
+ <td>识别准确率</td>
563
+ <td>96%</td>
564
+ <td>99%</td>
565
+ <td>91%</td>
566
+ </tr>
567
+ <tr>
568
+ <td>价格</td>
569
+ <td>中</td>
570
+ <td>高</td>
571
+ <td>低</td>
572
+ </tr>
573
+ <tr>
574
+ <td>支持的语言</td>
575
+ <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
576
+ <td>中文、英文、中英文</td>
577
+ <td>中文、英文、中英文</td>
578
+ </tr>
579
+ <tr>
580
+ <td>自动语言检测</td>
581
+ <td>支持</td>
582
+ <td>支持</td>
583
+ <td>支持</td>
584
+ </tr>
585
+ <tr>
586
+ <td>返回文本行坐标</td>
587
+ <td>支持</td>
588
+ <td>支持</td>
589
+ <td>支持</td>
590
+ </tr>
591
+ <tr>
592
+ <td>自动旋转纠正</td>
593
+ <td>支持旋转识别,返回角度信息</td>
594
+ <td>支持旋转识别,返回角度信息</td>
595
+ <td>支持旋转识别,返回角度信息</td>
596
+ </tr>
597
+ </tbody>
598
+ </table>
599
+
600
+ 默认接口请求频率限制:20次/秒。
601
+ */
602
+ async GeneralBasicOCR(req, cb) {
603
+ return this.request("GeneralBasicOCR", req, cb);
604
+ }
605
+ /**
606
+ * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
607
+
608
+ 默认接口请求频率限制:5次/秒。
609
+ */
610
+ async MixedInvoiceOCR(req, cb) {
611
+ return this.request("MixedInvoiceOCR", req, cb);
612
+ }
613
+ /**
614
+ * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
615
+
616
+ 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
617
+
618
+ 默认接口请求频率限制:10次/秒。
619
+ */
620
+ async TableOCR(req, cb) {
621
+ return this.request("TableOCR", req, cb);
622
+ }
623
+ /**
624
+ * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
625
+
626
+ 默认接口请求频率限制:10次/秒。
627
+ */
628
+ async ArithmeticOCR(req, cb) {
629
+ return this.request("ArithmeticOCR", req, cb);
630
+ }
631
+ /**
632
+ * 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
633
+
634
+ 默认接口请求频率限制:5次/秒。
635
+ */
636
+ async EstateCertOCR(req, cb) {
637
+ return this.request("EstateCertOCR", req, cb);
638
+ }
639
+ /**
640
+ * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
641
+
642
+ 默认接口请求频率限制:20次/秒。
643
+ */
644
+ async RecognizeValidIDCardOCR(req, cb) {
645
+ return this.request("RecognizeValidIDCardOCR", req, cb);
646
+ }
647
+ /**
648
+ * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
649
+
650
+ 默认接口请求频率限制:10次/秒。
651
+ */
652
+ async BankCardOCR(req, cb) {
653
+ return this.request("BankCardOCR", req, cb);
654
+ }
655
+ /**
656
+ * 已上线VatInvoiceVerifyNew,VatInvoiceVerify需要下线,产品在官网已发通告
657
+
658
+ 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。
659
+
660
+ 默认接口请求频率限制:20次/秒。
661
+ */
662
+ async VatInvoiceVerify(req, cb) {
663
+ return this.request("VatInvoiceVerify", req, cb);
664
+ }
665
+ /**
666
+ * 获取ocr的token值
667
+ */
668
+ async GetOCRToken(req, cb) {
669
+ return this.request("GetOCRToken", req, cb);
670
+ }
671
+ /**
672
+ * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
673
+
674
+ 默认接口请求频率限制:5次/秒。
675
+ */
676
+ async EduPaperOCR(req, cb) {
677
+ return this.request("EduPaperOCR", req, cb);
678
+ }
679
+ /**
680
+ * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
681
+
682
+ 默认接口请求频率限制:5次/秒。
683
+ */
684
+ async EnterpriseLicenseOCR(req, cb) {
685
+ return this.request("EnterpriseLicenseOCR", req, cb);
686
+ }
687
+ /**
688
+ * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
689
+
690
+ 默认接口请求频率限制:10次/秒。
691
+ */
692
+ async BusinessCardOCR(req, cb) {
693
+ return this.request("BusinessCardOCR", req, cb);
694
+ }
695
+ /**
696
+ * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
697
+
698
+ 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
699
+
700
+ <table style="width:650px">
701
+ <thead>
702
+ <tr>
703
+ <th width="150">扩展能力</th>
704
+ <th width="500">能力项</th>
705
+ </tr>
706
+ </thead>
707
+ <tbody>
708
+ <tr>
709
+ <td rowspan="2">裁剪功能</td>
710
+ <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
711
+ </tr>
712
+ <tr>
713
+ <td>人像照片裁剪(自动抠取身份证头像区域)</td>
714
+ </tr>
715
+ <tr>
716
+ <td rowspan="9">告警功能</td>
717
+ <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
718
+
719
+ </td>
720
+ </tr>
721
+ <tr>
722
+ <td>身份证边框不完整告警</td>
723
+ </tr>
724
+ <tr>
725
+ <td>身份证复印件告警</td>
726
+ </tr>
727
+ <tr>
728
+ <td>身份证翻拍告警</td>
729
+ </tr>
730
+ <tr>
731
+ <td>身份证框内遮挡告警</td>
732
+ </tr>
733
+ <tr>
734
+ <td>临时身份证告警</td>
735
+ </tr>
736
+ <tr>
737
+ <td>身份证疑似存在PS痕迹告警</td>
738
+ </tr>
739
+ <tr>
740
+ <td>图片模糊告警(可根据图片质量分数判断)</td>
741
+ </tr>
742
+ </tbody>
743
+ </table>
744
+
745
+ 默认接口请求频率限制:20次/秒。
746
+ */
747
+ async IDCardOCR(req, cb) {
748
+ return this.request("IDCardOCR", req, cb);
749
+ }
750
+ /**
751
+ * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
752
+ */
753
+ async RecognizeGeneralTextImageWarn(req, cb) {
754
+ return this.request("RecognizeGeneralTextImageWarn", req, cb);
755
+ }
756
+ /**
757
+ * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
758
+
759
+ 默认接口请求频率限制:5次/秒。
760
+ */
761
+ async InstitutionOCR(req, cb) {
762
+ return this.request("InstitutionOCR", req, cb);
763
+ }
764
+ /**
765
+ * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
766
+
767
+ 默认接口请求频率限制:5次/秒。
768
+ */
769
+ async SmartStructuralOCRV2(req, cb) {
770
+ return this.request("SmartStructuralOCRV2", req, cb);
771
+ }
772
+ /**
773
+ * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
774
+
775
+ 默认接口请求频率限制:2次/秒。
776
+ */
777
+ async RecognizeTableAccurateOCR(req, cb) {
778
+ return this.request("RecognizeTableAccurateOCR", req, cb);
779
+ }
780
+ /**
781
+ * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
782
+ 默认接口请求频率限制:5次/秒。
783
+ */
784
+ async MixedInvoiceDetect(req, cb) {
785
+ return this.request("MixedInvoiceDetect", req, cb);
786
+ }
787
+ /**
788
+ * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
789
+
790
+ 默认接口请求频率限制:5次/秒。
791
+ */
792
+ async VatRollInvoiceOCR(req, cb) {
793
+ return this.request("VatRollInvoiceOCR", req, cb);
794
+ }
795
+ /**
796
+ * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
797
+
798
+ 默认接口请求频率限制:5次/秒。
799
+ */
800
+ async QuotaInvoiceOCR(req, cb) {
801
+ return this.request("QuotaInvoiceOCR", req, cb);
802
+ }
803
+ /**
804
+ * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
805
+
806
+ 默认接口请求频率限制:10次/秒。
807
+ */
808
+ async GeneralHandwritingOCR(req, cb) {
809
+ return this.request("GeneralHandwritingOCR", req, cb);
810
+ }
811
+ /**
812
+ * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
813
+
814
+ 默认接口请求频率限制:20次/秒。
815
+ */
816
+ async RecognizeOnlineTaxiItineraryOCR(req, cb) {
817
+ return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb);
818
+ }
819
+ /**
820
+ * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
821
+
822
+ 默认接口请求频率限制:10次/秒。
823
+ */
824
+ async RecognizeTableOCR(req, cb) {
825
+ return this.request("RecognizeTableOCR", req, cb);
826
+ }
827
+ /**
828
+ * 智慧表单产品已下线,需要下线相关API
829
+
830
+ 本接口可创建智能表单录入任务,支持多个识别图片和PDF的URL上传,返回含有识别内容的操作页面URL。
831
+
832
+ 智能表单录入产品提供高准确率的表单识别技术和人工核对工具,支持自定义字段,将识别结果自动填入到自定义条目中,并提供人工操作工具,完成整个表单识别过程。适用性强,可对票据、合同、货单等文件的识别,适用于金融、货代、保险、档案等领域。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
833
+ */
834
+ async CreateAIFormTask(req, cb) {
835
+ return this.request("CreateAIFormTask", req, cb);
836
+ }
837
+ /**
838
+ * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
839
+
840
+ 默认接口请求频率限制:10次/秒。
841
+ */
842
+ async WaybillOCR(req, cb) {
843
+ return this.request("WaybillOCR", req, cb);
844
+ }
845
+ /**
846
+ * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
847
+
848
+ 默认接口请求频率限制:20次/秒。
849
+ */
850
+ async HmtResidentPermitOCR(req, cb) {
851
+ return this.request("HmtResidentPermitOCR", req, cb);
852
+ }
853
+ /**
854
+ * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
855
+
856
+ 默认接口请求频率限制:5次/秒。
857
+ */
858
+ async TollInvoiceOCR(req, cb) {
859
+ return this.request("TollInvoiceOCR", req, cb);
860
+ }
861
+ /**
862
+ * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
863
+
864
+ 默认接口请求频率限制:20次/秒。
865
+ */
866
+ async ClassifyDetectOCR(req, cb) {
867
+ return this.request("ClassifyDetectOCR", req, cb);
868
+ }
869
+ /**
870
+ * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
871
+
872
+ 默认接口请求频率限制:5次/秒。
873
+ */
874
+ async SealOCR(req, cb) {
875
+ return this.request("SealOCR", req, cb);
876
+ }
877
+ /**
878
+ * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
879
+
880
+ 默认接口请求频率限制:10次/秒。
881
+ */
882
+ async BankSlipOCR(req, cb) {
883
+ return this.request("BankSlipOCR", req, cb);
884
+ }
885
+ /**
886
+ * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
887
+
888
+ 默认接口请求频率限制:5次/秒。
889
+ */
890
+ async ResidenceBookletOCR(req, cb) {
891
+ return this.request("ResidenceBookletOCR", req, cb);
892
+ }
893
+ /**
894
+ * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
895
+
896
+ 默认接口请求频率限制:20次/秒。
897
+ */
898
+ async RecognizeTravelCardOCR(req, cb) {
899
+ return this.request("RecognizeTravelCardOCR", req, cb);
900
+ }
901
+ /**
902
+ * 本接口支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
903
+ */
904
+ async VerifyOfdVatInvoiceOCR(req, cb) {
905
+ return this.request("VerifyOfdVatInvoiceOCR", req, cb);
906
+ }
907
+ /**
908
+ * 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
909
+
910
+ 驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
911
+
912
+ 驾驶证副页:包括证号、姓名、档案编号、记录。
913
+
914
+ 另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
915
+
916
+ 电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
917
+
918
+ 默认接口请求频率限制:10次/秒。
919
+ */
920
+ async DriverLicenseOCR(req, cb) {
921
+ return this.request("DriverLicenseOCR", req, cb);
922
+ }
923
+ /**
924
+ * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
925
+
926
+ 默认接口请求频率限制:5次/秒。
927
+ */
928
+ async FinanBillOCR(req, cb) {
929
+ return this.request("FinanBillOCR", req, cb);
930
+ }
931
+ /**
932
+ * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
933
+
934
+ 默认接口请求频率限制:5次/秒。
935
+ */
936
+ async SmartStructuralPro(req, cb) {
937
+ return this.request("SmartStructuralPro", req, cb);
938
+ }
939
+ /**
940
+ * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
941
+
942
+ 默认接口请求频率限制:10次/秒。
943
+ */
944
+ async RecognizeHealthCodeOCR(req, cb) {
945
+ return this.request("RecognizeHealthCodeOCR", req, cb);
946
+ }
947
+ /**
948
+ * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
949
+
950
+ 默认接口请求频率限制:10次/秒。
951
+ */
952
+ async ImageEnhancement(req, cb) {
953
+ return this.request("ImageEnhancement", req, cb);
954
+ }
955
+ /**
956
+ * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
957
+ 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
958
+ */
959
+ async MLIDCardOCR(req, cb) {
960
+ return this.request("MLIDCardOCR", req, cb);
961
+ }
962
+ /**
963
+ * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
964
+
965
+ 默认接口请求频率限制:5次/秒。
966
+ */
967
+ async RecognizeMedicalInvoiceOCR(req, cb) {
968
+ return this.request("RecognizeMedicalInvoiceOCR", req, cb);
969
+ }
970
+ /**
971
+ * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
972
+
973
+ 默认接口请求频率限制:10次/秒。
974
+ */
975
+ async GeneralFastOCR(req, cb) {
976
+ return this.request("GeneralFastOCR", req, cb);
977
+ }
978
+ /**
979
+ * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
980
+
981
+ 默认接口请求频率限制:10次/秒。
982
+ */
983
+ async VatInvoiceOCR(req, cb) {
984
+ return this.request("VatInvoiceOCR", req, cb);
985
+ }
986
+ /**
987
+ * 外国人永久居留身份证识别
988
+ */
989
+ async RecognizeForeignPermanentResidentIdCard(req, cb) {
990
+ return this.request("RecognizeForeignPermanentResidentIdCard", req, cb);
991
+ }
992
+ /**
993
+ * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
994
+
995
+ 默认接口请求频率限制:5次/秒。
996
+ */
997
+ async OrgCodeCertOCR(req, cb) {
998
+ return this.request("OrgCodeCertOCR", req, cb);
999
+ }
1000
+ /**
1001
+ * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
1002
+
1003
+ 默认接口请求频率限制:5次/秒。
1004
+ */
1005
+ async FinanBillSliceOCR(req, cb) {
1006
+ return this.request("FinanBillSliceOCR", req, cb);
1007
+ }
1008
+ /**
1009
+ * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
1010
+
1011
+ 默认接口请求频率限制:10次/秒。
1012
+ */
1013
+ async LicensePlateOCR(req, cb) {
1014
+ return this.request("LicensePlateOCR", req, cb);
1015
+ }
1016
+ /**
1017
+ * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
1018
+
1019
+ 适用于快速文本识别场景。
1020
+
1021
+ 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
1022
+
1023
+ 通用印刷体识别不同版本的差异如下:
1024
+ <table style="width:715px">
1025
+ <thead>
1026
+ <tr>
1027
+ <th style="width:150px"></th>
1028
+ <th >通用印刷体识别(精简版)</th>
1029
+ <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
1030
+ <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
1031
+ </tr>
1032
+ </thead>
1033
+ <tbody>
1034
+ <tr>
1035
+ <td> 适用场景</td>
1036
+ <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
1037
+ <td>适用于所有通用场景的印刷体识别</td>
1038
+ <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
1039
+ </tr>
1040
+ <tr>
1041
+ <td>识别准确率</td>
1042
+ <td>91%</td>
1043
+ <td>96%</td>
1044
+ <td>99%</td>
1045
+ </tr>
1046
+ <tr>
1047
+ <td>价格</td>
1048
+ <td>低</td>
1049
+ <td>中</td>
1050
+ <td>高</td>
1051
+ </tr>
1052
+ <tr>
1053
+ <td>支持的语言</td>
1054
+ <td>中文、英文、中英文</td>
1055
+ <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
1056
+ <td>中文、英文、中英文</td>
1057
+ </tr>
1058
+ <tr>
1059
+ <td>自动语言检测</td>
1060
+ <td>支持</td>
1061
+ <td>支持</td>
1062
+ <td>支持</td>
1063
+ </tr>
1064
+ <tr>
1065
+ <td>返回文本行坐标</td>
1066
+ <td>支持</td>
1067
+ <td>支持</td>
1068
+ <td>支持</td>
1069
+ </tr>
1070
+ <tr>
1071
+ <td>自动旋转纠正</td>
1072
+ <td>支持旋转识别,返回角度信息</td>
1073
+ <td>支持旋转识别,返回角度信息</td>
1074
+ <td>支持旋转识别,返回角度信息</td>
1075
+ </tr>
1076
+ </tbody>
1077
+ </table>
1078
+
1079
+ 默认接口请求频率限制:10次/秒。
1080
+ */
1081
+ async GeneralEfficientOCR(req, cb) {
1082
+ return this.request("GeneralEfficientOCR", req, cb);
1083
+ }
1084
+ /**
1085
+ * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
1086
+
1087
+ 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
1088
+
1089
+ 默认接口请求频率限制:20次/秒。
1090
+ */
1091
+ async AdvertiseOCR(req, cb) {
1092
+ return this.request("AdvertiseOCR", req, cb);
1093
+ }
1094
+ /**
1095
+ * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
1096
+
1097
+ 默认接口请求频率限制:5次/秒。
1098
+ */
1099
+ async VehicleRegCertOCR(req, cb) {
1100
+ return this.request("VehicleRegCertOCR", req, cb);
1101
+ }
1102
+ /**
1103
+ * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
1104
+
1105
+ 默认接口请求频率限制:5次/秒。
1106
+ */
1107
+ async CarInvoiceOCR(req, cb) {
1108
+ return this.request("CarInvoiceOCR", req, cb);
1109
+ }
1110
+ /**
1111
+ * 获取ocr结果
1112
+ */
1113
+ async GetOCRResult(req, cb) {
1114
+ return this.request("GetOCRResult", req, cb);
1115
+ }
1116
+ /**
1117
+ * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
1118
+
1119
+ 默认接口请求频率限制:5次/秒。
1120
+ */
1121
+ async FormulaOCR(req, cb) {
1122
+ return this.request("FormulaOCR", req, cb);
1123
+ }
1124
+ /**
1125
+ * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
1126
+
1127
+ 默认接口请求频率限制:10次/秒。
1128
+ */
1129
+ async PassportOCR(req, cb) {
1130
+ return this.request("PassportOCR", req, cb);
1131
+ }
1132
+ /**
1133
+ * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
1134
+
1135
+ 默认接口请求频率限制:5次/秒。
1136
+ */
1137
+ async ShipInvoiceOCR(req, cb) {
1138
+ return this.request("ShipInvoiceOCR", req, cb);
1139
+ }
1140
+ /**
1141
+ * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
1142
+
1143
+ 默认接口请求频率限制:5次/秒。
1144
+ */
1145
+ async RideHailingTransportLicenseOCR(req, cb) {
1146
+ return this.request("RideHailingTransportLicenseOCR", req, cb);
1141
1147
  }
1142
1148
  }
1143
1149
  exports.Client = Client;