tencentcloud-sdk-nodejs-ocr 4.0.1015 → 4.0.1019

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,5 +1,5 @@
1
1
  import * as TencentCloudCommon from "tencentcloud-sdk-nodejs-common";
2
- import { RecognizeOnlineTaxiItineraryOCRResponse, HKIDCardOCRRequest, BankSlipOCRRequest, BusinessCardOCRResponse, BankCardOCRRequest, CarInvoiceOCRRequest, RecognizeTravelCardOCRRequest, TrainTicketOCRRequest, EstateCertOCRResponse, FlightInvoiceOCRRequest, MLIDPassportOCRRequest, RecognizeGeneralTextImageWarnResponse, SmartStructuralOCRV2Request, TextDetectResponse, TollInvoiceOCRResponse, GetOCRTokenResponse, FinanBillSliceOCRResponse, DriverLicenseOCRResponse, WaybillOCRResponse, CreateAIFormTaskRequest, ClassifyStoreNameRequest, InvoiceGeneralOCRRequest, HmtResidentPermitOCRResponse, EnterpriseLicenseOCRResponse, InstitutionOCRResponse, DriverLicenseOCRRequest, SmartStructuralProRequest, RecognizeTableOCRResponse, QrcodeOCRResponse, MainlandPermitOCRRequest, SmartStructuralOCRV2Response, EnterpriseLicenseOCRRequest, SmartStructuralOCRRequest, RecognizeStoreNameRequest, PropOwnerCertOCRResponse, TrainTicketOCRResponse, SmartStructuralOCRResponse, ArithmeticOCRResponse, FormulaOCRResponse, GeneralHandwritingOCRRequest, BizLicenseOCRRequest, MixedInvoiceDetectResponse, RideHailingDriverLicenseOCRRequest, GeneralAccurateOCRResponse, QrcodeOCRRequest, TaxiInvoiceOCRResponse, RecognizeGeneralInvoiceRequest, GeneralBasicOCRResponse, RecognizeMedicalInvoiceOCRResponse, RecognizeValidIDCardOCRRequest, MixedInvoiceOCRResponse, ClassifyDetectOCRResponse, VinOCRRequest, VehicleLicenseOCRResponse, VatInvoiceOCRRequest, ClassifyDetectOCRRequest, DutyPaidProofOCRResponse, TollInvoiceOCRRequest, LicensePlateOCRResponse, HKIDCardOCRResponse, RecognizeThaiIDCardOCRResponse, PermitOCRRequest, InvoiceGeneralOCRResponse, VatInvoiceVerifyNewResponse, TaxiInvoiceOCRRequest, RecognizeContainerOCRRequest, TextDetectRequest, VatRollInvoiceOCRResponse, VatInvoiceVerifyRequest, EduPaperOCRResponse, RecognizeThaiIDCardOCRRequest, PropOwnerCertOCRRequest, ImageEnhancementResponse, PassportOCRResponse, VehicleRegCertOCRRequest, RecognizeTravelCardOCRResponse, LicensePlateOCRRequest, GeneralBasicOCRRequest, ReconstructDocumentResponse, GeneralEfficientOCRRequest, AdvertiseOCRRequest, RideHailingDriverLicenseOCRResponse, ImageEnhancementRequest, EnglishOCRRequest, VatInvoiceVerifyResponse, RecognizeValidIDCardOCRResponse, IDCardOCRResponse, GeneralAccurateOCRRequest, OrgCodeCertOCRRequest, FlightInvoiceOCRResponse, ShipInvoiceOCRResponse, ReconstructDocumentRequest, VatInvoiceVerifyNewRequest, InstitutionOCRRequest, ArithmeticOCRRequest, VerifyOfdVatInvoiceOCRRequest, FinanBillSliceOCRRequest, ClassifyStoreNameResponse, VatRollInvoiceOCRRequest, RecognizeTableAccurateOCRRequest, SealOCRResponse, FinanBillOCRResponse, RecognizeHealthCodeOCRRequest, BankSlipOCRResponse, RecognizeEncryptedIDCardOCRResponse, VinOCRResponse, EduPaperOCRRequest, FormulaOCRRequest, PassportOCRRequest, DutyPaidProofOCRRequest, RecognizeHealthCodeOCRResponse, RecognizeEncryptedIDCardOCRRequest, CreateAIFormTaskResponse, MixedInvoiceOCRRequest, ResidenceBookletOCRResponse, CarInvoiceOCRResponse, VehicleRegCertOCRResponse, GeneralFastOCRRequest, RecognizeGeneralInvoiceResponse, GetTaskStateResponse, GetTaskStateRequest, RecognizeMedicalInvoiceOCRRequest, InsuranceBillOCRResponse, GeneralEfficientOCRResponse, ShipInvoiceOCRRequest, MLIDPassportOCRResponse, SealOCRRequest, VerifyOfdVatInvoiceOCRResponse, HmtResidentPermitOCRRequest, RecognizeTableAccurateOCRResponse, ResidenceBookletOCRRequest, GetOCRResultRequest, BusInvoiceOCRResponse, GetOCRResultResponse, MainlandPermitOCRResponse, MLIDCardOCRRequest, EnglishOCRResponse, RecognizeForeignPermanentResidentIdCardResponse, BusInvoiceOCRRequest, OrgCodeCertOCRResponse, RideHailingTransportLicenseOCRResponse, RecognizeContainerOCRResponse, SmartStructuralProResponse, PermitOCRResponse, InsuranceBillOCRRequest, GeneralHandwritingOCRResponse, TableOCRResponse, AdvertiseOCRResponse, VehicleLicenseOCRRequest, RecognizeOnlineTaxiItineraryOCRRequest, IDCardOCRRequest, MixedInvoiceDetectRequest, WaybillOCRRequest, RecognizeStoreNameResponse, GetOCRTokenRequest, RideHailingTransportLicenseOCRRequest, MLIDCardOCRResponse, RecognizeTableOCRRequest, EstateCertOCRRequest, BizLicenseOCRResponse, TableOCRRequest, VatInvoiceOCRResponse, QuotaInvoiceOCRRequest, BankCardOCRResponse, BusinessCardOCRRequest, FinanBillOCRRequest, QuotaInvoiceOCRResponse, RecognizeGeneralTextImageWarnRequest, RecognizeForeignPermanentResidentIdCardRequest, GeneralFastOCRResponse } from "./ocr_models";
2
+ import { RecognizeOnlineTaxiItineraryOCRResponse, HKIDCardOCRRequest, BankSlipOCRRequest, BusinessCardOCRResponse, BankCardOCRRequest, CarInvoiceOCRRequest, RecognizeTravelCardOCRRequest, TrainTicketOCRRequest, EstateCertOCRResponse, FlightInvoiceOCRRequest, MLIDPassportOCRRequest, RecognizeGeneralTextImageWarnResponse, SmartStructuralOCRV2Request, TextDetectResponse, TollInvoiceOCRResponse, GetOCRTokenResponse, FinanBillSliceOCRResponse, DriverLicenseOCRResponse, WaybillOCRResponse, CreateAIFormTaskRequest, ClassifyStoreNameRequest, InvoiceGeneralOCRRequest, HmtResidentPermitOCRResponse, EnterpriseLicenseOCRResponse, InstitutionOCRResponse, DriverLicenseOCRRequest, SmartStructuralProRequest, RecognizeTableOCRResponse, QrcodeOCRResponse, MainlandPermitOCRRequest, SmartStructuralOCRV2Response, EnterpriseLicenseOCRRequest, SmartStructuralOCRRequest, RecognizeStoreNameRequest, PropOwnerCertOCRResponse, TrainTicketOCRResponse, SmartStructuralOCRResponse, ArithmeticOCRResponse, FormulaOCRResponse, RecognizeGeneralCardWarnRequest, RecognizeEncryptedIDCardOCRRequest, GeneralHandwritingOCRRequest, BizLicenseOCRRequest, MixedInvoiceDetectResponse, RideHailingDriverLicenseOCRRequest, GeneralAccurateOCRResponse, QrcodeOCRRequest, TaxiInvoiceOCRResponse, RecognizeGeneralInvoiceRequest, GeneralBasicOCRResponse, RecognizeMedicalInvoiceOCRResponse, RecognizeValidIDCardOCRRequest, MixedInvoiceOCRResponse, ClassifyDetectOCRResponse, VinOCRRequest, VehicleLicenseOCRResponse, VatInvoiceOCRRequest, ClassifyDetectOCRRequest, DutyPaidProofOCRResponse, TollInvoiceOCRRequest, LicensePlateOCRResponse, HKIDCardOCRResponse, RecognizeThaiIDCardOCRResponse, PermitOCRRequest, InvoiceGeneralOCRResponse, VatInvoiceVerifyNewResponse, TaxiInvoiceOCRRequest, RecognizeContainerOCRRequest, TextDetectRequest, VatRollInvoiceOCRResponse, VatInvoiceVerifyRequest, EduPaperOCRResponse, RecognizeThaiIDCardOCRRequest, PropOwnerCertOCRRequest, ImageEnhancementResponse, PassportOCRResponse, VehicleRegCertOCRRequest, RecognizeTravelCardOCRResponse, LicensePlateOCRRequest, GeneralBasicOCRRequest, ReconstructDocumentResponse, GeneralEfficientOCRRequest, AdvertiseOCRRequest, RideHailingDriverLicenseOCRResponse, ImageEnhancementRequest, EnglishOCRRequest, VatInvoiceVerifyResponse, RecognizeValidIDCardOCRResponse, IDCardOCRResponse, GeneralAccurateOCRRequest, OrgCodeCertOCRRequest, FlightInvoiceOCRResponse, ShipInvoiceOCRResponse, ReconstructDocumentRequest, VatInvoiceVerifyNewRequest, InstitutionOCRRequest, ArithmeticOCRRequest, VerifyOfdVatInvoiceOCRRequest, FinanBillSliceOCRRequest, RecognizeGeneralCardWarnResponse, ClassifyStoreNameResponse, VatRollInvoiceOCRRequest, RecognizeTableAccurateOCRRequest, SealOCRResponse, FinanBillOCRResponse, RecognizeHealthCodeOCRRequest, BankSlipOCRResponse, RecognizeEncryptedIDCardOCRResponse, VinOCRResponse, EduPaperOCRRequest, FormulaOCRRequest, PassportOCRRequest, DutyPaidProofOCRRequest, RecognizeHealthCodeOCRResponse, CreateAIFormTaskResponse, MixedInvoiceOCRRequest, ResidenceBookletOCRResponse, CarInvoiceOCRResponse, VehicleRegCertOCRResponse, GeneralFastOCRRequest, RecognizeGeneralInvoiceResponse, GetTaskStateResponse, GetTaskStateRequest, RecognizeMedicalInvoiceOCRRequest, InsuranceBillOCRResponse, GeneralEfficientOCRResponse, ShipInvoiceOCRRequest, MLIDPassportOCRResponse, SealOCRRequest, VerifyOfdVatInvoiceOCRResponse, HmtResidentPermitOCRRequest, RecognizeTableAccurateOCRResponse, ResidenceBookletOCRRequest, GetOCRResultRequest, BusInvoiceOCRResponse, GetOCRResultResponse, MainlandPermitOCRResponse, MLIDCardOCRRequest, EnglishOCRResponse, RecognizeForeignPermanentResidentIdCardResponse, BusInvoiceOCRRequest, OrgCodeCertOCRResponse, RideHailingTransportLicenseOCRResponse, RecognizeContainerOCRResponse, SmartStructuralProResponse, PermitOCRResponse, InsuranceBillOCRRequest, GeneralHandwritingOCRResponse, TableOCRResponse, AdvertiseOCRResponse, VehicleLicenseOCRRequest, RecognizeOnlineTaxiItineraryOCRRequest, IDCardOCRRequest, MixedInvoiceDetectRequest, WaybillOCRRequest, RecognizeStoreNameResponse, GetOCRTokenRequest, RideHailingTransportLicenseOCRRequest, MLIDCardOCRResponse, RecognizeTableOCRRequest, EstateCertOCRRequest, BizLicenseOCRResponse, TableOCRRequest, VatInvoiceOCRResponse, QuotaInvoiceOCRRequest, BankCardOCRResponse, BusinessCardOCRRequest, FinanBillOCRRequest, QuotaInvoiceOCRResponse, RecognizeGeneralTextImageWarnRequest, RecognizeForeignPermanentResidentIdCardRequest, GeneralFastOCRResponse } from "./ocr_models";
3
3
  /**
4
4
  * ocr client
5
5
  * @class
@@ -7,177 +7,11 @@ import { RecognizeOnlineTaxiItineraryOCRResponse, HKIDCardOCRRequest, BankSlipOC
7
7
  export declare class Client extends TencentCloudCommon.AbstractClient {
8
8
  constructor(clientConfig: TencentCloudCommon.ClientConfig);
9
9
  /**
10
- * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
11
-
12
- 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
13
-
14
- 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
15
-
16
- 通用印刷体识别不同版本的差异如下:
17
- <table style="width:715px">
18
- <thead>
19
- <tr>
20
- <th style="width:150px"></th>
21
- <th style="width:200px">【荐】通用印刷体识别</th>
22
- <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
23
- <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
24
- </tr>
25
- </thead>
26
- <tbody>
27
- <tr>
28
- <td> 适用场景</td>
29
- <td>适用于所有通用场景的印刷体识别</td>
30
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
31
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
32
- </tr>
33
- <tr>
34
- <td>识别准确率</td>
35
- <td>96%</td>
36
- <td>99%</td>
37
- <td>91%</td>
38
- </tr>
39
- <tr>
40
- <td>价格</td>
41
- <td>中</td>
42
- <td>高</td>
43
- <td>低</td>
44
- </tr>
45
- <tr>
46
- <td>支持的语言</td>
47
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
48
- <td>中文、英文、中英文</td>
49
- <td>中文、英文、中英文</td>
50
- </tr>
51
- <tr>
52
- <td>自动语言检测</td>
53
- <td>支持</td>
54
- <td>支持</td>
55
- <td>支持</td>
56
- </tr>
57
- <tr>
58
- <td>返回文本行坐标</td>
59
- <td>支持</td>
60
- <td>支持</td>
61
- <td>支持</td>
62
- </tr>
63
- <tr>
64
- <td>自动旋转纠正</td>
65
- <td>支持旋转识别,返回角度信息</td>
66
- <td>支持旋转识别,返回角度信息</td>
67
- <td>支持旋转识别,返回角度信息</td>
68
- </tr>
69
- </tbody>
70
- </table>
71
-
72
- 默认接口请求频率限制:20次/秒。
73
- */
74
- GeneralBasicOCR(req: GeneralBasicOCRRequest, cb?: (error: string, rep: GeneralBasicOCRResponse) => void): Promise<GeneralBasicOCRResponse>;
75
- /**
76
- * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
77
-
78
- 默认接口请求频率限制:10次/秒。
79
- */
80
- ImageEnhancement(req: ImageEnhancementRequest, cb?: (error: string, rep: ImageEnhancementResponse) => void): Promise<ImageEnhancementResponse>;
81
- /**
82
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
83
-
84
- 默认接口请求频率限制:5次/秒。
85
- */
86
- SmartStructuralOCRV2(req: SmartStructuralOCRV2Request, cb?: (error: string, rep: SmartStructuralOCRV2Response) => void): Promise<SmartStructuralOCRV2Response>;
87
- /**
88
- * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
89
-
90
- 默认接口请求频率限制:5次/秒。
91
- */
92
- EnterpriseLicenseOCR(req: EnterpriseLicenseOCRRequest, cb?: (error: string, rep: EnterpriseLicenseOCRResponse) => void): Promise<EnterpriseLicenseOCRResponse>;
93
- /**
94
- * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
95
-
96
- 默认接口请求频率限制:10次/秒。
97
- */
98
- BusinessCardOCR(req: BusinessCardOCRRequest, cb?: (error: string, rep: BusinessCardOCRResponse) => void): Promise<BusinessCardOCRResponse>;
99
- /**
100
- * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
101
-
102
- 默认接口请求频率限制:1次/秒。
103
- */
104
- InsuranceBillOCR(req: InsuranceBillOCRRequest, cb?: (error: string, rep: InsuranceBillOCRResponse) => void): Promise<InsuranceBillOCRResponse>;
105
- /**
106
- * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
107
-
108
- 默认接口请求频率限制:20次/秒。
109
- */
110
- RecognizeOnlineTaxiItineraryOCR(req: RecognizeOnlineTaxiItineraryOCRRequest, cb?: (error: string, rep: RecognizeOnlineTaxiItineraryOCRResponse) => void): Promise<RecognizeOnlineTaxiItineraryOCRResponse>;
111
- /**
112
- * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
113
-
114
- 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
115
-
116
- <table style="width:650px">
117
- <thead>
118
- <tr>
119
- <th width="150">扩展能力</th>
120
- <th width="500">能力项</th>
121
- </tr>
122
- </thead>
123
- <tbody>
124
- <tr>
125
- <td rowspan="2">裁剪功能</td>
126
- <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
127
- </tr>
128
- <tr>
129
- <td>人像照片裁剪(自动抠取身份证头像区域)</td>
130
- </tr>
131
- <tr>
132
- <td rowspan="9">告警功能</td>
133
- <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
134
-
135
- </td>
136
- </tr>
137
- <tr>
138
- <td>身份证边框不完整告警</td>
139
- </tr>
140
- <tr>
141
- <td>身份证复印件告警</td>
142
- </tr>
143
- <tr>
144
- <td>身份证翻拍告警</td>
145
- </tr>
146
- <tr>
147
- <td>身份证框内遮挡告警</td>
148
- </tr>
149
- <tr>
150
- <td>临时身份证告警</td>
151
- </tr>
152
- <tr>
153
- <td>身份证疑似存在PS痕迹告警</td>
154
- </tr>
155
- <tr>
156
- <td>图片模糊告警(可根据图片质量分数判断)</td>
157
- </tr>
158
- </tbody>
159
- </table>
160
-
161
- 默认接口请求频率限制:20次/秒。
162
- */
163
- IDCardOCR(req: IDCardOCRRequest, cb?: (error: string, rep: IDCardOCRResponse) => void): Promise<IDCardOCRResponse>;
164
- /**
165
- * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
10
+ * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
166
11
 
167
12
  默认接口请求频率限制:5次/秒。
168
13
  */
169
- TollInvoiceOCR(req: TollInvoiceOCRRequest, cb?: (error: string, rep: TollInvoiceOCRResponse) => void): Promise<TollInvoiceOCRResponse>;
170
- /**
171
- * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
172
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
173
- */
174
- MLIDCardOCR(req: MLIDCardOCRRequest, cb?: (error: string, rep: MLIDCardOCRResponse) => void): Promise<MLIDCardOCRResponse>;
175
- /**
176
- * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
177
-
178
- 默认接口请求频率限制:20次/秒。
179
- */
180
- VatInvoiceVerifyNew(req: VatInvoiceVerifyNewRequest, cb?: (error: string, rep: VatInvoiceVerifyNewResponse) => void): Promise<VatInvoiceVerifyNewResponse>;
14
+ TextDetect(req: TextDetectRequest, cb?: (error: string, rep: TextDetectResponse) => void): Promise<TextDetectResponse>;
181
15
  /**
182
16
  * 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。
183
17
 
@@ -255,12 +89,6 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
255
89
  默认接口请求频率限制:5次/秒。
256
90
  */
257
91
  RecognizeContainerOCR(req: RecognizeContainerOCRRequest, cb?: (error: string, rep: RecognizeContainerOCRResponse) => void): Promise<RecognizeContainerOCRResponse>;
258
- /**
259
- * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
260
-
261
- 默认接口请求频率限制:2次/秒。
262
- */
263
- RecognizeTableAccurateOCR(req: RecognizeTableAccurateOCRRequest, cb?: (error: string, rep: RecognizeTableAccurateOCRResponse) => void): Promise<RecognizeTableAccurateOCRResponse>;
264
92
  /**
265
93
  * 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。
266
94
 
@@ -316,23 +144,6 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
316
144
  默认接口请求频率限制:20次/秒。
317
145
  */
318
146
  RecognizeEncryptedIDCardOCR(req: RecognizeEncryptedIDCardOCRRequest, cb?: (error: string, rep: RecognizeEncryptedIDCardOCRResponse) => void): Promise<RecognizeEncryptedIDCardOCRResponse>;
319
- /**
320
- * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
321
- 默认接口请求频率限制:5次/秒。
322
- */
323
- MixedInvoiceDetect(req: MixedInvoiceDetectRequest, cb?: (error: string, rep: MixedInvoiceDetectResponse) => void): Promise<MixedInvoiceDetectResponse>;
324
- /**
325
- * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
326
-
327
- 默认接口请求频率限制:5次/秒。
328
- */
329
- VehicleRegCertOCR(req: VehicleRegCertOCRRequest, cb?: (error: string, rep: VehicleRegCertOCRResponse) => void): Promise<VehicleRegCertOCRResponse>;
330
- /**
331
- * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
332
-
333
- 默认接口请求频率限制:5次/秒。
334
- */
335
- ShipInvoiceOCR(req: ShipInvoiceOCRRequest, cb?: (error: string, rep: ShipInvoiceOCRResponse) => void): Promise<ShipInvoiceOCRResponse>;
336
147
  /**
337
148
  * 本接口用于识别门头照文字识别结果以及对应分类标签信息
338
149
  默认接口请求频率限制:1次/秒
@@ -346,71 +157,63 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
346
157
  */
347
158
  MLIDPassportOCR(req: MLIDPassportOCRRequest, cb?: (error: string, rep: MLIDPassportOCRResponse) => void): Promise<MLIDPassportOCRResponse>;
348
159
  /**
349
- * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
160
+ * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
350
161
 
351
162
  默认接口请求频率限制:5次/秒。
352
163
  */
353
- VatRollInvoiceOCR(req: VatRollInvoiceOCRRequest, cb?: (error: string, rep: VatRollInvoiceOCRResponse) => void): Promise<VatRollInvoiceOCRResponse>;
164
+ TrainTicketOCR(req: TrainTicketOCRRequest, cb?: (error: string, rep: TrainTicketOCRResponse) => void): Promise<TrainTicketOCRResponse>;
354
165
  /**
355
- * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
166
+ * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
167
+ 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
356
168
 
357
169
  默认接口请求频率限制:5次/秒。
358
170
  */
359
- QuotaInvoiceOCR(req: QuotaInvoiceOCRRequest, cb?: (error: string, rep: QuotaInvoiceOCRResponse) => void): Promise<QuotaInvoiceOCRResponse>;
171
+ PropOwnerCertOCR(req: PropOwnerCertOCRRequest, cb?: (error: string, rep: PropOwnerCertOCRResponse) => void): Promise<PropOwnerCertOCRResponse>;
360
172
  /**
361
- * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
173
+ * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
362
174
 
363
- 默认接口请求频率限制:10次/秒。
175
+ 默认接口请求频率限制:5次/秒。
364
176
  */
365
- WaybillOCR(req: WaybillOCRRequest, cb?: (error: string, rep: WaybillOCRResponse) => void): Promise<WaybillOCRResponse>;
177
+ InvoiceGeneralOCR(req: InvoiceGeneralOCRRequest, cb?: (error: string, rep: InvoiceGeneralOCRResponse) => void): Promise<InvoiceGeneralOCRResponse>;
366
178
  /**
367
- * 本接口支持图片内车辆识别代号(VIN)的检测和识别。
368
- 默认接口请求频率限制:10次/秒。
369
- */
370
- VinOCR(req: VinOCRRequest, cb?: (error: string, rep: VinOCRResponse) => void): Promise<VinOCRResponse>;
179
+ * 服务已迁移至 [文档解析](https://cloud.tencent.com/document/product/1759/107504),请跳转查看接口文档。该接口支持将图片或PDF文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。
180
+ */
181
+ ReconstructDocument(req: ReconstructDocumentRequest, cb?: (error: string, rep: ReconstructDocumentResponse) => void): Promise<ReconstructDocumentResponse>;
371
182
  /**
372
- * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
183
+ * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
373
184
 
374
- 默认接口请求频率限制:10次/秒。
185
+ 默认接口请求频率限制:5次/秒。
375
186
  */
376
- GeneralFastOCR(req: GeneralFastOCRRequest, cb?: (error: string, rep: GeneralFastOCRResponse) => void): Promise<GeneralFastOCRResponse>;
187
+ HKIDCardOCR(req: HKIDCardOCRRequest, cb?: (error: string, rep: HKIDCardOCRResponse) => void): Promise<HKIDCardOCRResponse>;
377
188
  /**
378
- * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
379
- 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
189
+ * 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
380
190
 
381
- 默认接口请求频率限制:5次/秒。
191
+ 默认接口请求频率限制:10次/秒。
382
192
  */
383
- PropOwnerCertOCR(req: PropOwnerCertOCRRequest, cb?: (error: string, rep: PropOwnerCertOCRResponse) => void): Promise<PropOwnerCertOCRResponse>;
193
+ PermitOCR(req: PermitOCRRequest, cb?: (error: string, rep: PermitOCRResponse) => void): Promise<PermitOCRResponse>;
384
194
  /**
385
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
195
+ * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
386
196
 
387
197
  默认接口请求频率限制:5次/秒。
388
198
  */
389
- SmartStructuralPro(req: SmartStructuralProRequest, cb?: (error: string, rep: SmartStructuralProResponse) => void): Promise<SmartStructuralProResponse>;
199
+ BusInvoiceOCR(req: BusInvoiceOCRRequest, cb?: (error: string, rep: BusInvoiceOCRResponse) => void): Promise<BusInvoiceOCRResponse>;
390
200
  /**
391
- * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
201
+ * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
392
202
 
393
203
  默认接口请求频率限制:10次/秒。
394
204
  */
395
- BizLicenseOCR(req: BizLicenseOCRRequest, cb?: (error: string, rep: BizLicenseOCRResponse) => void): Promise<BizLicenseOCRResponse>;
205
+ EnglishOCR(req: EnglishOCRRequest, cb?: (error: string, rep: EnglishOCRResponse) => void): Promise<EnglishOCRResponse>;
396
206
  /**
397
- * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
207
+ * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
398
208
 
399
- 默认接口请求频率限制:10次/秒。
209
+ 默认接口请求频率限制:5次/秒。
400
210
  */
401
- GeneralHandwritingOCR(req: GeneralHandwritingOCRRequest, cb?: (error: string, rep: GeneralHandwritingOCRResponse) => void): Promise<GeneralHandwritingOCRResponse>;
402
- /**
403
- * 外国人永久居留身份证识别
404
- */
405
- RecognizeForeignPermanentResidentIdCard(req: RecognizeForeignPermanentResidentIdCardRequest, cb?: (error: string, rep: RecognizeForeignPermanentResidentIdCardResponse) => void): Promise<RecognizeForeignPermanentResidentIdCardResponse>;
211
+ SmartStructuralOCR(req: SmartStructuralOCRRequest, cb?: (error: string, rep: SmartStructuralOCRResponse) => void): Promise<SmartStructuralOCRResponse>;
406
212
  /**
407
- * 已上线VatInvoiceVerifyNew,VatInvoiceVerify需要下线,产品在官网已发通告
408
-
409
- 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。
410
-
411
- 默认接口请求频率限制:20次/秒。
213
+ * 本接口用于识别门头照分类标签信息
214
+ 默认接口请求频率限制:1次/秒
412
215
  */
413
- VatInvoiceVerify(req: VatInvoiceVerifyRequest, cb?: (error: string, rep: VatInvoiceVerifyResponse) => void): Promise<VatInvoiceVerifyResponse>;
216
+ ClassifyStoreName(req: ClassifyStoreNameRequest, cb?: (error: string, rep: ClassifyStoreNameResponse) => void): Promise<ClassifyStoreNameResponse>;
414
217
  /**
415
218
  * 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
416
219
 
@@ -418,143 +221,322 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
418
221
  */
419
222
  TaxiInvoiceOCR(req: TaxiInvoiceOCRRequest, cb?: (error: string, rep: TaxiInvoiceOCRResponse) => void): Promise<TaxiInvoiceOCRResponse>;
420
223
  /**
421
- * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
224
+ * 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
422
225
 
423
226
  默认接口请求频率限制:5次/秒。
424
227
  */
425
- InvoiceGeneralOCR(req: InvoiceGeneralOCRRequest, cb?: (error: string, rep: InvoiceGeneralOCRResponse) => void): Promise<InvoiceGeneralOCRResponse>;
228
+ RideHailingDriverLicenseOCR(req: RideHailingDriverLicenseOCRRequest, cb?: (error: string, rep: RideHailingDriverLicenseOCRResponse) => void): Promise<RideHailingDriverLicenseOCRResponse>;
426
229
  /**
427
- * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
230
+ * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
428
231
 
429
232
  默认接口请求频率限制:5次/秒。
430
233
  */
431
- RideHailingTransportLicenseOCR(req: RideHailingTransportLicenseOCRRequest, cb?: (error: string, rep: RideHailingTransportLicenseOCRResponse) => void): Promise<RideHailingTransportLicenseOCRResponse>;
234
+ DutyPaidProofOCR(req: DutyPaidProofOCRRequest, cb?: (error: string, rep: DutyPaidProofOCRResponse) => void): Promise<DutyPaidProofOCRResponse>;
432
235
  /**
433
- * 智慧表单产品已下线,需要下线相关API
236
+ * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
434
237
 
435
- 支持查询智能表单录入任务的状态。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
238
+ 默认接口请求频率限制:20次/秒。
436
239
  */
437
- GetTaskState(req: GetTaskStateRequest, cb?: (error: string, rep: GetTaskStateResponse) => void): Promise<GetTaskStateResponse>;
438
- /**
439
- * 获取ocr结果
440
- */
441
- GetOCRResult(req: GetOCRResultRequest, cb?: (error: string, rep: GetOCRResultResponse) => void): Promise<GetOCRResultResponse>;
240
+ MainlandPermitOCR(req: MainlandPermitOCRRequest, cb?: (error: string, rep: MainlandPermitOCRResponse) => void): Promise<MainlandPermitOCRResponse>;
442
241
  /**
443
- * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
242
+ * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
444
243
 
445
244
  默认接口请求频率限制:5次/秒。
446
245
  */
447
- HKIDCardOCR(req: HKIDCardOCRRequest, cb?: (error: string, rep: HKIDCardOCRResponse) => void): Promise<HKIDCardOCRResponse>;
246
+ FlightInvoiceOCR(req: FlightInvoiceOCRRequest, cb?: (error: string, rep: FlightInvoiceOCRResponse) => void): Promise<FlightInvoiceOCRResponse>;
448
247
  /**
449
- * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
248
+ * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
249
+ 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
450
250
 
451
- 默认接口请求频率限制:10次/秒。
251
+ 默认接口请求频率限制:10次/秒
452
252
  */
453
- RecognizeTableOCR(req: RecognizeTableOCRRequest, cb?: (error: string, rep: RecognizeTableOCRResponse) => void): Promise<RecognizeTableOCRResponse>;
253
+ RecognizeThaiIDCardOCR(req: RecognizeThaiIDCardOCRRequest, cb?: (error: string, rep: RecognizeThaiIDCardOCRResponse) => void): Promise<RecognizeThaiIDCardOCRResponse>;
454
254
  /**
455
- * 智慧表单产品已下线,需要下线相关API
255
+ * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
456
256
 
457
- 本接口可创建智能表单录入任务,支持多个识别图片和PDF的URL上传,返回含有识别内容的操作页面URL。
257
+ 默认接口请求频率限制:5次/秒。
458
258
 
459
- 智能表单录入产品提供高准确率的表单识别技术和人工核对工具,支持自定义字段,将识别结果自动填入到自定义条目中,并提供人工操作工具,完成整个表单识别过程。适用性强,可对票据、合同、货单等文件的识别,适用于金融、货代、保险、档案等领域。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
259
+
260
+ 支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表:
261
+ <table style="width:715px">
262
+ <thead>
263
+ <tr>
264
+ <th style="width:200px">SubType 子票种英文</th>
265
+ <th style="width:200px">TypeDescription子票种中文</th>
266
+ <th >Type 所属大类票种</th>
267
+ </tr>
268
+ </thead>
269
+ <tbody>
270
+ <tr>
271
+ <td> VatSpecialInvoice</td>
272
+ <td> 增值税专用发票 </td>
273
+ <td> 3 </td>
274
+ </tr>
275
+ <tr>
276
+ <td> VatCommonInvoice</td>
277
+ <td> 增值税普通发票 </td>
278
+ <td> 3 </td>
279
+ </tr>
280
+ <tr>
281
+ <td> VatElectronicCommonInvoice </td>
282
+ <td> 增值税电子普通发票 </td>
283
+ <td> 3 </td>
284
+ </tr>
285
+ <tr>
286
+ <td> VatElectronicSpecialInvoice </td>
287
+ <td> 增值税电子专用发票 </td>
288
+ <td> 3 </td>
289
+ </tr>
290
+ <tr>
291
+ <td> VatElectronicInvoiceBlockchain</td>
292
+ <td> 区块链电子发票 </td>
293
+ <td> 3 </td>
294
+ </tr>
295
+ <tr>
296
+ <td> VatElectronicInvoiceToll</td>
297
+ <td> 增值税电子普通发票(通行费)</td>
298
+ <td> 3 </td>
299
+ </tr>
300
+ <tr>
301
+ <td> VatSalesList</td>
302
+ <td> 增值税销货清单</td>
303
+ <td> 3 </td>
304
+ </tr>
305
+ <tr>
306
+ <td> VatElectronicSpecialInvoiceFull</td>
307
+ <td> 电子发票(专用发票)</td>
308
+ <td> 16 </td>
309
+ </tr>
310
+ <tr>
311
+ <td> VatElectronicInvoiceFull</td>
312
+ <td> 电子发票(普通发票) </td>
313
+ <td> 16 </td>
314
+ </tr>
315
+ <tr>
316
+ <td> ElectronicFlightTicketFull</td>
317
+ <td> 电子发票(机票行程单)</td>
318
+ <td> 16 </td>
319
+ </tr>
320
+ <tr>
321
+ <td> ElectronicTrainTicketFull</td>
322
+ <td> 电子发票(铁路电子客票)</td>
323
+ <td> 16 </td>
324
+ </tr>
325
+ <tr>
326
+ <td> MotorVehicleSaleInvoice </td>
327
+ <td> 机动车销售统一发票 </td>
328
+ <td> 12 </td>
329
+ </tr>
330
+ <tr>
331
+ <td> UsedCarPurchaseInvoice </td>
332
+ <td> 二手车销售统一发票 </td>
333
+ <td> 12 </td>
334
+ </tr>
335
+ <tr>
336
+ <td> VatInvoiceRoll </td>
337
+ <td> 增值税普通发票(卷票) </td>
338
+ <td> 11 </td>
339
+ </tr>
340
+ <tr>
341
+ <td> TaxiTicket </td>
342
+ <td> 出租车发票 </td>
343
+ <td> 0 </td>
344
+ </tr>
345
+ <tr>
346
+ <td> QuotaInvoice </td>
347
+ <td> 定额发票 </td>
348
+ <td> 1 </td>
349
+ </tr>
350
+ <tr>
351
+ <td> TrainTicket </td>
352
+ <td> 火车票 </td>
353
+ <td> 2 </td>
354
+ </tr>
355
+ <tr>
356
+ <td> AirTransport </td>
357
+ <td> 机票行程单 </td>
358
+ <td> 5 </td>
359
+ </tr>
360
+ <tr>
361
+ <td> MachinePrintedInvoice </td>
362
+ <td> 通用机打发票 </td>
363
+ <td> 8 </td>
364
+ </tr>
365
+ <tr>
366
+ <td> BusInvoice </td>
367
+ <td> 汽车票 </td>
368
+ <td> 9 </td>
369
+ </tr>
370
+ <tr>
371
+ <td> ShippingInvoice </td>
372
+ <td> 轮船票 </td>
373
+ <td> 10 </td>
374
+ </tr>
375
+ <tr>
376
+ <td> NonTaxIncomeGeneralBill </td>
377
+ <td> 非税收入通用票据 </td>
378
+ <td> 15 </td>
379
+ </tr>
380
+ <tr>
381
+ <td> NonTaxIncomeElectronicBill </td>
382
+ <td> 非税收入一般缴款书(电子) </td>
383
+ <td> 15 </td>
384
+ </tr>
385
+ <tr>
386
+ <td> TollInvoice </td>
387
+ <td> 过路过桥费发票 </td>
388
+ <td> 13 </td>
389
+ </tr>
390
+ <tr>
391
+ <td> MedicalOutpatientInvoice </td>
392
+ <td> 医疗门诊收费票据(电子) </td>
393
+ <td> 17 </td>
394
+ </tr>
395
+ <tr>
396
+ <td> MedicalHospitalizedInvoice </td>
397
+ <td> 医疗住院收费票据(电子) </td>
398
+ <td> 17 </td>
399
+ </tr>
400
+ <tr>
401
+ <td> OtherInvoice </td>
402
+ <td> 其他发票 </td>
403
+ <td> -1 </td>
404
+ </tr>
405
+ </tbody>
406
+ </table>
460
407
  */
461
- CreateAIFormTask(req: CreateAIFormTaskRequest, cb?: (error: string, rep: CreateAIFormTaskResponse) => void): Promise<CreateAIFormTaskResponse>;
408
+ RecognizeGeneralInvoice(req: RecognizeGeneralInvoiceRequest, cb?: (error: string, rep: RecognizeGeneralInvoiceResponse) => void): Promise<RecognizeGeneralInvoiceResponse>;
462
409
  /**
463
- * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
410
+ * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
464
411
 
465
- 默认接口请求频率限制:5次/秒。
412
+ 默认接口请求频率限制:1次/秒。
466
413
  */
467
- DutyPaidProofOCR(req: DutyPaidProofOCRRequest, cb?: (error: string, rep: DutyPaidProofOCRResponse) => void): Promise<DutyPaidProofOCRResponse>;
414
+ InsuranceBillOCR(req: InsuranceBillOCRRequest, cb?: (error: string, rep: InsuranceBillOCRResponse) => void): Promise<InsuranceBillOCRResponse>;
468
415
  /**
469
- * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
416
+ * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
470
417
 
471
- 默认接口请求频率限制:5次/秒。
418
+ 默认接口请求频率限制:20次/秒。
472
419
  */
473
- FlightInvoiceOCR(req: FlightInvoiceOCRRequest, cb?: (error: string, rep: FlightInvoiceOCRResponse) => void): Promise<FlightInvoiceOCRResponse>;
420
+ VatInvoiceVerifyNew(req: VatInvoiceVerifyNewRequest, cb?: (error: string, rep: VatInvoiceVerifyNewResponse) => void): Promise<VatInvoiceVerifyNewResponse>;
474
421
  /**
475
- * 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
476
-
422
+ * 本接口支持图片内车辆识别代号(VIN)的检测和识别。
477
423
  默认接口请求频率限制:10次/秒。
478
424
  */
479
- PermitOCR(req: PermitOCRRequest, cb?: (error: string, rep: PermitOCRResponse) => void): Promise<PermitOCRResponse>;
425
+ VinOCR(req: VinOCRRequest, cb?: (error: string, rep: VinOCRResponse) => void): Promise<VinOCRResponse>;
480
426
  /**
481
- * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
427
+ * 本接口支持行驶证主页和副页所有字段的自动定位与识别。
482
428
 
483
- 默认接口请求频率限制:5次/秒。
484
- */
485
- OrgCodeCertOCR(req: OrgCodeCertOCRRequest, cb?: (error: string, rep: OrgCodeCertOCRResponse) => void): Promise<OrgCodeCertOCRResponse>;
486
- /**
487
- * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
429
+ 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
488
430
 
489
- 默认接口请求频率限制:5次/秒。
490
- */
491
- TextDetect(req: TextDetectRequest, cb?: (error: string, rep: TextDetectResponse) => void): Promise<TextDetectResponse>;
492
- /**
493
- * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
431
+ 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
494
432
 
495
- 默认接口请求频率限制:5次/秒。
496
- */
497
- FinanBillSliceOCR(req: FinanBillSliceOCRRequest, cb?: (error: string, rep: FinanBillSliceOCRResponse) => void): Promise<FinanBillSliceOCRResponse>;
498
- /**
499
- * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
433
+ 另外,本接口还支持复印件、翻拍告警功能。
500
434
 
501
- 默认接口请求频率限制:5次/秒。
435
+ 默认接口请求频率限制:10次/秒。
502
436
  */
503
- BusInvoiceOCR(req: BusInvoiceOCRRequest, cb?: (error: string, rep: BusInvoiceOCRResponse) => void): Promise<BusInvoiceOCRResponse>;
437
+ VehicleLicenseOCR(req: VehicleLicenseOCRRequest, cb?: (error: string, rep: VehicleLicenseOCRResponse) => void): Promise<VehicleLicenseOCRResponse>;
504
438
  /**
505
- * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
439
+ * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
506
440
 
507
- 默认接口请求频率限制:5次/秒。
441
+ 默认接口请求频率限制:10次/秒。
508
442
  */
509
- RecognizeMedicalInvoiceOCR(req: RecognizeMedicalInvoiceOCRRequest, cb?: (error: string, rep: RecognizeMedicalInvoiceOCRResponse) => void): Promise<RecognizeMedicalInvoiceOCRResponse>;
443
+ BizLicenseOCR(req: BizLicenseOCRRequest, cb?: (error: string, rep: BizLicenseOCRResponse) => void): Promise<BizLicenseOCRResponse>;
510
444
  /**
511
- * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
445
+ * 智慧表单产品已下线,需要下线相关API
512
446
 
513
- 默认接口请求频率限制:10次/秒。
447
+ 支持查询智能表单录入任务的状态。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
514
448
  */
515
- VatInvoiceOCR(req: VatInvoiceOCRRequest, cb?: (error: string, rep: VatInvoiceOCRResponse) => void): Promise<VatInvoiceOCRResponse>;
449
+ GetTaskState(req: GetTaskStateRequest, cb?: (error: string, rep: GetTaskStateResponse) => void): Promise<GetTaskStateResponse>;
516
450
  /**
517
- * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
451
+ * 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。
452
+ */
453
+ RecognizeGeneralCardWarn(req: RecognizeGeneralCardWarnRequest, cb?: (error: string, rep: RecognizeGeneralCardWarnResponse) => void): Promise<RecognizeGeneralCardWarnResponse>;
454
+ /**
455
+ * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
518
456
 
519
- 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
457
+ 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
520
458
 
521
- 默认接口请求频率限制:10次/秒。
522
- */
523
- TableOCR(req: TableOCRRequest, cb?: (error: string, rep: TableOCRResponse) => void): Promise<TableOCRResponse>;
524
- /**
525
- * 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
459
+ 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
526
460
 
527
- 默认接口请求频率限制:5次/秒。
528
- */
529
- RideHailingDriverLicenseOCR(req: RideHailingDriverLicenseOCRRequest, cb?: (error: string, rep: RideHailingDriverLicenseOCRResponse) => void): Promise<RideHailingDriverLicenseOCRResponse>;
530
- /**
531
- * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
461
+ 通用印刷体识别不同版本的差异如下:
462
+ <table style="width:715px">
463
+ <thead>
464
+ <tr>
465
+ <th style="width:150px"></th>
466
+ <th style="width:200px">【荐】通用印刷体识别</th>
467
+ <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
468
+ <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
469
+ </tr>
470
+ </thead>
471
+ <tbody>
472
+ <tr>
473
+ <td> 适用场景</td>
474
+ <td>适用于所有通用场景的印刷体识别</td>
475
+ <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
476
+ <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
477
+ </tr>
478
+ <tr>
479
+ <td>识别准确率</td>
480
+ <td>96%</td>
481
+ <td>99%</td>
482
+ <td>91%</td>
483
+ </tr>
484
+ <tr>
485
+ <td>价格</td>
486
+ <td>中</td>
487
+ <td>高</td>
488
+ <td>低</td>
489
+ </tr>
490
+ <tr>
491
+ <td>支持的语言</td>
492
+ <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
493
+ <td>中文、英文、中英文</td>
494
+ <td>中文、英文、中英文</td>
495
+ </tr>
496
+ <tr>
497
+ <td>自动语言检测</td>
498
+ <td>支持</td>
499
+ <td>支持</td>
500
+ <td>支持</td>
501
+ </tr>
502
+ <tr>
503
+ <td>返回文本行坐标</td>
504
+ <td>支持</td>
505
+ <td>支持</td>
506
+ <td>支持</td>
507
+ </tr>
508
+ <tr>
509
+ <td>自动旋转纠正</td>
510
+ <td>支持旋转识别,返回角度信息</td>
511
+ <td>支持旋转识别,返回角度信息</td>
512
+ <td>支持旋转识别,返回角度信息</td>
513
+ </tr>
514
+ </tbody>
515
+ </table>
532
516
 
533
517
  默认接口请求频率限制:20次/秒。
534
518
  */
535
- HmtResidentPermitOCR(req: HmtResidentPermitOCRRequest, cb?: (error: string, rep: HmtResidentPermitOCRResponse) => void): Promise<HmtResidentPermitOCRResponse>;
536
- /**
537
- * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
538
- */
539
- RecognizeGeneralTextImageWarn(req: RecognizeGeneralTextImageWarnRequest, cb?: (error: string, rep: RecognizeGeneralTextImageWarnResponse) => void): Promise<RecognizeGeneralTextImageWarnResponse>;
519
+ GeneralBasicOCR(req: GeneralBasicOCRRequest, cb?: (error: string, rep: GeneralBasicOCRResponse) => void): Promise<GeneralBasicOCRResponse>;
540
520
  /**
541
- * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
521
+ * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
542
522
 
543
523
  默认接口请求频率限制:5次/秒。
544
524
  */
545
- SmartStructuralOCR(req: SmartStructuralOCRRequest, cb?: (error: string, rep: SmartStructuralOCRResponse) => void): Promise<SmartStructuralOCRResponse>;
525
+ MixedInvoiceOCR(req: MixedInvoiceOCRRequest, cb?: (error: string, rep: MixedInvoiceOCRResponse) => void): Promise<MixedInvoiceOCRResponse>;
546
526
  /**
547
- * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
527
+ * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
528
+
529
+ 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
548
530
 
549
531
  默认接口请求频率限制:10次/秒。
550
532
  */
551
- ArithmeticOCR(req: ArithmeticOCRRequest, cb?: (error: string, rep: ArithmeticOCRResponse) => void): Promise<ArithmeticOCRResponse>;
533
+ TableOCR(req: TableOCRRequest, cb?: (error: string, rep: TableOCRResponse) => void): Promise<TableOCRResponse>;
552
534
  /**
553
- * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
535
+ * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
554
536
 
555
537
  默认接口请求频率限制:10次/秒。
556
538
  */
557
- LicensePlateOCR(req: LicensePlateOCRRequest, cb?: (error: string, rep: LicensePlateOCRResponse) => void): Promise<LicensePlateOCRResponse>;
539
+ ArithmeticOCR(req: ArithmeticOCRRequest, cb?: (error: string, rep: ArithmeticOCRResponse) => void): Promise<ArithmeticOCRResponse>;
558
540
  /**
559
541
  * 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
560
542
 
@@ -562,150 +544,217 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
562
544
  */
563
545
  EstateCertOCR(req: EstateCertOCRRequest, cb?: (error: string, rep: EstateCertOCRResponse) => void): Promise<EstateCertOCRResponse>;
564
546
  /**
565
- * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
547
+ * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
566
548
 
567
549
  默认接口请求频率限制:20次/秒。
568
550
  */
569
- ClassifyDetectOCR(req: ClassifyDetectOCRRequest, cb?: (error: string, rep: ClassifyDetectOCRResponse) => void): Promise<ClassifyDetectOCRResponse>;
551
+ RecognizeValidIDCardOCR(req: RecognizeValidIDCardOCRRequest, cb?: (error: string, rep: RecognizeValidIDCardOCRResponse) => void): Promise<RecognizeValidIDCardOCRResponse>;
570
552
  /**
571
- * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
553
+ * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
554
+
555
+ 默认接口请求频率限制:10次/秒。
556
+ */
557
+ BankCardOCR(req: BankCardOCRRequest, cb?: (error: string, rep: BankCardOCRResponse) => void): Promise<BankCardOCRResponse>;
558
+ /**
559
+ * 已上线VatInvoiceVerifyNew,VatInvoiceVerify需要下线,产品在官网已发通告
560
+
561
+ 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。
562
+
563
+ 默认接口请求频率限制:20次/秒。
564
+ */
565
+ VatInvoiceVerify(req: VatInvoiceVerifyRequest, cb?: (error: string, rep: VatInvoiceVerifyResponse) => void): Promise<VatInvoiceVerifyResponse>;
566
+ /**
567
+ * 获取ocr的token值
568
+ */
569
+ GetOCRToken(req: GetOCRTokenRequest, cb?: (error: string, rep: GetOCRTokenResponse) => void): Promise<GetOCRTokenResponse>;
570
+ /**
571
+ * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
572
572
 
573
573
  默认接口请求频率限制:5次/秒。
574
574
  */
575
- SealOCR(req: SealOCRRequest, cb?: (error: string, rep: SealOCRResponse) => void): Promise<SealOCRResponse>;
575
+ EduPaperOCR(req: EduPaperOCRRequest, cb?: (error: string, rep: EduPaperOCRResponse) => void): Promise<EduPaperOCRResponse>;
576
576
  /**
577
- * 本接口用于识别门头照分类标签信息
578
- 默认接口请求频率限制:1次/秒
577
+ * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
578
+
579
+ 默认接口请求频率限制:5次/秒。
579
580
  */
580
- ClassifyStoreName(req: ClassifyStoreNameRequest, cb?: (error: string, rep: ClassifyStoreNameResponse) => void): Promise<ClassifyStoreNameResponse>;
581
+ EnterpriseLicenseOCR(req: EnterpriseLicenseOCRRequest, cb?: (error: string, rep: EnterpriseLicenseOCRResponse) => void): Promise<EnterpriseLicenseOCRResponse>;
581
582
  /**
582
- * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
583
+ * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
583
584
 
584
585
  默认接口请求频率限制:10次/秒。
585
586
  */
586
- BankSlipOCR(req: BankSlipOCRRequest, cb?: (error: string, rep: BankSlipOCRResponse) => void): Promise<BankSlipOCRResponse>;
587
+ BusinessCardOCR(req: BusinessCardOCRRequest, cb?: (error: string, rep: BusinessCardOCRResponse) => void): Promise<BusinessCardOCRResponse>;
587
588
  /**
588
- * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
589
-
590
- 适用于快速文本识别场景。
589
+ * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
591
590
 
592
- 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
591
+ 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
593
592
 
594
- 通用印刷体识别不同版本的差异如下:
595
- <table style="width:715px">
593
+ <table style="width:650px">
596
594
  <thead>
597
595
  <tr>
598
- <th style="width:150px"></th>
599
- <th >通用印刷体识别(精简版)</th>
600
- <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
601
- <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
596
+ <th width="150">扩展能力</th>
597
+ <th width="500">能力项</th>
602
598
  </tr>
603
599
  </thead>
604
600
  <tbody>
605
601
  <tr>
606
- <td> 适用场景</td>
607
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
608
- <td>适用于所有通用场景的印刷体识别</td>
609
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
602
+ <td rowspan="2">裁剪功能</td>
603
+ <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
610
604
  </tr>
611
605
  <tr>
612
- <td>识别准确率</td>
613
- <td>91%</td>
614
- <td>96%</td>
615
- <td>99%</td>
606
+ <td>人像照片裁剪(自动抠取身份证头像区域)</td>
616
607
  </tr>
617
608
  <tr>
618
- <td>价格</td>
619
- <td>低</td>
620
- <td>中</td>
621
- <td>高</td>
609
+ <td rowspan="9">告警功能</td>
610
+ <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
611
+
612
+ </td>
622
613
  </tr>
623
614
  <tr>
624
- <td>支持的语言</td>
625
- <td>中文、英文、中英文</td>
626
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
627
- <td>中文、英文、中英文</td>
615
+ <td>身份证边框不完整告警</td>
628
616
  </tr>
629
617
  <tr>
630
- <td>自动语言检测</td>
631
- <td>支持</td>
632
- <td>支持</td>
633
- <td>支持</td>
618
+ <td>身份证复印件告警</td>
634
619
  </tr>
635
620
  <tr>
636
- <td>返回文本行坐标</td>
637
- <td>支持</td>
638
- <td>支持</td>
639
- <td>支持</td>
621
+ <td>身份证翻拍告警</td>
640
622
  </tr>
641
- <tr>
642
- <td>自动旋转纠正</td>
643
- <td>支持旋转识别,返回角度信息</td>
644
- <td>支持旋转识别,返回角度信息</td>
645
- <td>支持旋转识别,返回角度信息</td>
623
+ <tr>
624
+ <td>身份证框内遮挡告警</td>
625
+ </tr>
626
+ <tr>
627
+ <td>临时身份证告警</td>
628
+ </tr>
629
+ <tr>
630
+ <td>身份证疑似存在PS痕迹告警</td>
631
+ </tr>
632
+ <tr>
633
+ <td>图片模糊告警(可根据图片质量分数判断)</td>
646
634
  </tr>
647
635
  </tbody>
648
636
  </table>
649
637
 
650
- 默认接口请求频率限制:10次/秒。
638
+ 默认接口请求频率限制:20次/秒。
651
639
  */
652
- GeneralEfficientOCR(req: GeneralEfficientOCRRequest, cb?: (error: string, rep: GeneralEfficientOCRResponse) => void): Promise<GeneralEfficientOCRResponse>;
640
+ IDCardOCR(req: IDCardOCRRequest, cb?: (error: string, rep: IDCardOCRResponse) => void): Promise<IDCardOCRResponse>;
653
641
  /**
654
- * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
642
+ * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
643
+ */
644
+ RecognizeGeneralTextImageWarn(req: RecognizeGeneralTextImageWarnRequest, cb?: (error: string, rep: RecognizeGeneralTextImageWarnResponse) => void): Promise<RecognizeGeneralTextImageWarnResponse>;
645
+ /**
646
+ * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
655
647
 
656
- 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
648
+ 默认接口请求频率限制:5次/秒。
649
+ */
650
+ InstitutionOCR(req: InstitutionOCRRequest, cb?: (error: string, rep: InstitutionOCRResponse) => void): Promise<InstitutionOCRResponse>;
651
+ /**
652
+ * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
657
653
 
658
- 默认接口请求频率限制:20次/秒。
654
+ 默认接口请求频率限制:5次/秒。
659
655
  */
660
- AdvertiseOCR(req: AdvertiseOCRRequest, cb?: (error: string, rep: AdvertiseOCRResponse) => void): Promise<AdvertiseOCRResponse>;
656
+ SmartStructuralOCRV2(req: SmartStructuralOCRV2Request, cb?: (error: string, rep: SmartStructuralOCRV2Response) => void): Promise<SmartStructuralOCRV2Response>;
661
657
  /**
662
- * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
658
+ * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
663
659
 
660
+ 默认接口请求频率限制:2次/秒。
661
+ */
662
+ RecognizeTableAccurateOCR(req: RecognizeTableAccurateOCRRequest, cb?: (error: string, rep: RecognizeTableAccurateOCRResponse) => void): Promise<RecognizeTableAccurateOCRResponse>;
663
+ /**
664
+ * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
664
665
  默认接口请求频率限制:5次/秒。
665
666
  */
666
- TrainTicketOCR(req: TrainTicketOCRRequest, cb?: (error: string, rep: TrainTicketOCRResponse) => void): Promise<TrainTicketOCRResponse>;
667
+ MixedInvoiceDetect(req: MixedInvoiceDetectRequest, cb?: (error: string, rep: MixedInvoiceDetectResponse) => void): Promise<MixedInvoiceDetectResponse>;
667
668
  /**
668
- * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
669
+ * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
669
670
 
670
671
  默认接口请求频率限制:5次/秒。
671
672
  */
672
- ResidenceBookletOCR(req: ResidenceBookletOCRRequest, cb?: (error: string, rep: ResidenceBookletOCRResponse) => void): Promise<ResidenceBookletOCRResponse>;
673
+ VatRollInvoiceOCR(req: VatRollInvoiceOCRRequest, cb?: (error: string, rep: VatRollInvoiceOCRResponse) => void): Promise<VatRollInvoiceOCRResponse>;
673
674
  /**
674
- * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
675
+ * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
676
+
677
+ 默认接口请求频率限制:5次/秒。
678
+ */
679
+ QuotaInvoiceOCR(req: QuotaInvoiceOCRRequest, cb?: (error: string, rep: QuotaInvoiceOCRResponse) => void): Promise<QuotaInvoiceOCRResponse>;
680
+ /**
681
+ * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
682
+
683
+ 默认接口请求频率限制:10次/秒。
684
+ */
685
+ GeneralHandwritingOCR(req: GeneralHandwritingOCRRequest, cb?: (error: string, rep: GeneralHandwritingOCRResponse) => void): Promise<GeneralHandwritingOCRResponse>;
686
+ /**
687
+ * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
675
688
 
676
689
  默认接口请求频率限制:20次/秒。
677
690
  */
678
- RecognizeTravelCardOCR(req: RecognizeTravelCardOCRRequest, cb?: (error: string, rep: RecognizeTravelCardOCRResponse) => void): Promise<RecognizeTravelCardOCRResponse>;
691
+ RecognizeOnlineTaxiItineraryOCR(req: RecognizeOnlineTaxiItineraryOCRRequest, cb?: (error: string, rep: RecognizeOnlineTaxiItineraryOCRResponse) => void): Promise<RecognizeOnlineTaxiItineraryOCRResponse>;
679
692
  /**
680
- * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
693
+ * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
681
694
 
682
- 默认接口请求频率限制:5次/秒。
695
+ 默认接口请求频率限制:10次/秒。
683
696
  */
684
- InstitutionOCR(req: InstitutionOCRRequest, cb?: (error: string, rep: InstitutionOCRResponse) => void): Promise<InstitutionOCRResponse>;
697
+ RecognizeTableOCR(req: RecognizeTableOCRRequest, cb?: (error: string, rep: RecognizeTableOCRResponse) => void): Promise<RecognizeTableOCRResponse>;
685
698
  /**
686
- * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
699
+ * 智慧表单产品已下线,需要下线相关API
700
+
701
+ 本接口可创建智能表单录入任务,支持多个识别图片和PDF的URL上传,返回含有识别内容的操作页面URL。
702
+
703
+ 智能表单录入产品提供高准确率的表单识别技术和人工核对工具,支持自定义字段,将识别结果自动填入到自定义条目中,并提供人工操作工具,完成整个表单识别过程。适用性强,可对票据、合同、货单等文件的识别,适用于金融、货代、保险、档案等领域。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
704
+ */
705
+ CreateAIFormTask(req: CreateAIFormTaskRequest, cb?: (error: string, rep: CreateAIFormTaskResponse) => void): Promise<CreateAIFormTaskResponse>;
706
+ /**
707
+ * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
687
708
 
688
709
  默认接口请求频率限制:10次/秒。
689
710
  */
690
- EnglishOCR(req: EnglishOCRRequest, cb?: (error: string, rep: EnglishOCRResponse) => void): Promise<EnglishOCRResponse>;
711
+ WaybillOCR(req: WaybillOCRRequest, cb?: (error: string, rep: WaybillOCRResponse) => void): Promise<WaybillOCRResponse>;
691
712
  /**
692
- * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
713
+ * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
693
714
 
694
715
  默认接口请求频率限制:20次/秒。
695
716
  */
696
- RecognizeValidIDCardOCR(req: RecognizeValidIDCardOCRRequest, cb?: (error: string, rep: RecognizeValidIDCardOCRResponse) => void): Promise<RecognizeValidIDCardOCRResponse>;
717
+ HmtResidentPermitOCR(req: HmtResidentPermitOCRRequest, cb?: (error: string, rep: HmtResidentPermitOCRResponse) => void): Promise<HmtResidentPermitOCRResponse>;
697
718
  /**
698
- * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
719
+ * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
720
+
721
+ 默认接口请求频率限制:5次/秒。
722
+ */
723
+ TollInvoiceOCR(req: TollInvoiceOCRRequest, cb?: (error: string, rep: TollInvoiceOCRResponse) => void): Promise<TollInvoiceOCRResponse>;
724
+ /**
725
+ * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
726
+
727
+ 默认接口请求频率限制:20次/秒。
728
+ */
729
+ ClassifyDetectOCR(req: ClassifyDetectOCRRequest, cb?: (error: string, rep: ClassifyDetectOCRResponse) => void): Promise<ClassifyDetectOCRResponse>;
730
+ /**
731
+ * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
732
+
733
+ 默认接口请求频率限制:5次/秒。
734
+ */
735
+ SealOCR(req: SealOCRRequest, cb?: (error: string, rep: SealOCRResponse) => void): Promise<SealOCRResponse>;
736
+ /**
737
+ * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
699
738
 
700
739
  默认接口请求频率限制:10次/秒。
701
740
  */
702
- BankCardOCR(req: BankCardOCRRequest, cb?: (error: string, rep: BankCardOCRResponse) => void): Promise<BankCardOCRResponse>;
741
+ BankSlipOCR(req: BankSlipOCRRequest, cb?: (error: string, rep: BankSlipOCRResponse) => void): Promise<BankSlipOCRResponse>;
703
742
  /**
704
- * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
743
+ * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
705
744
 
706
745
  默认接口请求频率限制:5次/秒。
707
746
  */
708
- CarInvoiceOCR(req: CarInvoiceOCRRequest, cb?: (error: string, rep: CarInvoiceOCRResponse) => void): Promise<CarInvoiceOCRResponse>;
747
+ ResidenceBookletOCR(req: ResidenceBookletOCRRequest, cb?: (error: string, rep: ResidenceBookletOCRResponse) => void): Promise<ResidenceBookletOCRResponse>;
748
+ /**
749
+ * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
750
+
751
+ 默认接口请求频率限制:20次/秒。
752
+ */
753
+ RecognizeTravelCardOCR(req: RecognizeTravelCardOCRRequest, cb?: (error: string, rep: RecognizeTravelCardOCRResponse) => void): Promise<RecognizeTravelCardOCRResponse>;
754
+ /**
755
+ * 本接口支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
756
+ */
757
+ VerifyOfdVatInvoiceOCR(req: VerifyOfdVatInvoiceOCRRequest, cb?: (error: string, rep: VerifyOfdVatInvoiceOCRResponse) => void): Promise<VerifyOfdVatInvoiceOCRResponse>;
709
758
  /**
710
759
  * 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
711
760
 
@@ -721,231 +770,186 @@ export declare class Client extends TencentCloudCommon.AbstractClient {
721
770
  */
722
771
  DriverLicenseOCR(req: DriverLicenseOCRRequest, cb?: (error: string, rep: DriverLicenseOCRResponse) => void): Promise<DriverLicenseOCRResponse>;
723
772
  /**
724
- * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
773
+ * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
725
774
 
726
- 默认接口请求频率限制:20次/秒。
775
+ 默认接口请求频率限制:5次/秒。
727
776
  */
728
- MainlandPermitOCR(req: MainlandPermitOCRRequest, cb?: (error: string, rep: MainlandPermitOCRResponse) => void): Promise<MainlandPermitOCRResponse>;
777
+ FinanBillOCR(req: FinanBillOCRRequest, cb?: (error: string, rep: FinanBillOCRResponse) => void): Promise<FinanBillOCRResponse>;
729
778
  /**
730
- * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
779
+ * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
731
780
 
732
781
  默认接口请求频率限制:5次/秒。
733
782
  */
734
- FormulaOCR(req: FormulaOCRRequest, cb?: (error: string, rep: FormulaOCRResponse) => void): Promise<FormulaOCRResponse>;
783
+ SmartStructuralPro(req: SmartStructuralProRequest, cb?: (error: string, rep: SmartStructuralProResponse) => void): Promise<SmartStructuralProResponse>;
784
+ /**
785
+ * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
786
+
787
+ 默认接口请求频率限制:10次/秒。
788
+ */
789
+ RecognizeHealthCodeOCR(req: RecognizeHealthCodeOCRRequest, cb?: (error: string, rep: RecognizeHealthCodeOCRResponse) => void): Promise<RecognizeHealthCodeOCRResponse>;
790
+ /**
791
+ * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
792
+
793
+ 默认接口请求频率限制:10次/秒。
794
+ */
795
+ ImageEnhancement(req: ImageEnhancementRequest, cb?: (error: string, rep: ImageEnhancementResponse) => void): Promise<ImageEnhancementResponse>;
796
+ /**
797
+ * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
798
+ 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
799
+ */
800
+ MLIDCardOCR(req: MLIDCardOCRRequest, cb?: (error: string, rep: MLIDCardOCRResponse) => void): Promise<MLIDCardOCRResponse>;
801
+ /**
802
+ * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
803
+
804
+ 默认接口请求频率限制:5次/秒。
805
+ */
806
+ RecognizeMedicalInvoiceOCR(req: RecognizeMedicalInvoiceOCRRequest, cb?: (error: string, rep: RecognizeMedicalInvoiceOCRResponse) => void): Promise<RecognizeMedicalInvoiceOCRResponse>;
735
807
  /**
736
- * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
808
+ * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
737
809
 
738
810
  默认接口请求频率限制:10次/秒。
739
811
  */
740
- PassportOCR(req: PassportOCRRequest, cb?: (error: string, rep: PassportOCRResponse) => void): Promise<PassportOCRResponse>;
812
+ GeneralFastOCR(req: GeneralFastOCRRequest, cb?: (error: string, rep: GeneralFastOCRResponse) => void): Promise<GeneralFastOCRResponse>;
741
813
  /**
742
- * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
814
+ * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
743
815
 
744
- 默认接口请求频率限制:5次/秒。
816
+ 默认接口请求频率限制:10次/秒。
745
817
  */
746
- FinanBillOCR(req: FinanBillOCRRequest, cb?: (error: string, rep: FinanBillOCRResponse) => void): Promise<FinanBillOCRResponse>;
747
- /**
748
- * 获取ocr的token值
749
- */
750
- GetOCRToken(req: GetOCRTokenRequest, cb?: (error: string, rep: GetOCRTokenResponse) => void): Promise<GetOCRTokenResponse>;
818
+ VatInvoiceOCR(req: VatInvoiceOCRRequest, cb?: (error: string, rep: VatInvoiceOCRResponse) => void): Promise<VatInvoiceOCRResponse>;
751
819
  /**
752
- * 本接口支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
820
+ * 外国人永久居留身份证识别
753
821
  */
754
- VerifyOfdVatInvoiceOCR(req: VerifyOfdVatInvoiceOCRRequest, cb?: (error: string, rep: VerifyOfdVatInvoiceOCRResponse) => void): Promise<VerifyOfdVatInvoiceOCRResponse>;
822
+ RecognizeForeignPermanentResidentIdCard(req: RecognizeForeignPermanentResidentIdCardRequest, cb?: (error: string, rep: RecognizeForeignPermanentResidentIdCardResponse) => void): Promise<RecognizeForeignPermanentResidentIdCardResponse>;
755
823
  /**
756
- * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
824
+ * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
757
825
 
758
826
  默认接口请求频率限制:5次/秒。
759
827
  */
760
- MixedInvoiceOCR(req: MixedInvoiceOCRRequest, cb?: (error: string, rep: MixedInvoiceOCRResponse) => void): Promise<MixedInvoiceOCRResponse>;
761
- /**
762
- * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
763
-
764
- 默认接口请求频率限制:10次/秒。
765
- */
766
- RecognizeHealthCodeOCR(req: RecognizeHealthCodeOCRRequest, cb?: (error: string, rep: RecognizeHealthCodeOCRResponse) => void): Promise<RecognizeHealthCodeOCRResponse>;
828
+ OrgCodeCertOCR(req: OrgCodeCertOCRRequest, cb?: (error: string, rep: OrgCodeCertOCRResponse) => void): Promise<OrgCodeCertOCRResponse>;
767
829
  /**
768
- * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
830
+ * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
769
831
 
770
832
  默认接口请求频率限制:5次/秒。
771
833
  */
772
- EduPaperOCR(req: EduPaperOCRRequest, cb?: (error: string, rep: EduPaperOCRResponse) => void): Promise<EduPaperOCRResponse>;
773
- /**
774
- * 服务已迁移至 [文档解析](https://cloud.tencent.com/document/product/1759/107504),请跳转查看接口文档。该接口支持将图片或PDF文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。
775
- */
776
- ReconstructDocument(req: ReconstructDocumentRequest, cb?: (error: string, rep: ReconstructDocumentResponse) => void): Promise<ReconstructDocumentResponse>;
834
+ FinanBillSliceOCR(req: FinanBillSliceOCRRequest, cb?: (error: string, rep: FinanBillSliceOCRResponse) => void): Promise<FinanBillSliceOCRResponse>;
777
835
  /**
778
- * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
779
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
836
+ * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
780
837
 
781
- 默认接口请求频率限制:10次/秒
838
+ 默认接口请求频率限制:10次/秒。
782
839
  */
783
- RecognizeThaiIDCardOCR(req: RecognizeThaiIDCardOCRRequest, cb?: (error: string, rep: RecognizeThaiIDCardOCRResponse) => void): Promise<RecognizeThaiIDCardOCRResponse>;
840
+ LicensePlateOCR(req: LicensePlateOCRRequest, cb?: (error: string, rep: LicensePlateOCRResponse) => void): Promise<LicensePlateOCRResponse>;
784
841
  /**
785
- * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
842
+ * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
786
843
 
787
- 默认接口请求频率限制:5次/秒。
844
+ 适用于快速文本识别场景。
788
845
 
846
+ 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
789
847
 
790
- 支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表:
848
+ 通用印刷体识别不同版本的差异如下:
791
849
  <table style="width:715px">
792
850
  <thead>
793
851
  <tr>
794
- <th style="width:200px">SubType 子票种英文</th>
795
- <th style="width:200px">TypeDescription子票种中文</th>
796
- <th >Type 所属大类票种</th>
852
+ <th style="width:150px"></th>
853
+ <th >通用印刷体识别(精简版)</th>
854
+ <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
855
+ <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
797
856
  </tr>
798
857
  </thead>
799
858
  <tbody>
800
859
  <tr>
801
- <td> VatSpecialInvoice</td>
802
- <td> 增值税专用发票 </td>
803
- <td> 3 </td>
804
- </tr>
805
- <tr>
806
- <td> VatCommonInvoice</td>
807
- <td> 增值税普通发票 </td>
808
- <td> 3 </td>
809
- </tr>
810
- <tr>
811
- <td> VatElectronicCommonInvoice </td>
812
- <td> 增值税电子普通发票 </td>
813
- <td> 3 </td>
814
- </tr>
815
- <tr>
816
- <td> VatElectronicSpecialInvoice </td>
817
- <td> 增值税电子专用发票 </td>
818
- <td> 3 </td>
819
- </tr>
820
- <tr>
821
- <td> VatElectronicInvoiceBlockchain</td>
822
- <td> 区块链电子发票 </td>
823
- <td> 3 </td>
824
- </tr>
825
- <tr>
826
- <td> VatElectronicInvoiceToll</td>
827
- <td> 增值税电子普通发票(通行费)</td>
828
- <td> 3 </td>
829
- </tr>
830
- <tr>
831
- <td> VatSalesList</td>
832
- <td> 增值税销货清单</td>
833
- <td> 3 </td>
834
- </tr>
835
- <tr>
836
- <td> VatElectronicSpecialInvoiceFull</td>
837
- <td> 电子发票(专用发票)</td>
838
- <td> 16 </td>
839
- </tr>
840
- <tr>
841
- <td> VatElectronicInvoiceFull</td>
842
- <td> 电子发票(普通发票) </td>
843
- <td> 16 </td>
844
- </tr>
845
- <tr>
846
- <td> ElectronicFlightTicketFull</td>
847
- <td> 电子发票(机票行程单)</td>
848
- <td> 16 </td>
849
- </tr>
850
- <tr>
851
- <td> ElectronicTrainTicketFull</td>
852
- <td> 电子发票(铁路电子客票)</td>
853
- <td> 16 </td>
854
- </tr>
855
- <tr>
856
- <td> MotorVehicleSaleInvoice </td>
857
- <td> 机动车销售统一发票 </td>
858
- <td> 12 </td>
859
- </tr>
860
- <tr>
861
- <td> UsedCarPurchaseInvoice </td>
862
- <td> 二手车销售统一发票 </td>
863
- <td> 12 </td>
864
- </tr>
865
- <tr>
866
- <td> VatInvoiceRoll </td>
867
- <td> 增值税普通发票(卷票) </td>
868
- <td> 11 </td>
869
- </tr>
870
- <tr>
871
- <td> TaxiTicket </td>
872
- <td> 出租车发票 </td>
873
- <td> 0 </td>
874
- </tr>
875
- <tr>
876
- <td> QuotaInvoice </td>
877
- <td> 定额发票 </td>
878
- <td> 1 </td>
879
- </tr>
880
- <tr>
881
- <td> TrainTicket </td>
882
- <td> 火车票 </td>
883
- <td> 2 </td>
884
- </tr>
885
- <tr>
886
- <td> AirTransport </td>
887
- <td> 机票行程单 </td>
888
- <td> 5 </td>
889
- </tr>
890
- <tr>
891
- <td> MachinePrintedInvoice </td>
892
- <td> 通用机打发票 </td>
893
- <td> 8 </td>
894
- </tr>
895
- <tr>
896
- <td> BusInvoice </td>
897
- <td> 汽车票 </td>
898
- <td> 9 </td>
899
- </tr>
900
- <tr>
901
- <td> ShippingInvoice </td>
902
- <td> 轮船票 </td>
903
- <td> 10 </td>
860
+ <td> 适用场景</td>
861
+ <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
862
+ <td>适用于所有通用场景的印刷体识别</td>
863
+ <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
904
864
  </tr>
905
865
  <tr>
906
- <td> NonTaxIncomeGeneralBill </td>
907
- <td> 非税收入通用票据 </td>
908
- <td> 15 </td>
866
+ <td>识别准确率</td>
867
+ <td>91%</td>
868
+ <td>96%</td>
869
+ <td>99%</td>
909
870
  </tr>
910
871
  <tr>
911
- <td> NonTaxIncomeElectronicBill </td>
912
- <td> 非税收入一般缴款书(电子) </td>
913
- <td> 15 </td>
872
+ <td>价格</td>
873
+ <td>低</td>
874
+ <td>中</td>
875
+ <td>高</td>
914
876
  </tr>
915
877
  <tr>
916
- <td> TollInvoice </td>
917
- <td> 过路过桥费发票 </td>
918
- <td> 13 </td>
878
+ <td>支持的语言</td>
879
+ <td>中文、英文、中英文</td>
880
+ <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
881
+ <td>中文、英文、中英文</td>
919
882
  </tr>
920
883
  <tr>
921
- <td> MedicalOutpatientInvoice </td>
922
- <td> 医疗门诊收费票据(电子) </td>
923
- <td> 17 </td>
884
+ <td>自动语言检测</td>
885
+ <td>支持</td>
886
+ <td>支持</td>
887
+ <td>支持</td>
924
888
  </tr>
925
889
  <tr>
926
- <td> MedicalHospitalizedInvoice </td>
927
- <td> 医疗住院收费票据(电子) </td>
928
- <td> 17 </td>
890
+ <td>返回文本行坐标</td>
891
+ <td>支持</td>
892
+ <td>支持</td>
893
+ <td>支持</td>
929
894
  </tr>
930
895
  <tr>
931
- <td> OtherInvoice </td>
932
- <td> 其他发票 </td>
933
- <td> -1 </td>
896
+ <td>自动旋转纠正</td>
897
+ <td>支持旋转识别,返回角度信息</td>
898
+ <td>支持旋转识别,返回角度信息</td>
899
+ <td>支持旋转识别,返回角度信息</td>
934
900
  </tr>
935
901
  </tbody>
936
902
  </table>
903
+
904
+ 默认接口请求频率限制:10次/秒。
937
905
  */
938
- RecognizeGeneralInvoice(req: RecognizeGeneralInvoiceRequest, cb?: (error: string, rep: RecognizeGeneralInvoiceResponse) => void): Promise<RecognizeGeneralInvoiceResponse>;
906
+ GeneralEfficientOCR(req: GeneralEfficientOCRRequest, cb?: (error: string, rep: GeneralEfficientOCRResponse) => void): Promise<GeneralEfficientOCRResponse>;
939
907
  /**
940
- * 本接口支持行驶证主页和副页所有字段的自动定位与识别。
908
+ * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
941
909
 
942
- 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
910
+ 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
943
911
 
944
- 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
912
+ 默认接口请求频率限制:20次/秒。
913
+ */
914
+ AdvertiseOCR(req: AdvertiseOCRRequest, cb?: (error: string, rep: AdvertiseOCRResponse) => void): Promise<AdvertiseOCRResponse>;
915
+ /**
916
+ * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
945
917
 
946
- 另外,本接口还支持复印件、翻拍告警功能。
918
+ 默认接口请求频率限制:5次/秒。
919
+ */
920
+ VehicleRegCertOCR(req: VehicleRegCertOCRRequest, cb?: (error: string, rep: VehicleRegCertOCRResponse) => void): Promise<VehicleRegCertOCRResponse>;
921
+ /**
922
+ * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
923
+
924
+ 默认接口请求频率限制:5次/秒。
925
+ */
926
+ CarInvoiceOCR(req: CarInvoiceOCRRequest, cb?: (error: string, rep: CarInvoiceOCRResponse) => void): Promise<CarInvoiceOCRResponse>;
927
+ /**
928
+ * 获取ocr结果
929
+ */
930
+ GetOCRResult(req: GetOCRResultRequest, cb?: (error: string, rep: GetOCRResultResponse) => void): Promise<GetOCRResultResponse>;
931
+ /**
932
+ * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
933
+
934
+ 默认接口请求频率限制:5次/秒。
935
+ */
936
+ FormulaOCR(req: FormulaOCRRequest, cb?: (error: string, rep: FormulaOCRResponse) => void): Promise<FormulaOCRResponse>;
937
+ /**
938
+ * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
947
939
 
948
940
  默认接口请求频率限制:10次/秒。
949
941
  */
950
- VehicleLicenseOCR(req: VehicleLicenseOCRRequest, cb?: (error: string, rep: VehicleLicenseOCRResponse) => void): Promise<VehicleLicenseOCRResponse>;
942
+ PassportOCR(req: PassportOCRRequest, cb?: (error: string, rep: PassportOCRResponse) => void): Promise<PassportOCRResponse>;
943
+ /**
944
+ * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
945
+
946
+ 默认接口请求频率限制:5次/秒。
947
+ */
948
+ ShipInvoiceOCR(req: ShipInvoiceOCRRequest, cb?: (error: string, rep: ShipInvoiceOCRResponse) => void): Promise<ShipInvoiceOCRResponse>;
949
+ /**
950
+ * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
951
+
952
+ 默认接口请求频率限制:5次/秒。
953
+ */
954
+ RideHailingTransportLicenseOCR(req: RideHailingTransportLicenseOCRRequest, cb?: (error: string, rep: RideHailingTransportLicenseOCRResponse) => void): Promise<RideHailingTransportLicenseOCRResponse>;
951
955
  }