tencentcloud-sdk-nodejs-ocr 4.0.1053 → 4.1.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,1860 +0,0 @@
1
- /* eslint-disable @typescript-eslint/no-unused-vars */
2
- /*
3
- * Copyright (c) 2018 THL A29 Limited, a Tencent company. All Rights Reserved.
4
- *
5
- * Licensed under the Apache License, Version 2.0 (the "License");
6
- * you may not use this file except in compliance with the License.
7
- * You may obtain a copy of the License at
8
- *
9
- * http://www.apache.org/licenses/LICENSE-2.0
10
- *
11
- * Unless required by applicable law or agreed to in writing,
12
- * software distributed under the License is distributed on an
13
- * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
14
- * KIND, either express or implied. See the License for the
15
- * specific language governing permissions and limitations
16
- * under the License.
17
- */
18
- import * as TencentCloudCommon from "tencentcloud-sdk-nodejs-common"
19
- import {
20
- StoreInfo,
21
- NonTaxItem,
22
- TextWaybill,
23
- RecognizeOnlineTaxiItineraryOCRResponse,
24
- InvoiceItem,
25
- HKIDCardOCRRequest,
26
- BankSlipOCRRequest,
27
- BusinessCardOCRResponse,
28
- TextArithmetic,
29
- ResidencePermitInfo,
30
- BankCardOCRRequest,
31
- SmartStructuralOCRResponse,
32
- CarInvoiceOCRRequest,
33
- MixedInvoiceItem,
34
- RecognizeTravelCardOCRRequest,
35
- TrainTicketOCRRequest,
36
- EstateCertOCRResponse,
37
- FlightInvoiceOCRRequest,
38
- WordItem,
39
- MLIDPassportOCRRequest,
40
- RecognizeGeneralTextImageWarnResponse,
41
- ItemInfo,
42
- SmartStructuralOCRV2Request,
43
- TextDetectResponse,
44
- RailwayTicketInfo,
45
- TollInvoiceOCRResponse,
46
- GetOCRTokenResponse,
47
- IDCardInfoResult,
48
- FinanBillSliceOCRResponse,
49
- DriverLicenseOCRResponse,
50
- WaybillOCRResponse,
51
- CreateAIFormTaskRequest,
52
- Words,
53
- TextDetectionEn,
54
- ElectronicFlightTicketFull,
55
- ClassifyStoreNameRequest,
56
- InvoiceGeneralOCRRequest,
57
- Rect,
58
- CustomsPaymentReceipt,
59
- QuestionSplitOCRRequest,
60
- VatRollItem,
61
- TextFormula,
62
- HmtResidentPermitOCRResponse,
63
- OtherInvoiceList,
64
- VehicleRegCertInfo,
65
- GeneralWarnInfo,
66
- FlightItem,
67
- Value,
68
- EnterpriseLicenseOCRResponse,
69
- BankSlip,
70
- QuestionOCRResponse,
71
- SealInfo,
72
- InvoiceGeneralInfo,
73
- TextVatInvoice,
74
- InstitutionOCRResponse,
75
- VehicleInvoiceInfo,
76
- DriverLicenseOCRRequest,
77
- OtherInvoiceItem,
78
- SmartStructuralProRequest,
79
- RecognizeTableOCRResponse,
80
- TextEduPaper,
81
- VatInvoiceItemInfo,
82
- QrcodeOCRResponse,
83
- WaybillObj,
84
- WordCoordPoint,
85
- InvoiceDetectInfo,
86
- MainlandPermitOCRRequest,
87
- VatElectronicItemInfo,
88
- SmartStructuralOCRV2Response,
89
- EnterpriseLicenseOCRRequest,
90
- QuestionSplitOCRResponse,
91
- TableOCRResponse,
92
- RecognizeStoreNameRequest,
93
- StructuralItem,
94
- OnlineTaxiItineraryInfo,
95
- FlightItemInfo,
96
- TextDetection,
97
- PropOwnerCertOCRResponse,
98
- FinanBillInfo,
99
- TrainTicketOCRResponse,
100
- TextFormulaInfo,
101
- TollInvoiceInfo,
102
- BankSlipInfo,
103
- RecognizeFormulaOCRResponse,
104
- ArithmeticOCRResponse,
105
- FormulaOCRResponse,
106
- RecognizeGeneralCardWarnRequest,
107
- BusInvoiceInfo,
108
- RecognizeEncryptedIDCardOCRRequest,
109
- SmartStructuralOCRRequest,
110
- TableCellInfo,
111
- GeneralHandwritingOCRRequest,
112
- BizLicenseOCRRequest,
113
- MixedInvoiceDetectResponse,
114
- RideHailingDriverLicenseOCRRequest,
115
- VatInvoiceUserInfo,
116
- GeneralMachineItem,
117
- GeneralAccurateOCRResponse,
118
- ElectronicTrainTicketFull,
119
- BusInvoice,
120
- QrcodeOCRRequest,
121
- TaxiInvoiceOCRResponse,
122
- RecognizeGeneralInvoiceRequest,
123
- GeneralBasicOCRResponse,
124
- MainlandTravelPermitBackInfos,
125
- OtherInvoice,
126
- CellContent,
127
- RecognizeMedicalInvoiceOCRResponse,
128
- RecognizeValidIDCardOCRRequest,
129
- MixedInvoiceOCRResponse,
130
- ClassifyDetectOCRResponse,
131
- VinOCRRequest,
132
- OCRResult,
133
- VehicleLicenseOCRResponse,
134
- VatInvoiceOCRRequest,
135
- Key,
136
- ElectronicAirTransport,
137
- ClassifyDetectOCRRequest,
138
- DutyPaidProofOCRResponse,
139
- TollInvoiceOCRRequest,
140
- LicensePlateOCRResponse,
141
- HKIDCardOCRResponse,
142
- ReflectDetailInfo,
143
- MedicalInvoiceInfo,
144
- VatInvoiceGoodsInfo,
145
- RecognizeThaiIDCardOCRResponse,
146
- GroupInfo,
147
- ItemPolygonInfo,
148
- PermitOCRRequest,
149
- SingleInvoiceItem,
150
- InvoiceGeneralOCRResponse,
151
- SmartFormFileUrl,
152
- VatInvoiceVerifyNewResponse,
153
- VatInvoiceInfo,
154
- TaxiInvoiceOCRRequest,
155
- MachinePrintedInvoice,
156
- FinancialBillItem,
157
- SingleInvoiceInfo,
158
- RecognizeContainerOCRRequest,
159
- TrainTicket,
160
- TextDetectRequest,
161
- VatRollInvoiceOCRResponse,
162
- VatInvoiceVerifyRequest,
163
- EduPaperOCRResponse,
164
- RecognizeThaiIDCardOCRRequest,
165
- BusinessCardInfo,
166
- MotorVehicleSaleInvoice,
167
- ElectronicTrainTicket,
168
- UsedVehicleInvoiceInfo,
169
- PassportRecognizeInfos,
170
- PropOwnerCertOCRRequest,
171
- ImageEnhancementResponse,
172
- PortraitImageInfo,
173
- QrcodeImgSize,
174
- PassportOCRResponse,
175
- FinancialBillItemDetails,
176
- CardWarnInfo,
177
- TaxPayment,
178
- VehicleRegCertOCRRequest,
179
- RecognizeTravelCardOCRResponse,
180
- ElectronicAirTransportDetail,
181
- FinancialBill,
182
- DocumentRecognizeInfo,
183
- LicensePlateOCRRequest,
184
- GeneralBasicOCRRequest,
185
- TextVehicleBack,
186
- ReconstructDocumentResponse,
187
- GeneralEfficientOCRRequest,
188
- AdvertiseOCRRequest,
189
- AirTicketInfo,
190
- RideHailingDriverLicenseOCRResponse,
191
- ImageEnhancementRequest,
192
- EnglishOCRRequest,
193
- VatInvoiceVerifyResponse,
194
- VatElectronicInfo,
195
- RecognizeValidIDCardOCRResponse,
196
- DetectedWords,
197
- IDCardInfo,
198
- IDCardOCRResponse,
199
- ShipInvoiceInfo,
200
- MedicalInvoiceItem,
201
- GeneralAccurateOCRRequest,
202
- OrgCodeCertOCRRequest,
203
- RecognizeFormulaOCRRequest,
204
- FlightInvoiceOCRResponse,
205
- ShipInvoiceOCRResponse,
206
- ReconstructDocumentRequest,
207
- VatInvoiceVerifyNewRequest,
208
- InstitutionOCRRequest,
209
- CarInvoiceInfo,
210
- FlightInvoiceInfo,
211
- DetailInformationOfAirTicketTupleList,
212
- TextVehicleFront,
213
- AdvertiseTextDetection,
214
- TextTable,
215
- FinanBillSliceInfo,
216
- Encryption,
217
- ArithmeticOCRRequest,
218
- NonTaxIncomeBill,
219
- VerifyOfdVatInvoiceOCRRequest,
220
- FinanBillSliceOCRRequest,
221
- RecognizeGeneralCardWarnResponse,
222
- ClassifyStoreNameResponse,
223
- VatRollInvoiceOCRRequest,
224
- AirTransport,
225
- TableTitle,
226
- RecognizeTableAccurateOCRRequest,
227
- Coord,
228
- SealOCRResponse,
229
- DutyPaidProofInfo,
230
- FinanBillOCRResponse,
231
- RecognizeHealthCodeOCRRequest,
232
- BankSlipOCRResponse,
233
- RecognizeEncryptedIDCardOCRResponse,
234
- PassInvoiceInfo,
235
- QuestionObj,
236
- TableInfo,
237
- VinOCRResponse,
238
- EduPaperOCRRequest,
239
- FormulaOCRRequest,
240
- TextGeneralHandwriting,
241
- PassportOCRRequest,
242
- DutyPaidProofOCRRequest,
243
- RecognizeHealthCodeOCRResponse,
244
- LineInfo,
245
- GeneralCardWarnInfo,
246
- TollInvoice,
247
- ItemCoord,
248
- CreateAIFormTaskResponse,
249
- MixedInvoiceOCRRequest,
250
- ShippingInvoice,
251
- TableDetectInfo,
252
- IDCardConfig,
253
- ResidenceBookletOCRResponse,
254
- VatInvoiceRoll,
255
- CarInvoiceOCRResponse,
256
- VehicleRegCertOCRResponse,
257
- GeneralFastOCRRequest,
258
- ImageSize,
259
- DocumentElement,
260
- RecognizeGeneralInvoiceResponse,
261
- Polygon,
262
- GetTaskStateResponse,
263
- InsuranceBillInfo,
264
- ContentInfo,
265
- QuestionOCRRequest,
266
- GetTaskStateRequest,
267
- TextTractorVehicleBack,
268
- RecognizeMedicalInvoiceOCRRequest,
269
- InsuranceBillOCRResponse,
270
- ClassifyDetectInfo,
271
- GeneralEfficientOCRResponse,
272
- ShipInvoiceOCRRequest,
273
- MLIDPassportOCRResponse,
274
- SealOCRRequest,
275
- VerifyOfdVatInvoiceOCRResponse,
276
- MedicalInvoice,
277
- HmtResidentPermitOCRRequest,
278
- RecognizeTableAccurateOCRResponse,
279
- ResidenceBookletOCRRequest,
280
- GetOCRResultRequest,
281
- BusInvoiceOCRResponse,
282
- QrcodeResultsInfo,
283
- GetOCRResultResponse,
284
- MainlandPermitOCRResponse,
285
- VatInvoice,
286
- MLIDCardOCRRequest,
287
- QuestionInfo,
288
- TaxiTicket,
289
- EnglishOCRResponse,
290
- ImageCoordinates,
291
- RecognizeForeignPermanentResidentIdCardResponse,
292
- BusInvoiceOCRRequest,
293
- OrgCodeCertOCRResponse,
294
- TemporaryIDCardInfo,
295
- VatInvoiceItem,
296
- RideHailingTransportLicenseOCRResponse,
297
- CandWord,
298
- RecognizeContainerOCRResponse,
299
- EnterpriseLicenseInfo,
300
- SmartStructuralProResponse,
301
- PermitOCRResponse,
302
- QuotaInvoice,
303
- InsuranceBillOCRRequest,
304
- GeneralHandwritingOCRResponse,
305
- IDCardResult,
306
- TableCell,
307
- LicensePlateInfo,
308
- DetectedWordCoordPoint,
309
- QuestionBlockObj,
310
- Element,
311
- AdvertiseOCRResponse,
312
- VehicleLicenseOCRRequest,
313
- VatRollInvoiceInfo,
314
- RecognizeOnlineTaxiItineraryOCRRequest,
315
- IDCardOCRRequest,
316
- MixedInvoiceDetectRequest,
317
- WaybillOCRRequest,
318
- ReconstructDocumentConfig,
319
- RecognizeStoreNameResponse,
320
- GetOCRTokenRequest,
321
- RideHailingTransportLicenseOCRRequest,
322
- MLIDCardOCRResponse,
323
- RecognizeTableOCRRequest,
324
- EstateCertOCRRequest,
325
- PermanentResidencePermitInfo,
326
- BizLicenseOCRResponse,
327
- ResultList,
328
- VatInvoiceOCRResponse,
329
- QuotaInvoiceOCRRequest,
330
- BankCardOCRResponse,
331
- TableOCRRequest,
332
- BusinessCardOCRRequest,
333
- FinanBillOCRRequest,
334
- QuotaInvoiceOCRResponse,
335
- RecognizeGeneralTextImageWarnRequest,
336
- RecognizeForeignPermanentResidentIdCardRequest,
337
- GeneralFastOCRResponse,
338
- UsedCarPurchaseInvoice,
339
- QrcodePositionObj,
340
- } from "./ocr_models"
341
-
342
- /**
343
- * ocr client
344
- * @class
345
- */
346
- export class Client extends TencentCloudCommon.AbstractClient {
347
- constructor(clientConfig: TencentCloudCommon.ClientConfig) {
348
- super("ocr.tencentcloudapi.com", "2018-11-19", clientConfig)
349
- }
350
-
351
- /**
352
- * 题目识别是教育的基础OCR识别能力。可支持扫描、拍照场景的单题题目识别。接口支持印刷体文本、手写体文本及公式的OCR识别和坐标返回,此外,接口还可对题目中的配图位置进行检测并返回坐标位置。适用于智能批改等场景的题目内容识别作为检索输入。
353
-
354
- 默认接口请求频率限制:2次/秒。
355
- */
356
- async QuestionOCR(
357
- req: QuestionOCRRequest,
358
- cb?: (error: string, rep: QuestionOCRResponse) => void
359
- ): Promise<QuestionOCRResponse> {
360
- return this.request("QuestionOCR", req, cb)
361
- }
362
-
363
- /**
364
- * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
365
-
366
- 默认接口请求频率限制:5次/秒。
367
- */
368
- async TextDetect(
369
- req: TextDetectRequest,
370
- cb?: (error: string, rep: TextDetectResponse) => void
371
- ): Promise<TextDetectResponse> {
372
- return this.request("TextDetect", req, cb)
373
- }
374
-
375
- /**
376
- * 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。
377
-
378
- 默认接口请求频率限制:5次/秒。
379
- */
380
- async QrcodeOCR(
381
- req: QrcodeOCRRequest,
382
- cb?: (error: string, rep: QrcodeOCRResponse) => void
383
- ): Promise<QrcodeOCRResponse> {
384
- return this.request("QrcodeOCR", req, cb)
385
- }
386
-
387
- /**
388
- * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
389
-
390
- 适用于文字较多、版式复杂、对识别准召率要求较高的场景,如试卷试题、网络图片、街景店招牌、法律卷宗等场景。
391
-
392
- 产品优势:与通用印刷体识别接口相比,本接口提供更高精度的通用文字识别服务,在手写体、文字较多、长串数字、小字、模糊字、倾斜文本等困难场景下,高精度版的准确率和召回率更高。
393
-
394
- 通用文字识别不同版本的差异如下:
395
- <table style="width:715px">
396
- <thead>
397
- <tr>
398
- <th style="width:150px"></th>
399
- <th >【荐】通用印刷体识别(高精度版)</th>
400
- <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
401
- <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
402
- </tr>
403
- </thead>
404
- <tbody>
405
- <tr>
406
- <td> 适用场景</td>
407
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
408
- <td>适用于所有通用场景的印刷体识别</td>
409
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
410
- </tr>
411
- <tr>
412
- <td>识别准确率</td>
413
- <td>99%</td>
414
- <td>96%</td>
415
- <td>91%</td>
416
- </tr>
417
- <tr>
418
- <td>价格</td>
419
- <td>高</td>
420
- <td>中</td>
421
- <td>低</td>
422
- </tr>
423
- <tr>
424
- <td>支持的语言</td>
425
- <td>中文、英文、中英文</td>
426
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
427
- <td>中文、英文、中英文</td>
428
- </tr>
429
- <tr>
430
- <td>自动语言检测</td>
431
- <td>支持</td>
432
- <td>支持</td>
433
- <td>支持</td>
434
- </tr>
435
- <tr>
436
- <td>返回文本行坐标</td>
437
- <td>支持</td>
438
- <td>支持</td>
439
- <td>支持</td>
440
- </tr>
441
- <tr>
442
- <td>自动旋转纠正</td>
443
- <td>支持旋转识别,返回角度信息</td>
444
- <td>支持旋转识别,返回角度信息</td>
445
- <td>支持旋转识别,返回角度信息</td>
446
- </tr>
447
- </tbody>
448
- </table>
449
-
450
- 默认接口请求频率限制:10次/秒。
451
- */
452
- async GeneralAccurateOCR(
453
- req: GeneralAccurateOCRRequest,
454
- cb?: (error: string, rep: GeneralAccurateOCRResponse) => void
455
- ): Promise<GeneralAccurateOCRResponse> {
456
- return this.request("GeneralAccurateOCR", req, cb)
457
- }
458
-
459
- /**
460
- * 本接口支持集装箱箱门信息识别,识别字段包括集装箱箱号、类型、总重量、有效承重、容量、自身重量,具备集装箱箱号、类型不完整或者不清晰的告警功能。
461
- 默认接口请求频率限制:5次/秒。
462
- */
463
- async RecognizeContainerOCR(
464
- req: RecognizeContainerOCRRequest,
465
- cb?: (error: string, rep: RecognizeContainerOCRResponse) => void
466
- ): Promise<RecognizeContainerOCRResponse> {
467
- return this.request("RecognizeContainerOCR", req, cb)
468
- }
469
-
470
- /**
471
- * 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。
472
-
473
- 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
474
-
475
- 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备9种告警功能,如下表所示。
476
-
477
- <table style="width:650px">
478
- <thead>
479
- <tr>
480
- <th width="150">扩展能力</th>
481
- <th width="500">能力项</th>
482
- </tr>
483
- </thead>
484
- <tbody>
485
- <tr>
486
- <td rowspan="2">裁剪功能</td>
487
- <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
488
- </tr>
489
- <tr>
490
- <td>人像照片裁剪(自动抠取身份证头像区域)</td>
491
- </tr>
492
- <tr>
493
- <td rowspan="9">告警功能</td>
494
- <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
495
-
496
- </td>
497
- </tr>
498
- <tr>
499
- <td>身份证边框不完整告警</td>
500
- </tr>
501
- <tr>
502
- <td>身份证复印件告警</td>
503
- </tr>
504
- <tr>
505
- <td>身份证翻拍告警</td>
506
- </tr>
507
- <tr>
508
- <td>身份证框内遮挡告警</td>
509
- </tr>
510
- <tr>
511
- <td>临时身份证告警</td>
512
- </tr>
513
- <tr>
514
- <td>身份证疑似存在PS痕迹告警</td>
515
- </tr>
516
- <tr>
517
- <td>图片模糊告警(可根据图片质量分数判断)</td>
518
- </tr>
519
- </tbody>
520
- </table>
521
-
522
- 默认接口请求频率限制:20次/秒。
523
- */
524
- async RecognizeEncryptedIDCardOCR(
525
- req: RecognizeEncryptedIDCardOCRRequest,
526
- cb?: (error: string, rep: RecognizeEncryptedIDCardOCRResponse) => void
527
- ): Promise<RecognizeEncryptedIDCardOCRResponse> {
528
- return this.request("RecognizeEncryptedIDCardOCR", req, cb)
529
- }
530
-
531
- /**
532
- * 本接口用于识别门头照文字识别结果以及对应分类标签信息
533
- 默认接口请求频率限制:1次/秒
534
- */
535
- async RecognizeStoreName(
536
- req: RecognizeStoreNameRequest,
537
- cb?: (error: string, rep: RecognizeStoreNameResponse) => void
538
- ): Promise<RecognizeStoreNameResponse> {
539
- return this.request("RecognizeStoreName", req, cb)
540
- }
541
-
542
- /**
543
- * 本接口支持以及其他国家、地区的护照识别。识别字段包括护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码,具备护照人像照片的裁剪功能和翻拍、复印件告警功能。
544
- 本接口支持地区范围:可机读护照国家。包括中国港澳台地区、新加坡、马来西亚、泰国、美国、韩国、越南、澳大利亚、缅甸、印度尼西亚、日本、加拿大、老挝、巴基斯坦、哈萨克斯坦、法国、英国、德国、菲律宾、新西兰、印度、意大利、蒙古、孟加拉国、尼日利亚、柬埔寨、西班牙、摩洛哥、吉尔吉斯斯坦、埃及、荷兰、塔吉克斯坦、巴西、乌兹别克斯坦、伊拉克、阿尔及利亚、土耳其、南非、墨西哥、尼泊尔、白俄罗斯、叶门、阿富汗、沙特、肯尼亚、波兰、比利时、瑞典、奥地利、坦桑尼亚、委内瑞拉、阿根廷、喀麦隆、斯里兰卡、衣索比亚、约旦、瑞士、加纳、爱尔兰、哥伦比亚、苏丹、匈牙利、罗马尼亚、阿联酋、文莱、希腊、以色列、巴拿马、丹麦、伊朗、乌干达、挪威、秘鲁、葡萄牙、智利、塞尔维亚、芬兰、尚比亚、亚美尼亚、叙利亚、黎巴嫩、斯洛伐克、卡塔尔、古巴、朝鲜。
545
-
546
- 默认接口请求频率限制:5次/秒。
547
- */
548
- async MLIDPassportOCR(
549
- req: MLIDPassportOCRRequest,
550
- cb?: (error: string, rep: MLIDPassportOCRResponse) => void
551
- ): Promise<MLIDPassportOCRResponse> {
552
- return this.request("MLIDPassportOCR", req, cb)
553
- }
554
-
555
- /**
556
- * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
557
-
558
- 默认接口请求频率限制:5次/秒。
559
- */
560
- async TrainTicketOCR(
561
- req: TrainTicketOCRRequest,
562
- cb?: (error: string, rep: TrainTicketOCRResponse) => void
563
- ): Promise<TrainTicketOCRResponse> {
564
- return this.request("TrainTicketOCR", req, cb)
565
- }
566
-
567
- /**
568
- * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。
569
- 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。
570
-
571
- 默认接口请求频率限制:5次/秒。
572
- */
573
- async PropOwnerCertOCR(
574
- req: PropOwnerCertOCRRequest,
575
- cb?: (error: string, rep: PropOwnerCertOCRResponse) => void
576
- ): Promise<PropOwnerCertOCRResponse> {
577
- return this.request("PropOwnerCertOCR", req, cb)
578
- }
579
-
580
- /**
581
- * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
582
-
583
- 默认接口请求频率限制:5次/秒。
584
- */
585
- async InvoiceGeneralOCR(
586
- req: InvoiceGeneralOCRRequest,
587
- cb?: (error: string, rep: InvoiceGeneralOCRResponse) => void
588
- ): Promise<InvoiceGeneralOCRResponse> {
589
- return this.request("InvoiceGeneralOCR", req, cb)
590
- }
591
-
592
- /**
593
- * 服务已迁移至 [文档解析](https://cloud.tencent.com/document/product/1759/107504),请跳转查看接口文档。该接口支持将图片或PDF文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。
594
- */
595
- async ReconstructDocument(
596
- req: ReconstructDocumentRequest,
597
- cb?: (error: string, rep: ReconstructDocumentResponse) => void
598
- ): Promise<ReconstructDocumentResponse> {
599
- return this.request("ReconstructDocument", req, cb)
600
- }
601
-
602
- /**
603
- * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
604
-
605
- 默认接口请求频率限制:5次/秒。
606
- */
607
- async HKIDCardOCR(
608
- req: HKIDCardOCRRequest,
609
- cb?: (error: string, rep: HKIDCardOCRResponse) => void
610
- ): Promise<HKIDCardOCRResponse> {
611
- return this.request("HKIDCardOCR", req, cb)
612
- }
613
-
614
- /**
615
- * 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
616
-
617
- 默认接口请求频率限制:10次/秒。
618
- */
619
- async PermitOCR(
620
- req: PermitOCRRequest,
621
- cb?: (error: string, rep: PermitOCRResponse) => void
622
- ): Promise<PermitOCRResponse> {
623
- return this.request("PermitOCR", req, cb)
624
- }
625
-
626
- /**
627
- * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
628
-
629
- 默认接口请求频率限制:5次/秒。
630
- */
631
- async BusInvoiceOCR(
632
- req: BusInvoiceOCRRequest,
633
- cb?: (error: string, rep: BusInvoiceOCRResponse) => void
634
- ): Promise<BusInvoiceOCRResponse> {
635
- return this.request("BusInvoiceOCR", req, cb)
636
- }
637
-
638
- /**
639
- * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
640
-
641
- 默认接口请求频率限制:10次/秒。
642
- */
643
- async EnglishOCR(
644
- req: EnglishOCRRequest,
645
- cb?: (error: string, rep: EnglishOCRResponse) => void
646
- ): Promise<EnglishOCRResponse> {
647
- return this.request("EnglishOCR", req, cb)
648
- }
649
-
650
- /**
651
- * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
652
-
653
- 默认接口请求频率限制:5次/秒。
654
- */
655
- async SmartStructuralOCR(
656
- req: SmartStructuralOCRRequest,
657
- cb?: (error: string, rep: SmartStructuralOCRResponse) => void
658
- ): Promise<SmartStructuralOCRResponse> {
659
- return this.request("SmartStructuralOCR", req, cb)
660
- }
661
-
662
- /**
663
- * 本接口用于识别门头照分类标签信息
664
- 默认接口请求频率限制:1次/秒
665
- */
666
- async ClassifyStoreName(
667
- req: ClassifyStoreNameRequest,
668
- cb?: (error: string, rep: ClassifyStoreNameResponse) => void
669
- ): Promise<ClassifyStoreNameResponse> {
670
- return this.request("ClassifyStoreName", req, cb)
671
- }
672
-
673
- /**
674
- * 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
675
-
676
- 默认接口请求频率限制:5次/秒。
677
- */
678
- async TaxiInvoiceOCR(
679
- req: TaxiInvoiceOCRRequest,
680
- cb?: (error: string, rep: TaxiInvoiceOCRResponse) => void
681
- ): Promise<TaxiInvoiceOCRResponse> {
682
- return this.request("TaxiInvoiceOCR", req, cb)
683
- }
684
-
685
- /**
686
- * 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
687
-
688
- 默认接口请求频率限制:5次/秒。
689
- */
690
- async RideHailingDriverLicenseOCR(
691
- req: RideHailingDriverLicenseOCRRequest,
692
- cb?: (error: string, rep: RideHailingDriverLicenseOCRResponse) => void
693
- ): Promise<RideHailingDriverLicenseOCRResponse> {
694
- return this.request("RideHailingDriverLicenseOCR", req, cb)
695
- }
696
-
697
- /**
698
- * 外国人永久居留身份证识别
699
- */
700
- async RecognizeForeignPermanentResidentIdCard(
701
- req: RecognizeForeignPermanentResidentIdCardRequest,
702
- cb?: (error: string, rep: RecognizeForeignPermanentResidentIdCardResponse) => void
703
- ): Promise<RecognizeForeignPermanentResidentIdCardResponse> {
704
- return this.request("RecognizeForeignPermanentResidentIdCard", req, cb)
705
- }
706
-
707
- /**
708
- * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
709
-
710
- 默认接口请求频率限制:20次/秒。
711
- */
712
- async MainlandPermitOCR(
713
- req: MainlandPermitOCRRequest,
714
- cb?: (error: string, rep: MainlandPermitOCRResponse) => void
715
- ): Promise<MainlandPermitOCRResponse> {
716
- return this.request("MainlandPermitOCR", req, cb)
717
- }
718
-
719
- /**
720
- * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
721
-
722
- 默认接口请求频率限制:5次/秒。
723
- */
724
- async FlightInvoiceOCR(
725
- req: FlightInvoiceOCRRequest,
726
- cb?: (error: string, rep: FlightInvoiceOCRResponse) => void
727
- ): Promise<FlightInvoiceOCRResponse> {
728
- return this.request("FlightInvoiceOCR", req, cb)
729
- }
730
-
731
- /**
732
- * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
733
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
734
-
735
- 默认接口请求频率限制:10次/秒
736
- */
737
- async RecognizeThaiIDCardOCR(
738
- req: RecognizeThaiIDCardOCRRequest,
739
- cb?: (error: string, rep: RecognizeThaiIDCardOCRResponse) => void
740
- ): Promise<RecognizeThaiIDCardOCRResponse> {
741
- return this.request("RecognizeThaiIDCardOCR", req, cb)
742
- }
743
-
744
- /**
745
- * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票等常用标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
746
-
747
- 默认接口请求频率限制:5次/秒。
748
-
749
-
750
- 支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表:
751
- <table style="width:715px">
752
- <thead>
753
- <tr>
754
- <th style="width:200px">SubType 子票种英文</th>
755
- <th style="width:200px">TypeDescription子票种中文</th>
756
- <th >Type 所属大类票种</th>
757
- </tr>
758
- </thead>
759
- <tbody>
760
- <tr>
761
- <td> VatSpecialInvoice</td>
762
- <td> 增值税专用发票 </td>
763
- <td> 3 </td>
764
- </tr>
765
- <tr>
766
- <td> VatCommonInvoice</td>
767
- <td> 增值税普通发票 </td>
768
- <td> 3 </td>
769
- </tr>
770
- <tr>
771
- <td> VatElectronicCommonInvoice </td>
772
- <td> 增值税电子普通发票 </td>
773
- <td> 3 </td>
774
- </tr>
775
- <tr>
776
- <td> VatElectronicSpecialInvoice </td>
777
- <td> 增值税电子专用发票 </td>
778
- <td> 3 </td>
779
- </tr>
780
- <tr>
781
- <td> VatElectronicInvoiceBlockchain</td>
782
- <td> 区块链电子发票 </td>
783
- <td> 3 </td>
784
- </tr>
785
- <tr>
786
- <td> VatElectronicInvoiceToll</td>
787
- <td> 增值税电子普通发票(通行费)</td>
788
- <td> 3 </td>
789
- </tr>
790
- <tr>
791
- <td> VatSalesList</td>
792
- <td> 增值税销货清单</td>
793
- <td> 3 </td>
794
- </tr>
795
- <tr>
796
- <td> VatElectronicSpecialInvoiceFull</td>
797
- <td> 电子发票(专用发票)</td>
798
- <td> 16 </td>
799
- </tr>
800
- <tr>
801
- <td> VatElectronicInvoiceFull</td>
802
- <td> 电子发票(普通发票) </td>
803
- <td> 16 </td>
804
- </tr>
805
- <tr>
806
- <td> ElectronicFlightTicketFull</td>
807
- <td> 电子发票(机票行程单)</td>
808
- <td> 16 </td>
809
- </tr>
810
- <tr>
811
- <td> ElectronicTrainTicketFull</td>
812
- <td> 电子发票(铁路电子客票)</td>
813
- <td> 16 </td>
814
- </tr>
815
- <tr>
816
- <td> MotorVehicleSaleInvoice </td>
817
- <td> 机动车销售统一发票 </td>
818
- <td> 12 </td>
819
- </tr>
820
- <tr>
821
- <td> UsedCarPurchaseInvoice </td>
822
- <td> 二手车销售统一发票 </td>
823
- <td> 12 </td>
824
- </tr>
825
- <tr>
826
- <td> VatInvoiceRoll </td>
827
- <td> 增值税普通发票(卷票) </td>
828
- <td> 11 </td>
829
- </tr>
830
- <tr>
831
- <td> TaxiTicket </td>
832
- <td> 出租车发票 </td>
833
- <td> 0 </td>
834
- </tr>
835
- <tr>
836
- <td> QuotaInvoice </td>
837
- <td> 定额发票 </td>
838
- <td> 1 </td>
839
- </tr>
840
- <tr>
841
- <td> TrainTicket </td>
842
- <td> 火车票 </td>
843
- <td> 2 </td>
844
- </tr>
845
- <tr>
846
- <td> AirTransport </td>
847
- <td> 机票行程单 </td>
848
- <td> 5 </td>
849
- </tr>
850
- <tr>
851
- <td> MachinePrintedInvoice </td>
852
- <td> 通用机打发票 </td>
853
- <td> 8 </td>
854
- </tr>
855
- <tr>
856
- <td> BusInvoice </td>
857
- <td> 汽车票 </td>
858
- <td> 9 </td>
859
- </tr>
860
- <tr>
861
- <td> ShippingInvoice </td>
862
- <td> 轮船票 </td>
863
- <td> 10 </td>
864
- </tr>
865
- <tr>
866
- <td> NonTaxIncomeGeneralBill </td>
867
- <td> 非税收入通用票据 </td>
868
- <td> 15 </td>
869
- </tr>
870
- <tr>
871
- <td> NonTaxIncomeElectronicBill </td>
872
- <td> 非税收入一般缴款书(电子) </td>
873
- <td> 15 </td>
874
- </tr>
875
- <tr>
876
- <td> TollInvoice </td>
877
- <td> 过路过桥费发票 </td>
878
- <td> 13 </td>
879
- </tr>
880
- <tr>
881
- <td> MedicalOutpatientInvoice </td>
882
- <td> 医疗门诊收费票据(电子) </td>
883
- <td> 17 </td>
884
- </tr>
885
- <tr>
886
- <td> MedicalHospitalizedInvoice </td>
887
- <td> 医疗住院收费票据(电子) </td>
888
- <td> 17 </td>
889
- </tr>
890
- <tr>
891
- <td> TaxPayment </td>
892
- <td> 完税凭证 </td>
893
- <td> 18 </td>
894
- </tr>
895
- <tr>
896
- <td> CustomsPaymentReceipt </td>
897
- <td> 海关缴款 </td>
898
- <td> 19 </td>
899
- </tr>
900
- <tr>
901
- <td> OtherInvoice </td>
902
- <td> 其他发票 </td>
903
- <td> -1 </td>
904
- </tr>
905
- </tbody>
906
- </table>
907
- */
908
- async RecognizeGeneralInvoice(
909
- req: RecognizeGeneralInvoiceRequest,
910
- cb?: (error: string, rep: RecognizeGeneralInvoiceResponse) => void
911
- ): Promise<RecognizeGeneralInvoiceResponse> {
912
- return this.request("RecognizeGeneralInvoice", req, cb)
913
- }
914
-
915
- /**
916
- * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
917
-
918
- 默认接口请求频率限制:1次/秒。
919
- */
920
- async InsuranceBillOCR(
921
- req: InsuranceBillOCRRequest,
922
- cb?: (error: string, rep: InsuranceBillOCRResponse) => void
923
- ): Promise<InsuranceBillOCRResponse> {
924
- return this.request("InsuranceBillOCR", req, cb)
925
- }
926
-
927
- /**
928
- * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
929
-
930
- 默认接口请求频率限制:20次/秒。
931
- */
932
- async VatInvoiceVerifyNew(
933
- req: VatInvoiceVerifyNewRequest,
934
- cb?: (error: string, rep: VatInvoiceVerifyNewResponse) => void
935
- ): Promise<VatInvoiceVerifyNewResponse> {
936
- return this.request("VatInvoiceVerifyNew", req, cb)
937
- }
938
-
939
- /**
940
- * 本接口支持图片内车辆识别代号(VIN)的检测和识别。
941
- 默认接口请求频率限制:10次/秒。
942
- */
943
- async VinOCR(
944
- req: VinOCRRequest,
945
- cb?: (error: string, rep: VinOCRResponse) => void
946
- ): Promise<VinOCRResponse> {
947
- return this.request("VinOCR", req, cb)
948
- }
949
-
950
- /**
951
- * 本接口支持行驶证主页和副页所有字段的自动定位与识别。
952
-
953
- 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
954
-
955
- 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
956
-
957
- 另外,本接口还支持复印件、翻拍告警功能。
958
-
959
- 默认接口请求频率限制:10次/秒。
960
- */
961
- async VehicleLicenseOCR(
962
- req: VehicleLicenseOCRRequest,
963
- cb?: (error: string, rep: VehicleLicenseOCRResponse) => void
964
- ): Promise<VehicleLicenseOCRResponse> {
965
- return this.request("VehicleLicenseOCR", req, cb)
966
- }
967
-
968
- /**
969
- * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
970
-
971
- 默认接口请求频率限制:10次/秒。
972
- */
973
- async BizLicenseOCR(
974
- req: BizLicenseOCRRequest,
975
- cb?: (error: string, rep: BizLicenseOCRResponse) => void
976
- ): Promise<BizLicenseOCRResponse> {
977
- return this.request("BizLicenseOCR", req, cb)
978
- }
979
-
980
- /**
981
- * 智慧表单产品已下线,需要下线相关API
982
-
983
- 支持查询智能表单录入任务的状态。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
984
- */
985
- async GetTaskState(
986
- req: GetTaskStateRequest,
987
- cb?: (error: string, rep: GetTaskStateResponse) => void
988
- ): Promise<GetTaskStateResponse> {
989
- return this.request("GetTaskState", req, cb)
990
- }
991
-
992
- /**
993
- * 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。
994
-
995
- 默认接口请求频率限制:5次/秒。
996
- */
997
- async RecognizeGeneralCardWarn(
998
- req: RecognizeGeneralCardWarnRequest,
999
- cb?: (error: string, rep: RecognizeGeneralCardWarnResponse) => void
1000
- ): Promise<RecognizeGeneralCardWarnResponse> {
1001
- return this.request("RecognizeGeneralCardWarn", req, cb)
1002
- }
1003
-
1004
- /**
1005
- * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
1006
-
1007
- 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
1008
-
1009
- 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
1010
-
1011
- 通用印刷体识别不同版本的差异如下:
1012
- <table style="width:715px">
1013
- <thead>
1014
- <tr>
1015
- <th style="width:150px"></th>
1016
- <th style="width:200px">【荐】通用印刷体识别</th>
1017
- <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
1018
- <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th>
1019
- </tr>
1020
- </thead>
1021
- <tbody>
1022
- <tr>
1023
- <td> 适用场景</td>
1024
- <td>适用于所有通用场景的印刷体识别</td>
1025
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
1026
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
1027
- </tr>
1028
- <tr>
1029
- <td>识别准确率</td>
1030
- <td>96%</td>
1031
- <td>99%</td>
1032
- <td>91%</td>
1033
- </tr>
1034
- <tr>
1035
- <td>价格</td>
1036
- <td>中</td>
1037
- <td>高</td>
1038
- <td>低</td>
1039
- </tr>
1040
- <tr>
1041
- <td>支持的语言</td>
1042
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
1043
- <td>中文、英文、中英文</td>
1044
- <td>中文、英文、中英文</td>
1045
- </tr>
1046
- <tr>
1047
- <td>自动语言检测</td>
1048
- <td>支持</td>
1049
- <td>支持</td>
1050
- <td>支持</td>
1051
- </tr>
1052
- <tr>
1053
- <td>返回文本行坐标</td>
1054
- <td>支持</td>
1055
- <td>支持</td>
1056
- <td>支持</td>
1057
- </tr>
1058
- <tr>
1059
- <td>自动旋转纠正</td>
1060
- <td>支持旋转识别,返回角度信息</td>
1061
- <td>支持旋转识别,返回角度信息</td>
1062
- <td>支持旋转识别,返回角度信息</td>
1063
- </tr>
1064
- </tbody>
1065
- </table>
1066
-
1067
- 默认接口请求频率限制:20次/秒。
1068
- */
1069
- async GeneralBasicOCR(
1070
- req: GeneralBasicOCRRequest,
1071
- cb?: (error: string, rep: GeneralBasicOCRResponse) => void
1072
- ): Promise<GeneralBasicOCRResponse> {
1073
- return this.request("GeneralBasicOCR", req, cb)
1074
- }
1075
-
1076
- /**
1077
- * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
1078
-
1079
- 默认接口请求频率限制:5次/秒。
1080
- */
1081
- async MixedInvoiceOCR(
1082
- req: MixedInvoiceOCRRequest,
1083
- cb?: (error: string, rep: MixedInvoiceOCRResponse) => void
1084
- ): Promise<MixedInvoiceOCRResponse> {
1085
- return this.request("MixedInvoiceOCR", req, cb)
1086
- }
1087
-
1088
- /**
1089
- * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
1090
-
1091
- 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
1092
-
1093
- 默认接口请求频率限制:10次/秒。
1094
- */
1095
- async TableOCR(
1096
- req: TableOCRRequest,
1097
- cb?: (error: string, rep: TableOCRResponse) => void
1098
- ): Promise<TableOCRResponse> {
1099
- return this.request("TableOCR", req, cb)
1100
- }
1101
-
1102
- /**
1103
- * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
1104
-
1105
- 默认接口请求频率限制:10次/秒。
1106
- */
1107
- async ArithmeticOCR(
1108
- req: ArithmeticOCRRequest,
1109
- cb?: (error: string, rep: ArithmeticOCRResponse) => void
1110
- ): Promise<ArithmeticOCRResponse> {
1111
- return this.request("ArithmeticOCR", req, cb)
1112
- }
1113
-
1114
- /**
1115
- * 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
1116
-
1117
- 默认接口请求频率限制:5次/秒。
1118
- */
1119
- async EstateCertOCR(
1120
- req: EstateCertOCRRequest,
1121
- cb?: (error: string, rep: EstateCertOCRResponse) => void
1122
- ): Promise<EstateCertOCRResponse> {
1123
- return this.request("EstateCertOCR", req, cb)
1124
- }
1125
-
1126
- /**
1127
- * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
1128
-
1129
- 默认接口请求频率限制:5次/秒。
1130
- */
1131
- async RecognizeValidIDCardOCR(
1132
- req: RecognizeValidIDCardOCRRequest,
1133
- cb?: (error: string, rep: RecognizeValidIDCardOCRResponse) => void
1134
- ): Promise<RecognizeValidIDCardOCRResponse> {
1135
- return this.request("RecognizeValidIDCardOCR", req, cb)
1136
- }
1137
-
1138
- /**
1139
- * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
1140
-
1141
- 默认接口请求频率限制:10次/秒。
1142
- */
1143
- async BankCardOCR(
1144
- req: BankCardOCRRequest,
1145
- cb?: (error: string, rep: BankCardOCRResponse) => void
1146
- ): Promise<BankCardOCRResponse> {
1147
- return this.request("BankCardOCR", req, cb)
1148
- }
1149
-
1150
- /**
1151
- * 已上线VatInvoiceVerifyNew,VatInvoiceVerify需要下线,产品在官网已发通告
1152
-
1153
- 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。
1154
-
1155
- 默认接口请求频率限制:20次/秒。
1156
- */
1157
- async VatInvoiceVerify(
1158
- req: VatInvoiceVerifyRequest,
1159
- cb?: (error: string, rep: VatInvoiceVerifyResponse) => void
1160
- ): Promise<VatInvoiceVerifyResponse> {
1161
- return this.request("VatInvoiceVerify", req, cb)
1162
- }
1163
-
1164
- /**
1165
- * 获取ocr的token值
1166
- */
1167
- async GetOCRToken(
1168
- req: GetOCRTokenRequest,
1169
- cb?: (error: string, rep: GetOCRTokenResponse) => void
1170
- ): Promise<GetOCRTokenResponse> {
1171
- return this.request("GetOCRToken", req, cb)
1172
- }
1173
-
1174
- /**
1175
- * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
1176
-
1177
- 默认接口请求频率限制:5次/秒。
1178
- */
1179
- async EduPaperOCR(
1180
- req: EduPaperOCRRequest,
1181
- cb?: (error: string, rep: EduPaperOCRResponse) => void
1182
- ): Promise<EduPaperOCRResponse> {
1183
- return this.request("EduPaperOCR", req, cb)
1184
- }
1185
-
1186
- /**
1187
- * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
1188
-
1189
- 默认接口请求频率限制:5次/秒。
1190
- */
1191
- async EnterpriseLicenseOCR(
1192
- req: EnterpriseLicenseOCRRequest,
1193
- cb?: (error: string, rep: EnterpriseLicenseOCRResponse) => void
1194
- ): Promise<EnterpriseLicenseOCRResponse> {
1195
- return this.request("EnterpriseLicenseOCR", req, cb)
1196
- }
1197
-
1198
- /**
1199
- * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
1200
-
1201
- 默认接口请求频率限制:10次/秒。
1202
- */
1203
- async BusinessCardOCR(
1204
- req: BusinessCardOCRRequest,
1205
- cb?: (error: string, rep: BusinessCardOCRResponse) => void
1206
- ): Promise<BusinessCardOCRResponse> {
1207
- return this.request("BusinessCardOCR", req, cb)
1208
- }
1209
-
1210
- /**
1211
- * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
1212
-
1213
- 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。
1214
-
1215
- <table style="width:650px">
1216
- <thead>
1217
- <tr>
1218
- <th width="150">扩展能力</th>
1219
- <th width="500">能力项</th>
1220
- </tr>
1221
- </thead>
1222
- <tbody>
1223
- <tr>
1224
- <td rowspan="2">裁剪功能</td>
1225
- <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
1226
- </tr>
1227
- <tr>
1228
- <td>人像照片裁剪(自动抠取身份证头像区域)</td>
1229
- </tr>
1230
- <tr>
1231
- <td rowspan="9">告警功能</td>
1232
- <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限
1233
-
1234
- </td>
1235
- </tr>
1236
- <tr>
1237
- <td>身份证边框不完整告警</td>
1238
- </tr>
1239
- <tr>
1240
- <td>身份证复印件告警</td>
1241
- </tr>
1242
- <tr>
1243
- <td>身份证翻拍告警</td>
1244
- </tr>
1245
- <tr>
1246
- <td>身份证框内遮挡告警</td>
1247
- </tr>
1248
- <tr>
1249
- <td>临时身份证告警</td>
1250
- </tr>
1251
- <tr>
1252
- <td>身份证疑似存在PS痕迹告警</td>
1253
- </tr>
1254
- <tr>
1255
- <td>图片模糊告警(可根据图片质量分数判断)</td>
1256
- </tr>
1257
- </tbody>
1258
- </table>
1259
-
1260
- 默认接口请求频率限制:20次/秒。
1261
- */
1262
- async IDCardOCR(
1263
- req: IDCardOCRRequest,
1264
- cb?: (error: string, rep: IDCardOCRResponse) => void
1265
- ): Promise<IDCardOCRResponse> {
1266
- return this.request("IDCardOCR", req, cb)
1267
- }
1268
-
1269
- /**
1270
- * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。
1271
- */
1272
- async RecognizeGeneralTextImageWarn(
1273
- req: RecognizeGeneralTextImageWarnRequest,
1274
- cb?: (error: string, rep: RecognizeGeneralTextImageWarnResponse) => void
1275
- ): Promise<RecognizeGeneralTextImageWarnResponse> {
1276
- return this.request("RecognizeGeneralTextImageWarn", req, cb)
1277
- }
1278
-
1279
- /**
1280
- * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。
1281
-
1282
- 默认接口请求频率限制:5次/秒。
1283
- */
1284
- async InstitutionOCR(
1285
- req: InstitutionOCRRequest,
1286
- cb?: (error: string, rep: InstitutionOCRResponse) => void
1287
- ): Promise<InstitutionOCRResponse> {
1288
- return this.request("InstitutionOCR", req, cb)
1289
- }
1290
-
1291
- /**
1292
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
1293
-
1294
- 默认接口请求频率限制:5次/秒。
1295
- */
1296
- async SmartStructuralOCRV2(
1297
- req: SmartStructuralOCRV2Request,
1298
- cb?: (error: string, rep: SmartStructuralOCRV2Response) => void
1299
- ): Promise<SmartStructuralOCRV2Response> {
1300
- return this.request("SmartStructuralOCRV2", req, cb)
1301
- }
1302
-
1303
- /**
1304
- * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
1305
-
1306
- 默认接口请求频率限制:2次/秒。
1307
- */
1308
- async RecognizeTableAccurateOCR(
1309
- req: RecognizeTableAccurateOCRRequest,
1310
- cb?: (error: string, rep: RecognizeTableAccurateOCRResponse) => void
1311
- ): Promise<RecognizeTableAccurateOCRResponse> {
1312
- return this.request("RecognizeTableAccurateOCR", req, cb)
1313
- }
1314
-
1315
- /**
1316
- * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
1317
- 默认接口请求频率限制:5次/秒。
1318
- */
1319
- async MixedInvoiceDetect(
1320
- req: MixedInvoiceDetectRequest,
1321
- cb?: (error: string, rep: MixedInvoiceDetectResponse) => void
1322
- ): Promise<MixedInvoiceDetectResponse> {
1323
- return this.request("MixedInvoiceDetect", req, cb)
1324
- }
1325
-
1326
- /**
1327
- * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
1328
-
1329
- 默认接口请求频率限制:5次/秒。
1330
- */
1331
- async VatRollInvoiceOCR(
1332
- req: VatRollInvoiceOCRRequest,
1333
- cb?: (error: string, rep: VatRollInvoiceOCRResponse) => void
1334
- ): Promise<VatRollInvoiceOCRResponse> {
1335
- return this.request("VatRollInvoiceOCR", req, cb)
1336
- }
1337
-
1338
- /**
1339
- * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
1340
-
1341
- 默认接口请求频率限制:5次/秒。
1342
- */
1343
- async QuotaInvoiceOCR(
1344
- req: QuotaInvoiceOCRRequest,
1345
- cb?: (error: string, rep: QuotaInvoiceOCRResponse) => void
1346
- ): Promise<QuotaInvoiceOCRResponse> {
1347
- return this.request("QuotaInvoiceOCR", req, cb)
1348
- }
1349
-
1350
- /**
1351
- * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
1352
-
1353
- 默认接口请求频率限制:10次/秒。
1354
- */
1355
- async GeneralHandwritingOCR(
1356
- req: GeneralHandwritingOCRRequest,
1357
- cb?: (error: string, rep: GeneralHandwritingOCRResponse) => void
1358
- ): Promise<GeneralHandwritingOCRResponse> {
1359
- return this.request("GeneralHandwritingOCR", req, cb)
1360
- }
1361
-
1362
- /**
1363
- * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
1364
-
1365
- 默认接口请求频率限制:20次/秒。
1366
- */
1367
- async RecognizeOnlineTaxiItineraryOCR(
1368
- req: RecognizeOnlineTaxiItineraryOCRRequest,
1369
- cb?: (error: string, rep: RecognizeOnlineTaxiItineraryOCRResponse) => void
1370
- ): Promise<RecognizeOnlineTaxiItineraryOCRResponse> {
1371
- return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb)
1372
- }
1373
-
1374
- /**
1375
- * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
1376
-
1377
- 默认接口请求频率限制:10次/秒。
1378
- */
1379
- async RecognizeTableOCR(
1380
- req: RecognizeTableOCRRequest,
1381
- cb?: (error: string, rep: RecognizeTableOCRResponse) => void
1382
- ): Promise<RecognizeTableOCRResponse> {
1383
- return this.request("RecognizeTableOCR", req, cb)
1384
- }
1385
-
1386
- /**
1387
- * 智慧表单产品已下线,需要下线相关API
1388
-
1389
- 本接口可创建智能表单录入任务,支持多个识别图片和PDF的URL上传,返回含有识别内容的操作页面URL。
1390
-
1391
- 智能表单录入产品提供高准确率的表单识别技术和人工核对工具,支持自定义字段,将识别结果自动填入到自定义条目中,并提供人工操作工具,完成整个表单识别过程。适用性强,可对票据、合同、货单等文件的识别,适用于金融、货代、保险、档案等领域。本产品免费公测中,您可以点击demo(超链接:https://ocr.smartform.cloud.tencent.com/)试用,如需购买请与商务团队联系。
1392
- */
1393
- async CreateAIFormTask(
1394
- req: CreateAIFormTaskRequest,
1395
- cb?: (error: string, rep: CreateAIFormTaskResponse) => void
1396
- ): Promise<CreateAIFormTaskResponse> {
1397
- return this.request("CreateAIFormTask", req, cb)
1398
- }
1399
-
1400
- /**
1401
- * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
1402
-
1403
- 默认接口请求频率限制:10次/秒。
1404
- */
1405
- async WaybillOCR(
1406
- req: WaybillOCRRequest,
1407
- cb?: (error: string, rep: WaybillOCRResponse) => void
1408
- ): Promise<WaybillOCRResponse> {
1409
- return this.request("WaybillOCR", req, cb)
1410
- }
1411
-
1412
- /**
1413
- * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
1414
-
1415
- 默认接口请求频率限制:20次/秒。
1416
- */
1417
- async HmtResidentPermitOCR(
1418
- req: HmtResidentPermitOCRRequest,
1419
- cb?: (error: string, rep: HmtResidentPermitOCRResponse) => void
1420
- ): Promise<HmtResidentPermitOCRResponse> {
1421
- return this.request("HmtResidentPermitOCR", req, cb)
1422
- }
1423
-
1424
- /**
1425
- * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
1426
-
1427
- 默认接口请求频率限制:5次/秒。
1428
- */
1429
- async TollInvoiceOCR(
1430
- req: TollInvoiceOCRRequest,
1431
- cb?: (error: string, rep: TollInvoiceOCRResponse) => void
1432
- ): Promise<TollInvoiceOCRResponse> {
1433
- return this.request("TollInvoiceOCR", req, cb)
1434
- }
1435
-
1436
- /**
1437
- * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
1438
-
1439
- 默认接口请求频率限制:20次/秒。
1440
- */
1441
- async ClassifyDetectOCR(
1442
- req: ClassifyDetectOCRRequest,
1443
- cb?: (error: string, rep: ClassifyDetectOCRResponse) => void
1444
- ): Promise<ClassifyDetectOCRResponse> {
1445
- return this.request("ClassifyDetectOCR", req, cb)
1446
- }
1447
-
1448
- /**
1449
- * 公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物)的印刷体和手写体的公式识别。
1450
-
1451
- 默认接口请求频率限制:2次/秒。
1452
- */
1453
- async RecognizeFormulaOCR(
1454
- req: RecognizeFormulaOCRRequest,
1455
- cb?: (error: string, rep: RecognizeFormulaOCRResponse) => void
1456
- ): Promise<RecognizeFormulaOCRResponse> {
1457
- return this.request("RecognizeFormulaOCR", req, cb)
1458
- }
1459
-
1460
- /**
1461
- * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
1462
-
1463
- 默认接口请求频率限制:5次/秒。
1464
- */
1465
- async SealOCR(
1466
- req: SealOCRRequest,
1467
- cb?: (error: string, rep: SealOCRResponse) => void
1468
- ): Promise<SealOCRResponse> {
1469
- return this.request("SealOCR", req, cb)
1470
- }
1471
-
1472
- /**
1473
- * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
1474
-
1475
- 默认接口请求频率限制:10次/秒。
1476
- */
1477
- async BankSlipOCR(
1478
- req: BankSlipOCRRequest,
1479
- cb?: (error: string, rep: BankSlipOCRResponse) => void
1480
- ): Promise<BankSlipOCRResponse> {
1481
- return this.request("BankSlipOCR", req, cb)
1482
- }
1483
-
1484
- /**
1485
- * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
1486
-
1487
- 默认接口请求频率限制:5次/秒。
1488
- */
1489
- async ResidenceBookletOCR(
1490
- req: ResidenceBookletOCRRequest,
1491
- cb?: (error: string, rep: ResidenceBookletOCRResponse) => void
1492
- ): Promise<ResidenceBookletOCRResponse> {
1493
- return this.request("ResidenceBookletOCR", req, cb)
1494
- }
1495
-
1496
- /**
1497
- * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
1498
-
1499
- 默认接口请求频率限制:20次/秒。
1500
- */
1501
- async RecognizeTravelCardOCR(
1502
- req: RecognizeTravelCardOCRRequest,
1503
- cb?: (error: string, rep: RecognizeTravelCardOCRResponse) => void
1504
- ): Promise<RecognizeTravelCardOCRResponse> {
1505
- return this.request("RecognizeTravelCardOCR", req, cb)
1506
- }
1507
-
1508
- /**
1509
- * 本接口支持OFD格式的增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
1510
- */
1511
- async VerifyOfdVatInvoiceOCR(
1512
- req: VerifyOfdVatInvoiceOCRRequest,
1513
- cb?: (error: string, rep: VerifyOfdVatInvoiceOCRResponse) => void
1514
- ): Promise<VerifyOfdVatInvoiceOCRResponse> {
1515
- return this.request("VerifyOfdVatInvoiceOCR", req, cb)
1516
- }
1517
-
1518
- /**
1519
- * 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
1520
-
1521
- 驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
1522
-
1523
- 驾驶证副页:包括证号、姓名、档案编号、记录。
1524
-
1525
- 另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
1526
-
1527
- 电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
1528
-
1529
- 默认接口请求频率限制:10次/秒。
1530
- */
1531
- async DriverLicenseOCR(
1532
- req: DriverLicenseOCRRequest,
1533
- cb?: (error: string, rep: DriverLicenseOCRResponse) => void
1534
- ): Promise<DriverLicenseOCRResponse> {
1535
- return this.request("DriverLicenseOCR", req, cb)
1536
- }
1537
-
1538
- /**
1539
- * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
1540
-
1541
- 默认接口请求频率限制:5次/秒。
1542
- */
1543
- async FinanBillOCR(
1544
- req: FinanBillOCRRequest,
1545
- cb?: (error: string, rep: FinanBillOCRResponse) => void
1546
- ): Promise<FinanBillOCRResponse> {
1547
- return this.request("FinanBillOCR", req, cb)
1548
- }
1549
-
1550
- /**
1551
- * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
1552
-
1553
- 默认接口请求频率限制:5次/秒。
1554
- */
1555
- async SmartStructuralPro(
1556
- req: SmartStructuralProRequest,
1557
- cb?: (error: string, rep: SmartStructuralProResponse) => void
1558
- ): Promise<SmartStructuralProResponse> {
1559
- return this.request("SmartStructuralPro", req, cb)
1560
- }
1561
-
1562
- /**
1563
- * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
1564
-
1565
- 默认接口请求频率限制:10次/秒。
1566
- */
1567
- async RecognizeHealthCodeOCR(
1568
- req: RecognizeHealthCodeOCRRequest,
1569
- cb?: (error: string, rep: RecognizeHealthCodeOCRResponse) => void
1570
- ): Promise<RecognizeHealthCodeOCRResponse> {
1571
- return this.request("RecognizeHealthCodeOCR", req, cb)
1572
- }
1573
-
1574
- /**
1575
- * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
1576
-
1577
- 默认接口请求频率限制:10次/秒。
1578
- */
1579
- async ImageEnhancement(
1580
- req: ImageEnhancementRequest,
1581
- cb?: (error: string, rep: ImageEnhancementResponse) => void
1582
- ): Promise<ImageEnhancementResponse> {
1583
- return this.request("ImageEnhancement", req, cb)
1584
- }
1585
-
1586
- /**
1587
- * 试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。
1588
-
1589
- 默认接口请求频率限制:2次/秒。
1590
- */
1591
- async QuestionSplitOCR(
1592
- req: QuestionSplitOCRRequest,
1593
- cb?: (error: string, rep: QuestionSplitOCRResponse) => void
1594
- ): Promise<QuestionSplitOCRResponse> {
1595
- return this.request("QuestionSplitOCR", req, cb)
1596
- }
1597
-
1598
- /**
1599
- * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
1600
- 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
1601
- */
1602
- async MLIDCardOCR(
1603
- req: MLIDCardOCRRequest,
1604
- cb?: (error: string, rep: MLIDCardOCRResponse) => void
1605
- ): Promise<MLIDCardOCRResponse> {
1606
- return this.request("MLIDCardOCR", req, cb)
1607
- }
1608
-
1609
- /**
1610
- * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
1611
-
1612
- 默认接口请求频率限制:5次/秒。
1613
- */
1614
- async RecognizeMedicalInvoiceOCR(
1615
- req: RecognizeMedicalInvoiceOCRRequest,
1616
- cb?: (error: string, rep: RecognizeMedicalInvoiceOCRResponse) => void
1617
- ): Promise<RecognizeMedicalInvoiceOCRResponse> {
1618
- return this.request("RecognizeMedicalInvoiceOCR", req, cb)
1619
- }
1620
-
1621
- /**
1622
- * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
1623
-
1624
- 默认接口请求频率限制:10次/秒。
1625
- */
1626
- async GeneralFastOCR(
1627
- req: GeneralFastOCRRequest,
1628
- cb?: (error: string, rep: GeneralFastOCRResponse) => void
1629
- ): Promise<GeneralFastOCRResponse> {
1630
- return this.request("GeneralFastOCR", req, cb)
1631
- }
1632
-
1633
- /**
1634
- * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
1635
-
1636
- 默认接口请求频率限制:10次/秒。
1637
- */
1638
- async VatInvoiceOCR(
1639
- req: VatInvoiceOCRRequest,
1640
- cb?: (error: string, rep: VatInvoiceOCRResponse) => void
1641
- ): Promise<VatInvoiceOCRResponse> {
1642
- return this.request("VatInvoiceOCR", req, cb)
1643
- }
1644
-
1645
- /**
1646
- * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
1647
-
1648
- 默认接口请求频率限制:5次/秒。
1649
- */
1650
- async DutyPaidProofOCR(
1651
- req: DutyPaidProofOCRRequest,
1652
- cb?: (error: string, rep: DutyPaidProofOCRResponse) => void
1653
- ): Promise<DutyPaidProofOCRResponse> {
1654
- return this.request("DutyPaidProofOCR", req, cb)
1655
- }
1656
-
1657
- /**
1658
- * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。
1659
-
1660
- 默认接口请求频率限制:5次/秒。
1661
- */
1662
- async OrgCodeCertOCR(
1663
- req: OrgCodeCertOCRRequest,
1664
- cb?: (error: string, rep: OrgCodeCertOCRResponse) => void
1665
- ): Promise<OrgCodeCertOCRResponse> {
1666
- return this.request("OrgCodeCertOCR", req, cb)
1667
- }
1668
-
1669
- /**
1670
- * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
1671
-
1672
- 默认接口请求频率限制:5次/秒。
1673
- */
1674
- async FinanBillSliceOCR(
1675
- req: FinanBillSliceOCRRequest,
1676
- cb?: (error: string, rep: FinanBillSliceOCRResponse) => void
1677
- ): Promise<FinanBillSliceOCRResponse> {
1678
- return this.request("FinanBillSliceOCR", req, cb)
1679
- }
1680
-
1681
- /**
1682
- * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
1683
-
1684
- 默认接口请求频率限制:10次/秒。
1685
- */
1686
- async LicensePlateOCR(
1687
- req: LicensePlateOCRRequest,
1688
- cb?: (error: string, rep: LicensePlateOCRResponse) => void
1689
- ): Promise<LicensePlateOCRResponse> {
1690
- return this.request("LicensePlateOCR", req, cb)
1691
- }
1692
-
1693
- /**
1694
- * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
1695
-
1696
- 适用于快速文本识别场景。
1697
-
1698
- 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
1699
-
1700
- 通用印刷体识别不同版本的差异如下:
1701
- <table style="width:715px">
1702
- <thead>
1703
- <tr>
1704
- <th style="width:150px"></th>
1705
- <th >通用印刷体识别(精简版)</th>
1706
- <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
1707
- <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
1708
- </tr>
1709
- </thead>
1710
- <tbody>
1711
- <tr>
1712
- <td> 适用场景</td>
1713
- <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
1714
- <td>适用于所有通用场景的印刷体识别</td>
1715
- <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
1716
- </tr>
1717
- <tr>
1718
- <td>识别准确率</td>
1719
- <td>91%</td>
1720
- <td>96%</td>
1721
- <td>99%</td>
1722
- </tr>
1723
- <tr>
1724
- <td>价格</td>
1725
- <td>低</td>
1726
- <td>中</td>
1727
- <td>高</td>
1728
- </tr>
1729
- <tr>
1730
- <td>支持的语言</td>
1731
- <td>中文、英文、中英文</td>
1732
- <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
1733
- <td>中文、英文、中英文</td>
1734
- </tr>
1735
- <tr>
1736
- <td>自动语言检测</td>
1737
- <td>支持</td>
1738
- <td>支持</td>
1739
- <td>支持</td>
1740
- </tr>
1741
- <tr>
1742
- <td>返回文本行坐标</td>
1743
- <td>支持</td>
1744
- <td>支持</td>
1745
- <td>支持</td>
1746
- </tr>
1747
- <tr>
1748
- <td>自动旋转纠正</td>
1749
- <td>支持旋转识别,返回角度信息</td>
1750
- <td>支持旋转识别,返回角度信息</td>
1751
- <td>支持旋转识别,返回角度信息</td>
1752
- </tr>
1753
- </tbody>
1754
- </table>
1755
-
1756
- 默认接口请求频率限制:10次/秒。
1757
- */
1758
- async GeneralEfficientOCR(
1759
- req: GeneralEfficientOCRRequest,
1760
- cb?: (error: string, rep: GeneralEfficientOCRResponse) => void
1761
- ): Promise<GeneralEfficientOCRResponse> {
1762
- return this.request("GeneralEfficientOCR", req, cb)
1763
- }
1764
-
1765
- /**
1766
- * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。
1767
-
1768
- 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
1769
-
1770
- 默认接口请求频率限制:20次/秒。
1771
- */
1772
- async AdvertiseOCR(
1773
- req: AdvertiseOCRRequest,
1774
- cb?: (error: string, rep: AdvertiseOCRResponse) => void
1775
- ): Promise<AdvertiseOCRResponse> {
1776
- return this.request("AdvertiseOCR", req, cb)
1777
- }
1778
-
1779
- /**
1780
- * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
1781
-
1782
- 默认接口请求频率限制:5次/秒。
1783
- */
1784
- async VehicleRegCertOCR(
1785
- req: VehicleRegCertOCRRequest,
1786
- cb?: (error: string, rep: VehicleRegCertOCRResponse) => void
1787
- ): Promise<VehicleRegCertOCRResponse> {
1788
- return this.request("VehicleRegCertOCR", req, cb)
1789
- }
1790
-
1791
- /**
1792
- * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
1793
-
1794
- 默认接口请求频率限制:5次/秒。
1795
- */
1796
- async CarInvoiceOCR(
1797
- req: CarInvoiceOCRRequest,
1798
- cb?: (error: string, rep: CarInvoiceOCRResponse) => void
1799
- ): Promise<CarInvoiceOCRResponse> {
1800
- return this.request("CarInvoiceOCR", req, cb)
1801
- }
1802
-
1803
- /**
1804
- * 获取ocr结果
1805
- */
1806
- async GetOCRResult(
1807
- req: GetOCRResultRequest,
1808
- cb?: (error: string, rep: GetOCRResultResponse) => void
1809
- ): Promise<GetOCRResultResponse> {
1810
- return this.request("GetOCRResult", req, cb)
1811
- }
1812
-
1813
- /**
1814
- * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
1815
-
1816
- 默认接口请求频率限制:5次/秒。
1817
- */
1818
- async FormulaOCR(
1819
- req: FormulaOCRRequest,
1820
- cb?: (error: string, rep: FormulaOCRResponse) => void
1821
- ): Promise<FormulaOCRResponse> {
1822
- return this.request("FormulaOCR", req, cb)
1823
- }
1824
-
1825
- /**
1826
- * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
1827
-
1828
- 默认接口请求频率限制:10次/秒。
1829
- */
1830
- async PassportOCR(
1831
- req: PassportOCRRequest,
1832
- cb?: (error: string, rep: PassportOCRResponse) => void
1833
- ): Promise<PassportOCRResponse> {
1834
- return this.request("PassportOCR", req, cb)
1835
- }
1836
-
1837
- /**
1838
- * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
1839
-
1840
- 默认接口请求频率限制:5次/秒。
1841
- */
1842
- async ShipInvoiceOCR(
1843
- req: ShipInvoiceOCRRequest,
1844
- cb?: (error: string, rep: ShipInvoiceOCRResponse) => void
1845
- ): Promise<ShipInvoiceOCRResponse> {
1846
- return this.request("ShipInvoiceOCR", req, cb)
1847
- }
1848
-
1849
- /**
1850
- * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
1851
-
1852
- 默认接口请求频率限制:5次/秒。
1853
- */
1854
- async RideHailingTransportLicenseOCR(
1855
- req: RideHailingTransportLicenseOCRRequest,
1856
- cb?: (error: string, rep: RideHailingTransportLicenseOCRResponse) => void
1857
- ): Promise<RideHailingTransportLicenseOCRResponse> {
1858
- return this.request("RideHailingTransportLicenseOCR", req, cb)
1859
- }
1860
- }