tencentcloud-sdk-ocr 3.0.1107 → 3.0.1109

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
checksums.yaml CHANGED
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  SHA1:
3
- metadata.gz: 87219dbaff6aa0460944cc17f97b77934f36c2b5
4
- data.tar.gz: 55baac29e28f036329764784fa915c150d5bd3ee
3
+ metadata.gz: 9d8ad8c5d339c104ad37d30667be6c78a76689c6
4
+ data.tar.gz: 669d1714248857559818611bffb71d784f00e062
5
5
  SHA512:
6
- metadata.gz: 258530b724324df4a9d24eb41962fcaa343e323b1429b7ebe22b6683050ba20e69e431ff71f6dbaf7acb242d549ce55c730a5cd500076a81a01342885809afa4
7
- data.tar.gz: fd0e9098e638feed82ac409b92e725450334f8c266bdbb5c56deae13699af87586bfe8b4552f657c5317193612a30c3d3f9c808b3dd5a7a8366035d9a0584a7c
6
+ metadata.gz: e936c14e0c3fd6b15672e7a9c2fc58c22e8c56b5d7e96a91966c48fdae1ddc0c99df5a527fa955e507f8a5de8f509109e7bf6d6bf9c018d6e290a22809ac0237
7
+ data.tar.gz: 699b28468d4d68efa063fd1a4157a242d0e903d59b3841475bcad20154f655ac191a297939ac62e58f1e94097bfc44dc029649df56a719ebfdc7954320a95ad9
data/lib/VERSION CHANGED
@@ -1 +1 @@
1
- 3.0.1107
1
+ 3.0.1109
@@ -2170,6 +2170,32 @@ module TencentCloud
2170
2170
  raise TencentCloud::Common::TencentCloudSDKException.new(nil, e.inspect)
2171
2171
  end
2172
2172
 
2173
+ # 基于MLLM(多模态大语言模型)的表格识别能力,针对复杂表格的算法识别效果更佳,适配财务报表识别场景,并可输出直接对接业务系统的Excel数据。
2174
+
2175
+ # 默认接口请求频率限制:1次/秒。
2176
+
2177
+ # @param request: Request instance for RecognizeTableMultiOCR.
2178
+ # @type request: :class:`Tencentcloud::ocr::V20181119::RecognizeTableMultiOCRRequest`
2179
+ # @rtype: :class:`Tencentcloud::ocr::V20181119::RecognizeTableMultiOCRResponse`
2180
+ def RecognizeTableMultiOCR(request)
2181
+ body = send_request('RecognizeTableMultiOCR', request.serialize)
2182
+ response = JSON.parse(body)
2183
+ if response['Response'].key?('Error') == false
2184
+ model = RecognizeTableMultiOCRResponse.new
2185
+ model.deserialize(response['Response'])
2186
+ model
2187
+ else
2188
+ code = response['Response']['Error']['Code']
2189
+ message = response['Response']['Error']['Message']
2190
+ reqid = response['Response']['RequestId']
2191
+ raise TencentCloud::Common::TencentCloudSDKException.new(code, message, reqid)
2192
+ end
2193
+ rescue TencentCloud::Common::TencentCloudSDKException => e
2194
+ raise e
2195
+ rescue StandardError => e
2196
+ raise TencentCloud::Common::TencentCloudSDKException.new(nil, e.inspect)
2197
+ end
2198
+
2173
2199
  # 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
2174
2200
 
2175
2201
  # 默认接口请求频率限制:10次/秒。
@@ -9501,6 +9501,62 @@ module TencentCloud
9501
9501
  end
9502
9502
  end
9503
9503
 
9504
+ # RecognizeTableMultiOCR请求参数结构体
9505
+ class RecognizeTableMultiOCRRequest < TencentCloud::Common::AbstractModel
9506
+ # @param ImageBase64: 图片/PDF的 Base64 值。 要求图片/PDF经Base64编码后不超过 10M,分辨率建议600*800以上,支持PNG、JPG、JPEG、BMP、PDF格式。 图片支持的像素范围:需介于20-10000px之间。 图片的 ImageUrl、ImageBase64 必须提供一个,如果都提供,只使用 ImageUrl。
9507
+ # @type ImageBase64: String
9508
+ # @param ImageUrl: 图片/PDF的 Url 地址。 要求图片/PDF经Base64编码后不超过 10M,分辨率建议600*800以上,支持PNG、JPG、JPEG、BMP、PDF格式。 图片支持的像素范围:需介于20-10000px之间。 图片存储于腾讯云的 Url 可保障更高的下载速度和稳定性,建议图片存储于腾讯云。非腾讯云存储的 Url 速度和稳定性可能受一定影响。
9509
+ # @type ImageUrl: String
9510
+ # @param PdfStartPageNumber: 文档的起始页码。 当传入文件是PDF型时,用来指定识别的起始页码,识别的页码包含当前值。
9511
+ # @type PdfStartPageNumber: Integer
9512
+ # @param PdfEndPageNumber: 文档的结束页码。 当传入文件是PDF类型时,用来指定识别的结束页码,识别的页码包含当前值。单次调用最多支持识别3页内容,即PdfEndPageNumber-PdfStartPageNumber需要不大于3。
9513
+ # @type PdfEndPageNumber: Integer
9514
+ # @param DataFormat: 配置选项,支持配置输出数据格式。
9515
+
9516
+ # * **Mdbase64** 返回 base64 编码的 markdown 格式文本。
9517
+ # * **Excelbase64** 返回 base64 编码的 excel 文件。
9518
+ # @type DataFormat: String
9519
+
9520
+ attr_accessor :ImageBase64, :ImageUrl, :PdfStartPageNumber, :PdfEndPageNumber, :DataFormat
9521
+
9522
+ def initialize(imagebase64=nil, imageurl=nil, pdfstartpagenumber=nil, pdfendpagenumber=nil, dataformat=nil)
9523
+ @ImageBase64 = imagebase64
9524
+ @ImageUrl = imageurl
9525
+ @PdfStartPageNumber = pdfstartpagenumber
9526
+ @PdfEndPageNumber = pdfendpagenumber
9527
+ @DataFormat = dataformat
9528
+ end
9529
+
9530
+ def deserialize(params)
9531
+ @ImageBase64 = params['ImageBase64']
9532
+ @ImageUrl = params['ImageUrl']
9533
+ @PdfStartPageNumber = params['PdfStartPageNumber']
9534
+ @PdfEndPageNumber = params['PdfEndPageNumber']
9535
+ @DataFormat = params['DataFormat']
9536
+ end
9537
+ end
9538
+
9539
+ # RecognizeTableMultiOCR返回参数结构体
9540
+ class RecognizeTableMultiOCRResponse < TencentCloud::Common::AbstractModel
9541
+ # @param DataBase64: Base64 编码后的 Excel 数据或 Markdown 数据。 注意:此字段可能返回空,表示取不到有效值。
9542
+ # 注意:此字段可能返回 null,表示取不到有效值。
9543
+ # @type DataBase64: String
9544
+ # @param RequestId: 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
9545
+ # @type RequestId: String
9546
+
9547
+ attr_accessor :DataBase64, :RequestId
9548
+
9549
+ def initialize(database64=nil, requestid=nil)
9550
+ @DataBase64 = database64
9551
+ @RequestId = requestid
9552
+ end
9553
+
9554
+ def deserialize(params)
9555
+ @DataBase64 = params['DataBase64']
9556
+ @RequestId = params['RequestId']
9557
+ end
9558
+ end
9559
+
9504
9560
  # RecognizeTableOCR请求参数结构体
9505
9561
  class RecognizeTableOCRRequest < TencentCloud::Common::AbstractModel
9506
9562
  # @param ImageBase64: 图片/PDF的 Base64 值。
metadata CHANGED
@@ -1,14 +1,14 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: tencentcloud-sdk-ocr
3
3
  version: !ruby/object:Gem::Version
4
- version: 3.0.1107
4
+ version: 3.0.1109
5
5
  platform: ruby
6
6
  authors:
7
7
  - Tencent Cloud
8
8
  autorequire:
9
9
  bindir: bin
10
10
  cert_chain: []
11
- date: 2025-07-23 00:00:00.000000000 Z
11
+ date: 2025-07-27 00:00:00.000000000 Z
12
12
  dependencies:
13
13
  - !ruby/object:Gem::Dependency
14
14
  name: tencentcloud-sdk-common