RubyGems - tencentcloud-sdk-asr - Versions diffs - 3.0.651 → 3.0.652 - Mend

tencentcloud-sdk-asr 3.0.651 → 3.0.652

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: eaec1beb0978d739923bb85c75453a50563bf709
-  data.tar.gz: 14cee5c1b0859c4cfbeca3a90e314c4bfddc44e3
+  metadata.gz: 53b44fc98df9ba18e9aabebfc954e0a46420fb5a
+  data.tar.gz: 104b8613f34a43b7f99333f1c1403749cd9a9f5c
 SHA512:
-  metadata.gz: 7e95db4d321c32fbeb59c75e2a22cb7115c2581a4c32a85f73c1098e8e26f17c23660a33693ccdb1e2cf9a412c820216a1c95e709e8ab53a4351068203e5e272
-  data.tar.gz: d2df38fbfdb934360ce10115fa9efc263fd7d382d40e800681aacaad54df5781c931ac87d6ad3fa3cb57ad516188bf6658dd3b504dda8a6784ced2689a5beb1a
+  metadata.gz: ec4db3234468301dcbe104dfab453b093a35cb3b768d2e9fa2b78cc9c16aa2f30d42b82c15f1e58831ad54566b047e66bb34d8a461b8130cd36e1a0c854dd6a1
+  data.tar.gz: 55e4029e5315ae33b94982559849a8f12db5f117f4bf5ff23722cab915fa307734242d80eeb64524ee76d4549c359636e1f5f807b4719bd95f26842e4eb1b8be

data/lib/VERSION CHANGED Viewed

	@@ -1 +1 @@
1	- 3.0.~~651~~
1	+ 3.0.652

data/lib/v20190614/client.rb CHANGED Viewed

@@ -137,15 +137,16 @@ module TencentCloud
           raise TencentCloud::Common::TencentCloudSDKException.new(nil, e.inspect)
         end
-        # 本接口服务对时长5小时以内的录音文件进行识别，异步返回识别全部结果。
-        # • 支持中文普通话、英语、粤语、日语、越南语、马来语、印度尼西亚语、菲律宾语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。
-        # • 支持wav、mp3、m4a、flv、mp4、wma、3gp、amr、aac、ogg-opus、flac格式。
-        # • 支持语音 URL 和本地语音文件两种请求方式。语音 URL 的音频时长不能长于5小时，文件大小不超过1GB。本地语音文件调用不能大于5MB。推荐使用 [ 腾讯云COS](https://cloud.tencent.com/document/product/436/38484) 来存储&生成URL提交任务，无外网&流量下行费用，节约成本、提升任务速度。(COS桶权限需要设置公有读私有写，或URL设置外部可访问)
-        # • 提交录音文件识别请求后，在3小时内完成识别（大多数情况下1小时音频约3分钟以内完成识别，半小时内发送超过1000小时录音或者2万条识别任务的除外），识别结果在服务端可保存7天。
-        # • 支持回调或轮询的方式获取结果，结果获取请参考[ 录音文件识别结果查询](https://cloud.tencent.com/document/product/1093/37822)。
-        # •   生成字幕场景可设置参数ResTextFormat为3，解析ResultDetail结构生成字幕，可参考 [生成字幕最佳实践](https://cloud.tencent.com/document/product/1093/84291)。
-        # •   签名方法参考 [公共参数](https://cloud.tencent.com/document/api/1093/35640) 中签名方法v3。
-        # • 默认接口请求频率限制：20次/秒。
+        # 本接口可对较长的录音文件进行识别。如希望直接使用带界面的语音识别产品，请访问[产品体验中心](https://console.cloud.tencent.com/asr/demonstrate)。产品计费标准请查阅 [计费概述（在线版）](https://cloud.tencent.com/document/product/1093/35686)
+        # • 接口默认限频：20次/秒。此处仅限制任务提交频次，与识别结果返回时效无关
+        # • 返回时效：异步回调，非实时返回。最长3小时返回识别结果，**大多数情况下，1小时的音频1-3分钟即可完成识别**。请注意：上述返回时长不含音频下载时延，且30分钟内发送超过1000小时录音或2万条任务的情况除外
+        # • 音频格式：wav、mp3、m4a、flv、mp4、wma、3gp、amr、aac、ogg-opus、flac
+        # • 支持语言：在本页面上搜索 **EngineModelType**，或前往 [产品功能](https://cloud.tencent.com/document/product/1093/35682) 查看
+        # • 音频提交方式：本接口支持**音频 URL 、本地音频文件**两种请求方式。推荐使用 [腾讯云COS](https://cloud.tencent.com/document/product/436/38484) 来存储、生成URL并提交任务，此种方式将不产生外网和流量下行费用，可节约成本、提升任务速度（COS桶权限需要设置公有读私有写，或URL设置外部可访问）
+        # • 音频限制：音频 URL 时长不能大于5小时，文件大小不超过1GB；本地音频文件不能大于5MB
+        # • 如何获取识别结果：支持**回调或轮询**的方式获取结果，具体请参考 [录音文件识别结果查询](https://cloud.tencent.com/document/product/1093/37822)
+        # • 识别结果有效时间：在服务端保存7天
+        # • 签名方法参考 [公共参数](https://cloud.tencent.com/document/api/1093/35640) 中签名方法 v3
         # @param request: Request instance for CreateRecTask.
         # @type request: :class:`Tencentcloud::asr::V20190614::CreateRecTaskRequest`
@@ -463,7 +464,7 @@ module TencentCloud
           raise TencentCloud::Common::TencentCloudSDKException.new(nil, e.inspect)
         end
-        # 本接口用于对60秒之内的短音频文件进行识别。<br>•   支持中文普通话、英语、粤语、日语、越南语、马来语、印度尼西亚语、菲律宾语、泰语、葡萄牙语、土耳其语、阿拉伯语、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。<br>•   支持本地语音文件上传和语音URL上传两种请求方式，音频时长不能超过60s，音频文件大小不能超过3MB。<br>•   音频格式支持wav、pcm、ogg-opus、speex、silk、mp3、m4a、aac。<br>•   请求方法为 HTTP POST , Content-Type为"application/json; charset=utf-8"<br>•   签名方法参考 [公共参数](https://cloud.tencent.com/document/api/1093/35640) 中签名方法v3。<br>•   默认接口请求频率限制：30次/秒，如您有提高请求频率限制的需求，请[前往购买](https://buy.cloud.tencent.com/asr)。
+        # 本接口用于对60秒之内的短音频文件进行识别。<br>•   支持中文普通话、英语、粤语、日语、越南语、马来语、印度尼西亚语、菲律宾语、泰语、葡萄牙语、土耳其语、阿拉伯语、印地语、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。<br>•   支持本地语音文件上传和语音URL上传两种请求方式，音频时长不能超过60s，音频文件大小不能超过3MB。<br>•   音频格式支持wav、pcm、ogg-opus、speex、silk、mp3、m4a、aac。<br>•   请求方法为 HTTP POST , Content-Type为"application/json; charset=utf-8"<br>•   签名方法参考 [公共参数](https://cloud.tencent.com/document/api/1093/35640) 中签名方法v3。<br>•   默认接口请求频率限制：30次/秒，如您有提高请求频率限制的需求，请[前往购买](https://buy.cloud.tencent.com/asr)。
         # @param request: Request instance for SentenceRecognition.
         # @type request: :class:`Tencentcloud::asr::V20190614::SentenceRecognitionRequest`

data/lib/v20190614/models.rb CHANGED Viewed

@@ -162,6 +162,7 @@ module TencentCloud
         # • 16k_tr：土耳其语；
         # • 16k_ar：阿拉伯语；
         # • 16k_es：西班牙语；
+        # • 16k_hi：印地语；
         # @type EngineType: String
         # @param Url: 语音流地址，支持rtmp、rtsp等流媒体协议，以及各类基于http协议的直播流(不支持hls, m3u8)
         # @type Url: String
@@ -288,15 +289,19 @@ module TencentCloud
       # CreateRecTask请求参数结构体
       class CreateRecTaskRequest < TencentCloud::Common::AbstractModel
-        # @param EngineModelType: 引擎模型类型。注意：非电话场景请务必使用16k的引擎。
-        # 电话场景：
-        # • 8k_zh：中文电话通用；
-        # • 8k_en：英文电话通用；
-        # 非电话场景：
-        # • 16k_zh：中文通用；
-        # • 16k_zh-PY：中英粤;
-        # • 16k_zh_medical：中文医疗；
+        # @param EngineModelType: 引擎模型类型
+        # 电话通讯场景引擎：
+        # **注意：电话通讯场景，请务必使用以下8k引擎**
+        # • 8k_zh：中文电话通讯；
+        # • 8k_en：英文电话通讯；
+        # 如您有电话通讯场景识别需求，但发现需求语种仅支持16k，可将8k音频传入下方16k引擎，亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练，无法承诺此种调用方式的识别效果，需由您自行验证识别结果是否可用**。
+        # 通用场景引擎：
+        # **注意：除电话通讯场景以外的其它识别场景，请务必使用以下16k引擎**
+        # • 16k_zh：中文普通话通用引擎，支持中文普通话和少量英语，使用丰富的中文普通话语料训练，覆盖场景广泛，适用于除电话通讯外的所有中文普通话识别场景；
+        # • 16k_zh-PY：中英粤混合引擎，使用一个引擎同时识别中文普通话、英语、粤语三个语言;
+        # • 16k_zh_dialect：中文普通话+多方言混合引擎，除普通话外支持23种方言（上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话）；
         # • 16k_en：英语；
         # • 16k_yue：粤语；
         # • 16k_ja：日语；
@@ -310,21 +315,46 @@ module TencentCloud
         # • 16k_tr：土耳其语；
         # • 16k_ar：阿拉伯语；
         # • 16k_es：西班牙语；
-        # • 16k_zh_dialect：多方言，支持23种方言（上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话）；
+        # • 16k_hi：印地语；
+        # • 16k_zh_medical：中文医疗引擎
         # @type EngineModelType: String
-        # @param ChannelNum: 识别声道数。1：单声道（非电话场景，直接选择单声道即可，忽略音频声道数）；2：双声道（仅支持8k_zh电话场景，双声道应分别对应通话双方）。注意：双声道的电话音频已物理分离说话人，无需再开启说话人分离功能。
+        # @param ChannelNum: 识别声道数
+        # 1：单声道（16k音频仅支持单声道，**请勿**设置为双声道）；
+        # 2：双声道（仅支持8k电话音频，且双声道应分别为通话双方）
+        # 注意：
+        # • 16k音频：仅支持单声道识别，**需设置ChannelNum=1**
+        # • 8k电话音频：支持单声道、双声道识别，**建议设置ChannelNum=2，即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误，能达到最好的说话人分离效果和识别效果。设置双声道后，将自动区分说话人，因此**无需再开启说话人分离功能**，相关参数（**SpeakerDiarization、SpeakerNumber**）使用默认值即可
         # @type ChannelNum: Integer
-        # @param ResTextFormat: 识别结果返回形式。0： 识别结果文本(含分段时间戳)； 1：词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点，含语速值)；2：词级别粒度的详细识别结果（包含标点、语速值）；3: 标点符号分段，包含每段时间戳，特别适用于字幕场景（包含词级时间、标点、语速值）。4：【增值付费功能】对识别结果按照语义分段，并展示词级别粒度的详细识别结果，仅支持8k_zh、16k_zh引擎，需购买对应资源包使用（注意：如果账号后付费功能开启并使用此功能，将[自动计费](https://cloud.tencent.com/document/product/1093/35686)）
+        # @param ResTextFormat: 识别结果返回形式
+        # 0： 识别结果文本(含分段时间戳)；
+        # 1：词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点，含语速值)；
+        # 2：词级别粒度的详细识别结果（包含标点、语速值）；
+        # 3: 标点符号分段，包含每段时间戳，特别适用于字幕场景（包含词级时间、标点、语速值）
+        # 4：【增值付费功能】对识别结果按照语义分段，并展示词级别粒度的详细识别结果，仅支持8k_zh、16k_zh引擎，需购买对应资源包使用（注意：如果账号后付费功能开启并使用此功能，将[自动计费](https://cloud.tencent.com/document/product/1093/35686)）
         # @type ResTextFormat: Integer
-        # @param SourceType: 语音数据来源。0：语音 URL；1：语音数据（post body）。
+        # @param SourceType: 语音数据来源
+        # 0：语音 URL；
+        # 1：语音数据（post body）
         # @type SourceType: Integer
-        # @param SpeakerDiarization: 是否开启说话人分离，0：不开启，1：开启(仅支持8k_zh/16k_zh，ChannelNum=1时可用)，默认值为 0。
-        # 注意：8k电话场景建议使用双声道来区分通话双方，设置ChannelNum=2即可，不用开启说话人分离，如果设置了ChannelNum=1，后台会先转码成单声道，说话人分离结果可能产生偏差。
+        # @param SpeakerDiarization: 是否开启说话人分离
+        # 0：不开启；
+        # 1：开启（仅支持8k_zh/16k_zh，且ChannelNum=1时可用）；
+        # 默认值为 0
+        # 注意：
+        # 8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
         # @type SpeakerDiarization: Integer
-        # @param SpeakerNumber: 说话人分离人数（需配合开启说话人分离使用），取值范围：0-10，0代表自动分离（目前仅支持≤6个人），1-10代表指定说话人数分离。默认值为 0。
-        # 注：此功能结果仅供参考，请根据您的需要谨慎使用。
+        # @param SpeakerNumber: 说话人分离人数
+        # **需配合开启说话人分离使用，不开启无效**，取值范围：0-10
+        # 0：自动分离（最多分离出20个人）；
+        # 1-10：指定人数分离；
+        # 默认值为 0
+        # 注意：此功能结果仅供参考
         # @type SpeakerNumber: Integer
-        # @param CallbackUrl: 回调 URL，用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果，则无需提交该参数。回调格式&内容详见：[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
+        # @param CallbackUrl: 回调 URL：用户自行搭建的用于接收识别结果的服务URL。回调格式和内容详见：[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
+        # 如果用户使用轮询方式获取识别结果，则无需提交该参数。
         # @type CallbackUrl: String
         # @param Url: 语音的URL地址，需要公网环境浏览器可下载。当 SourceType 值为 0 时须填写该字段，为 1 时不需要填写。注意：请确保录音文件时长在5个小时之内，否则可能识别失败。请保证文件的下载速度，否则可能下载失败。
         # @type Url: String
@@ -1117,6 +1147,7 @@ module TencentCloud
         # • 16k_tr：土耳其语；
         # • 16k_ar：阿拉伯语；
         # • 16k_es：西班牙语；
+        # • 16k_hi：印地语；
         # • 16k_zh_dialect：多方言，支持23种方言（上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话）；
         # @type EngSerViceType: String
         # @param SourceType: 语音数据来源。0：语音 URL；1：语音数据（post body）。
@@ -1164,12 +1195,12 @@ module TencentCloud
         attr_accessor :EngSerViceType, :SourceType, :VoiceFormat, :ProjectId, :SubServiceType, :Url, :UsrAudioKey, :Data, :DataLen, :WordInfo, :FilterDirty, :FilterModal, :FilterPunc, :ConvertNumMode, :HotwordId, :CustomizationId, :ReinforceHotword, :HotwordList, :InputSampleRate
         extend Gem::Deprecate
-        deprecate :ProjectId, :none, 2023, 8
-        deprecate :ProjectId=, :none, 2023, 8
-        deprecate :SubServiceType, :none, 2023, 8
-        deprecate :SubServiceType=, :none, 2023, 8
-        deprecate :UsrAudioKey, :none, 2023, 8
-        deprecate :UsrAudioKey=, :none, 2023, 8
+        deprecate :ProjectId, :none, 2023, 9
+        deprecate :ProjectId=, :none, 2023, 9
+        deprecate :SubServiceType, :none, 2023, 9
+        deprecate :SubServiceType=, :none, 2023, 9
+        deprecate :UsrAudioKey, :none, 2023, 9
+        deprecate :UsrAudioKey=, :none, 2023, 9
         def initialize(engservicetype=nil, sourcetype=nil, voiceformat=nil, projectid=nil, subservicetype=nil, url=nil, usraudiokey=nil, data=nil, datalen=nil, wordinfo=nil, filterdirty=nil, filtermodal=nil, filterpunc=nil, convertnummode=nil, hotwordid=nil, customizationid=nil, reinforcehotword=nil, hotwordlist=nil, inputsamplerate=nil)
           @EngSerViceType = engservicetype

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: tencentcloud-sdk-asr
 version: !ruby/object:Gem::Version
-  version: 3.0.651
+  version: 3.0.652
 platform: ruby
 authors:
 - Tencent Cloud
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2023-09-01 00:00:00.000000000 Z
+date: 2023-09-05 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: tencentcloud-sdk-common