tencentcloud-sdk-asr 3.0.656 → 3.0.658

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (4) hide show
  1. checksums.yaml +4 -4
  2. data/lib/VERSION +1 -1
  3. data/lib/v20190614/models.rb +81 -28
  4. metadata +2 -2
checksums.yaml CHANGED
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  SHA1:
3
- metadata.gz: 6ec020e67aeb79c6f81290c9c3a8eed7e26da768
4
- data.tar.gz: 6de25c7ce2c250e1171d950ef642d22c3c22cf18
3
+ metadata.gz: f2938aa23f1beb05e22f8c5bd504d2c930bef2da
4
+ data.tar.gz: 210e69d2d967e92677f3183d27662adcdfd638f3
5
5
  SHA512:
6
- metadata.gz: f1d5c0d3adc4d56ca1424692c5a63b14ec42e1daa7a827f4cbb5f55db4eb550b41a5d2b0a6b03f913f4db1fa45c7311d984f8a9d09c8c4069756b883847d2af0
7
- data.tar.gz: e7d2031f676a456e55bed2aa14d85c690994a005bcb86a258026f01fba09885068bed14752c3d103978456e23188d200f894e94a1ae033ae20ff642cb2dae824
6
+ metadata.gz: b6580aa7eb2c90ca62684616f328c1452858e7fe791b29e3aeb816220465571a12b4b19b7b7cffc8a05872f82bd8eaa712f050c6fcb13d1f0e9e2a5a97a4c5e8
7
+ data.tar.gz: 1b74af38efc8b484f411179b129b45ab94eeec2af85d9c884c228ac28d08d23c402f41dd617f96a9fc7e72d262ba48a21d867a43beeb8881a1b4ef2de0bb84b5
data/lib/VERSION CHANGED
@@ -1 +1 @@
1
- 3.0.656
1
+ 3.0.658
@@ -295,7 +295,7 @@ module TencentCloud
295
295
  # **注意:电话通讯场景,请务必使用以下8k引擎**
296
296
  # • 8k_zh:中文电话通讯;
297
297
  # • 8k_en:英文电话通讯;
298
- # 如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**。
298
+ # 如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
299
299
 
300
300
  # 通用场景引擎:
301
301
  # **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
@@ -323,15 +323,17 @@ module TencentCloud
323
323
  # 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
324
324
 
325
325
  # 注意:
326
- # • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**
326
+ # • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
327
327
  # • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
328
328
  # @type ChannelNum: Integer
329
- # @param ResTextFormat: 识别结果返回形式
330
- # 0: 识别结果文本(含分段时间戳)
331
- # 1:词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点,含语速值);
332
- # 2:词级别粒度的详细识别结果(包含标点、语速值);
333
- # 3: 标点符号分段,包含每段时间戳,特别适用于字幕场景(包含词级时间、标点、语速值)
334
- # 4:【增值付费功能】对识别结果按照语义分段,并展示词级别粒度的详细识别结果,仅支持8k_zh、16k_zh引擎,需购买对应资源包使用(注意:如果账号后付费功能开启并使用此功能,将[自动计费](https://cloud.tencent.com/document/product/1093/35686)
329
+ # @param ResTextFormat: 识别结果返回样式
330
+ # 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
331
+ # 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
332
+ # 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
333
+ # 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
334
+ # 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
335
+
336
+ # 注意:如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**
335
337
  # @type ResTextFormat: Integer
336
338
  # @param SourceType: 语音数据来源
337
339
  # 0:语音 URL;
@@ -339,7 +341,7 @@ module TencentCloud
339
341
  # @type SourceType: Integer
340
342
  # @param SpeakerDiarization: 是否开启说话人分离
341
343
  # 0:不开启;
342
- # 1:开启(仅支持8k_zh/16k_zh,且ChannelNum=1时可用);
344
+ # 1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id,且ChannelNum=1时可用);
343
345
  # 默认值为 0
344
346
 
345
347
  # 注意:
@@ -350,40 +352,91 @@ module TencentCloud
350
352
  # 0:自动分离(最多分离出20个人);
351
353
  # 1-10:指定人数分离;
352
354
  # 默认值为 0
353
-
354
- # 注意:此功能结果仅供参考
355
355
  # @type SpeakerNumber: Integer
356
- # @param CallbackUrl: 回调 URL:用户自行搭建的用于接收识别结果的服务URL。回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
357
- # 如果用户使用轮询方式获取识别结果,则无需提交该参数。
356
+ # @param CallbackUrl: 回调 URL
357
+ # 用户自行搭建的用于接收识别结果的服务URL
358
+ # 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
359
+
360
+ # 注意:
361
+ # 如果用户使用轮询方式获取识别结果,则无需提交该参数
358
362
  # @type CallbackUrl: String
359
- # @param Url: 语音的URL地址,需要公网环境浏览器可下载。当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写。注意:请确保录音文件时长在5个小时之内,否则可能识别失败。请保证文件的下载速度,否则可能下载失败。
363
+ # @param Url: 语音URL的地址(需要公网环境浏览器可下载)
364
+ # **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
365
+
366
+ # 注意:
367
+ # 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
368
+ # 2. 请保证文件的下载速度,否则可能下载失败
360
369
  # @type Url: String
361
- # @param Data: 语音数据base64编码,当SourceType 值为1时必须填写,为0可不写。音频数据要小于5MB。
370
+ # @param Data: 语音数据base64编码
371
+ # **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
372
+
373
+ # 注意:音频数据要小于5MB(含)
362
374
  # @type Data: String
363
- # @param DataLen: 数据长度,非必填(此数据长度为数据未进行base64编码时的数据长度)。
375
+ # @param DataLen: 数据长度(此数据长度为数据未进行base64编码时的长度)
364
376
  # @type DataLen: Integer
365
- # @param ConvertNumMode: 是否进行阿拉伯数字智能转换(目前支持中文普通话引擎)。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字,3: 打开数学相关数字转换。默认值为 1。
377
+ # @param ConvertNumMode: 阿拉伯数字智能转换(目前仅支持8k_zh/16k_zh引擎)
378
+ # 0:不转换,直接输出中文数字;
379
+ # 1:根据场景智能转换为阿拉伯数字;
380
+ # 3:打开数学相关数字转换(如:阿尔法转写为α);
381
+ # 默认值为 1
366
382
  # @type ConvertNumMode: Integer
367
- # @param FilterDirty: 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0。
383
+ # @param FilterDirty: 脏词过滤(目前仅支持8k_zh/16k_zh引擎)
384
+ # 0:不过滤脏词;
385
+ # 1:过滤脏词;
386
+ # 2:将脏词替换为 * ;
387
+ # 默认值为 0
368
388
  # @type FilterDirty: Integer
369
- # @param HotwordId: 热词表id。如不设置该参数,自动生效默认热词表;如设置了该参数,那么将生效对应的热词表。
389
+ # @param HotwordId: 热词表id
390
+ # 如不设置该参数,将自动生效默认热词表;
391
+ # 如设置该参数,将生效对应id的热词表;
392
+ # 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
370
393
  # @type HotwordId: String
371
- # @param CustomizationId: 自学习模型 id。如设置了该参数,将生效对应的自学习模型。
394
+ # @param CustomizationId: 自学习定制模型 id
395
+ # 如设置了该参数,将生效对应id的自学习定制模型;
396
+ # 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
372
397
  # @type CustomizationId: String
373
- # @param Extra: 附加参数(该参数无意义,忽略即可)
398
+ # @param Extra: 附加参数**(该参数无意义,忽略即可)**
374
399
  # @type Extra: String
375
- # @param FilterPunc: 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认值为 0。
400
+ # @param FilterPunc: 标点符号过滤(目前仅支持8k_zh/16k_zh引擎)
401
+ # 0:不过滤标点;
402
+ # 1:过滤句末标点;
403
+ # 2:过滤所有标点;
404
+ # 默认值为 0
376
405
  # @type FilterPunc: Integer
377
- # @param FilterModal: 是否过滤语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0。
406
+ # @param FilterModal: 语气词过滤(目前支持8k_zh/16k_zh引擎)
407
+ # 0:不过滤语气词;
408
+ # 1:过滤部分语气词;
409
+ # 2:严格过滤语气词;
410
+ # 默认值为 0
378
411
  # @type FilterModal: Integer
379
- # @param EmotionalEnergy: 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。0:不开启,1:开启
412
+ # @param EmotionalEnergy: 情绪能量值
413
+ # 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
414
+ # 0:不开启;
415
+ # 1:开启;
416
+ # 默认值为0
380
417
  # @type EmotionalEnergy: Integer
381
- # @param ReinforceHotword: 热词增强功能。1:开启后(仅支持8k_zh,16k_zh),将开启同音替换功能,同音字、词在热词中配置。举例:热词配置“蜜制”并开启增强功能后,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。
418
+ # @param ReinforceHotword: 热词增强功能(仅支持8k_zh/16k_zh引擎)
419
+ # 1:开启热词增强功能
420
+
421
+ # 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
382
422
  # @type ReinforceHotword: Integer
383
- # @param SentenceMaxLength: 单标点最多字数,取值范围:[6,40]。默认为0,不开启该功能。该参数可用于字幕生成场景,控制单行字幕最大字数(设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果)。
423
+ # @param SentenceMaxLength: 单标点最多字数
424
+ # **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
425
+ # 0:不开启该功能;
426
+ # 默认值为0
427
+
428
+ # 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
384
429
  # @type SentenceMaxLength: Integer
385
- # @param EmotionRecognition: 情绪识别能力(目前支持16k_zh) 默认为0,不开启。 1:开启情绪识别但是不会在文本展示“情绪标签”, 2:开启情绪识别并且在文本展示“情绪标签”。(该功能需要设置ResTextFormat 大于0
386
- # 注意:本功能为增值服务,购买对应套餐包后,将参数设置为1或2时方可按对应方式生效,并消耗套餐包对应资源。参数设置为0时无需购买套餐包,也不会消耗对应资源。
430
+ # @param EmotionRecognition: **【增值付费功能】**情绪识别能力(目前仅支持16k_zh)
431
+ # 0:不开启;
432
+ # 1:开启情绪识别,但不在文本展示情绪标签;
433
+ # 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
434
+ # 默认值为0
435
+
436
+ # 注意:
437
+ # 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
438
+ # 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
439
+ # 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
387
440
  # @type EmotionRecognition: Integer
388
441
 
389
442
  attr_accessor :EngineModelType, :ChannelNum, :ResTextFormat, :SourceType, :SpeakerDiarization, :SpeakerNumber, :CallbackUrl, :Url, :Data, :DataLen, :ConvertNumMode, :FilterDirty, :HotwordId, :CustomizationId, :Extra, :FilterPunc, :FilterModal, :EmotionalEnergy, :ReinforceHotword, :SentenceMaxLength, :EmotionRecognition
metadata CHANGED
@@ -1,14 +1,14 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: tencentcloud-sdk-asr
3
3
  version: !ruby/object:Gem::Version
4
- version: 3.0.656
4
+ version: 3.0.658
5
5
  platform: ruby
6
6
  authors:
7
7
  - Tencent Cloud
8
8
  autorequire:
9
9
  bindir: bin
10
10
  cert_chain: []
11
- date: 2023-09-11 00:00:00.000000000 Z
11
+ date: 2023-09-13 00:00:00.000000000 Z
12
12
  dependencies:
13
13
  - !ruby/object:Gem::Dependency
14
14
  name: tencentcloud-sdk-common