tencentcloud-sdk-asr 3.0.656 → 3.0.658
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- checksums.yaml +4 -4
- data/lib/VERSION +1 -1
- data/lib/v20190614/models.rb +81 -28
- metadata +2 -2
checksums.yaml
CHANGED
|
@@ -1,7 +1,7 @@
|
|
|
1
1
|
---
|
|
2
2
|
SHA1:
|
|
3
|
-
metadata.gz:
|
|
4
|
-
data.tar.gz:
|
|
3
|
+
metadata.gz: f2938aa23f1beb05e22f8c5bd504d2c930bef2da
|
|
4
|
+
data.tar.gz: 210e69d2d967e92677f3183d27662adcdfd638f3
|
|
5
5
|
SHA512:
|
|
6
|
-
metadata.gz:
|
|
7
|
-
data.tar.gz:
|
|
6
|
+
metadata.gz: b6580aa7eb2c90ca62684616f328c1452858e7fe791b29e3aeb816220465571a12b4b19b7b7cffc8a05872f82bd8eaa712f050c6fcb13d1f0e9e2a5a97a4c5e8
|
|
7
|
+
data.tar.gz: 1b74af38efc8b484f411179b129b45ab94eeec2af85d9c884c228ac28d08d23c402f41dd617f96a9fc7e72d262ba48a21d867a43beeb8881a1b4ef2de0bb84b5
|
data/lib/VERSION
CHANGED
|
@@ -1 +1 @@
|
|
|
1
|
-
3.0.
|
|
1
|
+
3.0.658
|
data/lib/v20190614/models.rb
CHANGED
|
@@ -295,7 +295,7 @@ module TencentCloud
|
|
|
295
295
|
# **注意:电话通讯场景,请务必使用以下8k引擎**
|
|
296
296
|
# • 8k_zh:中文电话通讯;
|
|
297
297
|
# • 8k_en:英文电话通讯;
|
|
298
|
-
# 如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k
|
|
298
|
+
# 如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
|
|
299
299
|
|
|
300
300
|
# 通用场景引擎:
|
|
301
301
|
# **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
|
|
@@ -323,15 +323,17 @@ module TencentCloud
|
|
|
323
323
|
# 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
|
|
324
324
|
|
|
325
325
|
# 注意:
|
|
326
|
-
# • 16k音频:仅支持单声道识别,**需设置ChannelNum=1
|
|
326
|
+
# • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
|
|
327
327
|
# • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
|
|
328
328
|
# @type ChannelNum: Integer
|
|
329
|
-
# @param ResTextFormat:
|
|
330
|
-
# 0
|
|
331
|
-
# 1
|
|
332
|
-
# 2
|
|
333
|
-
# 3
|
|
334
|
-
# 4
|
|
329
|
+
# @param ResTextFormat: 识别结果返回样式
|
|
330
|
+
# 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
|
|
331
|
+
# 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
|
|
332
|
+
# 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
|
|
333
|
+
# 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
|
|
334
|
+
# 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
|
|
335
|
+
|
|
336
|
+
# 注意:如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**
|
|
335
337
|
# @type ResTextFormat: Integer
|
|
336
338
|
# @param SourceType: 语音数据来源
|
|
337
339
|
# 0:语音 URL;
|
|
@@ -339,7 +341,7 @@ module TencentCloud
|
|
|
339
341
|
# @type SourceType: Integer
|
|
340
342
|
# @param SpeakerDiarization: 是否开启说话人分离
|
|
341
343
|
# 0:不开启;
|
|
342
|
-
# 1
|
|
344
|
+
# 1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id,且ChannelNum=1时可用);
|
|
343
345
|
# 默认值为 0
|
|
344
346
|
|
|
345
347
|
# 注意:
|
|
@@ -350,40 +352,91 @@ module TencentCloud
|
|
|
350
352
|
# 0:自动分离(最多分离出20个人);
|
|
351
353
|
# 1-10:指定人数分离;
|
|
352
354
|
# 默认值为 0
|
|
353
|
-
|
|
354
|
-
# 注意:此功能结果仅供参考
|
|
355
355
|
# @type SpeakerNumber: Integer
|
|
356
|
-
# @param CallbackUrl: 回调 URL
|
|
357
|
-
#
|
|
356
|
+
# @param CallbackUrl: 回调 URL
|
|
357
|
+
# 用户自行搭建的用于接收识别结果的服务URL
|
|
358
|
+
# 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
|
359
|
+
|
|
360
|
+
# 注意:
|
|
361
|
+
# 如果用户使用轮询方式获取识别结果,则无需提交该参数
|
|
358
362
|
# @type CallbackUrl: String
|
|
359
|
-
# @param Url:
|
|
363
|
+
# @param Url: 语音URL的地址(需要公网环境浏览器可下载)
|
|
364
|
+
# **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
|
|
365
|
+
|
|
366
|
+
# 注意:
|
|
367
|
+
# 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
|
|
368
|
+
# 2. 请保证文件的下载速度,否则可能下载失败
|
|
360
369
|
# @type Url: String
|
|
361
|
-
# @param Data: 语音数据base64
|
|
370
|
+
# @param Data: 语音数据base64编码
|
|
371
|
+
# **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
|
|
372
|
+
|
|
373
|
+
# 注意:音频数据要小于5MB(含)
|
|
362
374
|
# @type Data: String
|
|
363
|
-
# @param DataLen:
|
|
375
|
+
# @param DataLen: 数据长度(此数据长度为数据未进行base64编码时的长度)
|
|
364
376
|
# @type DataLen: Integer
|
|
365
|
-
# @param ConvertNumMode:
|
|
377
|
+
# @param ConvertNumMode: 阿拉伯数字智能转换(目前仅支持8k_zh/16k_zh引擎)
|
|
378
|
+
# 0:不转换,直接输出中文数字;
|
|
379
|
+
# 1:根据场景智能转换为阿拉伯数字;
|
|
380
|
+
# 3:打开数学相关数字转换(如:阿尔法转写为α);
|
|
381
|
+
# 默认值为 1
|
|
366
382
|
# @type ConvertNumMode: Integer
|
|
367
|
-
# @param FilterDirty:
|
|
383
|
+
# @param FilterDirty: 脏词过滤(目前仅支持8k_zh/16k_zh引擎)
|
|
384
|
+
# 0:不过滤脏词;
|
|
385
|
+
# 1:过滤脏词;
|
|
386
|
+
# 2:将脏词替换为 * ;
|
|
387
|
+
# 默认值为 0
|
|
368
388
|
# @type FilterDirty: Integer
|
|
369
|
-
# @param HotwordId: 热词表id
|
|
389
|
+
# @param HotwordId: 热词表id
|
|
390
|
+
# 如不设置该参数,将自动生效默认热词表;
|
|
391
|
+
# 如设置该参数,将生效对应id的热词表;
|
|
392
|
+
# 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
|
|
370
393
|
# @type HotwordId: String
|
|
371
|
-
# @param CustomizationId:
|
|
394
|
+
# @param CustomizationId: 自学习定制模型 id
|
|
395
|
+
# 如设置了该参数,将生效对应id的自学习定制模型;
|
|
396
|
+
# 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
|
|
372
397
|
# @type CustomizationId: String
|
|
373
|
-
# @param Extra:
|
|
398
|
+
# @param Extra: 附加参数**(该参数无意义,忽略即可)**
|
|
374
399
|
# @type Extra: String
|
|
375
|
-
# @param FilterPunc:
|
|
400
|
+
# @param FilterPunc: 标点符号过滤(目前仅支持8k_zh/16k_zh引擎)
|
|
401
|
+
# 0:不过滤标点;
|
|
402
|
+
# 1:过滤句末标点;
|
|
403
|
+
# 2:过滤所有标点;
|
|
404
|
+
# 默认值为 0
|
|
376
405
|
# @type FilterPunc: Integer
|
|
377
|
-
# @param FilterModal:
|
|
406
|
+
# @param FilterModal: 语气词过滤(目前支持8k_zh/16k_zh引擎)
|
|
407
|
+
# 0:不过滤语气词;
|
|
408
|
+
# 1:过滤部分语气词;
|
|
409
|
+
# 2:严格过滤语气词;
|
|
410
|
+
# 默认值为 0
|
|
378
411
|
# @type FilterModal: Integer
|
|
379
|
-
# @param EmotionalEnergy:
|
|
412
|
+
# @param EmotionalEnergy: 情绪能量值
|
|
413
|
+
# 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
|
|
414
|
+
# 0:不开启;
|
|
415
|
+
# 1:开启;
|
|
416
|
+
# 默认值为0
|
|
380
417
|
# @type EmotionalEnergy: Integer
|
|
381
|
-
# @param ReinforceHotword:
|
|
418
|
+
# @param ReinforceHotword: 热词增强功能(仅支持8k_zh/16k_zh引擎)
|
|
419
|
+
# 1:开启热词增强功能
|
|
420
|
+
|
|
421
|
+
# 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
|
|
382
422
|
# @type ReinforceHotword: Integer
|
|
383
|
-
# @param SentenceMaxLength:
|
|
423
|
+
# @param SentenceMaxLength: 单标点最多字数
|
|
424
|
+
# **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
|
|
425
|
+
# 0:不开启该功能;
|
|
426
|
+
# 默认值为0
|
|
427
|
+
|
|
428
|
+
# 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
|
|
384
429
|
# @type SentenceMaxLength: Integer
|
|
385
|
-
# @param EmotionRecognition:
|
|
386
|
-
#
|
|
430
|
+
# @param EmotionRecognition: **【增值付费功能】**情绪识别能力(目前仅支持16k_zh)
|
|
431
|
+
# 0:不开启;
|
|
432
|
+
# 1:开启情绪识别,但不在文本展示情绪标签;
|
|
433
|
+
# 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
|
|
434
|
+
# 默认值为0
|
|
435
|
+
|
|
436
|
+
# 注意:
|
|
437
|
+
# 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
|
|
438
|
+
# 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
|
|
439
|
+
# 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
|
|
387
440
|
# @type EmotionRecognition: Integer
|
|
388
441
|
|
|
389
442
|
attr_accessor :EngineModelType, :ChannelNum, :ResTextFormat, :SourceType, :SpeakerDiarization, :SpeakerNumber, :CallbackUrl, :Url, :Data, :DataLen, :ConvertNumMode, :FilterDirty, :HotwordId, :CustomizationId, :Extra, :FilterPunc, :FilterModal, :EmotionalEnergy, :ReinforceHotword, :SentenceMaxLength, :EmotionRecognition
|
metadata
CHANGED
|
@@ -1,14 +1,14 @@
|
|
|
1
1
|
--- !ruby/object:Gem::Specification
|
|
2
2
|
name: tencentcloud-sdk-asr
|
|
3
3
|
version: !ruby/object:Gem::Version
|
|
4
|
-
version: 3.0.
|
|
4
|
+
version: 3.0.658
|
|
5
5
|
platform: ruby
|
|
6
6
|
authors:
|
|
7
7
|
- Tencent Cloud
|
|
8
8
|
autorequire:
|
|
9
9
|
bindir: bin
|
|
10
10
|
cert_chain: []
|
|
11
|
-
date: 2023-09-
|
|
11
|
+
date: 2023-09-13 00:00:00.000000000 Z
|
|
12
12
|
dependencies:
|
|
13
13
|
- !ruby/object:Gem::Dependency
|
|
14
14
|
name: tencentcloud-sdk-common
|