tencentcloud-sdk-python-asr 3.1.44__tar.gz → 3.1.51__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/PKG-INFO +2 -2
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/setup.py +1 -1
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/__init__.py +1 -1
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/models.py +108 -390
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/PKG-INFO +2 -2
- tencentcloud_sdk_python_asr-3.1.51/tencentcloud_sdk_python_asr.egg-info/requires.txt +1 -0
- tencentcloud_sdk_python_asr-3.1.44/tencentcloud_sdk_python_asr.egg-info/requires.txt +0 -1
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/README.rst +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/setup.cfg +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/__init__.py +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/__init__.py +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/asr_client.py +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/asr_client_async.py +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/errorcodes.py +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/SOURCES.txt +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/dependency_links.txt +0 -0
- {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/top_level.txt +0 -0
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.1
|
|
2
2
|
Name: tencentcloud-sdk-python-asr
|
|
3
|
-
Version: 3.1.
|
|
3
|
+
Version: 3.1.51
|
|
4
4
|
Summary: Tencent Cloud Asr SDK for Python
|
|
5
5
|
Home-page: https://github.com/TencentCloud/tencentcloud-sdk-python
|
|
6
6
|
Author: Tencent Cloud
|
|
@@ -15,7 +15,7 @@ Classifier: Programming Language :: Python :: 2.7
|
|
|
15
15
|
Classifier: Programming Language :: Python :: 3
|
|
16
16
|
Classifier: Programming Language :: Python :: 3.6
|
|
17
17
|
Classifier: Programming Language :: Python :: 3.7
|
|
18
|
-
Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.
|
|
18
|
+
Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.51
|
|
19
19
|
|
|
20
20
|
============================
|
|
21
21
|
Tencent Cloud SDK for Python
|
|
@@ -8,7 +8,7 @@ ROOT = os.path.dirname(__file__)
|
|
|
8
8
|
|
|
9
9
|
setup(
|
|
10
10
|
name='tencentcloud-sdk-python-asr',
|
|
11
|
-
install_requires=["tencentcloud-sdk-python-common>=3.1.
|
|
11
|
+
install_requires=["tencentcloud-sdk-python-common>=3.1.51,<4.0.0"],
|
|
12
12
|
|
|
13
13
|
version=tencentcloud.__version__,
|
|
14
14
|
description='Tencent Cloud Asr SDK for Python',
|
|
@@ -809,208 +809,55 @@ class CreateRecTaskRequest(AbstractModel):
|
|
|
809
809
|
|
|
810
810
|
def __init__(self):
|
|
811
811
|
r"""
|
|
812
|
-
:param _EngineModelType:
|
|
813
|
-
识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
|
|
814
|
-
|
|
815
|
-
电话通讯场景引擎:
|
|
816
|
-
**注意:电话通讯场景,请务必使用以下8k引擎**
|
|
817
|
-
• 8k_zh:中文电话通讯;
|
|
818
|
-
• 8k_en:英文电话通讯;
|
|
819
|
-
• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型效果;
|
|
820
|
-
|
|
821
|
-
注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
|
|
822
|
-
|
|
823
|
-
通用场景引擎:
|
|
824
|
-
**注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
|
|
825
|
-
• **16k_zh_en**:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;
|
|
826
|
-
• **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
|
|
827
|
-
• **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
|
|
828
|
-
• **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
|
|
829
|
-
• **16k_en:**英语;
|
|
830
|
-
• **16k_yue:**粤语;
|
|
831
|
-
• **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
|
|
832
|
-
• **16k_zh-TW**:中文繁体;
|
|
833
|
-
• **16k_ja:**日语;
|
|
834
|
-
• **16k_ko:**韩语;
|
|
835
|
-
• **16k_vi:**越南语;
|
|
836
|
-
• **16k_ms:**马来语;
|
|
837
|
-
• **16k_id:**印度尼西亚语;
|
|
838
|
-
• **16k_fil:**菲律宾语;
|
|
839
|
-
• **16k_th:**泰语;
|
|
840
|
-
• **16k_pt:**葡萄牙语;
|
|
841
|
-
• **16k_tr:**土耳其语;
|
|
842
|
-
• **16k_ar:**阿拉伯语;
|
|
843
|
-
• **16k_es:**西班牙语;
|
|
844
|
-
• **16k_hi:**印地语;
|
|
845
|
-
• **16k_fr:**法语;
|
|
846
|
-
• **16k_zh_medical:**中文医疗引擎;
|
|
847
|
-
• **16k_de:**德语;
|
|
812
|
+
:param _EngineModelType: <p>引擎模型类型<br>识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,<a href="https://cloud.tencent.com/document/product/1093/35686">点击这里</a> 查看产品计费说明</p><p>电话通讯场景引擎:<br><strong>注意:电话通讯场景,请务必使用以下8k引擎</strong><br>• 8k_zh:中文电话通讯;<br>• 8k_en:英文电话通讯;<br>• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比常规版本与普方大模型效果;</p><p>注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但<strong>16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用</strong></p><p>通用场景引擎:<br><strong>注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎</strong><br>• <strong>16k_zh_en</strong>:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;<br>• <strong>16k_zh_large:</strong>普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、<a href="https://cloud.tencent.com/document/product/1093/35682">多种中文方言</a>等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比中文普通话常规版本与普方英大模型版本的识别效果;<br>• <strong>16k_multi_lang:</strong>多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);<br>• <strong>16k_zh:</strong>中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;<br>• <strong>16k_en:</strong>英语;<br>• <strong>16k_en_large:</strong>英语大模型;<br>• <strong>16k_yue:</strong>粤语;<br>• <strong>16k_zh-PY:</strong>中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;<br>• <strong>16k_zh-TW</strong>:中文繁体;<br>• <strong>16k_ja:</strong>日语;<br>• <strong>16k_ko:</strong>韩语;<br>• <strong>16k_vi:</strong>越南语;<br>• <strong>16k_ms:</strong>马来语;<br>• <strong>16k_id:</strong>印度尼西亚语;<br>• <strong>16k_fil:</strong>菲律宾语;<br>• <strong>16k_th:</strong>泰语;<br>• <strong>16k_pt:</strong>葡萄牙语;<br>• <strong>16k_tr:</strong>土耳其语;<br>• <strong>16k_ar:</strong>阿拉伯语;<br>• <strong>16k_es:</strong>西班牙语;<br>• <strong>16k_hi:</strong>印地语;<br>• <strong>16k_fr:</strong>法语;<br>• <strong>16k_zh_medical:</strong>中文医疗引擎;<br>• <strong>16k_de:</strong>德语;</p><p>枚举值:</p><ul><li>16k_zh: 中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景</li></ul>
|
|
848
813
|
:type EngineModelType: str
|
|
849
|
-
:param _ChannelNum:
|
|
850
|
-
1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
|
|
851
|
-
2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
|
|
852
|
-
|
|
853
|
-
注意:
|
|
854
|
-
• 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
|
|
855
|
-
• 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。
|
|
814
|
+
:param _ChannelNum: <p>识别声道数<br>1:单声道(16k音频仅支持单声道,<strong>请勿</strong>设置为双声道);<br>2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)</p><p>注意:<br>• 16k音频:仅支持单声道识别,<strong>需设置ChannelNum=1</strong>;<br>• 8k电话音频:支持单声道、双声道识别,<strong>建议设置ChannelNum=2,即双声道</strong>。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此<strong>无需再开启说话人分离功能</strong>,相关参数(<strong>SpeakerDiarization、SpeakerNumber</strong>)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。</p>
|
|
856
815
|
:type ChannelNum: int
|
|
857
|
-
:param _ResTextFormat:
|
|
858
|
-
0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
|
|
859
|
-
1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
|
|
860
|
-
2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
|
|
861
|
-
3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
|
|
862
|
-
4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
|
|
863
|
-
5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
|
|
864
|
-
|
|
865
|
-
注意:
|
|
866
|
-
以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de
|
|
867
|
-
如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
868
|
-
如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
816
|
+
:param _ResTextFormat: <p>识别结果返回样式<br>0:基础识别结果(仅包含有效人声时间戳,无词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>);<br>1:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值,<strong>不含标点</strong>);<br>2:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点);<br>3:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,<strong>适用字幕场景</strong>;<br>4:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,<strong>适用会议、庭审记录转写等场景</strong>,仅支持8k_zh/16k_zh引擎<br>5:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,<strong>适用于线上、线下会议直接总结为书面会议纪要的场景</strong>,仅支持8k_zh/16k_zh引擎</p><p>注意:<br>以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de<br>如果传入参数值4,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">语义分段资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值4,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong><br>如果传入参数值5,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">口语转书面语资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值5,将自动计费<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong></p>
|
|
869
817
|
:type ResTextFormat: int
|
|
870
|
-
:param _SourceType:
|
|
871
|
-
0:音频URL;
|
|
872
|
-
1:音频数据(post body)
|
|
818
|
+
:param _SourceType: <p>音频数据来源<br>0:音频URL;<br>1:音频数据(post body)</p>
|
|
873
819
|
:type SourceType: int
|
|
874
|
-
:param _Data:
|
|
875
|
-
**当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
|
|
876
|
-
|
|
877
|
-
注意:音频数据要小于5MB(含)
|
|
820
|
+
:param _Data: <p>音频数据base64编码<br><strong>当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写</strong></p><p>注意:音频数据要小于5MB(含)</p>
|
|
878
821
|
:type Data: str
|
|
879
|
-
:param _DataLen:
|
|
822
|
+
:param _DataLen: <p>数据长度(此数据长度为数据未进行base64编码时的长度)</p>
|
|
880
823
|
:type DataLen: int
|
|
881
|
-
:param _Url:
|
|
882
|
-
**当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
|
|
883
|
-
|
|
884
|
-
注意:
|
|
885
|
-
1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
|
|
886
|
-
2. 请保证文件的下载速度,否则可能下载失败
|
|
824
|
+
:param _Url: <p>音频URL的地址(需要公网环境浏览器可下载)<br><strong>当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写</strong></p><p>注意:</p><ol><li>请确保录音文件时长在5个小时(含)之内,否则可能识别失败;</li><li>请保证文件的下载速度,否则可能下载失败</li></ol>
|
|
887
825
|
:type Url: str
|
|
888
|
-
:param _CallbackUrl:
|
|
889
|
-
用户自行搭建的用于接收识别结果的服务URL
|
|
890
|
-
回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
|
891
|
-
|
|
892
|
-
注意:
|
|
893
|
-
|
|
894
|
-
- 如果用户使用轮询方式获取识别结果,则无需提交该参数
|
|
895
|
-
- 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
|
|
826
|
+
:param _CallbackUrl: <p>回调 URL<br>用户自行搭建的用于接收识别结果的服务URL<br>回调格式和内容详见:<a href="https://cloud.tencent.com/document/product/1093/52632">录音识别回调说明</a></p><p>注意:</p><ul><li>如果用户使用轮询方式获取识别结果,则无需提交该参数</li><li>建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑</li></ul>
|
|
896
827
|
:type CallbackUrl: str
|
|
897
|
-
:param _SpeakerDiarization:
|
|
898
|
-
0:不开启;
|
|
899
|
-
1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en,且ChannelNum=1时可用);
|
|
900
|
-
3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)
|
|
901
|
-
默认值为 0
|
|
902
|
-
|
|
903
|
-
注意:
|
|
904
|
-
8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
|
|
828
|
+
:param _SpeakerDiarization: <p>是否开启说话人分离<br>0:不开启;<br>1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en/16k_es/16k_fr/16k_ja/16k_ko,且ChannelNum=1时可用);<br>3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)<br>默认值为 0</p><p>注意:<br>8k双声道电话音频请按 <strong>ChannelNum 识别声道数</strong> 的参数描述使用默认值</p>
|
|
905
829
|
:type SpeakerDiarization: int
|
|
906
|
-
:param _SpeakerNumber:
|
|
907
|
-
**需配合开启说话人分离使用,不开启无效**,取值范围:0-10
|
|
908
|
-
0:自动分离(最多分离出20个人);
|
|
909
|
-
1-10:指定人数分离;
|
|
910
|
-
默认值为 0
|
|
911
|
-
注:16k引擎不支持指定人数分离
|
|
830
|
+
:param _SpeakerNumber: <p>说话人分离人数<br><strong>需配合开启说话人分离使用,不开启无效</strong>,取值范围:0-10<br>0:自动分离(最多分离出20个人);<br>1-10:指定人数分离;<br>默认值为 0<br>注:16k引擎不支持指定人数分离</p>
|
|
912
831
|
:type SpeakerNumber: int
|
|
913
|
-
:param _HotwordId:
|
|
914
|
-
如不设置该参数,将自动生效默认热词表;
|
|
915
|
-
如设置该参数,将生效对应id的热词表;
|
|
916
|
-
点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
|
|
832
|
+
:param _HotwordId: <p>热词表id<br>如不设置该参数,将自动生效默认热词表;<br>如设置该参数,将生效对应id的热词表;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a></p>
|
|
917
833
|
:type HotwordId: str
|
|
918
|
-
:param _ReinforceHotword:
|
|
919
|
-
1:开启热词增强功能
|
|
920
|
-
|
|
921
|
-
注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
|
|
834
|
+
:param _ReinforceHotword: <p>热词增强功能(目前仅支持8k_zh/16k_zh引擎)<br>1:开启热词增强功能</p><p>注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a>。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。<strong>建议客户根据实际的业务需求开启该功能</strong></p>
|
|
922
835
|
:type ReinforceHotword: int
|
|
923
|
-
:param _CustomizationId:
|
|
924
|
-
如设置了该参数,将生效对应id的自学习定制模型;
|
|
925
|
-
点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
|
|
836
|
+
:param _CustomizationId: <p>自学习定制模型 id<br>如设置了该参数,将生效对应id的自学习定制模型;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/38416">自学习定制模型配置方法</a></p>
|
|
926
837
|
:type CustomizationId: str
|
|
927
|
-
:param _EmotionRecognition:
|
|
928
|
-
0:不开启;
|
|
929
|
-
1:开启情绪识别,但不在文本展示情绪标签;
|
|
930
|
-
2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
|
|
931
|
-
默认值为0
|
|
932
|
-
支持的情绪分类为:高兴、伤心、愤怒
|
|
933
|
-
|
|
934
|
-
注意:
|
|
935
|
-
1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
|
|
936
|
-
2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
|
|
937
|
-
3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
|
|
838
|
+
:param _EmotionRecognition: <p><strong>【增值付费功能】</strong>情绪识别能力(目前仅支持 16k_zh , 16k_zh_en , 8k_zh )<br>0:不开启;<br>1:开启情绪识别,但不在文本展示情绪标签;<br>2:开启情绪识别,并且在文本展示情绪标签(<strong>该功能需要设置ResTextFormat 大于0</strong>)<br>默认值为0<br>支持的情绪分类为:高兴、伤心、愤怒</p><p>注意:</p><ol><li><strong>本功能为增值服务</strong>,需将参数设置为1或2时方可按对应方式生效;</li><li>如果传入参数值1或2,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">情绪识别资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值1或2,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a>)</strong>;</li><li>参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源</li></ol>
|
|
938
839
|
:type EmotionRecognition: int
|
|
939
|
-
:param _EmotionalEnergy:
|
|
940
|
-
取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
|
|
941
|
-
0:不开启;
|
|
942
|
-
1:开启;
|
|
943
|
-
默认值为0
|
|
840
|
+
:param _EmotionalEnergy: <p>情绪能量值<br>取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈<br>0:不开启;<br>1:开启;<br>默认值为0</p>
|
|
944
841
|
:type EmotionalEnergy: int
|
|
945
|
-
:param _ConvertNumMode:
|
|
946
|
-
0:不转换,直接输出中文数字;
|
|
947
|
-
1:根据场景智能转换为阿拉伯数字;
|
|
948
|
-
3:打开数学相关数字转换(如:阿尔法转写为α);
|
|
949
|
-
默认值为 1
|
|
842
|
+
:param _ConvertNumMode: <p>阿拉伯数字智能转换(目前支持中文普通话引擎)<br>0:不转换,直接输出中文数字;<br>1:根据场景智能转换为阿拉伯数字;<br>3:打开数学相关数字转换(如:阿尔法转写为α);<br>默认值为 1</p>
|
|
950
843
|
:type ConvertNumMode: int
|
|
951
|
-
:param _FilterDirty:
|
|
952
|
-
0:不过滤脏词;
|
|
953
|
-
1:过滤脏词;
|
|
954
|
-
2:将脏词替换为 * ;
|
|
955
|
-
默认值为 0
|
|
844
|
+
:param _FilterDirty: <p>脏词过滤(目前支持中文普通话引擎)<br>0:不过滤脏词;<br>1:过滤脏词;<br>2:将脏词替换为 * ;<br>默认值为 0</p>
|
|
956
845
|
:type FilterDirty: int
|
|
957
|
-
:param _FilterPunc:
|
|
958
|
-
0:不过滤标点;
|
|
959
|
-
1:过滤句末标点;
|
|
960
|
-
2:过滤所有标点;
|
|
961
|
-
默认值为 0
|
|
846
|
+
:param _FilterPunc: <p>标点符号过滤(目前支持中文普通话引擎)<br>0:不过滤标点;<br>1:过滤句末标点;<br>2:过滤所有标点;<br>默认值为 0</p>
|
|
962
847
|
:type FilterPunc: int
|
|
963
|
-
:param _FilterModal:
|
|
964
|
-
0:不过滤语气词;
|
|
965
|
-
1:过滤部分语气词;
|
|
966
|
-
2:严格过滤语气词;
|
|
967
|
-
默认值为 0
|
|
848
|
+
:param _FilterModal: <p>语气词过滤(目前支持中文普通话引擎)<br>0:不过滤语气词;<br>1:过滤部分语气词;<br>2:严格过滤语气词;<br>默认值为 0</p>
|
|
968
849
|
:type FilterModal: int
|
|
969
|
-
:param _SentenceMaxLength:
|
|
970
|
-
**可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
|
|
971
|
-
0:不开启该功能;
|
|
972
|
-
默认值为0
|
|
973
|
-
|
|
974
|
-
注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
|
|
850
|
+
:param _SentenceMaxLength: <p>单标点最多字数(目前支持中文普通话引擎)<br><strong>可控制单行字幕最大字数,适用于字幕生成场景</strong>,取值范围:[6,40]<br>0:不开启该功能;<br>默认值为0</p><p>注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果</p>
|
|
975
851
|
:type SentenceMaxLength: int
|
|
976
|
-
:param _Extra:
|
|
852
|
+
:param _Extra: <p>附加参数<strong>(该参数无意义,忽略即可)</strong></p>
|
|
977
853
|
:type Extra: str
|
|
978
|
-
:param _HotwordList:
|
|
979
|
-
|
|
980
|
-
- 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
|
|
981
|
-
|
|
982
|
-
- 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
|
|
983
|
-
|
|
984
|
-
- 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
|
|
985
|
-
|
|
986
|
-
- hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
|
|
987
|
-
|
|
988
|
-
- hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
|
|
989
|
-
|
|
990
|
-
注意:
|
|
991
|
-
|
|
992
|
-
- 如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;
|
|
993
|
-
|
|
994
|
-
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
995
|
-
|
|
996
|
-
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
854
|
+
:param _HotwordList: <p>临时热词表:该参数用于提升识别准确率。</p><ul><li><p>单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;</p></li><li><p>临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;</p></li><li><p>参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:</p><ul><li><p>hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;</p></li><li><p>hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;</p></li></ul></li></ul><p>注意:</p><ul><li><p>如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;</p></li><li><p>热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。</p></li><li><p>热词权重设置为100时,当前热词开启热词增强同音同调替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。</p></li></ul>
|
|
997
855
|
:type HotwordList: str
|
|
998
|
-
:param _KeyWordLibIdList:
|
|
999
|
-
|
|
856
|
+
:param _KeyWordLibIdList: <p>关键词识别ID列表,默认空为不进行识别,最多10个</p>
|
|
1000
857
|
:type KeyWordLibIdList: list of str
|
|
1001
|
-
:param _ReplaceTextId:
|
|
1002
|
-
|
|
1003
|
-
注意:
|
|
1004
|
-
1. 本功能配置完成后,预计在10分钟后生效
|
|
1005
|
-
|
|
858
|
+
:param _ReplaceTextId: <p>替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考<a href="https://console.cloud.tencent.com/asr/replaceword">配置控制台</a>;强制替换功能可能会影响正常识别结果,请谨慎使用</p><p>注意:</p><ol><li>本功能配置完成后,预计在10分钟后生效</li></ol>
|
|
1006
859
|
:type ReplaceTextId: str
|
|
1007
|
-
:param _SpeakerRoles:
|
|
1008
|
-
配合SpeakerDiarization: 3 使用,ASR增值服务,可传入一组声纹信息进行角色认证,仅支持16k_zh_en引擎。
|
|
1009
|
-
需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。
|
|
1010
|
-
RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。
|
|
1011
|
-
RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。
|
|
1012
|
-
示例:
|
|
1013
|
-
"{\"EngineModelType\":\"16k_zh_en\",\"ChannelNum\":1,\"ResTextFormat\":1,\"SourceType\":0,\"Url\":\"需要进行ASR识别的音频链接\",\"SpeakerDiarization\":3,\"SpeakerRoles\":[{\"RoleAudioUrl\":\"需要认证角色的声纹音频地址\",\"RoleName\":\"需要认证角色的名称\"}]}"
|
|
860
|
+
:param _SpeakerRoles: <p>开启角色分离能力配合SpeakerDiarization: 3 使用,ASR增值服务,<strong>仅可传入一组声纹信息</strong>进行角色认证,仅支持16k_zh_en引擎。需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。 RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。 RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。 示例: "{"EngineModelType":"16k_zh_en","ChannelNum":1,"ResTextFormat":1,"SourceType":0,"Url":"需要进行ASR识别的音频链接","SpeakerDiarization":3,"SpeakerRoles":[{"RoleAudioUrl":"需要认证角色的声纹音频地址","RoleName":"需要认证角色的名称"}]}"</p>
|
|
1014
861
|
:type SpeakerRoles: list of SpeakerRoleInfo
|
|
1015
862
|
"""
|
|
1016
863
|
self._EngineModelType = None
|
|
@@ -1041,42 +888,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1041
888
|
|
|
1042
889
|
@property
|
|
1043
890
|
def EngineModelType(self):
|
|
1044
|
-
r"""
|
|
1045
|
-
识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
|
|
1046
|
-
|
|
1047
|
-
电话通讯场景引擎:
|
|
1048
|
-
**注意:电话通讯场景,请务必使用以下8k引擎**
|
|
1049
|
-
• 8k_zh:中文电话通讯;
|
|
1050
|
-
• 8k_en:英文电话通讯;
|
|
1051
|
-
• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型效果;
|
|
1052
|
-
|
|
1053
|
-
注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
|
|
1054
|
-
|
|
1055
|
-
通用场景引擎:
|
|
1056
|
-
**注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
|
|
1057
|
-
• **16k_zh_en**:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;
|
|
1058
|
-
• **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
|
|
1059
|
-
• **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
|
|
1060
|
-
• **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
|
|
1061
|
-
• **16k_en:**英语;
|
|
1062
|
-
• **16k_yue:**粤语;
|
|
1063
|
-
• **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
|
|
1064
|
-
• **16k_zh-TW**:中文繁体;
|
|
1065
|
-
• **16k_ja:**日语;
|
|
1066
|
-
• **16k_ko:**韩语;
|
|
1067
|
-
• **16k_vi:**越南语;
|
|
1068
|
-
• **16k_ms:**马来语;
|
|
1069
|
-
• **16k_id:**印度尼西亚语;
|
|
1070
|
-
• **16k_fil:**菲律宾语;
|
|
1071
|
-
• **16k_th:**泰语;
|
|
1072
|
-
• **16k_pt:**葡萄牙语;
|
|
1073
|
-
• **16k_tr:**土耳其语;
|
|
1074
|
-
• **16k_ar:**阿拉伯语;
|
|
1075
|
-
• **16k_es:**西班牙语;
|
|
1076
|
-
• **16k_hi:**印地语;
|
|
1077
|
-
• **16k_fr:**法语;
|
|
1078
|
-
• **16k_zh_medical:**中文医疗引擎;
|
|
1079
|
-
• **16k_de:**德语;
|
|
891
|
+
r"""<p>引擎模型类型<br>识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,<a href="https://cloud.tencent.com/document/product/1093/35686">点击这里</a> 查看产品计费说明</p><p>电话通讯场景引擎:<br><strong>注意:电话通讯场景,请务必使用以下8k引擎</strong><br>• 8k_zh:中文电话通讯;<br>• 8k_en:英文电话通讯;<br>• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比常规版本与普方大模型效果;</p><p>注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但<strong>16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用</strong></p><p>通用场景引擎:<br><strong>注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎</strong><br>• <strong>16k_zh_en</strong>:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;<br>• <strong>16k_zh_large:</strong>普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、<a href="https://cloud.tencent.com/document/product/1093/35682">多种中文方言</a>等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比中文普通话常规版本与普方英大模型版本的识别效果;<br>• <strong>16k_multi_lang:</strong>多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);<br>• <strong>16k_zh:</strong>中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;<br>• <strong>16k_en:</strong>英语;<br>• <strong>16k_en_large:</strong>英语大模型;<br>• <strong>16k_yue:</strong>粤语;<br>• <strong>16k_zh-PY:</strong>中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;<br>• <strong>16k_zh-TW</strong>:中文繁体;<br>• <strong>16k_ja:</strong>日语;<br>• <strong>16k_ko:</strong>韩语;<br>• <strong>16k_vi:</strong>越南语;<br>• <strong>16k_ms:</strong>马来语;<br>• <strong>16k_id:</strong>印度尼西亚语;<br>• <strong>16k_fil:</strong>菲律宾语;<br>• <strong>16k_th:</strong>泰语;<br>• <strong>16k_pt:</strong>葡萄牙语;<br>• <strong>16k_tr:</strong>土耳其语;<br>• <strong>16k_ar:</strong>阿拉伯语;<br>• <strong>16k_es:</strong>西班牙语;<br>• <strong>16k_hi:</strong>印地语;<br>• <strong>16k_fr:</strong>法语;<br>• <strong>16k_zh_medical:</strong>中文医疗引擎;<br>• <strong>16k_de:</strong>德语;</p><p>枚举值:</p><ul><li>16k_zh: 中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景</li></ul>
|
|
1080
892
|
:rtype: str
|
|
1081
893
|
"""
|
|
1082
894
|
return self._EngineModelType
|
|
@@ -1087,13 +899,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1087
899
|
|
|
1088
900
|
@property
|
|
1089
901
|
def ChannelNum(self):
|
|
1090
|
-
r"""
|
|
1091
|
-
1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
|
|
1092
|
-
2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
|
|
1093
|
-
|
|
1094
|
-
注意:
|
|
1095
|
-
• 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
|
|
1096
|
-
• 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。
|
|
902
|
+
r"""<p>识别声道数<br>1:单声道(16k音频仅支持单声道,<strong>请勿</strong>设置为双声道);<br>2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)</p><p>注意:<br>• 16k音频:仅支持单声道识别,<strong>需设置ChannelNum=1</strong>;<br>• 8k电话音频:支持单声道、双声道识别,<strong>建议设置ChannelNum=2,即双声道</strong>。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此<strong>无需再开启说话人分离功能</strong>,相关参数(<strong>SpeakerDiarization、SpeakerNumber</strong>)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。</p>
|
|
1097
903
|
:rtype: int
|
|
1098
904
|
"""
|
|
1099
905
|
return self._ChannelNum
|
|
@@ -1104,18 +910,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1104
910
|
|
|
1105
911
|
@property
|
|
1106
912
|
def ResTextFormat(self):
|
|
1107
|
-
r"""
|
|
1108
|
-
0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
|
|
1109
|
-
1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
|
|
1110
|
-
2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
|
|
1111
|
-
3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
|
|
1112
|
-
4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
|
|
1113
|
-
5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
|
|
1114
|
-
|
|
1115
|
-
注意:
|
|
1116
|
-
以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de
|
|
1117
|
-
如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
1118
|
-
如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
913
|
+
r"""<p>识别结果返回样式<br>0:基础识别结果(仅包含有效人声时间戳,无词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>);<br>1:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值,<strong>不含标点</strong>);<br>2:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点);<br>3:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,<strong>适用字幕场景</strong>;<br>4:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,<strong>适用会议、庭审记录转写等场景</strong>,仅支持8k_zh/16k_zh引擎<br>5:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,<strong>适用于线上、线下会议直接总结为书面会议纪要的场景</strong>,仅支持8k_zh/16k_zh引擎</p><p>注意:<br>以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de<br>如果传入参数值4,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">语义分段资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值4,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong><br>如果传入参数值5,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">口语转书面语资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值5,将自动计费<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong></p>
|
|
1119
914
|
:rtype: int
|
|
1120
915
|
"""
|
|
1121
916
|
return self._ResTextFormat
|
|
@@ -1126,9 +921,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1126
921
|
|
|
1127
922
|
@property
|
|
1128
923
|
def SourceType(self):
|
|
1129
|
-
r"""
|
|
1130
|
-
0:音频URL;
|
|
1131
|
-
1:音频数据(post body)
|
|
924
|
+
r"""<p>音频数据来源<br>0:音频URL;<br>1:音频数据(post body)</p>
|
|
1132
925
|
:rtype: int
|
|
1133
926
|
"""
|
|
1134
927
|
return self._SourceType
|
|
@@ -1139,10 +932,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1139
932
|
|
|
1140
933
|
@property
|
|
1141
934
|
def Data(self):
|
|
1142
|
-
r"""
|
|
1143
|
-
**当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
|
|
1144
|
-
|
|
1145
|
-
注意:音频数据要小于5MB(含)
|
|
935
|
+
r"""<p>音频数据base64编码<br><strong>当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写</strong></p><p>注意:音频数据要小于5MB(含)</p>
|
|
1146
936
|
:rtype: str
|
|
1147
937
|
"""
|
|
1148
938
|
return self._Data
|
|
@@ -1153,7 +943,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1153
943
|
|
|
1154
944
|
@property
|
|
1155
945
|
def DataLen(self):
|
|
1156
|
-
r"""
|
|
946
|
+
r"""<p>数据长度(此数据长度为数据未进行base64编码时的长度)</p>
|
|
1157
947
|
:rtype: int
|
|
1158
948
|
"""
|
|
1159
949
|
return self._DataLen
|
|
@@ -1164,12 +954,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1164
954
|
|
|
1165
955
|
@property
|
|
1166
956
|
def Url(self):
|
|
1167
|
-
r"""
|
|
1168
|
-
**当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
|
|
1169
|
-
|
|
1170
|
-
注意:
|
|
1171
|
-
1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
|
|
1172
|
-
2. 请保证文件的下载速度,否则可能下载失败
|
|
957
|
+
r"""<p>音频URL的地址(需要公网环境浏览器可下载)<br><strong>当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写</strong></p><p>注意:</p><ol><li>请确保录音文件时长在5个小时(含)之内,否则可能识别失败;</li><li>请保证文件的下载速度,否则可能下载失败</li></ol>
|
|
1173
958
|
:rtype: str
|
|
1174
959
|
"""
|
|
1175
960
|
return self._Url
|
|
@@ -1180,14 +965,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1180
965
|
|
|
1181
966
|
@property
|
|
1182
967
|
def CallbackUrl(self):
|
|
1183
|
-
r"""
|
|
1184
|
-
用户自行搭建的用于接收识别结果的服务URL
|
|
1185
|
-
回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
|
1186
|
-
|
|
1187
|
-
注意:
|
|
1188
|
-
|
|
1189
|
-
- 如果用户使用轮询方式获取识别结果,则无需提交该参数
|
|
1190
|
-
- 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
|
|
968
|
+
r"""<p>回调 URL<br>用户自行搭建的用于接收识别结果的服务URL<br>回调格式和内容详见:<a href="https://cloud.tencent.com/document/product/1093/52632">录音识别回调说明</a></p><p>注意:</p><ul><li>如果用户使用轮询方式获取识别结果,则无需提交该参数</li><li>建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑</li></ul>
|
|
1191
969
|
:rtype: str
|
|
1192
970
|
"""
|
|
1193
971
|
return self._CallbackUrl
|
|
@@ -1198,14 +976,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1198
976
|
|
|
1199
977
|
@property
|
|
1200
978
|
def SpeakerDiarization(self):
|
|
1201
|
-
r"""
|
|
1202
|
-
0:不开启;
|
|
1203
|
-
1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en,且ChannelNum=1时可用);
|
|
1204
|
-
3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)
|
|
1205
|
-
默认值为 0
|
|
1206
|
-
|
|
1207
|
-
注意:
|
|
1208
|
-
8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
|
|
979
|
+
r"""<p>是否开启说话人分离<br>0:不开启;<br>1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en/16k_es/16k_fr/16k_ja/16k_ko,且ChannelNum=1时可用);<br>3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)<br>默认值为 0</p><p>注意:<br>8k双声道电话音频请按 <strong>ChannelNum 识别声道数</strong> 的参数描述使用默认值</p>
|
|
1209
980
|
:rtype: int
|
|
1210
981
|
"""
|
|
1211
982
|
return self._SpeakerDiarization
|
|
@@ -1216,12 +987,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1216
987
|
|
|
1217
988
|
@property
|
|
1218
989
|
def SpeakerNumber(self):
|
|
1219
|
-
r"""
|
|
1220
|
-
**需配合开启说话人分离使用,不开启无效**,取值范围:0-10
|
|
1221
|
-
0:自动分离(最多分离出20个人);
|
|
1222
|
-
1-10:指定人数分离;
|
|
1223
|
-
默认值为 0
|
|
1224
|
-
注:16k引擎不支持指定人数分离
|
|
990
|
+
r"""<p>说话人分离人数<br><strong>需配合开启说话人分离使用,不开启无效</strong>,取值范围:0-10<br>0:自动分离(最多分离出20个人);<br>1-10:指定人数分离;<br>默认值为 0<br>注:16k引擎不支持指定人数分离</p>
|
|
1225
991
|
:rtype: int
|
|
1226
992
|
"""
|
|
1227
993
|
return self._SpeakerNumber
|
|
@@ -1232,10 +998,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1232
998
|
|
|
1233
999
|
@property
|
|
1234
1000
|
def HotwordId(self):
|
|
1235
|
-
r"""
|
|
1236
|
-
如不设置该参数,将自动生效默认热词表;
|
|
1237
|
-
如设置该参数,将生效对应id的热词表;
|
|
1238
|
-
点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
|
|
1001
|
+
r"""<p>热词表id<br>如不设置该参数,将自动生效默认热词表;<br>如设置该参数,将生效对应id的热词表;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a></p>
|
|
1239
1002
|
:rtype: str
|
|
1240
1003
|
"""
|
|
1241
1004
|
return self._HotwordId
|
|
@@ -1248,10 +1011,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1248
1011
|
def ReinforceHotword(self):
|
|
1249
1012
|
warnings.warn("parameter `ReinforceHotword` is deprecated", DeprecationWarning)
|
|
1250
1013
|
|
|
1251
|
-
r"""
|
|
1252
|
-
1:开启热词增强功能
|
|
1253
|
-
|
|
1254
|
-
注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
|
|
1014
|
+
r"""<p>热词增强功能(目前仅支持8k_zh/16k_zh引擎)<br>1:开启热词增强功能</p><p>注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a>。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。<strong>建议客户根据实际的业务需求开启该功能</strong></p>
|
|
1255
1015
|
:rtype: int
|
|
1256
1016
|
"""
|
|
1257
1017
|
return self._ReinforceHotword
|
|
@@ -1264,9 +1024,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1264
1024
|
|
|
1265
1025
|
@property
|
|
1266
1026
|
def CustomizationId(self):
|
|
1267
|
-
r"""
|
|
1268
|
-
如设置了该参数,将生效对应id的自学习定制模型;
|
|
1269
|
-
点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
|
|
1027
|
+
r"""<p>自学习定制模型 id<br>如设置了该参数,将生效对应id的自学习定制模型;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/38416">自学习定制模型配置方法</a></p>
|
|
1270
1028
|
:rtype: str
|
|
1271
1029
|
"""
|
|
1272
1030
|
return self._CustomizationId
|
|
@@ -1277,17 +1035,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1277
1035
|
|
|
1278
1036
|
@property
|
|
1279
1037
|
def EmotionRecognition(self):
|
|
1280
|
-
r"""
|
|
1281
|
-
0:不开启;
|
|
1282
|
-
1:开启情绪识别,但不在文本展示情绪标签;
|
|
1283
|
-
2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
|
|
1284
|
-
默认值为0
|
|
1285
|
-
支持的情绪分类为:高兴、伤心、愤怒
|
|
1286
|
-
|
|
1287
|
-
注意:
|
|
1288
|
-
1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
|
|
1289
|
-
2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
|
|
1290
|
-
3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
|
|
1038
|
+
r"""<p><strong>【增值付费功能】</strong>情绪识别能力(目前仅支持 16k_zh , 16k_zh_en , 8k_zh )<br>0:不开启;<br>1:开启情绪识别,但不在文本展示情绪标签;<br>2:开启情绪识别,并且在文本展示情绪标签(<strong>该功能需要设置ResTextFormat 大于0</strong>)<br>默认值为0<br>支持的情绪分类为:高兴、伤心、愤怒</p><p>注意:</p><ol><li><strong>本功能为增值服务</strong>,需将参数设置为1或2时方可按对应方式生效;</li><li>如果传入参数值1或2,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">情绪识别资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值1或2,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a>)</strong>;</li><li>参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源</li></ol>
|
|
1291
1039
|
:rtype: int
|
|
1292
1040
|
"""
|
|
1293
1041
|
return self._EmotionRecognition
|
|
@@ -1298,11 +1046,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1298
1046
|
|
|
1299
1047
|
@property
|
|
1300
1048
|
def EmotionalEnergy(self):
|
|
1301
|
-
r"""
|
|
1302
|
-
取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
|
|
1303
|
-
0:不开启;
|
|
1304
|
-
1:开启;
|
|
1305
|
-
默认值为0
|
|
1049
|
+
r"""<p>情绪能量值<br>取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈<br>0:不开启;<br>1:开启;<br>默认值为0</p>
|
|
1306
1050
|
:rtype: int
|
|
1307
1051
|
"""
|
|
1308
1052
|
return self._EmotionalEnergy
|
|
@@ -1313,11 +1057,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1313
1057
|
|
|
1314
1058
|
@property
|
|
1315
1059
|
def ConvertNumMode(self):
|
|
1316
|
-
r"""
|
|
1317
|
-
0:不转换,直接输出中文数字;
|
|
1318
|
-
1:根据场景智能转换为阿拉伯数字;
|
|
1319
|
-
3:打开数学相关数字转换(如:阿尔法转写为α);
|
|
1320
|
-
默认值为 1
|
|
1060
|
+
r"""<p>阿拉伯数字智能转换(目前支持中文普通话引擎)<br>0:不转换,直接输出中文数字;<br>1:根据场景智能转换为阿拉伯数字;<br>3:打开数学相关数字转换(如:阿尔法转写为α);<br>默认值为 1</p>
|
|
1321
1061
|
:rtype: int
|
|
1322
1062
|
"""
|
|
1323
1063
|
return self._ConvertNumMode
|
|
@@ -1328,11 +1068,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1328
1068
|
|
|
1329
1069
|
@property
|
|
1330
1070
|
def FilterDirty(self):
|
|
1331
|
-
r"""
|
|
1332
|
-
0:不过滤脏词;
|
|
1333
|
-
1:过滤脏词;
|
|
1334
|
-
2:将脏词替换为 * ;
|
|
1335
|
-
默认值为 0
|
|
1071
|
+
r"""<p>脏词过滤(目前支持中文普通话引擎)<br>0:不过滤脏词;<br>1:过滤脏词;<br>2:将脏词替换为 * ;<br>默认值为 0</p>
|
|
1336
1072
|
:rtype: int
|
|
1337
1073
|
"""
|
|
1338
1074
|
return self._FilterDirty
|
|
@@ -1343,11 +1079,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1343
1079
|
|
|
1344
1080
|
@property
|
|
1345
1081
|
def FilterPunc(self):
|
|
1346
|
-
r"""
|
|
1347
|
-
0:不过滤标点;
|
|
1348
|
-
1:过滤句末标点;
|
|
1349
|
-
2:过滤所有标点;
|
|
1350
|
-
默认值为 0
|
|
1082
|
+
r"""<p>标点符号过滤(目前支持中文普通话引擎)<br>0:不过滤标点;<br>1:过滤句末标点;<br>2:过滤所有标点;<br>默认值为 0</p>
|
|
1351
1083
|
:rtype: int
|
|
1352
1084
|
"""
|
|
1353
1085
|
return self._FilterPunc
|
|
@@ -1358,11 +1090,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1358
1090
|
|
|
1359
1091
|
@property
|
|
1360
1092
|
def FilterModal(self):
|
|
1361
|
-
r"""
|
|
1362
|
-
0:不过滤语气词;
|
|
1363
|
-
1:过滤部分语气词;
|
|
1364
|
-
2:严格过滤语气词;
|
|
1365
|
-
默认值为 0
|
|
1093
|
+
r"""<p>语气词过滤(目前支持中文普通话引擎)<br>0:不过滤语气词;<br>1:过滤部分语气词;<br>2:严格过滤语气词;<br>默认值为 0</p>
|
|
1366
1094
|
:rtype: int
|
|
1367
1095
|
"""
|
|
1368
1096
|
return self._FilterModal
|
|
@@ -1373,12 +1101,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1373
1101
|
|
|
1374
1102
|
@property
|
|
1375
1103
|
def SentenceMaxLength(self):
|
|
1376
|
-
r"""
|
|
1377
|
-
**可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
|
|
1378
|
-
0:不开启该功能;
|
|
1379
|
-
默认值为0
|
|
1380
|
-
|
|
1381
|
-
注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
|
|
1104
|
+
r"""<p>单标点最多字数(目前支持中文普通话引擎)<br><strong>可控制单行字幕最大字数,适用于字幕生成场景</strong>,取值范围:[6,40]<br>0:不开启该功能;<br>默认值为0</p><p>注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果</p>
|
|
1382
1105
|
:rtype: int
|
|
1383
1106
|
"""
|
|
1384
1107
|
return self._SentenceMaxLength
|
|
@@ -1389,7 +1112,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1389
1112
|
|
|
1390
1113
|
@property
|
|
1391
1114
|
def Extra(self):
|
|
1392
|
-
r"""
|
|
1115
|
+
r"""<p>附加参数<strong>(该参数无意义,忽略即可)</strong></p>
|
|
1393
1116
|
:rtype: str
|
|
1394
1117
|
"""
|
|
1395
1118
|
return self._Extra
|
|
@@ -1400,25 +1123,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1400
1123
|
|
|
1401
1124
|
@property
|
|
1402
1125
|
def HotwordList(self):
|
|
1403
|
-
r"""
|
|
1404
|
-
|
|
1405
|
-
- 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
|
|
1406
|
-
|
|
1407
|
-
- 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
|
|
1408
|
-
|
|
1409
|
-
- 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
|
|
1410
|
-
|
|
1411
|
-
- hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
|
|
1412
|
-
|
|
1413
|
-
- hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
|
|
1414
|
-
|
|
1415
|
-
注意:
|
|
1416
|
-
|
|
1417
|
-
- 如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;
|
|
1418
|
-
|
|
1419
|
-
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
1420
|
-
|
|
1421
|
-
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
1126
|
+
r"""<p>临时热词表:该参数用于提升识别准确率。</p><ul><li><p>单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;</p></li><li><p>临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;</p></li><li><p>参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:</p><ul><li><p>hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;</p></li><li><p>hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;</p></li></ul></li></ul><p>注意:</p><ul><li><p>如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;</p></li><li><p>热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。</p></li><li><p>热词权重设置为100时,当前热词开启热词增强同音同调替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。</p></li></ul>
|
|
1422
1127
|
:rtype: str
|
|
1423
1128
|
"""
|
|
1424
1129
|
return self._HotwordList
|
|
@@ -1429,8 +1134,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1429
1134
|
|
|
1430
1135
|
@property
|
|
1431
1136
|
def KeyWordLibIdList(self):
|
|
1432
|
-
r"""
|
|
1433
|
-
|
|
1137
|
+
r"""<p>关键词识别ID列表,默认空为不进行识别,最多10个</p>
|
|
1434
1138
|
:rtype: list of str
|
|
1435
1139
|
"""
|
|
1436
1140
|
return self._KeyWordLibIdList
|
|
@@ -1441,11 +1145,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1441
1145
|
|
|
1442
1146
|
@property
|
|
1443
1147
|
def ReplaceTextId(self):
|
|
1444
|
-
r"""
|
|
1445
|
-
|
|
1446
|
-
注意:
|
|
1447
|
-
1. 本功能配置完成后,预计在10分钟后生效
|
|
1448
|
-
|
|
1148
|
+
r"""<p>替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考<a href="https://console.cloud.tencent.com/asr/replaceword">配置控制台</a>;强制替换功能可能会影响正常识别结果,请谨慎使用</p><p>注意:</p><ol><li>本功能配置完成后,预计在10分钟后生效</li></ol>
|
|
1449
1149
|
:rtype: str
|
|
1450
1150
|
"""
|
|
1451
1151
|
return self._ReplaceTextId
|
|
@@ -1456,13 +1156,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
|
|
|
1456
1156
|
|
|
1457
1157
|
@property
|
|
1458
1158
|
def SpeakerRoles(self):
|
|
1459
|
-
r"""
|
|
1460
|
-
配合SpeakerDiarization: 3 使用,ASR增值服务,可传入一组声纹信息进行角色认证,仅支持16k_zh_en引擎。
|
|
1461
|
-
需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。
|
|
1462
|
-
RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。
|
|
1463
|
-
RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。
|
|
1464
|
-
示例:
|
|
1465
|
-
"{\"EngineModelType\":\"16k_zh_en\",\"ChannelNum\":1,\"ResTextFormat\":1,\"SourceType\":0,\"Url\":\"需要进行ASR识别的音频链接\",\"SpeakerDiarization\":3,\"SpeakerRoles\":[{\"RoleAudioUrl\":\"需要认证角色的声纹音频地址\",\"RoleName\":\"需要认证角色的名称\"}]}"
|
|
1159
|
+
r"""<p>开启角色分离能力配合SpeakerDiarization: 3 使用,ASR增值服务,<strong>仅可传入一组声纹信息</strong>进行角色认证,仅支持16k_zh_en引擎。需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。 RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。 RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。 示例: "{"EngineModelType":"16k_zh_en","ChannelNum":1,"ResTextFormat":1,"SourceType":0,"Url":"需要进行ASR识别的音频链接","SpeakerDiarization":3,"SpeakerRoles":[{"RoleAudioUrl":"需要认证角色的声纹音频地址","RoleName":"需要认证角色的名称"}]}"</p>
|
|
1466
1160
|
:rtype: list of SpeakerRoleInfo
|
|
1467
1161
|
"""
|
|
1468
1162
|
return self._SpeakerRoles
|
|
@@ -1520,9 +1214,7 @@ class CreateRecTaskResponse(AbstractModel):
|
|
|
1520
1214
|
|
|
1521
1215
|
def __init__(self):
|
|
1522
1216
|
r"""
|
|
1523
|
-
:param _Data:
|
|
1524
|
-
**注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
|
|
1525
|
-
|
|
1217
|
+
:param _Data: <p>录音文件识别的请求返回结果,包含结果查询需要的TaskId。<br><strong>注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。</strong></p>
|
|
1526
1218
|
:type Data: :class:`tencentcloud.asr.v20190614.models.Task`
|
|
1527
1219
|
:param _RequestId: 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1528
1220
|
:type RequestId: str
|
|
@@ -1532,9 +1224,7 @@ class CreateRecTaskResponse(AbstractModel):
|
|
|
1532
1224
|
|
|
1533
1225
|
@property
|
|
1534
1226
|
def Data(self):
|
|
1535
|
-
r"""
|
|
1536
|
-
**注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
|
|
1537
|
-
|
|
1227
|
+
r"""<p>录音文件识别的请求返回结果,包含结果查询需要的TaskId。<br><strong>注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。</strong></p>
|
|
1538
1228
|
:rtype: :class:`tencentcloud.asr.v20190614.models.Task`
|
|
1539
1229
|
"""
|
|
1540
1230
|
return self._Data
|
|
@@ -3537,46 +3227,49 @@ class SentenceDetail(AbstractModel):
|
|
|
3537
3227
|
|
|
3538
3228
|
def __init__(self):
|
|
3539
3229
|
r"""
|
|
3540
|
-
:param _FinalSentence:
|
|
3230
|
+
:param _FinalSentence: <p>单句最终识别结果</p>
|
|
3541
3231
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3542
3232
|
:type FinalSentence: str
|
|
3543
|
-
:param _SliceSentence:
|
|
3233
|
+
:param _SliceSentence: <p>单句中间识别结果,使用空格拆分为多个词</p>
|
|
3544
3234
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3545
3235
|
:type SliceSentence: str
|
|
3546
|
-
:param _WrittenText:
|
|
3236
|
+
:param _WrittenText: <p>口语转书面语结果,开启该功能才有值</p>
|
|
3547
3237
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3548
3238
|
:type WrittenText: str
|
|
3549
|
-
:param _StartMs:
|
|
3239
|
+
:param _StartMs: <p>单句开始时间(毫秒)</p>
|
|
3550
3240
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3551
3241
|
:type StartMs: int
|
|
3552
|
-
:param _EndMs:
|
|
3242
|
+
:param _EndMs: <p>单句结束时间(毫秒)</p>
|
|
3553
3243
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3554
3244
|
:type EndMs: int
|
|
3555
|
-
:param _WordsNum:
|
|
3245
|
+
:param _WordsNum: <p>单句中词个数</p>
|
|
3556
3246
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3557
3247
|
:type WordsNum: int
|
|
3558
|
-
:param _Words:
|
|
3248
|
+
:param _Words: <p>单句中词详情</p>
|
|
3559
3249
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3560
3250
|
:type Words: list of SentenceWords
|
|
3561
|
-
:param _SpeechSpeed:
|
|
3251
|
+
:param _SpeechSpeed: <p>单句语速,单位:字数/秒</p>
|
|
3562
3252
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3563
3253
|
:type SpeechSpeed: float
|
|
3564
|
-
:param _SpeakerId:
|
|
3565
|
-
单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。
|
|
3254
|
+
:param _SpeakerId: <p>声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)<br>单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。</p>
|
|
3566
3255
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3567
3256
|
:type SpeakerId: int
|
|
3568
|
-
:param _EmotionalEnergy:
|
|
3257
|
+
:param _EmotionalEnergy: <p>情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。</p>
|
|
3569
3258
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3570
3259
|
:type EmotionalEnergy: float
|
|
3571
|
-
:param _SilenceTime:
|
|
3260
|
+
:param _SilenceTime: <p>本句与上一句之间的静音时长</p>
|
|
3572
3261
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3573
3262
|
:type SilenceTime: int
|
|
3574
|
-
:param _EmotionType:
|
|
3263
|
+
:param _EmotionType: <p>情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)</p>
|
|
3575
3264
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3576
3265
|
:type EmotionType: list of str
|
|
3577
|
-
:param _KeyWordResults:
|
|
3266
|
+
:param _KeyWordResults: <p>关键词识别结果列表</p>
|
|
3578
3267
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3579
3268
|
:type KeyWordResults: list of KeyWordResult
|
|
3269
|
+
:param _LangType: <p>多语言识别类型</p><ul><li>中文 chinese</li><li>英语 english</li><li>日语 japanese</li><li>韩语 korean</li><li>阿拉伯语 arabic</li><li>菲律宾语 filipino</li><li>法语 french</li><li>印地语 hindi</li><li>印尼语 indonesian</li><li>马来语 malay</li><li>葡萄牙语 portugal</li><li>西班牙语 spanish</li><li>泰语 thai</li><li>土耳其语 turkish</li><li>越南语 vietnam</li><li>德语 german</li></ul>
|
|
3270
|
+
:type LangType: str
|
|
3271
|
+
:param _SpeakerRoleName: <p>说话人角色名称</p>
|
|
3272
|
+
:type SpeakerRoleName: str
|
|
3580
3273
|
"""
|
|
3581
3274
|
self._FinalSentence = None
|
|
3582
3275
|
self._SliceSentence = None
|
|
@@ -3591,10 +3284,12 @@ class SentenceDetail(AbstractModel):
|
|
|
3591
3284
|
self._SilenceTime = None
|
|
3592
3285
|
self._EmotionType = None
|
|
3593
3286
|
self._KeyWordResults = None
|
|
3287
|
+
self._LangType = None
|
|
3288
|
+
self._SpeakerRoleName = None
|
|
3594
3289
|
|
|
3595
3290
|
@property
|
|
3596
3291
|
def FinalSentence(self):
|
|
3597
|
-
r"""
|
|
3292
|
+
r"""<p>单句最终识别结果</p>
|
|
3598
3293
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3599
3294
|
:rtype: str
|
|
3600
3295
|
"""
|
|
@@ -3606,7 +3301,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3606
3301
|
|
|
3607
3302
|
@property
|
|
3608
3303
|
def SliceSentence(self):
|
|
3609
|
-
r"""
|
|
3304
|
+
r"""<p>单句中间识别结果,使用空格拆分为多个词</p>
|
|
3610
3305
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3611
3306
|
:rtype: str
|
|
3612
3307
|
"""
|
|
@@ -3618,7 +3313,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3618
3313
|
|
|
3619
3314
|
@property
|
|
3620
3315
|
def WrittenText(self):
|
|
3621
|
-
r"""
|
|
3316
|
+
r"""<p>口语转书面语结果,开启该功能才有值</p>
|
|
3622
3317
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3623
3318
|
:rtype: str
|
|
3624
3319
|
"""
|
|
@@ -3630,7 +3325,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3630
3325
|
|
|
3631
3326
|
@property
|
|
3632
3327
|
def StartMs(self):
|
|
3633
|
-
r"""
|
|
3328
|
+
r"""<p>单句开始时间(毫秒)</p>
|
|
3634
3329
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3635
3330
|
:rtype: int
|
|
3636
3331
|
"""
|
|
@@ -3642,7 +3337,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3642
3337
|
|
|
3643
3338
|
@property
|
|
3644
3339
|
def EndMs(self):
|
|
3645
|
-
r"""
|
|
3340
|
+
r"""<p>单句结束时间(毫秒)</p>
|
|
3646
3341
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3647
3342
|
:rtype: int
|
|
3648
3343
|
"""
|
|
@@ -3654,7 +3349,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3654
3349
|
|
|
3655
3350
|
@property
|
|
3656
3351
|
def WordsNum(self):
|
|
3657
|
-
r"""
|
|
3352
|
+
r"""<p>单句中词个数</p>
|
|
3658
3353
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3659
3354
|
:rtype: int
|
|
3660
3355
|
"""
|
|
@@ -3666,7 +3361,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3666
3361
|
|
|
3667
3362
|
@property
|
|
3668
3363
|
def Words(self):
|
|
3669
|
-
r"""
|
|
3364
|
+
r"""<p>单句中词详情</p>
|
|
3670
3365
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3671
3366
|
:rtype: list of SentenceWords
|
|
3672
3367
|
"""
|
|
@@ -3678,7 +3373,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3678
3373
|
|
|
3679
3374
|
@property
|
|
3680
3375
|
def SpeechSpeed(self):
|
|
3681
|
-
r"""
|
|
3376
|
+
r"""<p>单句语速,单位:字数/秒</p>
|
|
3682
3377
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3683
3378
|
:rtype: float
|
|
3684
3379
|
"""
|
|
@@ -3690,8 +3385,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3690
3385
|
|
|
3691
3386
|
@property
|
|
3692
3387
|
def SpeakerId(self):
|
|
3693
|
-
r"""
|
|
3694
|
-
单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。
|
|
3388
|
+
r"""<p>声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)<br>单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。</p>
|
|
3695
3389
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3696
3390
|
:rtype: int
|
|
3697
3391
|
"""
|
|
@@ -3703,7 +3397,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3703
3397
|
|
|
3704
3398
|
@property
|
|
3705
3399
|
def EmotionalEnergy(self):
|
|
3706
|
-
r"""
|
|
3400
|
+
r"""<p>情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。</p>
|
|
3707
3401
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3708
3402
|
:rtype: float
|
|
3709
3403
|
"""
|
|
@@ -3715,7 +3409,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3715
3409
|
|
|
3716
3410
|
@property
|
|
3717
3411
|
def SilenceTime(self):
|
|
3718
|
-
r"""
|
|
3412
|
+
r"""<p>本句与上一句之间的静音时长</p>
|
|
3719
3413
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3720
3414
|
:rtype: int
|
|
3721
3415
|
"""
|
|
@@ -3727,7 +3421,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3727
3421
|
|
|
3728
3422
|
@property
|
|
3729
3423
|
def EmotionType(self):
|
|
3730
|
-
r"""
|
|
3424
|
+
r"""<p>情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)</p>
|
|
3731
3425
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3732
3426
|
:rtype: list of str
|
|
3733
3427
|
"""
|
|
@@ -3739,7 +3433,7 @@ class SentenceDetail(AbstractModel):
|
|
|
3739
3433
|
|
|
3740
3434
|
@property
|
|
3741
3435
|
def KeyWordResults(self):
|
|
3742
|
-
r"""
|
|
3436
|
+
r"""<p>关键词识别结果列表</p>
|
|
3743
3437
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
3744
3438
|
:rtype: list of KeyWordResult
|
|
3745
3439
|
"""
|
|
@@ -3749,6 +3443,28 @@ class SentenceDetail(AbstractModel):
|
|
|
3749
3443
|
def KeyWordResults(self, KeyWordResults):
|
|
3750
3444
|
self._KeyWordResults = KeyWordResults
|
|
3751
3445
|
|
|
3446
|
+
@property
|
|
3447
|
+
def LangType(self):
|
|
3448
|
+
r"""<p>多语言识别类型</p><ul><li>中文 chinese</li><li>英语 english</li><li>日语 japanese</li><li>韩语 korean</li><li>阿拉伯语 arabic</li><li>菲律宾语 filipino</li><li>法语 french</li><li>印地语 hindi</li><li>印尼语 indonesian</li><li>马来语 malay</li><li>葡萄牙语 portugal</li><li>西班牙语 spanish</li><li>泰语 thai</li><li>土耳其语 turkish</li><li>越南语 vietnam</li><li>德语 german</li></ul>
|
|
3449
|
+
:rtype: str
|
|
3450
|
+
"""
|
|
3451
|
+
return self._LangType
|
|
3452
|
+
|
|
3453
|
+
@LangType.setter
|
|
3454
|
+
def LangType(self, LangType):
|
|
3455
|
+
self._LangType = LangType
|
|
3456
|
+
|
|
3457
|
+
@property
|
|
3458
|
+
def SpeakerRoleName(self):
|
|
3459
|
+
r"""<p>说话人角色名称</p>
|
|
3460
|
+
:rtype: str
|
|
3461
|
+
"""
|
|
3462
|
+
return self._SpeakerRoleName
|
|
3463
|
+
|
|
3464
|
+
@SpeakerRoleName.setter
|
|
3465
|
+
def SpeakerRoleName(self, SpeakerRoleName):
|
|
3466
|
+
self._SpeakerRoleName = SpeakerRoleName
|
|
3467
|
+
|
|
3752
3468
|
|
|
3753
3469
|
def _deserialize(self, params):
|
|
3754
3470
|
self._FinalSentence = params.get("FinalSentence")
|
|
@@ -3774,6 +3490,8 @@ class SentenceDetail(AbstractModel):
|
|
|
3774
3490
|
obj = KeyWordResult()
|
|
3775
3491
|
obj._deserialize(item)
|
|
3776
3492
|
self._KeyWordResults.append(obj)
|
|
3493
|
+
self._LangType = params.get("LangType")
|
|
3494
|
+
self._SpeakerRoleName = params.get("SpeakerRoleName")
|
|
3777
3495
|
memeber_set = set(params.keys())
|
|
3778
3496
|
for name, value in vars(self).items():
|
|
3779
3497
|
property_name = name[1:]
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.1
|
|
2
2
|
Name: tencentcloud-sdk-python-asr
|
|
3
|
-
Version: 3.1.
|
|
3
|
+
Version: 3.1.51
|
|
4
4
|
Summary: Tencent Cloud Asr SDK for Python
|
|
5
5
|
Home-page: https://github.com/TencentCloud/tencentcloud-sdk-python
|
|
6
6
|
Author: Tencent Cloud
|
|
@@ -15,7 +15,7 @@ Classifier: Programming Language :: Python :: 2.7
|
|
|
15
15
|
Classifier: Programming Language :: Python :: 3
|
|
16
16
|
Classifier: Programming Language :: Python :: 3.6
|
|
17
17
|
Classifier: Programming Language :: Python :: 3.7
|
|
18
|
-
Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.
|
|
18
|
+
Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.51
|
|
19
19
|
|
|
20
20
|
============================
|
|
21
21
|
Tencent Cloud SDK for Python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
tencentcloud-sdk-python-common<4.0.0,>=3.1.51
|
|
@@ -1 +0,0 @@
|
|
|
1
|
-
tencentcloud-sdk-python-common<4.0.0,>=3.1.44
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|