tencentcloud-sdk-python-asr 3.1.44__tar.gz → 3.1.51__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (17) hide show
  1. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/PKG-INFO +2 -2
  2. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/setup.py +1 -1
  3. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/__init__.py +1 -1
  4. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/models.py +108 -390
  5. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/PKG-INFO +2 -2
  6. tencentcloud_sdk_python_asr-3.1.51/tencentcloud_sdk_python_asr.egg-info/requires.txt +1 -0
  7. tencentcloud_sdk_python_asr-3.1.44/tencentcloud_sdk_python_asr.egg-info/requires.txt +0 -1
  8. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/README.rst +0 -0
  9. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/setup.cfg +0 -0
  10. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/__init__.py +0 -0
  11. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/__init__.py +0 -0
  12. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/asr_client.py +0 -0
  13. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/asr_client_async.py +0 -0
  14. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud/asr/v20190614/errorcodes.py +0 -0
  15. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/SOURCES.txt +0 -0
  16. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/dependency_links.txt +0 -0
  17. {tencentcloud_sdk_python_asr-3.1.44 → tencentcloud_sdk_python_asr-3.1.51}/tencentcloud_sdk_python_asr.egg-info/top_level.txt +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: tencentcloud-sdk-python-asr
3
- Version: 3.1.44
3
+ Version: 3.1.51
4
4
  Summary: Tencent Cloud Asr SDK for Python
5
5
  Home-page: https://github.com/TencentCloud/tencentcloud-sdk-python
6
6
  Author: Tencent Cloud
@@ -15,7 +15,7 @@ Classifier: Programming Language :: Python :: 2.7
15
15
  Classifier: Programming Language :: Python :: 3
16
16
  Classifier: Programming Language :: Python :: 3.6
17
17
  Classifier: Programming Language :: Python :: 3.7
18
- Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.44
18
+ Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.51
19
19
 
20
20
  ============================
21
21
  Tencent Cloud SDK for Python
@@ -8,7 +8,7 @@ ROOT = os.path.dirname(__file__)
8
8
 
9
9
  setup(
10
10
  name='tencentcloud-sdk-python-asr',
11
- install_requires=["tencentcloud-sdk-python-common>=3.1.44,<4.0.0"],
11
+ install_requires=["tencentcloud-sdk-python-common>=3.1.51,<4.0.0"],
12
12
 
13
13
  version=tencentcloud.__version__,
14
14
  description='Tencent Cloud Asr SDK for Python',
@@ -14,4 +14,4 @@
14
14
  # limitations under the License.
15
15
 
16
16
 
17
- __version__ = '3.1.44'
17
+ __version__ = '3.1.51'
@@ -809,208 +809,55 @@ class CreateRecTaskRequest(AbstractModel):
809
809
 
810
810
  def __init__(self):
811
811
  r"""
812
- :param _EngineModelType: 引擎模型类型
813
- 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
814
-
815
- 电话通讯场景引擎:
816
- **注意:电话通讯场景,请务必使用以下8k引擎**
817
- • 8k_zh:中文电话通讯;
818
- • 8k_en:英文电话通讯;
819
- • 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型效果;
820
-
821
- 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
822
-
823
- 通用场景引擎:
824
- **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
825
- • **16k_zh_en**:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;
826
- • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
827
- • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
828
- • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
829
- • **16k_en:**英语;
830
- • **16k_yue:**粤语;
831
- • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
832
- • **16k_zh-TW**:中文繁体;
833
- • **16k_ja:**日语;
834
- • **16k_ko:**韩语;
835
- • **16k_vi:**越南语;
836
- • **16k_ms:**马来语;
837
- • **16k_id:**印度尼西亚语;
838
- • **16k_fil:**菲律宾语;
839
- • **16k_th:**泰语;
840
- • **16k_pt:**葡萄牙语;
841
- • **16k_tr:**土耳其语;
842
- • **16k_ar:**阿拉伯语;
843
- • **16k_es:**西班牙语;
844
- • **16k_hi:**印地语;
845
- • **16k_fr:**法语;
846
- • **16k_zh_medical:**中文医疗引擎;
847
- • **16k_de:**德语;
812
+ :param _EngineModelType: <p>引擎模型类型<br>识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,<a href="https://cloud.tencent.com/document/product/1093/35686">点击这里</a> 查看产品计费说明</p><p>电话通讯场景引擎:<br><strong>注意:电话通讯场景,请务必使用以下8k引擎</strong><br>• 8k_zh:中文电话通讯;<br>• 8k_en:英文电话通讯;<br>• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比常规版本与普方大模型效果;</p><p>注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但<strong>16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用</strong></p><p>通用场景引擎:<br><strong>注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎</strong><br>• <strong>16k_zh_en</strong>:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;<br>• <strong>16k_zh_large:</strong>普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、<a href="https://cloud.tencent.com/document/product/1093/35682">多种中文方言</a>等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比中文普通话常规版本与普方英大模型版本的识别效果;<br>• <strong>16k_multi_lang:</strong>多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);<br>• <strong>16k_zh:</strong>中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;<br>• <strong>16k_en:</strong>英语;<br>• <strong>16k_en_large:</strong>英语大模型;<br>• <strong>16k_yue:</strong>粤语;<br>• <strong>16k_zh-PY:</strong>中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;<br>• <strong>16k_zh-TW</strong>:中文繁体;<br>• <strong>16k_ja:</strong>日语;<br>• <strong>16k_ko:</strong>韩语;<br>• <strong>16k_vi:</strong>越南语;<br>• <strong>16k_ms:</strong>马来语;<br>• <strong>16k_id:</strong>印度尼西亚语;<br>• <strong>16k_fil:</strong>菲律宾语;<br>• <strong>16k_th:</strong>泰语;<br>• <strong>16k_pt:</strong>葡萄牙语;<br>• <strong>16k_tr:</strong>土耳其语;<br>• <strong>16k_ar:</strong>阿拉伯语;<br>• <strong>16k_es:</strong>西班牙语;<br>• <strong>16k_hi:</strong>印地语;<br>• <strong>16k_fr:</strong>法语;<br>• <strong>16k_zh_medical:</strong>中文医疗引擎;<br>• <strong>16k_de:</strong>德语;</p><p>枚举值:</p><ul><li>16k_zh: 中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景</li></ul>
848
813
  :type EngineModelType: str
849
- :param _ChannelNum: 识别声道数
850
- 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
851
- 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
852
-
853
- 注意:
854
- • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
855
- • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。
814
+ :param _ChannelNum: <p>识别声道数<br>1:单声道(16k音频仅支持单声道,<strong>请勿</strong>设置为双声道);<br>2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)</p><p>注意:<br>• 16k音频:仅支持单声道识别,<strong>需设置ChannelNum=1</strong>;<br>• 8k电话音频:支持单声道、双声道识别,<strong>建议设置ChannelNum=2,即双声道</strong>。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此<strong>无需再开启说话人分离功能</strong>,相关参数(<strong>SpeakerDiarization、SpeakerNumber</strong>)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。</p>
856
815
  :type ChannelNum: int
857
- :param _ResTextFormat: 识别结果返回样式
858
- 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
859
- 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
860
- 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
861
- 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
862
- 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
863
- 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
864
-
865
- 注意:
866
- 以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de
867
- 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
868
- 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
816
+ :param _ResTextFormat: <p>识别结果返回样式<br>0:基础识别结果(仅包含有效人声时间戳,无词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>);<br>1:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值,<strong>不含标点</strong>);<br>2:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点);<br>3:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,<strong>适用字幕场景</strong>;<br>4:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,<strong>适用会议、庭审记录转写等场景</strong>,仅支持8k_zh/16k_zh引擎<br>5:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,<strong>适用于线上、线下会议直接总结为书面会议纪要的场景</strong>,仅支持8k_zh/16k_zh引擎</p><p>注意:<br>以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de<br>如果传入参数值4,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">语义分段资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值4,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong><br>如果传入参数值5,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">口语转书面语资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值5,将自动计费<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong></p>
869
817
  :type ResTextFormat: int
870
- :param _SourceType: 音频数据来源
871
- 0:音频URL;
872
- 1:音频数据(post body)
818
+ :param _SourceType: <p>音频数据来源<br>0:音频URL;<br>1:音频数据(post body)</p>
873
819
  :type SourceType: int
874
- :param _Data: 音频数据base64编码
875
- **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
876
-
877
- 注意:音频数据要小于5MB(含)
820
+ :param _Data: <p>音频数据base64编码<br><strong>当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写</strong></p><p>注意:音频数据要小于5MB(含)</p>
878
821
  :type Data: str
879
- :param _DataLen: 数据长度(此数据长度为数据未进行base64编码时的长度)
822
+ :param _DataLen: <p>数据长度(此数据长度为数据未进行base64编码时的长度)</p>
880
823
  :type DataLen: int
881
- :param _Url: 音频URL的地址(需要公网环境浏览器可下载)
882
- **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
883
-
884
- 注意:
885
- 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
886
- 2. 请保证文件的下载速度,否则可能下载失败
824
+ :param _Url: <p>音频URL的地址(需要公网环境浏览器可下载)<br><strong>当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写</strong></p><p>注意:</p><ol><li>请确保录音文件时长在5个小时(含)之内,否则可能识别失败;</li><li>请保证文件的下载速度,否则可能下载失败</li></ol>
887
825
  :type Url: str
888
- :param _CallbackUrl: 回调 URL
889
- 用户自行搭建的用于接收识别结果的服务URL
890
- 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
891
-
892
- 注意:
893
-
894
- - 如果用户使用轮询方式获取识别结果,则无需提交该参数
895
- - 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
826
+ :param _CallbackUrl: <p>回调 URL<br>用户自行搭建的用于接收识别结果的服务URL<br>回调格式和内容详见:<a href="https://cloud.tencent.com/document/product/1093/52632">录音识别回调说明</a></p><p>注意:</p><ul><li>如果用户使用轮询方式获取识别结果,则无需提交该参数</li><li>建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑</li></ul>
896
827
  :type CallbackUrl: str
897
- :param _SpeakerDiarization: 是否开启说话人分离
898
- 0:不开启;
899
- 1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en,且ChannelNum=1时可用);
900
- 3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)
901
- 默认值为 0
902
-
903
- 注意:
904
- 8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
828
+ :param _SpeakerDiarization: <p>是否开启说话人分离<br>0:不开启;<br>1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en/16k_es/16k_fr/16k_ja/16k_ko,且ChannelNum=1时可用);<br>3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)<br>默认值为 0</p><p>注意:<br>8k双声道电话音频请按 <strong>ChannelNum 识别声道数</strong> 的参数描述使用默认值</p>
905
829
  :type SpeakerDiarization: int
906
- :param _SpeakerNumber: 说话人分离人数
907
- **需配合开启说话人分离使用,不开启无效**,取值范围:0-10
908
- 0:自动分离(最多分离出20个人);
909
- 1-10:指定人数分离;
910
- 默认值为 0
911
- 注:16k引擎不支持指定人数分离
830
+ :param _SpeakerNumber: <p>说话人分离人数<br><strong>需配合开启说话人分离使用,不开启无效</strong>,取值范围:0-10<br>0:自动分离(最多分离出20个人);<br>1-10:指定人数分离;<br>默认值为 0<br>注:16k引擎不支持指定人数分离</p>
912
831
  :type SpeakerNumber: int
913
- :param _HotwordId: 热词表id
914
- 如不设置该参数,将自动生效默认热词表;
915
- 如设置该参数,将生效对应id的热词表;
916
- 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
832
+ :param _HotwordId: <p>热词表id<br>如不设置该参数,将自动生效默认热词表;<br>如设置该参数,将生效对应id的热词表;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a></p>
917
833
  :type HotwordId: str
918
- :param _ReinforceHotword: 热词增强功能(目前仅支持8k_zh/16k_zh引擎)
919
- 1:开启热词增强功能
920
-
921
- 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
834
+ :param _ReinforceHotword: <p>热词增强功能(目前仅支持8k_zh/16k_zh引擎)<br>1:开启热词增强功能</p><p>注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a>。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。<strong>建议客户根据实际的业务需求开启该功能</strong></p>
922
835
  :type ReinforceHotword: int
923
- :param _CustomizationId: 自学习定制模型 id
924
- 如设置了该参数,将生效对应id的自学习定制模型;
925
- 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
836
+ :param _CustomizationId: <p>自学习定制模型 id<br>如设置了该参数,将生效对应id的自学习定制模型;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/38416">自学习定制模型配置方法</a></p>
926
837
  :type CustomizationId: str
927
- :param _EmotionRecognition: **【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh
928
- 0:不开启;
929
- 1:开启情绪识别,但不在文本展示情绪标签;
930
- 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
931
- 默认值为0
932
- 支持的情绪分类为:高兴、伤心、愤怒
933
-
934
- 注意:
935
- 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
936
- 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
937
- 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
838
+ :param _EmotionRecognition: <p><strong>【增值付费功能】</strong>情绪识别能力(目前仅支持 16k_zh , 16k_zh_en , 8k_zh )<br>0:不开启;<br>1:开启情绪识别,但不在文本展示情绪标签;<br>2:开启情绪识别,并且在文本展示情绪标签(<strong>该功能需要设置ResTextFormat 大于0</strong>)<br>默认值为0<br>支持的情绪分类为:高兴、伤心、愤怒</p><p>注意:</p><ol><li><strong>本功能为增值服务</strong>,需将参数设置为1或2时方可按对应方式生效;</li><li>如果传入参数值1或2,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">情绪识别资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值1或2,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a>)</strong>;</li><li>参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源</li></ol>
938
839
  :type EmotionRecognition: int
939
- :param _EmotionalEnergy: 情绪能量值
940
- 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
941
- 0:不开启;
942
- 1:开启;
943
- 默认值为0
840
+ :param _EmotionalEnergy: <p>情绪能量值<br>取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈<br>0:不开启;<br>1:开启;<br>默认值为0</p>
944
841
  :type EmotionalEnergy: int
945
- :param _ConvertNumMode: 阿拉伯数字智能转换(目前支持中文普通话引擎)
946
- 0:不转换,直接输出中文数字;
947
- 1:根据场景智能转换为阿拉伯数字;
948
- 3:打开数学相关数字转换(如:阿尔法转写为α);
949
- 默认值为 1
842
+ :param _ConvertNumMode: <p>阿拉伯数字智能转换(目前支持中文普通话引擎)<br>0:不转换,直接输出中文数字;<br>1:根据场景智能转换为阿拉伯数字;<br>3:打开数学相关数字转换(如:阿尔法转写为α);<br>默认值为 1</p>
950
843
  :type ConvertNumMode: int
951
- :param _FilterDirty: 脏词过滤(目前支持中文普通话引擎)
952
- 0:不过滤脏词;
953
- 1:过滤脏词;
954
- 2:将脏词替换为 * ;
955
- 默认值为 0
844
+ :param _FilterDirty: <p>脏词过滤(目前支持中文普通话引擎)<br>0:不过滤脏词;<br>1:过滤脏词;<br>2:将脏词替换为 * ;<br>默认值为 0</p>
956
845
  :type FilterDirty: int
957
- :param _FilterPunc: 标点符号过滤(目前支持中文普通话引擎)
958
- 0:不过滤标点;
959
- 1:过滤句末标点;
960
- 2:过滤所有标点;
961
- 默认值为 0
846
+ :param _FilterPunc: <p>标点符号过滤(目前支持中文普通话引擎)<br>0:不过滤标点;<br>1:过滤句末标点;<br>2:过滤所有标点;<br>默认值为 0</p>
962
847
  :type FilterPunc: int
963
- :param _FilterModal: 语气词过滤(目前支持中文普通话引擎)
964
- 0:不过滤语气词;
965
- 1:过滤部分语气词;
966
- 2:严格过滤语气词;
967
- 默认值为 0
848
+ :param _FilterModal: <p>语气词过滤(目前支持中文普通话引擎)<br>0:不过滤语气词;<br>1:过滤部分语气词;<br>2:严格过滤语气词;<br>默认值为 0</p>
968
849
  :type FilterModal: int
969
- :param _SentenceMaxLength: 单标点最多字数(目前支持中文普通话引擎)
970
- **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
971
- 0:不开启该功能;
972
- 默认值为0
973
-
974
- 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
850
+ :param _SentenceMaxLength: <p>单标点最多字数(目前支持中文普通话引擎)<br><strong>可控制单行字幕最大字数,适用于字幕生成场景</strong>,取值范围:[6,40]<br>0:不开启该功能;<br>默认值为0</p><p>注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果</p>
975
851
  :type SentenceMaxLength: int
976
- :param _Extra: 附加参数**(该参数无意义,忽略即可)**
852
+ :param _Extra: <p>附加参数<strong>(该参数无意义,忽略即可)</strong></p>
977
853
  :type Extra: str
978
- :param _HotwordList: 临时热词表:该参数用于提升识别准确率。
979
-
980
- - 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
981
-
982
- - 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
983
-
984
- - 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
985
-
986
- - hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
987
-
988
- - hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
989
-
990
- 注意:
991
-
992
- - 如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;
993
-
994
- - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
995
-
996
- - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
854
+ :param _HotwordList: <p>临时热词表:该参数用于提升识别准确率。</p><ul><li><p>单个热词限制:&quot;热词|权重&quot;,单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;</p></li><li><p>临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;</p></li><li><p>参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:</p><ul><li><p>hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;</p></li><li><p>hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;</p></li></ul></li></ul><p>注意:</p><ul><li><p>如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;</p></li><li><p>热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。</p></li><li><p>热词权重设置为100时,当前热词开启热词增强同音同调替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。</p></li></ul>
997
855
  :type HotwordList: str
998
- :param _KeyWordLibIdList: 关键词识别ID列表,默认空为不进行识别,最多10
999
-
856
+ :param _KeyWordLibIdList: <p>关键词识别ID列表,默认空为不进行识别,最多10个</p>
1000
857
  :type KeyWordLibIdList: list of str
1001
- :param _ReplaceTextId: 替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考[配置控制台](https://console.cloud.tencent.com/asr/replaceword);强制替换功能可能会影响正常识别结果,请谨慎使用
1002
-
1003
- 注意:
1004
- 1. 本功能配置完成后,预计在10分钟后生效
1005
-
858
+ :param _ReplaceTextId: <p>替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考<a href="https://console.cloud.tencent.com/asr/replaceword">配置控制台</a>;强制替换功能可能会影响正常识别结果,请谨慎使用</p><p>注意:</p><ol><li>本功能配置完成后,预计在10分钟后生效</li></ol>
1006
859
  :type ReplaceTextId: str
1007
- :param _SpeakerRoles: 开启角色分离能力
1008
- 配合SpeakerDiarization: 3 使用,ASR增值服务,可传入一组声纹信息进行角色认证,仅支持16k_zh_en引擎。
1009
- 需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。
1010
- RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。
1011
- RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。
1012
- 示例:
1013
- "{\"EngineModelType\":\"16k_zh_en\",\"ChannelNum\":1,\"ResTextFormat\":1,\"SourceType\":0,\"Url\":\"需要进行ASR识别的音频链接\",\"SpeakerDiarization\":3,\"SpeakerRoles\":[{\"RoleAudioUrl\":\"需要认证角色的声纹音频地址\",\"RoleName\":\"需要认证角色的名称\"}]}"
860
+ :param _SpeakerRoles: <p>开启角色分离能力配合SpeakerDiarization: 3 使用,ASR增值服务,<strong>仅可传入一组声纹信息</strong>进行角色认证,仅支持16k_zh_en引擎。需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。 RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。 RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。 示例: &quot;{"EngineModelType":"16k_zh_en","ChannelNum":1,"ResTextFormat":1,"SourceType":0,"Url":"需要进行ASR识别的音频链接","SpeakerDiarization":3,"SpeakerRoles":[{"RoleAudioUrl":"需要认证角色的声纹音频地址","RoleName":"需要认证角色的名称"}]}&quot;</p>
1014
861
  :type SpeakerRoles: list of SpeakerRoleInfo
1015
862
  """
1016
863
  self._EngineModelType = None
@@ -1041,42 +888,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1041
888
 
1042
889
  @property
1043
890
  def EngineModelType(self):
1044
- r"""引擎模型类型
1045
- 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
1046
-
1047
- 电话通讯场景引擎:
1048
- **注意:电话通讯场景,请务必使用以下8k引擎**
1049
- • 8k_zh:中文电话通讯;
1050
- • 8k_en:英文电话通讯;
1051
- • 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型效果;
1052
-
1053
- 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
1054
-
1055
- 通用场景引擎:
1056
- **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
1057
- • **16k_zh_en**:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;
1058
- • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
1059
- • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
1060
- • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
1061
- • **16k_en:**英语;
1062
- • **16k_yue:**粤语;
1063
- • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
1064
- • **16k_zh-TW**:中文繁体;
1065
- • **16k_ja:**日语;
1066
- • **16k_ko:**韩语;
1067
- • **16k_vi:**越南语;
1068
- • **16k_ms:**马来语;
1069
- • **16k_id:**印度尼西亚语;
1070
- • **16k_fil:**菲律宾语;
1071
- • **16k_th:**泰语;
1072
- • **16k_pt:**葡萄牙语;
1073
- • **16k_tr:**土耳其语;
1074
- • **16k_ar:**阿拉伯语;
1075
- • **16k_es:**西班牙语;
1076
- • **16k_hi:**印地语;
1077
- • **16k_fr:**法语;
1078
- • **16k_zh_medical:**中文医疗引擎;
1079
- • **16k_de:**德语;
891
+ r"""<p>引擎模型类型<br>识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,<a href="https://cloud.tencent.com/document/product/1093/35686">点击这里</a> 查看产品计费说明</p><p>电话通讯场景引擎:<br><strong>注意:电话通讯场景,请务必使用以下8k引擎</strong><br>• 8k_zh:中文电话通讯;<br>• 8k_en:英文电话通讯;<br>• 8k_zh_large:中文电话场景专用大模型引擎【大模型版】。当前模型同时支持中文、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、客家话、粤语、南宁话方言识别,通过显著提升模型参数规模与语言建模能力,实现对电话音频中复杂场景(如口音干扰、背景噪声)的高精度识别,识别准确率较常规版本大幅提升。<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比常规版本与普方大模型效果;</p><p>注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但<strong>16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用</strong></p><p>通用场景引擎:<br><strong>注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎</strong><br>• <strong>16k_zh_en</strong>:中英粤+9种方言大模型引擎【大模型版】。当前模型同时支持中文、英语、粤语、四川、陕西、河南、上海、湖南、湖北、安徽、闽南和潮汕方言识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升;<br>• <strong>16k_zh_large:</strong>普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、<a href="https://cloud.tencent.com/document/product/1093/35682">多种中文方言</a>等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,<a href="https://console.cloud.tencent.com/asr/demonstrate">点击这里</a> 对比中文普通话常规版本与普方英大模型版本的识别效果;<br>• <strong>16k_multi_lang:</strong>多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);<br>• <strong>16k_zh:</strong>中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;<br>• <strong>16k_en:</strong>英语;<br>• <strong>16k_en_large:</strong>英语大模型;<br>• <strong>16k_yue:</strong>粤语;<br>• <strong>16k_zh-PY:</strong>中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;<br>• <strong>16k_zh-TW</strong>:中文繁体;<br>• <strong>16k_ja:</strong>日语;<br>• <strong>16k_ko:</strong>韩语;<br>• <strong>16k_vi:</strong>越南语;<br>• <strong>16k_ms:</strong>马来语;<br>• <strong>16k_id:</strong>印度尼西亚语;<br>• <strong>16k_fil:</strong>菲律宾语;<br>• <strong>16k_th:</strong>泰语;<br>• <strong>16k_pt:</strong>葡萄牙语;<br>• <strong>16k_tr:</strong>土耳其语;<br>• <strong>16k_ar:</strong>阿拉伯语;<br>• <strong>16k_es:</strong>西班牙语;<br>• <strong>16k_hi:</strong>印地语;<br>• <strong>16k_fr:</strong>法语;<br>• <strong>16k_zh_medical:</strong>中文医疗引擎;<br>• <strong>16k_de:</strong>德语;</p><p>枚举值:</p><ul><li>16k_zh: 中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景</li></ul>
1080
892
  :rtype: str
1081
893
  """
1082
894
  return self._EngineModelType
@@ -1087,13 +899,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1087
899
 
1088
900
  @property
1089
901
  def ChannelNum(self):
1090
- r"""识别声道数
1091
- 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
1092
- 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
1093
-
1094
- 注意:
1095
- • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
1096
- • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。
902
+ r"""<p>识别声道数<br>1:单声道(16k音频仅支持单声道,<strong>请勿</strong>设置为双声道);<br>2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)</p><p>注意:<br>• 16k音频:仅支持单声道识别,<strong>需设置ChannelNum=1</strong>;<br>• 8k电话音频:支持单声道、双声道识别,<strong>建议设置ChannelNum=2,即双声道</strong>。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此<strong>无需再开启说话人分离功能</strong>,相关参数(<strong>SpeakerDiarization、SpeakerNumber</strong>)使用默认值即可,返回的ResultDetail中的speakerId的值为0代表左声道,值为1代表右声道。</p>
1097
903
  :rtype: int
1098
904
  """
1099
905
  return self._ChannelNum
@@ -1104,18 +910,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1104
910
 
1105
911
  @property
1106
912
  def ResTextFormat(self):
1107
- r"""识别结果返回样式
1108
- 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
1109
- 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
1110
- 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
1111
- 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
1112
- 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
1113
- 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
1114
-
1115
- 注意:
1116
- 以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de
1117
- 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
1118
- 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
913
+ r"""<p>识别结果返回样式<br>0:基础识别结果(仅包含有效人声时间戳,无词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>);<br>1:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值,<strong>不含标点</strong>);<br>2:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点);<br>3:基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,<strong>适用字幕场景</strong>;<br>4:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,<strong>适用会议、庭审记录转写等场景</strong>,仅支持8k_zh/16k_zh引擎<br>5:<strong>【增值付费功能】</strong>基础识别结果之上,增加词粒度的<a href="https://cloud.tencent.com/document/api/1093/37824#SentenceDetail">详细识别结果</a>(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,<strong>适用于线上、线下会议直接总结为书面会议纪要的场景</strong>,仅支持8k_zh/16k_zh引擎</p><p>注意:<br>以下引擎仅支持参数值设置为0:16k_multi_lang、16k_ja、16k_ko、16k_vi、16k_ms、16k_id、16k_fil、16k_th、16k_pt、16k_tr、16k_ar、16k_es、16k_hi、16k_fr、16k_zh_medical、16k_de<br>如果传入参数值4,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">语义分段资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值4,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong><br>如果传入参数值5,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">口语转书面语资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值5,将自动计费<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a></strong></p>
1119
914
  :rtype: int
1120
915
  """
1121
916
  return self._ResTextFormat
@@ -1126,9 +921,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1126
921
 
1127
922
  @property
1128
923
  def SourceType(self):
1129
- r"""音频数据来源
1130
- 0:音频URL;
1131
- 1:音频数据(post body)
924
+ r"""<p>音频数据来源<br>0:音频URL;<br>1:音频数据(post body)</p>
1132
925
  :rtype: int
1133
926
  """
1134
927
  return self._SourceType
@@ -1139,10 +932,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1139
932
 
1140
933
  @property
1141
934
  def Data(self):
1142
- r"""音频数据base64编码
1143
- **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
1144
-
1145
- 注意:音频数据要小于5MB(含)
935
+ r"""<p>音频数据base64编码<br><strong>当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写</strong></p><p>注意:音频数据要小于5MB(含)</p>
1146
936
  :rtype: str
1147
937
  """
1148
938
  return self._Data
@@ -1153,7 +943,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1153
943
 
1154
944
  @property
1155
945
  def DataLen(self):
1156
- r"""数据长度(此数据长度为数据未进行base64编码时的长度)
946
+ r"""<p>数据长度(此数据长度为数据未进行base64编码时的长度)</p>
1157
947
  :rtype: int
1158
948
  """
1159
949
  return self._DataLen
@@ -1164,12 +954,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1164
954
 
1165
955
  @property
1166
956
  def Url(self):
1167
- r"""音频URL的地址(需要公网环境浏览器可下载)
1168
- **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
1169
-
1170
- 注意:
1171
- 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
1172
- 2. 请保证文件的下载速度,否则可能下载失败
957
+ r"""<p>音频URL的地址(需要公网环境浏览器可下载)<br><strong>当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写</strong></p><p>注意:</p><ol><li>请确保录音文件时长在5个小时(含)之内,否则可能识别失败;</li><li>请保证文件的下载速度,否则可能下载失败</li></ol>
1173
958
  :rtype: str
1174
959
  """
1175
960
  return self._Url
@@ -1180,14 +965,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1180
965
 
1181
966
  @property
1182
967
  def CallbackUrl(self):
1183
- r"""回调 URL
1184
- 用户自行搭建的用于接收识别结果的服务URL
1185
- 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
1186
-
1187
- 注意:
1188
-
1189
- - 如果用户使用轮询方式获取识别结果,则无需提交该参数
1190
- - 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
968
+ r"""<p>回调 URL<br>用户自行搭建的用于接收识别结果的服务URL<br>回调格式和内容详见:<a href="https://cloud.tencent.com/document/product/1093/52632">录音识别回调说明</a></p><p>注意:</p><ul><li>如果用户使用轮询方式获取识别结果,则无需提交该参数</li><li>建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑</li></ul>
1191
969
  :rtype: str
1192
970
  """
1193
971
  return self._CallbackUrl
@@ -1198,14 +976,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1198
976
 
1199
977
  @property
1200
978
  def SpeakerDiarization(self):
1201
- r"""是否开启说话人分离
1202
- 0:不开启;
1203
- 1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en,且ChannelNum=1时可用);
1204
- 3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)
1205
- 默认值为 0
1206
-
1207
- 注意:
1208
- 8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
979
+ r"""<p>是否开启说话人分离<br>0:不开启;<br>1:开启(仅支持以下引擎:8k_zh/8k_zh_large/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect/16k_zh_en/16k_es/16k_fr/16k_ja/16k_ko,且ChannelNum=1时可用);<br>3: 开启角色分离,需配合SpeakerRoles参数使用(增值服务,仅支持16k_zh_en引擎,可支持传入声纹对录音文件内的说话人进行角色认证)<br>默认值为 0</p><p>注意:<br>8k双声道电话音频请按 <strong>ChannelNum 识别声道数</strong> 的参数描述使用默认值</p>
1209
980
  :rtype: int
1210
981
  """
1211
982
  return self._SpeakerDiarization
@@ -1216,12 +987,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1216
987
 
1217
988
  @property
1218
989
  def SpeakerNumber(self):
1219
- r"""说话人分离人数
1220
- **需配合开启说话人分离使用,不开启无效**,取值范围:0-10
1221
- 0:自动分离(最多分离出20个人);
1222
- 1-10:指定人数分离;
1223
- 默认值为 0
1224
- 注:16k引擎不支持指定人数分离
990
+ r"""<p>说话人分离人数<br><strong>需配合开启说话人分离使用,不开启无效</strong>,取值范围:0-10<br>0:自动分离(最多分离出20个人);<br>1-10:指定人数分离;<br>默认值为 0<br>注:16k引擎不支持指定人数分离</p>
1225
991
  :rtype: int
1226
992
  """
1227
993
  return self._SpeakerNumber
@@ -1232,10 +998,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1232
998
 
1233
999
  @property
1234
1000
  def HotwordId(self):
1235
- r"""热词表id
1236
- 如不设置该参数,将自动生效默认热词表;
1237
- 如设置该参数,将生效对应id的热词表;
1238
- 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
1001
+ r"""<p>热词表id<br>如不设置该参数,将自动生效默认热词表;<br>如设置该参数,将生效对应id的热词表;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a></p>
1239
1002
  :rtype: str
1240
1003
  """
1241
1004
  return self._HotwordId
@@ -1248,10 +1011,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1248
1011
  def ReinforceHotword(self):
1249
1012
  warnings.warn("parameter `ReinforceHotword` is deprecated", DeprecationWarning)
1250
1013
 
1251
- r"""热词增强功能(目前仅支持8k_zh/16k_zh引擎)
1252
- 1:开启热词增强功能
1253
-
1254
- 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
1014
+ r"""<p>热词增强功能(目前仅支持8k_zh/16k_zh引擎)<br>1:开启热词增强功能</p><p>注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看<a href="https://cloud.tencent.com/document/product/1093/40996">热词表配置方法</a>。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。<strong>建议客户根据实际的业务需求开启该功能</strong></p>
1255
1015
  :rtype: int
1256
1016
  """
1257
1017
  return self._ReinforceHotword
@@ -1264,9 +1024,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1264
1024
 
1265
1025
  @property
1266
1026
  def CustomizationId(self):
1267
- r"""自学习定制模型 id
1268
- 如设置了该参数,将生效对应id的自学习定制模型;
1269
- 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
1027
+ r"""<p>自学习定制模型 id<br>如设置了该参数,将生效对应id的自学习定制模型;<br>点击这里查看<a href="https://cloud.tencent.com/document/product/1093/38416">自学习定制模型配置方法</a></p>
1270
1028
  :rtype: str
1271
1029
  """
1272
1030
  return self._CustomizationId
@@ -1277,17 +1035,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1277
1035
 
1278
1036
  @property
1279
1037
  def EmotionRecognition(self):
1280
- r"""**【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh
1281
- 0:不开启;
1282
- 1:开启情绪识别,但不在文本展示情绪标签;
1283
- 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
1284
- 默认值为0
1285
- 支持的情绪分类为:高兴、伤心、愤怒
1286
-
1287
- 注意:
1288
- 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
1289
- 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
1290
- 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
1038
+ r"""<p><strong>【增值付费功能】</strong>情绪识别能力(目前仅支持 16k_zh , 16k_zh_en , 8k_zh )<br>0:不开启;<br>1:开启情绪识别,但不在文本展示情绪标签;<br>2:开启情绪识别,并且在文本展示情绪标签(<strong>该功能需要设置ResTextFormat 大于0</strong>)<br>默认值为0<br>支持的情绪分类为:高兴、伤心、愤怒</p><p>注意:</p><ol><li><strong>本功能为增值服务</strong>,需将参数设置为1或2时方可按对应方式生效;</li><li>如果传入参数值1或2,需确保账号已购买<a href="https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b">情绪识别资源包</a>,或账号开启后付费;<strong>若当前账号已开启后付费功能,并传入参数值1或2,将<a href="https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852">自动计费</a>)</strong>;</li><li>参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源</li></ol>
1291
1039
  :rtype: int
1292
1040
  """
1293
1041
  return self._EmotionRecognition
@@ -1298,11 +1046,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1298
1046
 
1299
1047
  @property
1300
1048
  def EmotionalEnergy(self):
1301
- r"""情绪能量值
1302
- 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
1303
- 0:不开启;
1304
- 1:开启;
1305
- 默认值为0
1049
+ r"""<p>情绪能量值<br>取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈<br>0:不开启;<br>1:开启;<br>默认值为0</p>
1306
1050
  :rtype: int
1307
1051
  """
1308
1052
  return self._EmotionalEnergy
@@ -1313,11 +1057,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1313
1057
 
1314
1058
  @property
1315
1059
  def ConvertNumMode(self):
1316
- r"""阿拉伯数字智能转换(目前支持中文普通话引擎)
1317
- 0:不转换,直接输出中文数字;
1318
- 1:根据场景智能转换为阿拉伯数字;
1319
- 3:打开数学相关数字转换(如:阿尔法转写为α);
1320
- 默认值为 1
1060
+ r"""<p>阿拉伯数字智能转换(目前支持中文普通话引擎)<br>0:不转换,直接输出中文数字;<br>1:根据场景智能转换为阿拉伯数字;<br>3:打开数学相关数字转换(如:阿尔法转写为α);<br>默认值为 1</p>
1321
1061
  :rtype: int
1322
1062
  """
1323
1063
  return self._ConvertNumMode
@@ -1328,11 +1068,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1328
1068
 
1329
1069
  @property
1330
1070
  def FilterDirty(self):
1331
- r"""脏词过滤(目前支持中文普通话引擎)
1332
- 0:不过滤脏词;
1333
- 1:过滤脏词;
1334
- 2:将脏词替换为 * ;
1335
- 默认值为 0
1071
+ r"""<p>脏词过滤(目前支持中文普通话引擎)<br>0:不过滤脏词;<br>1:过滤脏词;<br>2:将脏词替换为 * ;<br>默认值为 0</p>
1336
1072
  :rtype: int
1337
1073
  """
1338
1074
  return self._FilterDirty
@@ -1343,11 +1079,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1343
1079
 
1344
1080
  @property
1345
1081
  def FilterPunc(self):
1346
- r"""标点符号过滤(目前支持中文普通话引擎)
1347
- 0:不过滤标点;
1348
- 1:过滤句末标点;
1349
- 2:过滤所有标点;
1350
- 默认值为 0
1082
+ r"""<p>标点符号过滤(目前支持中文普通话引擎)<br>0:不过滤标点;<br>1:过滤句末标点;<br>2:过滤所有标点;<br>默认值为 0</p>
1351
1083
  :rtype: int
1352
1084
  """
1353
1085
  return self._FilterPunc
@@ -1358,11 +1090,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1358
1090
 
1359
1091
  @property
1360
1092
  def FilterModal(self):
1361
- r"""语气词过滤(目前支持中文普通话引擎)
1362
- 0:不过滤语气词;
1363
- 1:过滤部分语气词;
1364
- 2:严格过滤语气词;
1365
- 默认值为 0
1093
+ r"""<p>语气词过滤(目前支持中文普通话引擎)<br>0:不过滤语气词;<br>1:过滤部分语气词;<br>2:严格过滤语气词;<br>默认值为 0</p>
1366
1094
  :rtype: int
1367
1095
  """
1368
1096
  return self._FilterModal
@@ -1373,12 +1101,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1373
1101
 
1374
1102
  @property
1375
1103
  def SentenceMaxLength(self):
1376
- r"""单标点最多字数(目前支持中文普通话引擎)
1377
- **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
1378
- 0:不开启该功能;
1379
- 默认值为0
1380
-
1381
- 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
1104
+ r"""<p>单标点最多字数(目前支持中文普通话引擎)<br><strong>可控制单行字幕最大字数,适用于字幕生成场景</strong>,取值范围:[6,40]<br>0:不开启该功能;<br>默认值为0</p><p>注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果</p>
1382
1105
  :rtype: int
1383
1106
  """
1384
1107
  return self._SentenceMaxLength
@@ -1389,7 +1112,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1389
1112
 
1390
1113
  @property
1391
1114
  def Extra(self):
1392
- r"""附加参数**(该参数无意义,忽略即可)**
1115
+ r"""<p>附加参数<strong>(该参数无意义,忽略即可)</strong></p>
1393
1116
  :rtype: str
1394
1117
  """
1395
1118
  return self._Extra
@@ -1400,25 +1123,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1400
1123
 
1401
1124
  @property
1402
1125
  def HotwordList(self):
1403
- r"""临时热词表:该参数用于提升识别准确率。
1404
-
1405
- - 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
1406
-
1407
- - 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
1408
-
1409
- - 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
1410
-
1411
- - hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
1412
-
1413
- - hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
1414
-
1415
- 注意:
1416
-
1417
- - 如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;
1418
-
1419
- - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1420
-
1421
- - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1126
+ r"""<p>临时热词表:该参数用于提升识别准确率。</p><ul><li><p>单个热词限制:&quot;热词|权重&quot;,单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;</p></li><li><p>临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;</p></li><li><p>参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:</p><ul><li><p>hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;</p></li><li><p>hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;</p></li></ul></li></ul><p>注意:</p><ul><li><p>如果同时传入了 hotword_id 和 hotword_list,只有hotword_list 生效;</p></li><li><p>热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。</p></li><li><p>热词权重设置为100时,当前热词开启热词增强同音同调替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。</p></li></ul>
1422
1127
  :rtype: str
1423
1128
  """
1424
1129
  return self._HotwordList
@@ -1429,8 +1134,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1429
1134
 
1430
1135
  @property
1431
1136
  def KeyWordLibIdList(self):
1432
- r"""关键词识别ID列表,默认空为不进行识别,最多10
1433
-
1137
+ r"""<p>关键词识别ID列表,默认空为不进行识别,最多10个</p>
1434
1138
  :rtype: list of str
1435
1139
  """
1436
1140
  return self._KeyWordLibIdList
@@ -1441,11 +1145,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1441
1145
 
1442
1146
  @property
1443
1147
  def ReplaceTextId(self):
1444
- r"""替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考[配置控制台](https://console.cloud.tencent.com/asr/replaceword);强制替换功能可能会影响正常识别结果,请谨慎使用
1445
-
1446
- 注意:
1447
- 1. 本功能配置完成后,预计在10分钟后生效
1448
-
1148
+ r"""<p>替换词汇表id, 适用于热词和自学习场景也无法解决的极端case词组, 会对识别结果强制替换。具体可参考<a href="https://console.cloud.tencent.com/asr/replaceword">配置控制台</a>;强制替换功能可能会影响正常识别结果,请谨慎使用</p><p>注意:</p><ol><li>本功能配置完成后,预计在10分钟后生效</li></ol>
1449
1149
  :rtype: str
1450
1150
  """
1451
1151
  return self._ReplaceTextId
@@ -1456,13 +1156,7 @@ RoleName:需要认证角色的名称,若匹配成功,会替换话者分离
1456
1156
 
1457
1157
  @property
1458
1158
  def SpeakerRoles(self):
1459
- r"""开启角色分离能力
1460
- 配合SpeakerDiarization: 3 使用,ASR增值服务,可传入一组声纹信息进行角色认证,仅支持16k_zh_en引擎。
1461
- 需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。
1462
- RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。
1463
- RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。
1464
- 示例:
1465
- "{\"EngineModelType\":\"16k_zh_en\",\"ChannelNum\":1,\"ResTextFormat\":1,\"SourceType\":0,\"Url\":\"需要进行ASR识别的音频链接\",\"SpeakerDiarization\":3,\"SpeakerRoles\":[{\"RoleAudioUrl\":\"需要认证角色的声纹音频地址\",\"RoleName\":\"需要认证角色的名称\"}]}"
1159
+ r"""<p>开启角色分离能力配合SpeakerDiarization: 3 使用,ASR增值服务,<strong>仅可传入一组声纹信息</strong>进行角色认证,仅支持16k_zh_en引擎。需传入SpeakerRoleInfo数据组,确定说话人的角色信息,涉及RoleAudioUrl和RoleName两个参数。 RoleAudioUrl:需要认证角色的声纹音频地址,建议30s内的纯净人声,最长不能超过45s。 RoleName:需要认证角色的名称,若匹配成功,会替换话者分离中的SpeakerID。 示例: &quot;{"EngineModelType":"16k_zh_en","ChannelNum":1,"ResTextFormat":1,"SourceType":0,"Url":"需要进行ASR识别的音频链接","SpeakerDiarization":3,"SpeakerRoles":[{"RoleAudioUrl":"需要认证角色的声纹音频地址","RoleName":"需要认证角色的名称"}]}&quot;</p>
1466
1160
  :rtype: list of SpeakerRoleInfo
1467
1161
  """
1468
1162
  return self._SpeakerRoles
@@ -1520,9 +1214,7 @@ class CreateRecTaskResponse(AbstractModel):
1520
1214
 
1521
1215
  def __init__(self):
1522
1216
  r"""
1523
- :param _Data: 录音文件识别的请求返回结果,包含结果查询需要的TaskId
1524
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
1525
-
1217
+ :param _Data: <p>录音文件识别的请求返回结果,包含结果查询需要的TaskId。<br><strong>注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。</strong></p>
1526
1218
  :type Data: :class:`tencentcloud.asr.v20190614.models.Task`
1527
1219
  :param _RequestId: 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1528
1220
  :type RequestId: str
@@ -1532,9 +1224,7 @@ class CreateRecTaskResponse(AbstractModel):
1532
1224
 
1533
1225
  @property
1534
1226
  def Data(self):
1535
- r"""录音文件识别的请求返回结果,包含结果查询需要的TaskId
1536
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
1537
-
1227
+ r"""<p>录音文件识别的请求返回结果,包含结果查询需要的TaskId。<br><strong>注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。</strong></p>
1538
1228
  :rtype: :class:`tencentcloud.asr.v20190614.models.Task`
1539
1229
  """
1540
1230
  return self._Data
@@ -3537,46 +3227,49 @@ class SentenceDetail(AbstractModel):
3537
3227
 
3538
3228
  def __init__(self):
3539
3229
  r"""
3540
- :param _FinalSentence: 单句最终识别结果
3230
+ :param _FinalSentence: <p>单句最终识别结果</p>
3541
3231
  注意:此字段可能返回 null,表示取不到有效值。
3542
3232
  :type FinalSentence: str
3543
- :param _SliceSentence: 单句中间识别结果,使用空格拆分为多个词
3233
+ :param _SliceSentence: <p>单句中间识别结果,使用空格拆分为多个词</p>
3544
3234
  注意:此字段可能返回 null,表示取不到有效值。
3545
3235
  :type SliceSentence: str
3546
- :param _WrittenText: 口语转书面语结果,开启改功能才有值
3236
+ :param _WrittenText: <p>口语转书面语结果,开启该功能才有值</p>
3547
3237
  注意:此字段可能返回 null,表示取不到有效值。
3548
3238
  :type WrittenText: str
3549
- :param _StartMs: 单句开始时间(毫秒)
3239
+ :param _StartMs: <p>单句开始时间(毫秒)</p>
3550
3240
  注意:此字段可能返回 null,表示取不到有效值。
3551
3241
  :type StartMs: int
3552
- :param _EndMs: 单句结束时间(毫秒)
3242
+ :param _EndMs: <p>单句结束时间(毫秒)</p>
3553
3243
  注意:此字段可能返回 null,表示取不到有效值。
3554
3244
  :type EndMs: int
3555
- :param _WordsNum: 单句中词个数
3245
+ :param _WordsNum: <p>单句中词个数</p>
3556
3246
  注意:此字段可能返回 null,表示取不到有效值。
3557
3247
  :type WordsNum: int
3558
- :param _Words: 单句中词详情
3248
+ :param _Words: <p>单句中词详情</p>
3559
3249
  注意:此字段可能返回 null,表示取不到有效值。
3560
3250
  :type Words: list of SentenceWords
3561
- :param _SpeechSpeed: 单句语速,单位:字数/秒
3251
+ :param _SpeechSpeed: <p>单句语速,单位:字数/秒</p>
3562
3252
  注意:此字段可能返回 null,表示取不到有效值。
3563
3253
  :type SpeechSpeed: float
3564
- :param _SpeakerId: 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
3565
- 单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。
3254
+ :param _SpeakerId: <p>声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)<br>单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。</p>
3566
3255
  注意:此字段可能返回 null,表示取不到有效值。
3567
3256
  :type SpeakerId: int
3568
- :param _EmotionalEnergy: 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
3257
+ :param _EmotionalEnergy: <p>情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。</p>
3569
3258
  注意:此字段可能返回 null,表示取不到有效值。
3570
3259
  :type EmotionalEnergy: float
3571
- :param _SilenceTime: 本句与上一句之间的静音时长
3260
+ :param _SilenceTime: <p>本句与上一句之间的静音时长</p>
3572
3261
  注意:此字段可能返回 null,表示取不到有效值。
3573
3262
  :type SilenceTime: int
3574
- :param _EmotionType: 情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)
3263
+ :param _EmotionType: <p>情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)</p>
3575
3264
  注意:此字段可能返回 null,表示取不到有效值。
3576
3265
  :type EmotionType: list of str
3577
- :param _KeyWordResults: 关键词识别结果列表
3266
+ :param _KeyWordResults: <p>关键词识别结果列表</p>
3578
3267
  注意:此字段可能返回 null,表示取不到有效值。
3579
3268
  :type KeyWordResults: list of KeyWordResult
3269
+ :param _LangType: <p>多语言识别类型</p><ul><li>中文 chinese</li><li>英语 english</li><li>日语 japanese</li><li>韩语 korean</li><li>阿拉伯语 arabic</li><li>菲律宾语 filipino</li><li>法语 french</li><li>印地语 hindi</li><li>印尼语 indonesian</li><li>马来语 malay</li><li>葡萄牙语 portugal</li><li>西班牙语 spanish</li><li>泰语 thai</li><li>土耳其语 turkish</li><li>越南语 vietnam</li><li>德语 german</li></ul>
3270
+ :type LangType: str
3271
+ :param _SpeakerRoleName: <p>说话人角色名称</p>
3272
+ :type SpeakerRoleName: str
3580
3273
  """
3581
3274
  self._FinalSentence = None
3582
3275
  self._SliceSentence = None
@@ -3591,10 +3284,12 @@ class SentenceDetail(AbstractModel):
3591
3284
  self._SilenceTime = None
3592
3285
  self._EmotionType = None
3593
3286
  self._KeyWordResults = None
3287
+ self._LangType = None
3288
+ self._SpeakerRoleName = None
3594
3289
 
3595
3290
  @property
3596
3291
  def FinalSentence(self):
3597
- r"""单句最终识别结果
3292
+ r"""<p>单句最终识别结果</p>
3598
3293
  注意:此字段可能返回 null,表示取不到有效值。
3599
3294
  :rtype: str
3600
3295
  """
@@ -3606,7 +3301,7 @@ class SentenceDetail(AbstractModel):
3606
3301
 
3607
3302
  @property
3608
3303
  def SliceSentence(self):
3609
- r"""单句中间识别结果,使用空格拆分为多个词
3304
+ r"""<p>单句中间识别结果,使用空格拆分为多个词</p>
3610
3305
  注意:此字段可能返回 null,表示取不到有效值。
3611
3306
  :rtype: str
3612
3307
  """
@@ -3618,7 +3313,7 @@ class SentenceDetail(AbstractModel):
3618
3313
 
3619
3314
  @property
3620
3315
  def WrittenText(self):
3621
- r"""口语转书面语结果,开启改功能才有值
3316
+ r"""<p>口语转书面语结果,开启该功能才有值</p>
3622
3317
  注意:此字段可能返回 null,表示取不到有效值。
3623
3318
  :rtype: str
3624
3319
  """
@@ -3630,7 +3325,7 @@ class SentenceDetail(AbstractModel):
3630
3325
 
3631
3326
  @property
3632
3327
  def StartMs(self):
3633
- r"""单句开始时间(毫秒)
3328
+ r"""<p>单句开始时间(毫秒)</p>
3634
3329
  注意:此字段可能返回 null,表示取不到有效值。
3635
3330
  :rtype: int
3636
3331
  """
@@ -3642,7 +3337,7 @@ class SentenceDetail(AbstractModel):
3642
3337
 
3643
3338
  @property
3644
3339
  def EndMs(self):
3645
- r"""单句结束时间(毫秒)
3340
+ r"""<p>单句结束时间(毫秒)</p>
3646
3341
  注意:此字段可能返回 null,表示取不到有效值。
3647
3342
  :rtype: int
3648
3343
  """
@@ -3654,7 +3349,7 @@ class SentenceDetail(AbstractModel):
3654
3349
 
3655
3350
  @property
3656
3351
  def WordsNum(self):
3657
- r"""单句中词个数
3352
+ r"""<p>单句中词个数</p>
3658
3353
  注意:此字段可能返回 null,表示取不到有效值。
3659
3354
  :rtype: int
3660
3355
  """
@@ -3666,7 +3361,7 @@ class SentenceDetail(AbstractModel):
3666
3361
 
3667
3362
  @property
3668
3363
  def Words(self):
3669
- r"""单句中词详情
3364
+ r"""<p>单句中词详情</p>
3670
3365
  注意:此字段可能返回 null,表示取不到有效值。
3671
3366
  :rtype: list of SentenceWords
3672
3367
  """
@@ -3678,7 +3373,7 @@ class SentenceDetail(AbstractModel):
3678
3373
 
3679
3374
  @property
3680
3375
  def SpeechSpeed(self):
3681
- r"""单句语速,单位:字数/秒
3376
+ r"""<p>单句语速,单位:字数/秒</p>
3682
3377
  注意:此字段可能返回 null,表示取不到有效值。
3683
3378
  :rtype: float
3684
3379
  """
@@ -3690,8 +3385,7 @@ class SentenceDetail(AbstractModel):
3690
3385
 
3691
3386
  @property
3692
3387
  def SpeakerId(self):
3693
- r"""声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
3694
- 单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。
3388
+ r"""<p>声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)<br>单声道话者分离时不同的值代表不同的说话人; 8k双声道话者分离时speakerId的值为0代表左声道,值为1代表右声道。</p>
3695
3389
  注意:此字段可能返回 null,表示取不到有效值。
3696
3390
  :rtype: int
3697
3391
  """
@@ -3703,7 +3397,7 @@ class SentenceDetail(AbstractModel):
3703
3397
 
3704
3398
  @property
3705
3399
  def EmotionalEnergy(self):
3706
- r"""情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
3400
+ r"""<p>情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。</p>
3707
3401
  注意:此字段可能返回 null,表示取不到有效值。
3708
3402
  :rtype: float
3709
3403
  """
@@ -3715,7 +3409,7 @@ class SentenceDetail(AbstractModel):
3715
3409
 
3716
3410
  @property
3717
3411
  def SilenceTime(self):
3718
- r"""本句与上一句之间的静音时长
3412
+ r"""<p>本句与上一句之间的静音时长</p>
3719
3413
  注意:此字段可能返回 null,表示取不到有效值。
3720
3414
  :rtype: int
3721
3415
  """
@@ -3727,7 +3421,7 @@ class SentenceDetail(AbstractModel):
3727
3421
 
3728
3422
  @property
3729
3423
  def EmotionType(self):
3730
- r"""情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)
3424
+ r"""<p>情绪类型(可能为空,有2种情况 1、没有对应资源包;2、情绪跟语音效果相关,如果情绪不够强烈时可能无法识别)</p>
3731
3425
  注意:此字段可能返回 null,表示取不到有效值。
3732
3426
  :rtype: list of str
3733
3427
  """
@@ -3739,7 +3433,7 @@ class SentenceDetail(AbstractModel):
3739
3433
 
3740
3434
  @property
3741
3435
  def KeyWordResults(self):
3742
- r"""关键词识别结果列表
3436
+ r"""<p>关键词识别结果列表</p>
3743
3437
  注意:此字段可能返回 null,表示取不到有效值。
3744
3438
  :rtype: list of KeyWordResult
3745
3439
  """
@@ -3749,6 +3443,28 @@ class SentenceDetail(AbstractModel):
3749
3443
  def KeyWordResults(self, KeyWordResults):
3750
3444
  self._KeyWordResults = KeyWordResults
3751
3445
 
3446
+ @property
3447
+ def LangType(self):
3448
+ r"""<p>多语言识别类型</p><ul><li>中文 chinese</li><li>英语 english</li><li>日语 japanese</li><li>韩语 korean</li><li>阿拉伯语 arabic</li><li>菲律宾语 filipino</li><li>法语 french</li><li>印地语 hindi</li><li>印尼语 indonesian</li><li>马来语 malay</li><li>葡萄牙语 portugal</li><li>西班牙语 spanish</li><li>泰语 thai</li><li>土耳其语 turkish</li><li>越南语 vietnam</li><li>德语 german</li></ul>
3449
+ :rtype: str
3450
+ """
3451
+ return self._LangType
3452
+
3453
+ @LangType.setter
3454
+ def LangType(self, LangType):
3455
+ self._LangType = LangType
3456
+
3457
+ @property
3458
+ def SpeakerRoleName(self):
3459
+ r"""<p>说话人角色名称</p>
3460
+ :rtype: str
3461
+ """
3462
+ return self._SpeakerRoleName
3463
+
3464
+ @SpeakerRoleName.setter
3465
+ def SpeakerRoleName(self, SpeakerRoleName):
3466
+ self._SpeakerRoleName = SpeakerRoleName
3467
+
3752
3468
 
3753
3469
  def _deserialize(self, params):
3754
3470
  self._FinalSentence = params.get("FinalSentence")
@@ -3774,6 +3490,8 @@ class SentenceDetail(AbstractModel):
3774
3490
  obj = KeyWordResult()
3775
3491
  obj._deserialize(item)
3776
3492
  self._KeyWordResults.append(obj)
3493
+ self._LangType = params.get("LangType")
3494
+ self._SpeakerRoleName = params.get("SpeakerRoleName")
3777
3495
  memeber_set = set(params.keys())
3778
3496
  for name, value in vars(self).items():
3779
3497
  property_name = name[1:]
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: tencentcloud-sdk-python-asr
3
- Version: 3.1.44
3
+ Version: 3.1.51
4
4
  Summary: Tencent Cloud Asr SDK for Python
5
5
  Home-page: https://github.com/TencentCloud/tencentcloud-sdk-python
6
6
  Author: Tencent Cloud
@@ -15,7 +15,7 @@ Classifier: Programming Language :: Python :: 2.7
15
15
  Classifier: Programming Language :: Python :: 3
16
16
  Classifier: Programming Language :: Python :: 3.6
17
17
  Classifier: Programming Language :: Python :: 3.7
18
- Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.44
18
+ Requires-Dist: tencentcloud-sdk-python-common<4.0.0,>=3.1.51
19
19
 
20
20
  ============================
21
21
  Tencent Cloud SDK for Python
@@ -0,0 +1 @@
1
+ tencentcloud-sdk-python-common<4.0.0,>=3.1.51
@@ -1 +0,0 @@
1
- tencentcloud-sdk-python-common<4.0.0,>=3.1.44