tencentcloud-sdk-nodejs-trtc 4.1.150 → 4.1.157
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/package.json
CHANGED
|
@@ -404,7 +404,7 @@ export interface STTConfig {
|
|
|
404
404
|
|
|
405
405
|
语音转文本不同套餐版本支持的语言如下:
|
|
406
406
|
|
|
407
|
-
|
|
407
|
+
**基础语言引擎**:
|
|
408
408
|
- "zh": 中文(简体)
|
|
409
409
|
- "zh-TW": 中文(繁体)
|
|
410
410
|
- "en": 英语
|
|
@@ -412,13 +412,13 @@ export interface STTConfig {
|
|
|
412
412
|
- "16k_zh_medical":中文医疗
|
|
413
413
|
- "16k_zh_court":中文法庭
|
|
414
414
|
|
|
415
|
-
|
|
415
|
+
**标准语言引擎:**
|
|
416
416
|
- "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
|
|
417
417
|
- "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
418
418
|
- "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
|
|
419
419
|
- "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
420
420
|
|
|
421
|
-
|
|
421
|
+
**高级语言引擎:**
|
|
422
422
|
- "zh-dialect": 中国方言
|
|
423
423
|
- "zh-yue": 中国粤语
|
|
424
424
|
- "vi": 越南语
|
|
@@ -2233,11 +2233,22 @@ export interface DescribeAIConversationResponse {
|
|
|
2233
2233
|
*/
|
|
2234
2234
|
export interface AudioFormat {
|
|
2235
2235
|
/**
|
|
2236
|
-
*
|
|
2236
|
+
* 生成的音频格式
|
|
2237
|
+
|
|
2238
|
+
- TextToSpeech流式接口
|
|
2239
|
+
|
|
2240
|
+
支持 pcm, 默认: pcm
|
|
2241
|
+
|
|
2242
|
+
- TextToSpeech非流式接口
|
|
2243
|
+
|
|
2244
|
+
支持 pcm,wav, 默认: pcm
|
|
2237
2245
|
*/
|
|
2238
2246
|
Format?: string;
|
|
2239
2247
|
/**
|
|
2240
|
-
*
|
|
2248
|
+
* 生成的音频采样率,默认24000
|
|
2249
|
+
可选
|
|
2250
|
+
- 16000
|
|
2251
|
+
- 24000
|
|
2241
2252
|
*/
|
|
2242
2253
|
SampleRate?: number;
|
|
2243
2254
|
}
|
|
@@ -3453,7 +3464,7 @@ export interface RecognizeConfig {
|
|
|
3453
3464
|
|
|
3454
3465
|
语音转文本不同套餐版本支持的语言如下:
|
|
3455
3466
|
|
|
3456
|
-
|
|
3467
|
+
**基础语言引擎**:
|
|
3457
3468
|
- "zh": 中文(简体)
|
|
3458
3469
|
- "zh-TW": 中文(繁体)
|
|
3459
3470
|
- "en": 英语
|
|
@@ -3461,13 +3472,13 @@ export interface RecognizeConfig {
|
|
|
3461
3472
|
- "16k_zh_medical":中文医疗
|
|
3462
3473
|
- "16k_zh_court":中文法庭
|
|
3463
3474
|
|
|
3464
|
-
|
|
3475
|
+
**标准语言引擎:**
|
|
3465
3476
|
- "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
|
|
3466
3477
|
- "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
3467
3478
|
- "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
|
|
3468
3479
|
- "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
3469
3480
|
|
|
3470
|
-
|
|
3481
|
+
**高级语言引擎:**
|
|
3471
3482
|
- "zh-dialect": 中国方言
|
|
3472
3483
|
- "zh-yue": 中国粤语
|
|
3473
3484
|
- "vi": 越南语
|
|
@@ -3879,23 +3890,23 @@ export interface DescribePictureRequest {
|
|
|
3879
3890
|
PageNo?: number;
|
|
3880
3891
|
}
|
|
3881
3892
|
/**
|
|
3882
|
-
* TTS
|
|
3893
|
+
* TTS的声音参数配置
|
|
3883
3894
|
*/
|
|
3884
3895
|
export interface Voice {
|
|
3885
3896
|
/**
|
|
3886
|
-
*
|
|
3897
|
+
* 音色 ID,可从音色列表获取,或使用声音克隆生成的自定义音色 ID
|
|
3887
3898
|
*/
|
|
3888
3899
|
VoiceId: string;
|
|
3889
3900
|
/**
|
|
3890
|
-
*
|
|
3901
|
+
* 语速调节,0.5 为半速慢放,2.0 为两倍速快放,1.0 为正常语速,区间:[0.5, 2.0],默认1.0
|
|
3891
3902
|
*/
|
|
3892
3903
|
Speed?: number;
|
|
3893
3904
|
/**
|
|
3894
|
-
*
|
|
3905
|
+
* 音量调节,0 为静音,10 为最大音量,建议保持默认值 1.0,区间:[0, 10],默认1.0
|
|
3895
3906
|
*/
|
|
3896
3907
|
Volume?: number;
|
|
3897
3908
|
/**
|
|
3898
|
-
*
|
|
3909
|
+
* 音高调节,负值声音更低沉,正值声音更尖锐,0 为原始音高,区间 [-12, 12], 默认0
|
|
3899
3910
|
*/
|
|
3900
3911
|
Pitch?: number;
|
|
3901
3912
|
}
|
|
@@ -4622,14 +4633,15 @@ export interface TextToSpeechSSERequest {
|
|
|
4622
4633
|
AudioFormat?: AudioFormat;
|
|
4623
4634
|
/**
|
|
4624
4635
|
* TTS的API密钥
|
|
4636
|
+
* @deprecated
|
|
4625
4637
|
*/
|
|
4626
4638
|
APIKey?: string;
|
|
4627
4639
|
/**
|
|
4628
|
-
* TTS
|
|
4640
|
+
* TTS的模型,当前固定为:flow_01_turbo
|
|
4629
4641
|
*/
|
|
4630
4642
|
Model?: string;
|
|
4631
4643
|
/**
|
|
4632
|
-
*
|
|
4644
|
+
* 需要合成的语言(ISO 639-1),支持 zh(中文)、en(英文)、yue(粤语)、ja(日语)、ko(韩语),默认自动识别
|
|
4633
4645
|
*/
|
|
4634
4646
|
Language?: string;
|
|
4635
4647
|
}
|
|
@@ -4951,11 +4963,11 @@ export interface TextToSpeechRequest {
|
|
|
4951
4963
|
*/
|
|
4952
4964
|
APIKey?: string;
|
|
4953
4965
|
/**
|
|
4954
|
-
* TTS
|
|
4966
|
+
* TTS的模型,当前固定为:flow_01_turbo
|
|
4955
4967
|
*/
|
|
4956
4968
|
Model?: string;
|
|
4957
4969
|
/**
|
|
4958
|
-
*
|
|
4970
|
+
* 需要合成的语言(ISO 639-1),支持 zh(中文)、en(英文)、yue(粤语)、ja(日语)、ko(韩语),默认自动识别
|
|
4959
4971
|
*/
|
|
4960
4972
|
Language?: string;
|
|
4961
4973
|
}
|