tencentcloud-sdk-nodejs-trtc 4.1.150 → 4.1.157

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "tencentcloud-sdk-nodejs-trtc",
3
- "version": "4.1.150",
3
+ "version": "4.1.157",
4
4
  "description": "腾讯云 API NODEJS SDK",
5
5
  "main": "./tencentcloud/index.js",
6
6
  "module": "./es/index.js",
@@ -404,7 +404,7 @@ export interface STTConfig {
404
404
 
405
405
  语音转文本不同套餐版本支持的语言如下:
406
406
 
407
- **基础版**:
407
+ **基础语言引擎**:
408
408
  - "zh": 中文(简体)
409
409
  - "zh-TW": 中文(繁体)
410
410
  - "en": 英语
@@ -412,13 +412,13 @@ export interface STTConfig {
412
412
  - "16k_zh_medical":中文医疗
413
413
  - "16k_zh_court":中文法庭
414
414
 
415
- **标准版:**
415
+ **标准语言引擎:**
416
416
  - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
417
417
  - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
418
418
  - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
419
419
  - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
420
420
 
421
- **高级版:**
421
+ **高级语言引擎:**
422
422
  - "zh-dialect": 中国方言
423
423
  - "zh-yue": 中国粤语
424
424
  - "vi": 越南语
@@ -2233,11 +2233,22 @@ export interface DescribeAIConversationResponse {
2233
2233
  */
2234
2234
  export interface AudioFormat {
2235
2235
  /**
2236
- * 生成的音频格式,默认pcm,目前支持的格式列表:流式:[pcm],非流式 [pcm,wav]
2236
+ * 生成的音频格式
2237
+
2238
+ - TextToSpeech流式接口
2239
+
2240
+ 支持 pcm, 默认: pcm
2241
+
2242
+ - TextToSpeech非流式接口
2243
+
2244
+ 支持 pcm,wav, 默认: pcm
2237
2245
  */
2238
2246
  Format?: string;
2239
2247
  /**
2240
- * 采样率,默认24000, 可选16000, 24000
2248
+ * 生成的音频采样率,默认24000
2249
+ 可选
2250
+ - 16000
2251
+ - 24000
2241
2252
  */
2242
2253
  SampleRate?: number;
2243
2254
  }
@@ -3453,7 +3464,7 @@ export interface RecognizeConfig {
3453
3464
 
3454
3465
  语音转文本不同套餐版本支持的语言如下:
3455
3466
 
3456
- **基础版**:
3467
+ **基础语言引擎**:
3457
3468
  - "zh": 中文(简体)
3458
3469
  - "zh-TW": 中文(繁体)
3459
3470
  - "en": 英语
@@ -3461,13 +3472,13 @@ export interface RecognizeConfig {
3461
3472
  - "16k_zh_medical":中文医疗
3462
3473
  - "16k_zh_court":中文法庭
3463
3474
 
3464
- **标准版:**
3475
+ **标准语言引擎:**
3465
3476
  - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
3466
3477
  - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
3467
3478
  - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
3468
3479
  - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
3469
3480
 
3470
- **高级版:**
3481
+ **高级语言引擎:**
3471
3482
  - "zh-dialect": 中国方言
3472
3483
  - "zh-yue": 中国粤语
3473
3484
  - "vi": 越南语
@@ -3879,23 +3890,23 @@ export interface DescribePictureRequest {
3879
3890
  PageNo?: number;
3880
3891
  }
3881
3892
  /**
3882
- * TTS的声音参数
3893
+ * TTS的声音参数配置
3883
3894
  */
3884
3895
  export interface Voice {
3885
3896
  /**
3886
- * TTS的声音的ID
3897
+ * 音色 ID,可从音色列表获取,或使用声音克隆生成的自定义音色 ID
3887
3898
  */
3888
3899
  VoiceId: string;
3889
3900
  /**
3890
- * 语速,范围 0.5-2.0,默认 1.0
3901
+ * 语速调节,0.5 为半速慢放,2.0 为两倍速快放,1.0 为正常语速,区间:[0.5, 2.0],默认1.0
3891
3902
  */
3892
3903
  Speed?: number;
3893
3904
  /**
3894
- * (0, 10] 默认值1.0
3905
+ * 音量调节,0 为静音,10 为最大音量,建议保持默认值 1.0,区间:[0, 10],默认1.0
3895
3906
  */
3896
3907
  Volume?: number;
3897
3908
  /**
3898
- * 取值[-12,12],默认0
3909
+ * 音高调节,负值声音更低沉,正值声音更尖锐,0 为原始音高,区间 [-12, 12], 默认0
3899
3910
  */
3900
3911
  Pitch?: number;
3901
3912
  }
@@ -4622,14 +4633,15 @@ export interface TextToSpeechSSERequest {
4622
4633
  AudioFormat?: AudioFormat;
4623
4634
  /**
4624
4635
  * TTS的API密钥
4636
+ * @deprecated
4625
4637
  */
4626
4638
  APIKey?: string;
4627
4639
  /**
4628
- * TTS的模型:flow_01_turbo,flow_01_ex
4640
+ * TTS的模型,当前固定为:flow_01_turbo
4629
4641
  */
4630
4642
  Model?: string;
4631
4643
  /**
4632
- * 语言参数,默认为空, 参考: (ISO 639-1)
4644
+ * 需要合成的语言(ISO 639-1),支持 zh(中文)、en(英文)、yue(粤语)、ja(日语)、ko(韩语),默认自动识别
4633
4645
  */
4634
4646
  Language?: string;
4635
4647
  }
@@ -4951,11 +4963,11 @@ export interface TextToSpeechRequest {
4951
4963
  */
4952
4964
  APIKey?: string;
4953
4965
  /**
4954
- * TTS的模型:flow_01_turbo,flow_01_ex
4966
+ * TTS的模型,当前固定为:flow_01_turbo
4955
4967
  */
4956
4968
  Model?: string;
4957
4969
  /**
4958
- * 语言参数,默认为空, 参考: (ISO 639-1)
4970
+ * 需要合成的语言(ISO 639-1),支持 zh(中文)、en(英文)、yue(粤语)、ja(日语)、ko(韩语),默认自动识别
4959
4971
  */
4960
4972
  Language?: string;
4961
4973
  }