npm - tencentcloud-sdk-nodejs-trtc - Versions diffs - 4.1.151 → 4.1.158 - Mend

tencentcloud-sdk-nodejs-trtc 4.1.151 → 4.1.158

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/package.json +1 -1
package/tencentcloud/services/trtc/v20190722/trtc_models.d.ts +46 -18

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "tencentcloud-sdk-nodejs-trtc",
-  "version": "4.1.151",
+  "version": "4.1.158",
   "description": "腾讯云 API NODEJS SDK",
   "main": "./tencentcloud/index.js",
   "module": "./es/index.js",

package/tencentcloud/services/trtc/v20190722/trtc_models.d.ts CHANGED Viewed

@@ -404,7 +404,7 @@ export interface STTConfig {
   语音转文本不同套餐版本支持的语言如下：
-  **基础版**：
+  **基础语言引擎**：
   - "zh": 中文（简体）
   - "zh-TW": 中文（繁体）
   - "en": 英语
@@ -412,13 +412,13 @@ export interface STTConfig {
   - "16k_zh_medical"：中文医疗
   - "16k_zh_court"：中文法庭
-  **标准版：**
+  **标准语言引擎：**
   - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别，模型参数量极大，语言模型性能增强，针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
   - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
   - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别，可实现15个语种的自动识别(句子/段落级别).
   - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
-  **高级版：**
+  **高级语言引擎：**
   - "zh-dialect": 中国方言
   - "zh-yue": 中国粤语
   - "vi": 越南语
@@ -527,7 +527,7 @@ export interface VoiceCloneRequest {
      */
     VoiceName: string;
     /**
-     * 声音克隆的参考音频，必须为16k单声道的wav的base64字符串， 长度在5秒～12秒之间
+     * 声音克隆的参考音频，必须为16k单声道的wav的base64字符串， 长度在10秒～180秒之间
      */
     PromptAudio: string;
     /**
@@ -2233,11 +2233,22 @@ export interface DescribeAIConversationResponse {
  */
 export interface AudioFormat {
     /**
-     * 生成的音频格式，默认pcm，目前支持的格式列表：流式：[pcm]，非流式 [pcm，wav]
+     * 生成的音频格式
+  - TextToSpeech流式接口
+   支持 pcm, 默认: pcm
+  - TextToSpeech非流式接口
+   支持 pcm,wav,  默认: pcm
      */
     Format?: string;
     /**
-     * 采样率，默认24000， 可选16000, 24000
+     * 生成的音频采样率，默认24000
+  可选
+  - 16000
+  - 24000
      */
     SampleRate?: number;
 }
@@ -2668,6 +2679,14 @@ export interface StartStreamIngestRequest {
      * 音量，取值范围[0, 100]，默认100，表示原音量。
      */
     Volume?: number;
+    /**
+     * 开启播放进度回调, 默认false，当开启后，播放进度会通过trtc custom data 回调给播放端
+     */
+    EnableProgress?: boolean;
+    /**
+     * 播放倍速，默认1.0，可取[0.5, 0.75, 1.0, 1.25, 1.5, 1.75, 2.0]
+     */
+    Tempo?: number;
 }
 /**
  * UpdateVoicePrint返回参数结构体
@@ -3453,7 +3472,7 @@ export interface RecognizeConfig {
   语音转文本不同套餐版本支持的语言如下：
-  **基础版**：
+  **基础语言引擎**：
   - "zh": 中文（简体）
   - "zh-TW": 中文（繁体）
   - "en": 英语
@@ -3461,13 +3480,13 @@ export interface RecognizeConfig {
   - "16k_zh_medical"：中文医疗
   - "16k_zh_court"：中文法庭
-  **标准版：**
+  **标准语言引擎：**
   - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别，模型参数量极大，语言模型性能增强，针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
   - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
   - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别，可实现15个语种的自动识别(句子/段落级别).
   - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
-  **高级版：**
+  **高级语言引擎：**
   - "zh-dialect": 中国方言
   - "zh-yue": 中国粤语
   - "vi": 越南语
@@ -3879,23 +3898,23 @@ export interface DescribePictureRequest {
     PageNo?: number;
 }
 /**
- * TTS的声音参数
+ * TTS的声音参数配置
  */
 export interface Voice {
     /**
-     * TTS的声音的ID
+     *  音色 ID，可从音色列表获取，或使用声音克隆生成的自定义音色 ID
      */
     VoiceId: string;
     /**
-     * 语速，范围 0.5-2.0，默认 1.0
+     * 语速调节，0.5 为半速慢放，2.0 为两倍速快放，1.0 为正常语速，区间：[0.5, 2.0]，默认1.0
      */
     Speed?: number;
     /**
-     * (0, 10]   默认值1.0
+     *  音量调节，0 为静音，10 为最大音量，建议保持默认值 1.0，区间：[0, 10]，默认1.0
      */
     Volume?: number;
     /**
-     * 取值[-12,12],默认0
+     *  音高调节，负值声音更低沉，正值声音更尖锐，0 为原始音高，区间 [-12, 12],  默认0
      */
     Pitch?: number;
 }
@@ -4599,6 +4618,14 @@ export interface UpdateStreamIngestRequest {
      * 是否暂停，默认false表示不暂停。暂停期间任务仍在进行中仍会计费，暂停超过12小时会自动销毁任务, 建议主动调用停止任务接口。
      */
     IsPause?: boolean;
+    /**
+     * 是否开启播放进度回调, 默认false，当开启后，播放进度会通过trtc custom data 回调给播放端
+     */
+    EnableProgress?: boolean;
+    /**
+     * 播放倍速，默认1.0，可取[0.5, 0.75, 1.0, 1.25, 1.5, 1.75, 2.0]
+     */
+    Tempo?: number;
 }
 /**
  * TextToSpeechSSE请求参数结构体
@@ -4622,14 +4649,15 @@ export interface TextToSpeechSSERequest {
     AudioFormat?: AudioFormat;
     /**
      * TTS的API密钥
+     * @deprecated
      */
     APIKey?: string;
     /**
-     * TTS的模型：flow_01_turbo，flow_01_ex
+     * TTS的模型，当前固定为：flow_01_turbo
      */
     Model?: string;
     /**
-     * 语言参数，默认为空， 参考： (ISO 639-1)
+     *  需要合成的语言（ISO 639-1），支持 zh（中文）、en（英文）、yue（粤语）、ja（日语）、ko（韩语），默认自动识别
      */
     Language?: string;
 }
@@ -4951,11 +4979,11 @@ export interface TextToSpeechRequest {
      */
     APIKey?: string;
     /**
-     * TTS的模型：flow_01_turbo，flow_01_ex
+     * TTS的模型，当前固定为：flow_01_turbo
      */
     Model?: string;
     /**
-     * 语言参数，默认为空， 参考： (ISO 639-1)
+     *  需要合成的语言（ISO 639-1），支持 zh（中文）、en（英文）、yue（粤语）、ja（日语）、ko（韩语），默认自动识别
      */
     Language?: string;
 }