tencentcloud-sdk-nodejs-trtc 4.0.1034 → 4.0.1037
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/package.json
CHANGED
|
@@ -313,72 +313,41 @@ export interface STTConfig {
|
|
|
313
313
|
语音转文本不同套餐版本支持的语言如下:
|
|
314
314
|
|
|
315
315
|
**基础版**:
|
|
316
|
-
|
|
317
316
|
- "zh": 中文
|
|
318
|
-
|
|
319
317
|
- "zh-TW": 中国台湾
|
|
320
|
-
|
|
321
318
|
- "en": 英语
|
|
322
319
|
|
|
323
320
|
**标准版:**
|
|
324
|
-
|
|
325
321
|
- "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
|
|
326
|
-
|
|
327
322
|
- "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
328
|
-
|
|
329
323
|
- "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
|
|
330
|
-
|
|
331
324
|
- "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
332
325
|
|
|
333
326
|
**高级版:**
|
|
334
|
-
|
|
335
327
|
- "zh-dialect": 中国方言
|
|
336
|
-
|
|
337
328
|
- "zh-yue": 中国粤语
|
|
338
|
-
|
|
339
329
|
- "vi": 越南语
|
|
340
|
-
|
|
341
330
|
- "ja": 日语
|
|
342
|
-
|
|
343
331
|
- "ko": 韩语
|
|
344
|
-
|
|
345
332
|
- "id": 印度尼西亚语
|
|
346
|
-
|
|
347
333
|
- "th": 泰语
|
|
348
|
-
|
|
349
334
|
- "pt": 葡萄牙语
|
|
350
|
-
|
|
351
335
|
- "tr": 土耳其语
|
|
352
|
-
|
|
353
336
|
- "ar": 阿拉伯语
|
|
354
|
-
|
|
355
337
|
- "es": 西班牙语
|
|
356
|
-
|
|
357
338
|
- "hi": 印地语
|
|
358
|
-
|
|
359
339
|
- "fr": 法语
|
|
360
|
-
|
|
361
340
|
- "ms": 马来语
|
|
362
|
-
|
|
363
341
|
- "fil": 菲律宾语
|
|
364
|
-
|
|
365
342
|
- "de": 德语
|
|
366
|
-
|
|
367
343
|
- "it": 意大利语
|
|
368
|
-
|
|
369
344
|
- "ru": 俄语
|
|
370
|
-
|
|
371
345
|
- "sv": 瑞典语
|
|
372
|
-
|
|
373
346
|
- "da": 丹麦语
|
|
374
|
-
|
|
375
347
|
- "no": 挪威语
|
|
376
348
|
|
|
377
349
|
**注意:**
|
|
378
|
-
|
|
379
350
|
如果缺少满足您需求的语言,请联系我们技术人员。
|
|
380
|
-
|
|
381
|
-
示例值:zh
|
|
382
351
|
*/
|
|
383
352
|
Language?: string
|
|
384
353
|
/**
|
|
@@ -3169,6 +3138,10 @@ export interface StartAIConversationRequest {
|
|
|
3169
3138
|
<pre>{ <br>   "AppId": 您的应用ID, // Integer 必填<br>   "TTSType": "TTS类型", // String TTS类型, 固定为"tencent"<br>   "SecretId": "您的密钥ID", // String 必填<br>   "SecretKey": "您的密钥Key", // String 必填<br>   "VoiceType": 101001, // Integer 必填,音色 ID,包括标准音色与精品音色,精品音色拟真度更高,价格不同于标准音色,请参见<a href="https://cloud.tencent.com/document/product/1073/34112">语音合成计费概述</a>。完整的音色 ID 列表请参见<a href="https://cloud.tencent.com/document/product/1073/92668#55924b56-1a73-4663-a7a1-a8dd82d6e823">语音合成音色列表</a>。<br>   "Speed": 1.25, // Integer 非必填,语速,范围:[-2,6],分别对应不同语速: -2: 代表0.6倍 -1: 代表0.8倍 0: 代表1.0倍(默认) 1: 代表1.2倍 2: 代表1.5倍 6: 代表2.5倍 如果需要更细化的语速,可以保留小数点后 2 位,例如0.5/1.25/2.81等。 参数值与实际语速转换,可参考 <a href="https://sdk-1300466766.cos.ap-shanghai.myqcloud.com/sample/speed_sample.tar.gz">语速转换</a><br>   "Volume": 5, // Integer 非必填,音量大小,范围:[0,10],分别对应11个等级的音量,默认值为0,代表正常音量。<br>   "PrimaryLanguage": "zh-CN" // String 非必填,主要语言<br>  }</pre>
|
|
3170
3139
|
*/
|
|
3171
3140
|
TTSConfig?: string
|
|
3141
|
+
/**
|
|
3142
|
+
* 数字人配置,为JSON字符串。**数字人配置需要提工单加白后才能使用**
|
|
3143
|
+
*/
|
|
3144
|
+
AvatarConfig?: string
|
|
3172
3145
|
}
|
|
3173
3146
|
|
|
3174
3147
|
/**
|
|
@@ -286,72 +286,41 @@ export interface STTConfig {
|
|
|
286
286
|
语音转文本不同套餐版本支持的语言如下:
|
|
287
287
|
|
|
288
288
|
**基础版**:
|
|
289
|
-
|
|
290
289
|
- "zh": 中文
|
|
291
|
-
|
|
292
290
|
- "zh-TW": 中国台湾
|
|
293
|
-
|
|
294
291
|
- "en": 英语
|
|
295
292
|
|
|
296
293
|
**标准版:**
|
|
297
|
-
|
|
298
294
|
- "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
|
|
299
|
-
|
|
300
295
|
- "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
301
|
-
|
|
302
296
|
- "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
|
|
303
|
-
|
|
304
297
|
- "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
|
|
305
298
|
|
|
306
299
|
**高级版:**
|
|
307
|
-
|
|
308
300
|
- "zh-dialect": 中国方言
|
|
309
|
-
|
|
310
301
|
- "zh-yue": 中国粤语
|
|
311
|
-
|
|
312
302
|
- "vi": 越南语
|
|
313
|
-
|
|
314
303
|
- "ja": 日语
|
|
315
|
-
|
|
316
304
|
- "ko": 韩语
|
|
317
|
-
|
|
318
305
|
- "id": 印度尼西亚语
|
|
319
|
-
|
|
320
306
|
- "th": 泰语
|
|
321
|
-
|
|
322
307
|
- "pt": 葡萄牙语
|
|
323
|
-
|
|
324
308
|
- "tr": 土耳其语
|
|
325
|
-
|
|
326
309
|
- "ar": 阿拉伯语
|
|
327
|
-
|
|
328
310
|
- "es": 西班牙语
|
|
329
|
-
|
|
330
311
|
- "hi": 印地语
|
|
331
|
-
|
|
332
312
|
- "fr": 法语
|
|
333
|
-
|
|
334
313
|
- "ms": 马来语
|
|
335
|
-
|
|
336
314
|
- "fil": 菲律宾语
|
|
337
|
-
|
|
338
315
|
- "de": 德语
|
|
339
|
-
|
|
340
316
|
- "it": 意大利语
|
|
341
|
-
|
|
342
317
|
- "ru": 俄语
|
|
343
|
-
|
|
344
318
|
- "sv": 瑞典语
|
|
345
|
-
|
|
346
319
|
- "da": 丹麦语
|
|
347
|
-
|
|
348
320
|
- "no": 挪威语
|
|
349
321
|
|
|
350
322
|
**注意:**
|
|
351
|
-
|
|
352
323
|
如果缺少满足您需求的语言,请联系我们技术人员。
|
|
353
|
-
|
|
354
|
-
示例值:zh
|
|
355
324
|
*/
|
|
356
325
|
Language?: string;
|
|
357
326
|
/**
|
|
@@ -3029,6 +2998,10 @@ export interface StartAIConversationRequest {
|
|
|
3029
2998
|
<pre>{ <br>   "AppId": 您的应用ID, // Integer 必填<br>   "TTSType": "TTS类型", // String TTS类型, 固定为"tencent"<br>   "SecretId": "您的密钥ID", // String 必填<br>   "SecretKey": "您的密钥Key", // String 必填<br>   "VoiceType": 101001, // Integer 必填,音色 ID,包括标准音色与精品音色,精品音色拟真度更高,价格不同于标准音色,请参见<a href="https://cloud.tencent.com/document/product/1073/34112">语音合成计费概述</a>。完整的音色 ID 列表请参见<a href="https://cloud.tencent.com/document/product/1073/92668#55924b56-1a73-4663-a7a1-a8dd82d6e823">语音合成音色列表</a>。<br>   "Speed": 1.25, // Integer 非必填,语速,范围:[-2,6],分别对应不同语速: -2: 代表0.6倍 -1: 代表0.8倍 0: 代表1.0倍(默认) 1: 代表1.2倍 2: 代表1.5倍 6: 代表2.5倍 如果需要更细化的语速,可以保留小数点后 2 位,例如0.5/1.25/2.81等。 参数值与实际语速转换,可参考 <a href="https://sdk-1300466766.cos.ap-shanghai.myqcloud.com/sample/speed_sample.tar.gz">语速转换</a><br>   "Volume": 5, // Integer 非必填,音量大小,范围:[0,10],分别对应11个等级的音量,默认值为0,代表正常音量。<br>   "PrimaryLanguage": "zh-CN" // String 非必填,主要语言<br>  }</pre>
|
|
3030
2999
|
*/
|
|
3031
3000
|
TTSConfig?: string;
|
|
3001
|
+
/**
|
|
3002
|
+
* 数字人配置,为JSON字符串。**数字人配置需要提工单加白后才能使用**
|
|
3003
|
+
*/
|
|
3004
|
+
AvatarConfig?: string;
|
|
3032
3005
|
}
|
|
3033
3006
|
/**
|
|
3034
3007
|
* DeletePicture返回参数结构体
|