tencentcloud-sdk-nodejs 4.0.940 → 4.0.942

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (72) hide show
  1. package/CHANGELOG.md +383 -0
  2. package/SERVICE_CHANGELOG.md +611 -38
  3. package/package.json +1 -1
  4. package/products.md +15 -14
  5. package/src/common/sdk_version.ts +1 -1
  6. package/src/services/as/v20180419/as_models.ts +8 -0
  7. package/src/services/asr/v20190614/asr_client.ts +71 -57
  8. package/src/services/asr/v20190614/asr_models.ts +967 -895
  9. package/src/services/cfg/v20210820/cfg_models.ts +4 -0
  10. package/src/services/cwp/v20180228/cwp_client.ts +5 -3
  11. package/src/services/cwp/v20180228/cwp_models.ts +131 -48
  12. package/src/services/dlc/v20210125/dlc_models.ts +4 -0
  13. package/src/services/dsgc/v20190723/dsgc_models.ts +1 -1
  14. package/src/services/ims/v20201229/ims_client.ts +1 -1
  15. package/src/services/ims/v20201229/ims_models.ts +3 -3
  16. package/src/services/index.ts +1 -0
  17. package/src/services/lke/v20231130/lke_client.ts +576 -478
  18. package/src/services/lke/v20231130/lke_models.ts +516 -98
  19. package/src/services/mps/v20190612/mps_models.ts +8 -3
  20. package/src/services/mqtt/index.ts +5 -0
  21. package/src/services/mqtt/v20240516/index.ts +6 -0
  22. package/src/services/mqtt/v20240516/mqtt_client.ts +275 -0
  23. package/src/services/mqtt/v20240516/mqtt_models.ts +1112 -0
  24. package/src/services/tcss/v20201101/tcss_client.ts +4 -2
  25. package/src/services/tke/v20180525/tke_client.ts +40 -16
  26. package/src/services/tke/v20180525/tke_models.ts +154 -70
  27. package/src/services/vdb/v20230616/vdb_models.ts +5 -0
  28. package/src/services/vod/v20180717/vod_client.ts +2 -1
  29. package/src/services/vod/v20180717/vod_models.ts +34 -1
  30. package/src/services/vpc/v20170312/vpc_models.ts +17 -1
  31. package/tencentcloud/common/sdk_version.d.ts +1 -1
  32. package/tencentcloud/common/sdk_version.js +1 -1
  33. package/tencentcloud/services/as/v20180419/as_models.d.ts +8 -0
  34. package/tencentcloud/services/asr/v20190614/asr_client.d.ts +5 -1
  35. package/tencentcloud/services/asr/v20190614/asr_client.js +6 -0
  36. package/tencentcloud/services/asr/v20190614/asr_models.d.ts +998 -930
  37. package/tencentcloud/services/cfg/v20210820/cfg_models.d.ts +4 -0
  38. package/tencentcloud/services/cwp/v20180228/cwp_client.d.ts +1 -1
  39. package/tencentcloud/services/cwp/v20180228/cwp_models.d.ts +128 -47
  40. package/tencentcloud/services/dlc/v20210125/dlc_models.d.ts +4 -0
  41. package/tencentcloud/services/dsgc/v20190723/dsgc_models.d.ts +1 -1
  42. package/tencentcloud/services/ims/v20201229/ims_client.d.ts +1 -1
  43. package/tencentcloud/services/ims/v20201229/ims_client.js +1 -1
  44. package/tencentcloud/services/ims/v20201229/ims_models.d.ts +3 -3
  45. package/tencentcloud/services/index.d.ts +1 -0
  46. package/tencentcloud/services/index.js +2 -0
  47. package/tencentcloud/services/lke/v20231130/lke_client.d.ts +195 -163
  48. package/tencentcloud/services/lke/v20231130/lke_client.js +288 -240
  49. package/tencentcloud/services/lke/v20231130/lke_models.d.ts +497 -97
  50. package/tencentcloud/services/mps/v20190612/mps_models.d.ts +7 -2
  51. package/tencentcloud/services/mqtt/index.d.ts +6 -0
  52. package/tencentcloud/services/mqtt/index.js +7 -0
  53. package/tencentcloud/services/mqtt/v20240516/index.d.ts +6 -0
  54. package/tencentcloud/services/mqtt/v20240516/index.js +9 -0
  55. package/tencentcloud/services/mqtt/v20240516/mqtt_client.d.ts +95 -0
  56. package/tencentcloud/services/mqtt/v20240516/mqtt_client.js +154 -0
  57. package/tencentcloud/services/mqtt/v20240516/mqtt_models.d.ts +1051 -0
  58. package/tencentcloud/services/mqtt/v20240516/mqtt_models.js +18 -0
  59. package/tencentcloud/services/tcss/v20201101/tcss_client.d.ts +3 -1
  60. package/tencentcloud/services/tcss/v20201101/tcss_client.js +3 -1
  61. package/tencentcloud/services/tke/v20180525/tke_client.d.ts +13 -5
  62. package/tencentcloud/services/tke/v20180525/tke_client.js +18 -6
  63. package/tencentcloud/services/tke/v20180525/tke_models.d.ts +150 -70
  64. package/tencentcloud/services/vdb/v20230616/vdb_models.d.ts +5 -0
  65. package/tencentcloud/services/vod/v20180717/vod_client.d.ts +1 -1
  66. package/tencentcloud/services/vod/v20180717/vod_client.js +1 -1
  67. package/tencentcloud/services/vod/v20180717/vod_models.d.ts +33 -1
  68. package/tencentcloud/services/vpc/v20170312/vpc_models.d.ts +17 -1
  69. package/test/asr.v20190614.test.js +10 -0
  70. package/test/lke.v20231130.test.js +238 -158
  71. package/test/mqtt.v20240516.test.js +211 -0
  72. package/test/tke.v20180525.test.js +24 -4
@@ -15,20 +15,6 @@
15
15
  * under the License.
16
16
  */
17
17
 
18
- /**
19
- * SetVocabState返回参数结构体
20
- */
21
- export interface SetVocabStateResponse {
22
- /**
23
- * 热词表ID
24
- */
25
- VocabId?: string
26
- /**
27
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
28
- */
29
- RequestId?: string
30
- }
31
-
32
18
  /**
33
19
  * CreateCustomization返回参数结构体
34
20
  */
@@ -43,27 +29,6 @@ export interface CreateCustomizationResponse {
43
29
  RequestId?: string
44
30
  }
45
31
 
46
- /**
47
- * VoicePrintDelete请求参数结构体
48
- */
49
- export interface VoicePrintDeleteRequest {
50
- /**
51
- * 说话人id,说话人唯一标识
52
- */
53
- VoicePrintId?: string
54
- /**
55
- * 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
56
- */
57
- GroupId?: string
58
- /**
59
- * 删除模式:
60
- 0.默认值,删除该条声纹
61
- 1.从分组中删除该条声纹,声纹本身不删除
62
- 2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
63
- */
64
- DelMod?: number
65
- }
66
-
67
32
  /**
68
33
  * 关键字识别结果
69
34
  */
@@ -85,11 +50,6 @@ export interface KeyWordResult {
85
50
  KeyWords?: Array<string>
86
51
  }
87
52
 
88
- /**
89
- * DescribeAsyncRecognitionTasks请求参数结构体
90
- */
91
- export type DescribeAsyncRecognitionTasksRequest = null
92
-
93
53
  /**
94
54
  * ModifyCustomizationState请求参数结构体
95
55
  */
@@ -105,13 +65,15 @@ export interface ModifyCustomizationStateRequest {
105
65
  }
106
66
 
107
67
  /**
108
- * GetAsrKeyWordLibList返回参数结构体
68
+ * CreateRecTask返回参数结构体
109
69
  */
110
- export interface GetAsrKeyWordLibListResponse {
70
+ export interface CreateRecTaskResponse {
111
71
  /**
112
- * 关键词列表返回数据
72
+ * 录音文件识别的请求返回结果,包含结果查询需要的TaskId。
73
+ **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
74
+
113
75
  */
114
- Data?: KeyWordLibListData
76
+ Data?: Task
115
77
  /**
116
78
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
117
79
  */
@@ -119,13 +81,13 @@ export interface GetAsrKeyWordLibListResponse {
119
81
  }
120
82
 
121
83
  /**
122
- * VoicePrintEnroll返回参数结构体
84
+ * UpdateAsrVocab返回参数结构体
123
85
  */
124
- export interface VoicePrintEnrollResponse {
86
+ export interface UpdateAsrVocabResponse {
125
87
  /**
126
- * 说话人基本数据
88
+ * 热词表ID
127
89
  */
128
- Data?: VoicePrintBaseData
90
+ VocabId?: string
129
91
  /**
130
92
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
131
93
  */
@@ -133,156 +95,175 @@ export interface VoicePrintEnrollResponse {
133
95
  }
134
96
 
135
97
  /**
136
- * VoicePrintUpdate请求参数结构体
98
+ * DeleteAsrKeyWordLib返回参数结构体
137
99
  */
138
- export interface VoicePrintUpdateRequest {
139
- /**
140
- * 音频格式 0: pcm, 1: wav
141
- */
142
- VoiceFormat: number
143
- /**
144
- * 音频采样率 目前仅支持16000 单位Hz
145
- */
146
- SampleRate: number
147
- /**
148
- * 说话人id, 说话人唯一标识
149
- */
150
- VoicePrintId: string
151
- /**
152
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
153
- */
154
- Data: string
100
+ export interface DeleteAsrKeyWordLibResponse {
155
101
  /**
156
- * 说话人昵称 不超过32字节
102
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
157
103
  */
158
- SpeakerNick?: string
104
+ RequestId?: string
159
105
  }
160
106
 
161
107
  /**
162
- * CreateAsrKeyWordLib返回参数结构体
108
+ * CreateAsrKeyWordLib请求参数结构体
163
109
  */
164
- export interface CreateAsrKeyWordLibResponse {
110
+ export interface CreateAsrKeyWordLibRequest {
165
111
  /**
166
- * 词表ID数据
112
+ * 词表名称,长度在1-20之间
113
+ 仅限中英文数字-_
167
114
  */
168
- Data?: KeyWordLibIdData
115
+ Name: string
169
116
  /**
170
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
117
+ * 词文件(纯文本文件)的二进制base64编码,以行分隔
118
+ 格式要求:TXT
119
+ 每行只有一个词,不满足格式则报错无法上传
120
+ 每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
121
+ 注意不要有空行,尤其是最后一行
171
122
  */
172
- RequestId?: string
123
+ KeyWordFile?: string
173
124
  }
174
125
 
175
126
  /**
176
- * CreateAsyncRecognitionTask请求参数结构体
127
+ * VoicePrintGroupVerify请求参数结构体
177
128
  */
178
- export interface CreateAsyncRecognitionTaskRequest {
179
- /**
180
- * 引擎模型类型。
181
- • 16k_zh:中文普通话通用;
182
- • 16k_en:英语;
183
- • 16k_yue:粤语;
184
- • 16k_id:印度尼西亚语;
185
- • 16k_fil:菲律宾语;
186
- • 16k_th:泰语;
187
- • 16k_pt:葡萄牙语;
188
- • 16k_tr:土耳其语;
189
- • 16k_ar:阿拉伯语;
190
- • 16k_es:西班牙语;
191
- • 16k_hi:印地语;
192
- • 16k_fr:法语;
193
- • 16k_de:德语;
194
- */
195
- EngineType: string
196
- /**
197
- * 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
198
- */
199
- Url: string
129
+ export interface VoicePrintGroupVerifyRequest {
200
130
  /**
201
- * 支持HTTP和HTTPS协议,用于接收识别结果,您需要自行搭建公网可调用的服务。回调格式&内容详见:[语音流异步识别回调说明](https://cloud.tencent.com/document/product/1093/52633)
131
+ * 音频格式 0: pcm, 1: wav
202
132
  */
203
- CallbackUrl: string
133
+ VoiceFormat: number
204
134
  /**
205
- * 用于生成回调通知中的签名
135
+ * 音频采样率,目前支持16000,单位:Hz,必填
206
136
  */
207
- SignToken?: string
137
+ SampleRate: number
208
138
  /**
209
- * 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0
139
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
210
140
  */
211
- FilterDirty?: number
141
+ Data: string
212
142
  /**
213
- * 是否过语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0
143
+ * 分组id, 支持数字,字母,下划线,长度不超过128
214
144
  */
215
- FilterModal?: number
145
+ GroupId: string
216
146
  /**
217
- * 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认为0
147
+ * 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
218
148
  */
219
- FilterPunc?: number
149
+ TopN: number
150
+ }
151
+
152
+ /**
153
+ * GetCustomizationList返回参数结构体
154
+ */
155
+ export interface GetCustomizationListResponse {
220
156
  /**
221
- * 是否进行阿拉伯数字智能转换。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字。默认值为1
157
+ * 自学习模型数组
158
+ 注意:此字段可能返回 null,表示取不到有效值。
222
159
  */
223
- ConvertNumMode?: number
160
+ Data?: Array<Model>
224
161
  /**
225
- * 是否显示词级别时间戳。0:不显示;1:显示,不包含标点时间戳,2:显示,包含标点时间戳。默认为0
162
+ * 自学习模型总量
163
+ 注意:此字段可能返回 null,表示取不到有效值。
226
164
  */
227
- WordInfo?: number
165
+ TotalCount?: number
228
166
  /**
229
- * 热词id。用于调用对应的热词表,如果在调用语音识别服务时,不进行单独的热词id设置,自动生效默认热词;如果进行了单独的热词id设置,那么将生效单独设置的热词id
167
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId
230
168
  */
231
- HotwordId?: string
169
+ RequestId?: string
170
+ }
171
+
172
+ /**
173
+ * CloseAsyncRecognitionTask请求参数结构体
174
+ */
175
+ export interface CloseAsyncRecognitionTaskRequest {
232
176
  /**
233
- * 回调数据中,是否需要对应音频数据。
177
+ * 语音流异步识别任务的唯一标识,在创建任务时会返回
234
178
  */
235
- AudioData?: boolean
179
+ TaskId: number
236
180
  }
237
181
 
238
182
  /**
239
- * [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
183
+ * [录音文件识别](https://cloud.tencent.com/document/product/1093/37823#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)、[实时语音异步识别](https://cloud.tencent.com/document/product/1093/52061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)请求的返回数据
240
184
  */
241
- export interface HotWord {
185
+ export interface Task {
242
186
  /**
243
- * 热词
244
- 注意:此字段可能返回 null,表示取不到有效值。
187
+ * 任务ID,可通过此ID在轮询接口获取识别状态与结果。TaskId数据类型为**uint64**。
188
+ **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
245
189
  */
246
- Word: string
190
+ TaskId?: number
191
+ }
192
+
193
+ /**
194
+ * [音频流异步识别任务列表](https://cloud.tencent.com/document/product/1093/52060#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
195
+ */
196
+ export interface AsyncRecognitionTasks {
247
197
  /**
248
- * 权重
198
+ * 任务列表
249
199
  注意:此字段可能返回 null,表示取不到有效值。
250
200
  */
251
- Weight: number
201
+ Tasks?: Array<AsyncRecognitionTaskInfo>
252
202
  }
253
203
 
254
204
  /**
255
- * GetModelInfo请求参数结构体
205
+ * DeleteCustomization返回参数结构体
256
206
  */
257
- export interface GetModelInfoRequest {
207
+ export interface DeleteCustomizationResponse {
258
208
  /**
259
- * 模型id
209
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
260
210
  */
261
- ModelId: string
211
+ RequestId?: string
262
212
  }
263
213
 
264
214
  /**
265
- * GetAsrVocab请求参数结构体
215
+ * [获取录音识别结果的返回参数](https://cloud.tencent.com/document/product/1093/37822#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
266
216
  */
267
- export interface GetAsrVocabRequest {
217
+ export interface TaskStatus {
268
218
  /**
269
- * 热词表ID
219
+ * 任务标识。注意:TaskId数据类型为uint64。
270
220
  */
271
- VocabId: string
221
+ TaskId?: number
222
+ /**
223
+ * 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
224
+ */
225
+ Status?: number
226
+ /**
227
+ * 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
228
+ */
229
+ StatusStr?: string
230
+ /**
231
+ * 识别结果。
232
+ */
233
+ Result?: string
234
+ /**
235
+ * 失败原因说明。
236
+ */
237
+ ErrorMsg?: string
238
+ /**
239
+ * 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
240
+ 注意:此字段可能返回 null,表示取不到有效值。
241
+ */
242
+ ResultDetail?: Array<SentenceDetail>
243
+ /**
244
+ * 音频时长(秒)。
245
+ 注意:此字段可能返回 null,表示取不到有效值。
246
+ */
247
+ AudioDuration?: number
272
248
  }
273
249
 
274
250
  /**
275
- * DescribeTaskStatus返回参数结构体
251
+ * GetCustomizationList请求参数结构体
276
252
  */
277
- export interface DescribeTaskStatusResponse {
253
+ export interface GetCustomizationListRequest {
278
254
  /**
279
- * 录音文件识别的请求返回结果。
255
+ * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
256
+ * @deprecated
280
257
  */
281
- Data?: TaskStatus
258
+ TagInfos?: Array<string>
282
259
  /**
283
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
260
+ * 分页大小,默认1000
284
261
  */
285
- RequestId?: string
262
+ Limit?: number
263
+ /**
264
+ * 分页offset,默认0
265
+ */
266
+ Offset?: number
286
267
  }
287
268
 
288
269
  /**
@@ -408,61 +389,64 @@ hotword_list:临时热词表。每次请求时直接传入临时热词表来
408
389
  }
409
390
 
410
391
  /**
411
- * [说话人验证数据](https://cloud.tencent.com/document/product/1093/94481#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
392
+ * VoicePrintCount请求参数结构体
412
393
  */
413
- export interface VoicePrintVerifyData {
414
- /**
415
- * 说话人id
416
- 注意:此字段可能返回 null,表示取不到有效值。
417
- */
418
- VoicePrintId?: string
394
+ export interface VoicePrintCountRequest {
419
395
  /**
420
- * 匹配度 取值范围(0.0 - 100.0)
421
- 注意:此字段可能返回 null,表示取不到有效值。
396
+ * 分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
422
397
  */
423
- Score?: string
398
+ GroupId?: string
424
399
  /**
425
- * 验证结果 0: 未通过 1: 通过
426
- 注意:此字段可能返回 null,表示取不到有效值。
400
+ * 统计模式
401
+ 0: 统计所有声纹数量
402
+ 1: 统计指定分组下的声纹数量
427
403
  */
428
- Decision?: number
404
+ CountMod?: number
429
405
  }
430
406
 
431
407
  /**
432
- * 关键词表信息
408
+ * VoicePrintCompare返回参数结构体
433
409
  */
434
- export interface KeyWordLib {
410
+ export interface VoicePrintCompareResponse {
435
411
  /**
436
- * 关键词表ID
437
- 注意:此字段可能返回 null,表示取不到有效值。
412
+ * 音频声纹比对结果,包含相似度打分
438
413
  */
439
- KeyWordLibId?: string
414
+ Data?: VoicePrintCompareData
440
415
  /**
441
- * 关键词表名称
442
- 注意:此字段可能返回 null,表示取不到有效值。
416
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
443
417
  */
444
- Name?: string
418
+ RequestId?: string
419
+ }
420
+
421
+ /**
422
+ * 声纹组对比结果top数据
423
+ */
424
+ export interface VerifyTop {
445
425
  /**
446
- * 关键词列表
426
+ * 相似度打分
447
427
  注意:此字段可能返回 null,表示取不到有效值。
448
428
  */
449
- KeyWordList?: Array<string>
429
+ Score?: string
450
430
  /**
451
- * 创建时间
431
+ * 说话人id
452
432
  注意:此字段可能返回 null,表示取不到有效值。
453
433
  */
454
- CreateTime?: string
434
+ VoicePrintId?: string
455
435
  /**
456
- * 更新时间
436
+ * 说话人昵称
457
437
  注意:此字段可能返回 null,表示取不到有效值。
458
438
  */
459
- UpdateTime?: string
439
+ SpeakerId?: string
460
440
  }
461
441
 
462
442
  /**
463
- * CloseAsyncRecognitionTask返回参数结构体
443
+ * SetVocabState返回参数结构体
464
444
  */
465
- export interface CloseAsyncRecognitionTaskResponse {
445
+ export interface SetVocabStateResponse {
446
+ /**
447
+ * 热词表ID
448
+ */
449
+ VocabId?: string
466
450
  /**
467
451
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
468
452
  */
@@ -470,111 +454,78 @@ export interface CloseAsyncRecognitionTaskResponse {
470
454
  }
471
455
 
472
456
  /**
473
- * 单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。
457
+ * 用户用量信息
474
458
  */
475
- export interface SentenceDetail {
476
- /**
477
- * 单句最终识别结果
478
- 注意:此字段可能返回 null,表示取不到有效值。
479
- */
480
- FinalSentence?: string
481
- /**
482
- * 单句中间识别结果,使用空格拆分为多个词
483
- 注意:此字段可能返回 null,表示取不到有效值。
484
- */
485
- SliceSentence?: string
486
- /**
487
- * 口语转书面语结果,开启改功能才有值
488
- 注意:此字段可能返回 null,表示取不到有效值。
489
- */
490
- WrittenText?: string
491
- /**
492
- * 单句开始时间(毫秒)
493
- 注意:此字段可能返回 null,表示取不到有效值。
494
- */
495
- StartMs?: number
496
- /**
497
- * 单句结束时间(毫秒)
498
- 注意:此字段可能返回 null,表示取不到有效值。
499
- */
500
- EndMs?: number
501
- /**
502
- * 单句中词个数
503
- 注意:此字段可能返回 null,表示取不到有效值。
504
- */
505
- WordsNum?: number
506
- /**
507
- * 单句中词详情
508
- 注意:此字段可能返回 null,表示取不到有效值。
509
- */
510
- Words?: Array<SentenceWords>
511
- /**
512
- * 单句语速,单位:字数/秒
513
- 注意:此字段可能返回 null,表示取不到有效值。
514
- */
515
- SpeechSpeed?: number
516
- /**
517
- * 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
518
- 注意:此字段可能返回 null,表示取不到有效值。
519
- */
520
- SpeakerId?: number
459
+ export interface UsageByDateInfoData {
521
460
  /**
522
- * 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
461
+ * 用量信息列表
523
462
  注意:此字段可能返回 null,表示取不到有效值。
524
463
  */
525
- EmotionalEnergy?: number
464
+ UsageByDateInfoList?: Array<UsageByDateInfo>
465
+ }
466
+
467
+ /**
468
+ * VoicePrintDelete请求参数结构体
469
+ */
470
+ export interface VoicePrintDeleteRequest {
526
471
  /**
527
- * 本句与上一句之间的静音时长
528
- 注意:此字段可能返回 null,表示取不到有效值。
472
+ * 说话人id,说话人唯一标识
529
473
  */
530
- SilenceTime?: number
474
+ VoicePrintId?: string
531
475
  /**
532
- * 情绪类型(可能为空)
533
- 注意:此字段可能返回 null,表示取不到有效值。
476
+ * 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
534
477
  */
535
- EmotionType?: Array<string>
478
+ GroupId?: string
536
479
  /**
537
- * 关键词识别结果列表
538
- 注意:此字段可能返回 null,表示取不到有效值。
480
+ * 删除模式:
481
+ 0.默认值,删除该条声纹
482
+ 1.从分组中删除该条声纹,声纹本身不删除
483
+ 2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
539
484
  */
540
- KeyWordResults?: Array<KeyWordResult>
485
+ DelMod?: number
541
486
  }
542
487
 
543
488
  /**
544
- * CreateCustomization请求参数结构体
489
+ * DescribeAsyncRecognitionTasks请求参数结构体
545
490
  */
546
- export interface CreateCustomizationRequest {
491
+ export type DescribeAsyncRecognitionTasksRequest = null
492
+
493
+ /**
494
+ * GetAsrKeyWordLibList返回参数结构体
495
+ */
496
+ export interface GetAsrKeyWordLibListResponse {
547
497
  /**
548
- * 自学习模型名称,需在1-20字符之间
498
+ * 关键词列表返回数据
549
499
  */
550
- ModelName: string
500
+ Data?: KeyWordLibListData
551
501
  /**
552
- * 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
502
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
553
503
  */
554
- TextUrl: string
504
+ RequestId?: string
505
+ }
506
+
507
+ /**
508
+ * VoicePrintEnroll返回参数结构体
509
+ */
510
+ export interface VoicePrintEnrollResponse {
555
511
  /**
556
- * 自学习模型类型,填写8k或者16k
512
+ * 说话人基本数据
557
513
  */
558
- ModelType: string
514
+ Data?: VoicePrintBaseData
559
515
  /**
560
- * 标签信息
561
- * @deprecated
516
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
562
517
  */
563
- TagInfos?: Array<string>
518
+ RequestId?: string
564
519
  }
565
520
 
566
521
  /**
567
- * DownloadAsrVocab返回参数结构体
522
+ * CreateAsrKeyWordLib返回参数结构体
568
523
  */
569
- export interface DownloadAsrVocabResponse {
570
- /**
571
- * 词表ID。
572
- */
573
- VocabId?: string
524
+ export interface CreateAsrKeyWordLibResponse {
574
525
  /**
575
- * 词表权重文件形式的base64值。
526
+ * 词表ID数据
576
527
  */
577
- WordWeightStr?: string
528
+ Data?: KeyWordLibIdData
578
529
  /**
579
530
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
580
531
  */
@@ -582,54 +533,86 @@ export interface DownloadAsrVocabResponse {
582
533
  }
583
534
 
584
535
  /**
585
- * [词表内容](https://cloud.tencent.com/document/product/1093/41484#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
536
+ * CreateAsyncRecognitionTask请求参数结构体
586
537
  */
587
- export interface Vocab {
538
+ export interface CreateAsyncRecognitionTaskRequest {
588
539
  /**
589
- * 热词表名称
540
+ * 引擎模型类型。
541
+ • 16k_zh:中文普通话通用;
542
+ • 16k_en:英语;
543
+ • 16k_yue:粤语;
544
+ • 16k_id:印度尼西亚语;
545
+ • 16k_fil:菲律宾语;
546
+ • 16k_th:泰语;
547
+ • 16k_pt:葡萄牙语;
548
+ • 16k_tr:土耳其语;
549
+ • 16k_ar:阿拉伯语;
550
+ • 16k_es:西班牙语;
551
+ • 16k_hi:印地语;
552
+ • 16k_fr:法语;
553
+ • 16k_de:德语;
590
554
  */
591
- Name?: string
555
+ EngineType: string
592
556
  /**
593
- * 热词表描述
557
+ * 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
594
558
  */
595
- Description?: string
559
+ Url: string
596
560
  /**
597
- * 热词表ID
561
+ * 支持HTTP和HTTPS协议,用于接收识别结果,您需要自行搭建公网可调用的服务。回调格式&内容详见:[语音流异步识别回调说明](https://cloud.tencent.com/document/product/1093/52633)
598
562
  */
599
- VocabId?: string
563
+ CallbackUrl: string
600
564
  /**
601
- * 词权重列表
565
+ * 用于生成回调通知中的签名
602
566
  */
603
- WordWeights?: Array<HotWord>
567
+ SignToken?: string
604
568
  /**
605
- * 词表创建时间
569
+ * 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0
606
570
  */
607
- CreateTime?: string
571
+ FilterDirty?: number
608
572
  /**
609
- * 词表更新时间
573
+ * 是否过语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0
610
574
  */
611
- UpdateTime?: string
575
+ FilterModal?: number
612
576
  /**
613
- * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
577
+ * 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认为0
614
578
  */
615
- State?: number
579
+ FilterPunc?: number
616
580
  /**
617
- * 标签数组
618
- 注意:此字段可能返回 null,表示取不到有效值。
581
+ * 是否进行阿拉伯数字智能转换。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字。默认值为1
619
582
  */
620
- TagInfos?: Array<string>
583
+ ConvertNumMode?: number
584
+ /**
585
+ * 是否显示词级别时间戳。0:不显示;1:显示,不包含标点时间戳,2:显示,包含标点时间戳。默认为0
586
+ */
587
+ WordInfo?: number
588
+ /**
589
+ * 热词id。用于调用对应的热词表,如果在调用语音识别服务时,不进行单独的热词id设置,自动生效默认热词;如果进行了单独的热词id设置,那么将生效单独设置的热词id。
590
+ */
591
+ HotwordId?: string
592
+ /**
593
+ * 回调数据中,是否需要对应音频数据。
594
+ */
595
+ AudioData?: boolean
621
596
  }
622
597
 
623
598
  /**
624
- * CreateRecTask返回参数结构体
599
+ * GetAsrVocab请求参数结构体
625
600
  */
626
- export interface CreateRecTaskResponse {
601
+ export interface GetAsrVocabRequest {
627
602
  /**
628
- * 录音文件识别的请求返回结果,包含结果查询需要的TaskId。
629
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
603
+ * 热词表ID
604
+ */
605
+ VocabId: string
606
+ }
630
607
 
608
+ /**
609
+ * DescribeTaskStatus返回参数结构体
610
+ */
611
+ export interface DescribeTaskStatusResponse {
612
+ /**
613
+ * 录音文件识别的请求返回结果。
631
614
  */
632
- Data?: Task
615
+ Data?: TaskStatus
633
616
  /**
634
617
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
635
618
  */
@@ -637,41 +620,56 @@ export interface CreateRecTaskResponse {
637
620
  }
638
621
 
639
622
  /**
640
- * UpdateAsrKeyWordLib请求参数结构体
623
+ * [说话人验证数据](https://cloud.tencent.com/document/product/1093/94481#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
641
624
  */
642
- export interface UpdateAsrKeyWordLibRequest {
625
+ export interface VoicePrintVerifyData {
643
626
  /**
644
- * 关键词表ID
627
+ * 说话人id
628
+ 注意:此字段可能返回 null,表示取不到有效值。
645
629
  */
646
- KeyWordLibId: string
630
+ VoicePrintId?: string
647
631
  /**
648
- * 词表名称,长度在1-20之间
649
- 仅限中英文数字-_
632
+ * 匹配度 取值范围(0.0 - 100.0)
633
+ 注意:此字段可能返回 null,表示取不到有效值。
650
634
  */
651
- Name?: string
635
+ Score?: string
652
636
  /**
653
- * - 词文件(纯文本文件)以行分隔 ,进行二进制base64编码
654
- - 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
655
- - 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
656
- - 此参数为空则只更新词表名称
637
+ * 验证结果 0: 未通过 1: 通过
638
+ 注意:此字段可能返回 null,表示取不到有效值。
657
639
  */
658
- KeyWordFile?: string
640
+ Decision?: number
659
641
  }
660
642
 
661
643
  /**
662
- * ModifyCustomization返回参数结构体
644
+ * [一句话识别](https://cloud.tencent.com/document/product/1093/35646#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)返回的词时间戳
663
645
  */
664
- export interface ModifyCustomizationResponse {
646
+ export interface SentenceWord {
665
647
  /**
666
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
648
+ * 词结果
667
649
  */
668
- RequestId?: string
650
+ Word?: string
651
+ /**
652
+ * 词在音频中的开始时间
653
+ */
654
+ StartTime?: number
655
+ /**
656
+ * 词在音频中的结束时间
657
+ */
658
+ EndTime?: number
669
659
  }
670
660
 
671
661
  /**
672
- * DeleteAsrKeyWordLib返回参数结构体
662
+ * DownloadAsrVocab返回参数结构体
673
663
  */
674
- export interface DeleteAsrKeyWordLibResponse {
664
+ export interface DownloadAsrVocabResponse {
665
+ /**
666
+ * 词表ID。
667
+ */
668
+ VocabId?: string
669
+ /**
670
+ * 词表权重文件形式的base64值。
671
+ */
672
+ WordWeightStr?: string
675
673
  /**
676
674
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
677
675
  */
@@ -679,9 +677,9 @@ export interface DeleteAsrKeyWordLibResponse {
679
677
  }
680
678
 
681
679
  /**
682
- * DeleteAsrVocab返回参数结构体
680
+ * ModifyCustomization返回参数结构体
683
681
  */
684
- export interface DeleteAsrVocabResponse {
682
+ export interface ModifyCustomizationResponse {
685
683
  /**
686
684
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
687
685
  */
@@ -689,82 +687,111 @@ export interface DeleteAsrVocabResponse {
689
687
  }
690
688
 
691
689
  /**
692
- * CreateAsyncRecognitionTask返回参数结构体
690
+ * GetAsrVocabList请求参数结构体
693
691
  */
694
- export interface CreateAsyncRecognitionTaskResponse {
692
+ export interface GetAsrVocabListRequest {
695
693
  /**
696
- * 请求返回结果,包含本次的任务ID(TaskId)
694
+ * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
697
695
  */
698
- Data?: Task
696
+ TagInfos?: Array<string>
699
697
  /**
700
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
698
+ * 分页Offset
701
699
  */
702
- RequestId?: string
700
+ Offset?: number
701
+ /**
702
+ * 分页Limit
703
+ */
704
+ Limit?: number
703
705
  }
704
706
 
705
707
  /**
706
- * VoicePrintDelete返回参数结构体
708
+ * 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
707
709
  */
708
- export interface VoicePrintDeleteResponse {
710
+ export interface VoicePrintCountData {
709
711
  /**
710
- * 说话人基本信息
712
+ * 总数
713
+ 注意:此字段可能返回 null,表示取不到有效值。
711
714
  */
712
- Data?: VoicePrintBaseData
715
+ Total?: number
713
716
  /**
714
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
717
+ * 说话人id列表
718
+ 注意:此字段可能返回 null,表示取不到有效值。
715
719
  */
716
- RequestId?: string
720
+ VoicePrintList?: Array<VoicePrintBaseData>
717
721
  }
718
722
 
719
723
  /**
720
- * GetAsrKeyWordLibList请求参数结构体
724
+ * VoicePrintUpdate请求参数结构体
721
725
  */
722
- export interface GetAsrKeyWordLibListRequest {
726
+ export interface VoicePrintUpdateRequest {
723
727
  /**
724
- * 分页Offset
728
+ * 音频格式 0: pcm, 1: wav
725
729
  */
726
- Offset?: number
730
+ VoiceFormat: number
727
731
  /**
728
- * 分页Limit
732
+ * 音频采样率 目前仅支持16000 单位Hz
729
733
  */
730
- Limit?: number
734
+ SampleRate: number
731
735
  /**
732
- * 词库名称或者UIN检索
736
+ * 说话人id, 说话人唯一标识
733
737
  */
734
- SpecifyNames?: Array<string>
738
+ VoicePrintId: string
735
739
  /**
736
- * 只看用户自己创建的
740
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
737
741
  */
738
- OnlySelf?: boolean
742
+ Data: string
743
+ /**
744
+ * 说话人昵称 不超过32字节
745
+ */
746
+ SpeakerNick?: string
739
747
  }
740
748
 
741
749
  /**
742
- * CreateAsrKeyWordLib请求参数结构体
750
+ * DeleteAsrVocab请求参数结构体
743
751
  */
744
- export interface CreateAsrKeyWordLibRequest {
752
+ export interface DeleteAsrVocabRequest {
745
753
  /**
746
- * 词表名称,长度在1-20之间
747
- 仅限中英文数字-_
754
+ * 热词表Id
748
755
  */
749
- Name: string
756
+ VocabId: string
757
+ }
758
+
759
+ /**
760
+ * UpdateAsrVocab请求参数结构体
761
+ */
762
+ export interface UpdateAsrVocabRequest {
750
763
  /**
751
- * 词文件(纯文本文件)的二进制base64编码,以行分隔
752
- 格式要求:TXT
753
- 每行只有一个词,不满足格式则报错无法上传
754
- 每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
755
- 注意不要有空行,尤其是最后一行
764
+ * 热词表ID
756
765
  */
757
- KeyWordFile?: string
766
+ VocabId: string
767
+ /**
768
+ * 热词表名称,长度在1-255之间
769
+ */
770
+ Name?: string
771
+ /**
772
+ * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或100,数组长度不大于1000 (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
773
+ */
774
+ WordWeights?: Array<HotWord>
775
+ /**
776
+ * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
777
+ 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
778
+ (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
779
+ */
780
+ WordWeightStr?: string
781
+ /**
782
+ * 热词表描述,长度在0-1000之间
783
+ */
784
+ Description?: string
758
785
  }
759
786
 
760
787
  /**
761
- * DownloadCustomization返回参数结构体
788
+ * CreateAsrVocab返回参数结构体
762
789
  */
763
- export interface DownloadCustomizationResponse {
790
+ export interface CreateAsrVocabResponse {
764
791
  /**
765
- * 下载地址
792
+ * 词表ID,可用于获取词表信息
766
793
  */
767
- DownloadUrl?: string
794
+ VocabId?: string
768
795
  /**
769
796
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
770
797
  */
@@ -772,91 +799,307 @@ export interface DownloadCustomizationResponse {
772
799
  }
773
800
 
774
801
  /**
775
- * CreateRecTask请求参数结构体
802
+ * SentenceRecognition返回参数结构体
776
803
  */
777
- export interface CreateRecTaskRequest {
804
+ export interface SentenceRecognitionResponse {
778
805
  /**
779
- * 引擎模型类型
780
- 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
781
-
782
- 电话通讯场景引擎:
783
- **注意:电话通讯场景,请务必使用以下8k引擎**
784
- • 8k_zh:中文电话通讯;
785
- • 8k_en:英文电话通讯;
786
- • **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
787
-
788
- 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
789
-
790
- 通用场景引擎:
791
- **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
792
- • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
793
- • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
794
- • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
795
- • **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
796
- • **16k_en:**英语;
797
- • **16k_yue:**粤语;
798
- • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
799
- • **16k_ja:**日语;
800
- • **16k_ko:**韩语;
801
- • **16k_vi:**越南语;
802
- • **16k_ms:**马来语;
803
- • **16k_id:**印度尼西亚语;
804
- • **16k_fil:**菲律宾语;
805
- • **16k_th:**泰语;
806
- • **16k_pt:**葡萄牙语;
807
- • **16k_tr:**土耳其语;
808
- • **16k_ar:**阿拉伯语;
809
- • **16k_es:**西班牙语;
810
- • **16k_hi:**印地语;
811
- • **16k_fr:**法语;
812
- • **16k_zh_medical:**中文医疗引擎;
813
- • **16k_de:**德语;
806
+ * 识别结果。
814
807
  */
815
- EngineModelType: string
808
+ Result?: string
816
809
  /**
817
- * 识别声道数
818
- 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
819
- 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
820
-
821
- 注意:
822
- • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
823
- • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
810
+ * 请求的音频时长,单位为ms
824
811
  */
825
- ChannelNum: number
812
+ AudioDuration?: number
826
813
  /**
827
- * 识别结果返回样式
828
- 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
829
- 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
830
- 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
831
- 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
832
- 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
833
- 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
834
-
835
- 注意:
836
- 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
837
- 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
814
+ * 词时间戳列表的长度
815
+ 注意:此字段可能返回 null,表示取不到有效值。
838
816
  */
839
- ResTextFormat: number
817
+ WordSize?: number
840
818
  /**
841
- * 音频数据来源
842
- 0:音频URL;
843
- 1:音频数据(post body)
819
+ * 词时间戳列表
820
+ 注意:此字段可能返回 null,表示取不到有效值。
844
821
  */
845
- SourceType: number
822
+ WordList?: Array<SentenceWord>
846
823
  /**
847
- * 音频数据base64编码
848
- **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
849
-
850
- 注意:音频数据要小于5MB(含)
824
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
851
825
  */
852
- Data?: string
826
+ RequestId?: string
827
+ }
828
+
829
+ /**
830
+ * [说话人基础数据](https://cloud.tencent.com/document/product/1093/94483#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0),包括说话人id和说话人昵称
831
+ */
832
+ export interface VoicePrintBaseData {
853
833
  /**
854
- * 数据长度(此数据长度为数据未进行base64编码时的长度)
834
+ * 说话人id
835
+ 注意:此字段可能返回 null,表示取不到有效值。
855
836
  */
856
- DataLen?: number
837
+ VoicePrintId?: string
857
838
  /**
858
- * 音频URL的地址(需要公网环境浏览器可下载)
859
- **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
839
+ * 说话人昵称
840
+ 注意:此字段可能返回 null,表示取不到有效值。
841
+ */
842
+ SpeakerNick?: string
843
+ }
844
+
845
+ /**
846
+ * DescribeAsyncRecognitionTasks返回参数结构体
847
+ */
848
+ export interface DescribeAsyncRecognitionTasksResponse {
849
+ /**
850
+ * 任务列表
851
+ 注意:此字段可能返回 null,表示取不到有效值。
852
+ */
853
+ Data?: AsyncRecognitionTasks
854
+ /**
855
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
856
+ */
857
+ RequestId?: string
858
+ }
859
+
860
+ /**
861
+ * GetAsrVocabList返回参数结构体
862
+ */
863
+ export interface GetAsrVocabListResponse {
864
+ /**
865
+ * 热词表列表
866
+ */
867
+ VocabList?: Array<Vocab>
868
+ /**
869
+ * 热词列表总数
870
+ */
871
+ TotalCount?: number
872
+ /**
873
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
874
+ */
875
+ RequestId?: string
876
+ }
877
+
878
+ /**
879
+ * DownloadCustomization请求参数结构体
880
+ */
881
+ export interface DownloadCustomizationRequest {
882
+ /**
883
+ * 自学习模型ID
884
+ */
885
+ ModelId: string
886
+ }
887
+
888
+ /**
889
+ * 说话人验证1:N返回结果
890
+ */
891
+ export interface VerifyTopResult {
892
+ /**
893
+ * 对比打分结果,按照打分降序排列返回
894
+ 注意:此字段可能返回 null,表示取不到有效值。
895
+ */
896
+ VerifyTops?: Array<VerifyTop>
897
+ }
898
+
899
+ /**
900
+ * GetAsrVocab返回参数结构体
901
+ */
902
+ export interface GetAsrVocabResponse {
903
+ /**
904
+ * 热词表名称
905
+ */
906
+ Name?: string
907
+ /**
908
+ * 热词表描述
909
+ */
910
+ Description?: string
911
+ /**
912
+ * 热词表ID
913
+ */
914
+ VocabId?: string
915
+ /**
916
+ * 词权重列表
917
+ */
918
+ WordWeights?: Array<HotWord>
919
+ /**
920
+ * 词表创建时间
921
+ */
922
+ CreateTime?: string
923
+ /**
924
+ * 词表更新时间
925
+ */
926
+ UpdateTime?: string
927
+ /**
928
+ * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
929
+ */
930
+ State?: number
931
+ /**
932
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
933
+ */
934
+ RequestId?: string
935
+ }
936
+
937
+ /**
938
+ * [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
939
+ */
940
+ export interface HotWord {
941
+ /**
942
+ * 热词
943
+ 注意:此字段可能返回 null,表示取不到有效值。
944
+ */
945
+ Word: string
946
+ /**
947
+ * 权重
948
+ 注意:此字段可能返回 null,表示取不到有效值。
949
+ */
950
+ Weight: number
951
+ }
952
+
953
+ /**
954
+ * UpdateAsrKeyWordLib请求参数结构体
955
+ */
956
+ export interface UpdateAsrKeyWordLibRequest {
957
+ /**
958
+ * 关键词表ID
959
+ */
960
+ KeyWordLibId: string
961
+ /**
962
+ * 词表名称,长度在1-20之间
963
+ 仅限中英文数字-_
964
+ */
965
+ Name?: string
966
+ /**
967
+ * - 词文件(纯文本文件)以行分隔 ,进行二进制base64编码
968
+ - 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
969
+ - 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
970
+ - 此参数为空则只更新词表名称
971
+ */
972
+ KeyWordFile?: string
973
+ }
974
+
975
+ /**
976
+ * GetUsageByDate返回参数结构体
977
+ */
978
+ export interface GetUsageByDateResponse {
979
+ /**
980
+ * 用量次数
981
+ */
982
+ Data?: UsageByDateInfoData
983
+ /**
984
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
985
+ */
986
+ RequestId?: string
987
+ }
988
+
989
+ /**
990
+ * VoicePrintDelete返回参数结构体
991
+ */
992
+ export interface VoicePrintDeleteResponse {
993
+ /**
994
+ * 说话人基本信息
995
+ */
996
+ Data?: VoicePrintBaseData
997
+ /**
998
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
999
+ */
1000
+ RequestId?: string
1001
+ }
1002
+
1003
+ /**
1004
+ * DownloadCustomization返回参数结构体
1005
+ */
1006
+ export interface DownloadCustomizationResponse {
1007
+ /**
1008
+ * 下载地址
1009
+ */
1010
+ DownloadUrl?: string
1011
+ /**
1012
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1013
+ */
1014
+ RequestId?: string
1015
+ }
1016
+
1017
+ /**
1018
+ * CreateRecTask请求参数结构体
1019
+ */
1020
+ export interface CreateRecTaskRequest {
1021
+ /**
1022
+ * 引擎模型类型
1023
+ 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
1024
+
1025
+ 电话通讯场景引擎:
1026
+ **注意:电话通讯场景,请务必使用以下8k引擎**
1027
+ • 8k_zh:中文电话通讯;
1028
+ • 8k_en:英文电话通讯;
1029
+ • **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
1030
+
1031
+ 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
1032
+
1033
+ 通用场景引擎:
1034
+ **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
1035
+ • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
1036
+ • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
1037
+ • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
1038
+ • **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
1039
+ • **16k_en:**英语;
1040
+ • **16k_yue:**粤语;
1041
+ • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
1042
+ • **16k_ja:**日语;
1043
+ • **16k_ko:**韩语;
1044
+ • **16k_vi:**越南语;
1045
+ • **16k_ms:**马来语;
1046
+ • **16k_id:**印度尼西亚语;
1047
+ • **16k_fil:**菲律宾语;
1048
+ • **16k_th:**泰语;
1049
+ • **16k_pt:**葡萄牙语;
1050
+ • **16k_tr:**土耳其语;
1051
+ • **16k_ar:**阿拉伯语;
1052
+ • **16k_es:**西班牙语;
1053
+ • **16k_hi:**印地语;
1054
+ • **16k_fr:**法语;
1055
+ • **16k_zh_medical:**中文医疗引擎;
1056
+ • **16k_de:**德语;
1057
+ */
1058
+ EngineModelType: string
1059
+ /**
1060
+ * 识别声道数
1061
+ 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
1062
+ 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
1063
+
1064
+ 注意:
1065
+ • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
1066
+ • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
1067
+ */
1068
+ ChannelNum: number
1069
+ /**
1070
+ * 识别结果返回样式
1071
+ 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
1072
+ 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
1073
+ 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
1074
+ 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
1075
+ 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
1076
+ 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
1077
+
1078
+ 注意:
1079
+ 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
1080
+ 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
1081
+ */
1082
+ ResTextFormat: number
1083
+ /**
1084
+ * 音频数据来源
1085
+ 0:音频URL;
1086
+ 1:音频数据(post body)
1087
+ */
1088
+ SourceType: number
1089
+ /**
1090
+ * 音频数据base64编码
1091
+ **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
1092
+
1093
+ 注意:音频数据要小于5MB(含)
1094
+ */
1095
+ Data?: string
1096
+ /**
1097
+ * 数据长度(此数据长度为数据未进行base64编码时的长度)
1098
+ */
1099
+ DataLen?: number
1100
+ /**
1101
+ * 音频URL的地址(需要公网环境浏览器可下载)
1102
+ **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
860
1103
 
861
1104
  注意:
862
1105
  1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
@@ -1010,130 +1253,74 @@ export interface CreateRecTaskRequest {
1010
1253
  }
1011
1254
 
1012
1255
  /**
1013
- * 关键词ID
1256
+ * 单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。
1014
1257
  */
1015
- export interface KeyWordLibIdData {
1258
+ export interface SentenceDetail {
1016
1259
  /**
1017
- * 关键词ID
1260
+ * 单句最终识别结果
1018
1261
  注意:此字段可能返回 null,表示取不到有效值。
1019
1262
  */
1020
- KeyWordLibId?: string
1021
- }
1022
-
1023
- /**
1024
- * VoicePrintGroupVerify请求参数结构体
1025
- */
1026
- export interface VoicePrintGroupVerifyRequest {
1027
- /**
1028
- * 音频格式 0: pcm, 1: wav
1029
- */
1030
- VoiceFormat: number
1031
- /**
1032
- * 音频采样率,目前支持16000,单位:Hz,必填
1033
- */
1034
- SampleRate: number
1035
- /**
1036
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1037
- */
1038
- Data: string
1039
- /**
1040
- * 分组id, 支持数字,字母,下划线,长度不超过128
1041
- */
1042
- GroupId: string
1043
- /**
1044
- * 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
1045
- */
1046
- TopN: number
1047
- }
1048
-
1049
- /**
1050
- * GetAsrVocab返回参数结构体
1051
- */
1052
- export interface GetAsrVocabResponse {
1053
- /**
1054
- * 热词表名称
1055
- */
1056
- Name?: string
1057
- /**
1058
- * 热词表描述
1059
- */
1060
- Description?: string
1061
- /**
1062
- * 热词表ID
1063
- */
1064
- VocabId?: string
1065
- /**
1066
- * 词权重列表
1067
- */
1068
- WordWeights?: Array<HotWord>
1263
+ FinalSentence?: string
1069
1264
  /**
1070
- * 词表创建时间
1265
+ * 单句中间识别结果,使用空格拆分为多个词
1266
+ 注意:此字段可能返回 null,表示取不到有效值。
1071
1267
  */
1072
- CreateTime?: string
1268
+ SliceSentence?: string
1073
1269
  /**
1074
- * 词表更新时间
1270
+ * 口语转书面语结果,开启改功能才有值
1271
+ 注意:此字段可能返回 null,表示取不到有效值。
1075
1272
  */
1076
- UpdateTime?: string
1273
+ WrittenText?: string
1077
1274
  /**
1078
- * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
1275
+ * 单句开始时间(毫秒)
1276
+ 注意:此字段可能返回 null,表示取不到有效值。
1079
1277
  */
1080
- State?: number
1278
+ StartMs?: number
1081
1279
  /**
1082
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1280
+ * 单句结束时间(毫秒)
1281
+ 注意:此字段可能返回 null,表示取不到有效值。
1083
1282
  */
1084
- RequestId?: string
1085
- }
1086
-
1087
- /**
1088
- * GetAsrVocabList请求参数结构体
1089
- */
1090
- export interface GetAsrVocabListRequest {
1283
+ EndMs?: number
1091
1284
  /**
1092
- * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
1285
+ * 单句中词个数
1286
+ 注意:此字段可能返回 null,表示取不到有效值。
1093
1287
  */
1094
- TagInfos?: Array<string>
1288
+ WordsNum?: number
1095
1289
  /**
1096
- * 分页Offset
1290
+ * 单句中词详情
1291
+ 注意:此字段可能返回 null,表示取不到有效值。
1097
1292
  */
1098
- Offset?: number
1293
+ Words?: Array<SentenceWords>
1099
1294
  /**
1100
- * 分页Limit
1295
+ * 单句语速,单位:字数/秒
1296
+ 注意:此字段可能返回 null,表示取不到有效值。
1101
1297
  */
1102
- Limit?: number
1103
- }
1104
-
1105
- /**
1106
- * GetCustomizationList返回参数结构体
1107
- */
1108
- export interface GetCustomizationListResponse {
1298
+ SpeechSpeed?: number
1109
1299
  /**
1110
- * 自学习模型数组
1300
+ * 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
1111
1301
  注意:此字段可能返回 null,表示取不到有效值。
1112
1302
  */
1113
- Data?: Array<Model>
1303
+ SpeakerId?: number
1114
1304
  /**
1115
- * 自学习模型总量
1305
+ * 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
1116
1306
  注意:此字段可能返回 null,表示取不到有效值。
1117
1307
  */
1118
- TotalCount?: number
1308
+ EmotionalEnergy?: number
1119
1309
  /**
1120
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1310
+ * 本句与上一句之间的静音时长
1311
+ 注意:此字段可能返回 null,表示取不到有效值。
1121
1312
  */
1122
- RequestId?: string
1123
- }
1124
-
1125
- /**
1126
- * VoicePrintGroupVerify返回参数结构体
1127
- */
1128
- export interface VoicePrintGroupVerifyResponse {
1313
+ SilenceTime?: number
1129
1314
  /**
1130
- * TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
1315
+ * 情绪类型(可能为空)
1316
+ 注意:此字段可能返回 null,表示取不到有效值。
1131
1317
  */
1132
- Data?: VerifyTopResult
1318
+ EmotionType?: Array<string>
1133
1319
  /**
1134
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1320
+ * 关键词识别结果列表
1321
+ 注意:此字段可能返回 null,表示取不到有效值。
1135
1322
  */
1136
- RequestId?: string
1323
+ KeyWordResults?: Array<KeyWordResult>
1137
1324
  }
1138
1325
 
1139
1326
  /**
@@ -1147,238 +1334,119 @@ export interface DownloadAsrVocabRequest {
1147
1334
  }
1148
1335
 
1149
1336
  /**
1150
- * SetVocabState请求参数结构体
1151
- */
1152
- export interface SetVocabStateRequest {
1153
- /**
1154
- * 热词表ID。
1155
- */
1156
- VocabId: string
1157
- /**
1158
- * 热词表状态,1:设为默认状态;0:设为非默认状态。
1159
- */
1160
- State: number
1161
- }
1162
-
1163
- /**
1164
- * 查询列表返回数据
1165
- */
1166
- export interface KeyWordLibListData {
1167
- /**
1168
- * 关键词表列表
1169
- 注意:此字段可能返回 null,表示取不到有效值。
1170
- */
1171
- KeyWordLibList?: Array<KeyWordLib>
1172
- /**
1173
- * 关键词列表总数
1174
- 注意:此字段可能返回 null,表示取不到有效值。
1175
- */
1176
- TotalCount?: number
1177
- }
1178
-
1179
- /**
1180
- * CloseAsyncRecognitionTask请求参数结构体
1181
- */
1182
- export interface CloseAsyncRecognitionTaskRequest {
1183
- /**
1184
- * 语音流异步识别任务的唯一标识,在创建任务时会返回
1185
- */
1186
- TaskId: number
1187
- }
1188
-
1189
- /**
1190
- * [录音文件识别](https://cloud.tencent.com/document/product/1093/37823#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)、[实时语音异步识别](https://cloud.tencent.com/document/product/1093/52061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)请求的返回数据
1191
- */
1192
- export interface Task {
1193
- /**
1194
- * 任务ID,可通过此ID在轮询接口获取识别状态与结果。TaskId数据类型为**uint64**。
1195
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
1196
- */
1197
- TaskId?: number
1198
- }
1199
-
1200
- /**
1201
- * [音频流异步识别任务列表](https://cloud.tencent.com/document/product/1093/52060#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1202
- */
1203
- export interface AsyncRecognitionTasks {
1204
- /**
1205
- * 任务列表
1206
- 注意:此字段可能返回 null,表示取不到有效值。
1207
- */
1208
- Tasks?: Array<AsyncRecognitionTaskInfo>
1209
- }
1210
-
1211
- /**
1212
- * VoicePrintVerify请求参数结构体
1337
+ * [词表内容](https://cloud.tencent.com/document/product/1093/41484#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1213
1338
  */
1214
- export interface VoicePrintVerifyRequest {
1215
- /**
1216
- * 音频格式 0: pcm, 1: wav
1217
- */
1218
- VoiceFormat: number
1339
+ export interface Vocab {
1219
1340
  /**
1220
- * 音频采样率,目前支持16000,单位:Hz,必填
1341
+ * 热词表名称
1221
1342
  */
1222
- SampleRate: number
1343
+ Name?: string
1223
1344
  /**
1224
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1345
+ * 热词表描述
1225
1346
  */
1226
- Data: string
1347
+ Description?: string
1227
1348
  /**
1228
- * 说话人id, 说话人唯一标识
1349
+ * 热词表ID
1229
1350
  */
1230
- VoicePrintId: string
1231
- }
1232
-
1233
- /**
1234
- * ModifyCustomization请求参数结构体
1235
- */
1236
- export interface ModifyCustomizationRequest {
1351
+ VocabId?: string
1237
1352
  /**
1238
- * 要修改的模型ID
1353
+ * 词权重列表
1239
1354
  */
1240
- ModelId: string
1355
+ WordWeights?: Array<HotWord>
1241
1356
  /**
1242
- * 要修改的模型名称,长度需在1-20个字符之间
1357
+ * 词表创建时间
1243
1358
  */
1244
- ModelName?: string
1359
+ CreateTime?: string
1245
1360
  /**
1246
- * 要修改的模型类型,为8k或者16k
1361
+ * 词表更新时间
1247
1362
  */
1248
- ModelType?: string
1363
+ UpdateTime?: string
1249
1364
  /**
1250
- * 要修改的模型语料的下载地址,目前仅支持腾讯云cos
1365
+ * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
1251
1366
  */
1252
- TextUrl?: string
1253
- }
1254
-
1255
- /**
1256
- * DeleteCustomization返回参数结构体
1257
- */
1258
- export interface DeleteCustomizationResponse {
1367
+ State?: number
1259
1368
  /**
1260
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1369
+ * 标签数组
1370
+ 注意:此字段可能返回 null,表示取不到有效值。
1261
1371
  */
1262
- RequestId?: string
1372
+ TagInfos?: Array<string>
1263
1373
  }
1264
1374
 
1265
1375
  /**
1266
- * [获取录音识别结果的返回参数](https://cloud.tencent.com/document/product/1093/37822#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1376
+ * 关键词表信息
1267
1377
  */
1268
- export interface TaskStatus {
1269
- /**
1270
- * 任务标识。注意:TaskId数据类型为uint64。
1271
- */
1272
- TaskId?: number
1273
- /**
1274
- * 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
1275
- */
1276
- Status?: number
1277
- /**
1278
- * 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
1279
- */
1280
- StatusStr?: string
1281
- /**
1282
- * 识别结果。
1283
- */
1284
- Result?: string
1285
- /**
1286
- * 失败原因说明。
1287
- */
1288
- ErrorMsg?: string
1289
- /**
1290
- * 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
1291
- 注意:此字段可能返回 null,表示取不到有效值。
1292
- */
1293
- ResultDetail?: Array<SentenceDetail>
1378
+ export interface KeyWordLib {
1294
1379
  /**
1295
- * 音频时长(秒)。
1380
+ * 关键词表ID
1296
1381
  注意:此字段可能返回 null,表示取不到有效值。
1297
1382
  */
1298
- AudioDuration?: number
1299
- }
1300
-
1301
- /**
1302
- * DeleteAsrVocab请求参数结构体
1303
- */
1304
- export interface DeleteAsrVocabRequest {
1383
+ KeyWordLibId?: string
1305
1384
  /**
1306
- * 热词表Id
1307
- */
1308
- VocabId: string
1309
- }
1310
-
1311
- /**
1312
- * GetCustomizationList请求参数结构体
1313
- */
1314
- export interface GetCustomizationListRequest {
1385
+ * 关键词表名称
1386
+ 注意:此字段可能返回 null,表示取不到有效值。
1387
+ */
1388
+ Name?: string
1315
1389
  /**
1316
- * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
1317
- * @deprecated
1390
+ * 关键词列表
1391
+ 注意:此字段可能返回 null,表示取不到有效值。
1318
1392
  */
1319
- TagInfos?: Array<string>
1393
+ KeyWordList?: Array<string>
1320
1394
  /**
1321
- * 分页大小,默认1000
1395
+ * 创建时间
1396
+ 注意:此字段可能返回 null,表示取不到有效值。
1322
1397
  */
1323
- Limit?: number
1398
+ CreateTime?: string
1324
1399
  /**
1325
- * 分页offset,默认0
1400
+ * 更新时间
1401
+ 注意:此字段可能返回 null,表示取不到有效值。
1326
1402
  */
1327
- Offset?: number
1403
+ UpdateTime?: string
1328
1404
  }
1329
1405
 
1330
1406
  /**
1331
- * UpdateAsrVocab返回参数结构体
1407
+ * ModifyCustomization请求参数结构体
1332
1408
  */
1333
- export interface UpdateAsrVocabResponse {
1409
+ export interface ModifyCustomizationRequest {
1334
1410
  /**
1335
- * 热词表ID
1411
+ * 要修改的模型ID
1336
1412
  */
1337
- VocabId?: string
1413
+ ModelId: string
1338
1414
  /**
1339
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1415
+ * 要修改的模型名称,长度需在1-20个字符之间
1340
1416
  */
1341
- RequestId?: string
1342
- }
1343
-
1344
- /**
1345
- * VoicePrintCount返回参数结构体
1346
- */
1347
- export interface VoicePrintCountResponse {
1417
+ ModelName?: string
1348
1418
  /**
1349
- * 统计数据
1419
+ * 要修改的模型类型,为8k或者16k
1350
1420
  */
1351
- Data?: VoicePrintCountData
1421
+ ModelType?: string
1352
1422
  /**
1353
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1423
+ * 要修改的模型语料的下载地址,目前仅支持腾讯云cos
1354
1424
  */
1355
- RequestId?: string
1425
+ TextUrl?: string
1356
1426
  }
1357
1427
 
1358
1428
  /**
1359
- * 音频声纹比对结果,包含比对分数
1429
+ * VoicePrintVerify返回参数结构体
1360
1430
  */
1361
- export interface VoicePrintCompareData {
1431
+ export interface VoicePrintVerifyResponse {
1362
1432
  /**
1363
- * 匹配度 取值范围(0.0 - 100.0)
1364
- 注意:此字段可能返回 null,表示取不到有效值。
1433
+ * 说话人验证数据
1365
1434
  */
1366
- Score?: string
1435
+ Data?: VoicePrintVerifyData
1367
1436
  /**
1368
- * 验证结果 0: 未通过 1: 通过
1369
- 注意:此字段可能返回 null,表示取不到有效值。
1437
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1370
1438
  */
1371
- Decision?: number
1439
+ RequestId?: string
1372
1440
  }
1373
1441
 
1374
1442
  /**
1375
- * VoicePrintVerify返回参数结构体
1443
+ * GetModelInfo返回参数结构体
1376
1444
  */
1377
- export interface VoicePrintVerifyResponse {
1445
+ export interface GetModelInfoResponse {
1378
1446
  /**
1379
- * 说话人验证数据
1447
+ * 模型信息
1380
1448
  */
1381
- Data?: VoicePrintVerifyData
1449
+ Data?: Model
1382
1450
  /**
1383
1451
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1384
1452
  */
@@ -1397,84 +1465,59 @@ export interface DescribeTaskStatusRequest {
1397
1465
  }
1398
1466
 
1399
1467
  /**
1400
- * [自学习模型信息](https://cloud.tencent.com/document/product/1093/90813#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1468
+ * VoicePrintCompare请求参数结构体
1401
1469
  */
1402
- export interface Model {
1403
- /**
1404
- * 模型名称
1405
- */
1406
- ModelName?: string
1407
- /**
1408
- * 模型文件名称
1409
- */
1410
- DictName?: string
1411
- /**
1412
- * 模型Id
1413
- */
1414
- ModelId?: string
1415
- /**
1416
- * 模型类型,“8k”或者”16k“
1417
- */
1418
- ModelType?: string
1470
+ export interface VoicePrintCompareRequest {
1419
1471
  /**
1420
- * 服务类型
1472
+ * 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
1421
1473
  */
1422
- ServiceType?: string
1474
+ VoiceFormat: number
1423
1475
  /**
1424
- * 模型状态:
1425
- -2:模型训练失败;
1426
- -1:已下线;
1427
- 0:训练中;
1428
- 1:已上线;
1429
- 3:上线中;
1430
- 4:下线中;
1476
+ * 音频采样率,目前仅支持16k,请填写16000
1431
1477
  */
1432
- ModelState?: number
1478
+ SampleRate: number
1433
1479
  /**
1434
- * 最后更新时间
1480
+ * 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1435
1481
  */
1436
- AtUpdated?: string
1482
+ SrcAudioData: string
1437
1483
  /**
1438
- * 标签信息
1439
- 注意:此字段可能返回 null,表示取不到有效值。
1484
+ * 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1440
1485
  */
1441
- TagInfos?: Array<string>
1486
+ DestAudioData: string
1442
1487
  }
1443
1488
 
1444
1489
  /**
1445
- * CreateAsrVocab请求参数结构体
1490
+ * DeleteCustomization请求参数结构体
1446
1491
  */
1447
- export interface CreateAsrVocabRequest {
1448
- /**
1449
- * 热词表名称,长度在1-255之间
1450
- */
1451
- Name: string
1492
+ export interface DeleteCustomizationRequest {
1452
1493
  /**
1453
- * 热词表描述,长度在0-1000之间
1494
+ * 要删除的模型ID
1454
1495
  */
1455
- Description?: string
1496
+ ModelId: string
1497
+ }
1498
+
1499
+ /**
1500
+ * [音频流异步识别](https://cloud.tencent.com/document/api/1093/37824#AsyncRecognitionTasks)任务信息
1501
+ */
1502
+ export interface AsyncRecognitionTaskInfo {
1456
1503
  /**
1457
- * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或者100,数组长度不大于1000
1458
- 注意:
1459
- - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1460
- - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1504
+ * 任务ID
1461
1505
  */
1462
- WordWeights?: Array<HotWord>
1506
+ TaskId?: number
1463
1507
  /**
1464
- * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1465
- 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1508
+ * 音频流Url
1466
1509
  */
1467
- WordWeightStr?: string
1510
+ Url?: string
1468
1511
  }
1469
1512
 
1470
1513
  /**
1471
- * GetModelInfo返回参数结构体
1514
+ * VoicePrintCount返回参数结构体
1472
1515
  */
1473
- export interface GetModelInfoResponse {
1516
+ export interface VoicePrintCountResponse {
1474
1517
  /**
1475
- * 模型信息
1518
+ * 统计数据
1476
1519
  */
1477
- Data?: Model
1520
+ Data?: VoicePrintCountData
1478
1521
  /**
1479
1522
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1480
1523
  */
@@ -1482,83 +1525,113 @@ export interface GetModelInfoResponse {
1482
1525
  }
1483
1526
 
1484
1527
  /**
1485
- * UpdateAsrVocab请求参数结构体
1528
+ * 查询列表返回数据
1486
1529
  */
1487
- export interface UpdateAsrVocabRequest {
1530
+ export interface KeyWordLibListData {
1488
1531
  /**
1489
- * 热词表ID
1532
+ * 关键词表列表
1533
+ 注意:此字段可能返回 null,表示取不到有效值。
1490
1534
  */
1491
- VocabId: string
1535
+ KeyWordLibList?: Array<KeyWordLib>
1492
1536
  /**
1493
- * 热词表名称,长度在1-255之间
1537
+ * 关键词列表总数
1538
+ 注意:此字段可能返回 null,表示取不到有效值。
1494
1539
  */
1495
- Name?: string
1540
+ TotalCount?: number
1541
+ }
1542
+
1543
+ /**
1544
+ * CloseAsyncRecognitionTask返回参数结构体
1545
+ */
1546
+ export interface CloseAsyncRecognitionTaskResponse {
1496
1547
  /**
1497
- * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或100,数组长度不大于1000 (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
1548
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1498
1549
  */
1499
- WordWeights?: Array<HotWord>
1550
+ RequestId?: string
1551
+ }
1552
+
1553
+ /**
1554
+ * VoicePrintGroupVerify返回参数结构体
1555
+ */
1556
+ export interface VoicePrintGroupVerifyResponse {
1500
1557
  /**
1501
- * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1502
- 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1503
- (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
1558
+ * TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
1504
1559
  */
1505
- WordWeightStr?: string
1560
+ Data?: VerifyTopResult
1506
1561
  /**
1507
- * 热词表描述,长度在0-1000之间
1562
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1508
1563
  */
1509
- Description?: string
1564
+ RequestId?: string
1510
1565
  }
1511
1566
 
1512
1567
  /**
1513
- * VoicePrintCount请求参数结构体
1568
+ * CreateCustomization请求参数结构体
1514
1569
  */
1515
- export interface VoicePrintCountRequest {
1570
+ export interface CreateCustomizationRequest {
1516
1571
  /**
1517
- * 分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
1572
+ * 自学习模型名称,需在1-20字符之间
1518
1573
  */
1519
- GroupId?: string
1574
+ ModelName: string
1520
1575
  /**
1521
- * 统计模式
1522
- 0: 统计所有声纹数量
1523
- 1: 统计指定分组下的声纹数量
1576
+ * 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
1524
1577
  */
1525
- CountMod?: number
1578
+ TextUrl: string
1579
+ /**
1580
+ * 自学习模型类型,填写8k或者16k
1581
+ */
1582
+ ModelType: string
1583
+ /**
1584
+ * 标签信息
1585
+ * @deprecated
1586
+ */
1587
+ TagInfos?: Array<string>
1526
1588
  }
1527
1589
 
1528
1590
  /**
1529
- * VoicePrintEnroll请求参数结构体
1591
+ * 用户用量信息
1530
1592
  */
1531
- export interface VoicePrintEnrollRequest {
1593
+ export interface UsageByDateInfo {
1532
1594
  /**
1533
- * 音频格式 0: pcm, 1: wav
1595
+ * 业务类型名称
1596
+ 注意:此字段可能返回 null,表示取不到有效值。
1534
1597
  */
1535
- VoiceFormat: number
1598
+ BizName?: string
1536
1599
  /**
1537
- * 音频采样率,目前支持16000,单位:Hz,必填
1600
+ * 识别次数
1601
+ 单位:次
1602
+ 注意:此字段可能返回 null,表示取不到有效值。
1538
1603
  */
1539
- SampleRate: number
1604
+ Count?: number
1540
1605
  /**
1541
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1606
+ * 识别时长
1607
+ 单位:秒
1608
+ 注意:此字段可能返回 null,表示取不到有效值。
1542
1609
  */
1543
- Data: string
1610
+ Duration?: number
1611
+ }
1612
+
1613
+ /**
1614
+ * UpdateAsrKeyWordLib返回参数结构体
1615
+ */
1616
+ export interface UpdateAsrKeyWordLibResponse {
1544
1617
  /**
1545
- * 说话人昵称 不超过32字节
1618
+ * 关键词表ID数据
1546
1619
  */
1547
- SpeakerNick?: string
1620
+ Data?: KeyWordLibIdData
1548
1621
  /**
1549
- * 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符
1622
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1550
1623
  */
1551
- GroupId?: string
1624
+ RequestId?: string
1552
1625
  }
1553
1626
 
1554
1627
  /**
1555
- * CreateAsrVocab返回参数结构体
1628
+ * CreateAsyncRecognitionTask返回参数结构体
1556
1629
  */
1557
- export interface CreateAsrVocabResponse {
1630
+ export interface CreateAsyncRecognitionTaskResponse {
1558
1631
  /**
1559
- * 词表ID,可用于获取词表信息
1632
+ * 请求返回结果,包含本次的任务ID(TaskId)
1560
1633
  */
1561
- VocabId?: string
1634
+ Data?: Task
1562
1635
  /**
1563
1636
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1564
1637
  */
@@ -1566,41 +1639,31 @@ export interface CreateAsrVocabResponse {
1566
1639
  }
1567
1640
 
1568
1641
  /**
1569
- * SentenceRecognition返回参数结构体
1642
+ * GetAsrKeyWordLibList请求参数结构体
1570
1643
  */
1571
- export interface SentenceRecognitionResponse {
1572
- /**
1573
- * 识别结果。
1574
- */
1575
- Result?: string
1644
+ export interface GetAsrKeyWordLibListRequest {
1576
1645
  /**
1577
- * 请求的音频时长,单位为ms
1646
+ * 分页Offset
1578
1647
  */
1579
- AudioDuration?: number
1648
+ Offset?: number
1580
1649
  /**
1581
- * 词时间戳列表的长度
1582
- 注意:此字段可能返回 null,表示取不到有效值。
1650
+ * 分页Limit
1583
1651
  */
1584
- WordSize?: number
1652
+ Limit?: number
1585
1653
  /**
1586
- * 词时间戳列表
1587
- 注意:此字段可能返回 null,表示取不到有效值。
1654
+ * 词库名称或者UIN检索
1588
1655
  */
1589
- WordList?: Array<SentenceWord>
1656
+ SpecifyNames?: Array<string>
1590
1657
  /**
1591
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1658
+ * 只看用户自己创建的
1592
1659
  */
1593
- RequestId?: string
1660
+ OnlySelf?: boolean
1594
1661
  }
1595
1662
 
1596
1663
  /**
1597
- * VoicePrintUpdate返回参数结构体
1664
+ * DeleteAsrVocab返回参数结构体
1598
1665
  */
1599
- export interface VoicePrintUpdateResponse {
1600
- /**
1601
- * 说话人基础数据
1602
- */
1603
- Data?: VoicePrintBaseData
1666
+ export interface DeleteAsrVocabResponse {
1604
1667
  /**
1605
1668
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1606
1669
  */
@@ -1608,160 +1671,181 @@ export interface VoicePrintUpdateResponse {
1608
1671
  }
1609
1672
 
1610
1673
  /**
1611
- * DeleteAsrKeyWordLib请求参数结构体
1674
+ * 关键词ID
1612
1675
  */
1613
- export interface DeleteAsrKeyWordLibRequest {
1676
+ export interface KeyWordLibIdData {
1614
1677
  /**
1615
- * 关键词表ID
1678
+ * 关键词ID
1679
+ 注意:此字段可能返回 null,表示取不到有效值。
1616
1680
  */
1617
- KeyWordLibId: string
1681
+ KeyWordLibId?: string
1618
1682
  }
1619
1683
 
1620
1684
  /**
1621
- * [说话人基础数据](https://cloud.tencent.com/document/product/1093/94483#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0),包括说话人id和说话人昵称
1685
+ * 音频声纹比对结果,包含比对分数
1622
1686
  */
1623
- export interface VoicePrintBaseData {
1687
+ export interface VoicePrintCompareData {
1624
1688
  /**
1625
- * 说话人id
1689
+ * 匹配度 取值范围(0.0 - 100.0)
1626
1690
  注意:此字段可能返回 null,表示取不到有效值。
1627
1691
  */
1628
- VoicePrintId?: string
1692
+ Score?: string
1629
1693
  /**
1630
- * 说话人昵称
1694
+ * 验证结果 0: 未通过 1: 通过
1631
1695
  注意:此字段可能返回 null,表示取不到有效值。
1632
1696
  */
1633
- SpeakerNick?: string
1697
+ Decision?: number
1634
1698
  }
1635
1699
 
1636
1700
  /**
1637
- * UpdateAsrKeyWordLib返回参数结构体
1701
+ * VoicePrintVerify请求参数结构体
1638
1702
  */
1639
- export interface UpdateAsrKeyWordLibResponse {
1703
+ export interface VoicePrintVerifyRequest {
1640
1704
  /**
1641
- * 关键词表ID数据
1705
+ * 音频格式 0: pcm, 1: wav
1642
1706
  */
1643
- Data?: KeyWordLibIdData
1707
+ VoiceFormat: number
1644
1708
  /**
1645
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1709
+ * 音频采样率,目前支持16000,单位:Hz,必填
1646
1710
  */
1647
- RequestId?: string
1711
+ SampleRate: number
1712
+ /**
1713
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1714
+ */
1715
+ Data: string
1716
+ /**
1717
+ * 说话人id, 说话人唯一标识
1718
+ */
1719
+ VoicePrintId: string
1648
1720
  }
1649
1721
 
1650
1722
  /**
1651
- * 说话人验证1:N返回结果
1723
+ * SetVocabState请求参数结构体
1652
1724
  */
1653
- export interface VerifyTopResult {
1725
+ export interface SetVocabStateRequest {
1654
1726
  /**
1655
- * 对比打分结果,按照打分降序排列返回
1656
- 注意:此字段可能返回 null,表示取不到有效值。
1727
+ * 热词表ID。
1657
1728
  */
1658
- VerifyTops?: Array<VerifyTop>
1729
+ VocabId: string
1730
+ /**
1731
+ * 热词表状态,1:设为默认状态;0:设为非默认状态。
1732
+ */
1733
+ State: number
1659
1734
  }
1660
1735
 
1661
1736
  /**
1662
- * VoicePrintCompare请求参数结构体
1737
+ * [自学习模型信息](https://cloud.tencent.com/document/product/1093/90813#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1663
1738
  */
1664
- export interface VoicePrintCompareRequest {
1739
+ export interface Model {
1665
1740
  /**
1666
- * 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
1741
+ * 模型名称
1667
1742
  */
1668
- VoiceFormat: number
1743
+ ModelName?: string
1669
1744
  /**
1670
- * 音频采样率,目前仅支持16k,请填写16000
1745
+ * 模型文件名称
1671
1746
  */
1672
- SampleRate: number
1747
+ DictName?: string
1673
1748
  /**
1674
- * 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1749
+ * 模型Id
1675
1750
  */
1676
- SrcAudioData: string
1751
+ ModelId?: string
1677
1752
  /**
1678
- * 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1753
+ * 模型类型,“8k”或者”16k
1679
1754
  */
1680
- DestAudioData: string
1681
- }
1682
-
1683
- /**
1684
- * VoicePrintCompare返回参数结构体
1685
- */
1686
- export interface VoicePrintCompareResponse {
1755
+ ModelType?: string
1687
1756
  /**
1688
- * 音频声纹比对结果,包含相似度打分
1757
+ * 服务类型
1689
1758
  */
1690
- Data?: VoicePrintCompareData
1759
+ ServiceType?: string
1691
1760
  /**
1692
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1761
+ * 模型状态:
1762
+ -2:模型训练失败;
1763
+ -1:已下线;
1764
+ 0:训练中;
1765
+ 1:已上线;
1766
+ 3:上线中;
1767
+ 4:下线中;
1693
1768
  */
1694
- RequestId?: string
1695
- }
1696
-
1697
- /**
1698
- * DeleteCustomization请求参数结构体
1699
- */
1700
- export interface DeleteCustomizationRequest {
1769
+ ModelState?: number
1701
1770
  /**
1702
- * 要删除的模型ID
1771
+ * 最后更新时间
1703
1772
  */
1704
- ModelId: string
1773
+ AtUpdated?: string
1774
+ /**
1775
+ * 标签信息
1776
+ 注意:此字段可能返回 null,表示取不到有效值。
1777
+ */
1778
+ TagInfos?: Array<string>
1705
1779
  }
1706
1780
 
1707
1781
  /**
1708
- * 声纹组对比结果top数据
1782
+ * CreateAsrVocab请求参数结构体
1709
1783
  */
1710
- export interface VerifyTop {
1784
+ export interface CreateAsrVocabRequest {
1711
1785
  /**
1712
- * 相似度打分
1713
- 注意:此字段可能返回 null,表示取不到有效值。
1786
+ * 热词表名称,长度在1-255之间
1714
1787
  */
1715
- Score?: string
1788
+ Name: string
1716
1789
  /**
1717
- * 说话人id
1718
- 注意:此字段可能返回 null,表示取不到有效值。
1790
+ * 热词表描述,长度在0-1000之间
1719
1791
  */
1720
- VoicePrintId?: string
1792
+ Description?: string
1721
1793
  /**
1722
- * 说话人昵称
1723
- 注意:此字段可能返回 null,表示取不到有效值。
1794
+ * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或者100,数组长度不大于1000
1795
+ 注意:
1796
+ - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1797
+ - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1724
1798
  */
1725
- SpeakerId?: string
1799
+ WordWeights?: Array<HotWord>
1800
+ /**
1801
+ * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1802
+ 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1803
+ */
1804
+ WordWeightStr?: string
1726
1805
  }
1727
1806
 
1728
1807
  /**
1729
- * [音频流异步识别](https://cloud.tencent.com/document/api/1093/37824#AsyncRecognitionTasks)任务信息
1808
+ * VoicePrintUpdate返回参数结构体
1730
1809
  */
1731
- export interface AsyncRecognitionTaskInfo {
1810
+ export interface VoicePrintUpdateResponse {
1732
1811
  /**
1733
- * 任务ID
1812
+ * 说话人基础数据
1734
1813
  */
1735
- TaskId?: number
1814
+ Data?: VoicePrintBaseData
1736
1815
  /**
1737
- * 音频流Url
1816
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1738
1817
  */
1739
- Url?: string
1818
+ RequestId?: string
1740
1819
  }
1741
1820
 
1742
1821
  /**
1743
- * ModifyCustomizationState返回参数结构体
1822
+ * DeleteAsrKeyWordLib请求参数结构体
1744
1823
  */
1745
- export interface ModifyCustomizationStateResponse {
1824
+ export interface DeleteAsrKeyWordLibRequest {
1746
1825
  /**
1747
- * 自学习模型ID
1826
+ * 关键词表ID
1748
1827
  */
1749
- ModelId?: string
1828
+ KeyWordLibId: string
1829
+ }
1830
+
1831
+ /**
1832
+ * GetModelInfo请求参数结构体
1833
+ */
1834
+ export interface GetModelInfoRequest {
1750
1835
  /**
1751
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1836
+ * 模型id
1752
1837
  */
1753
- RequestId?: string
1838
+ ModelId: string
1754
1839
  }
1755
1840
 
1756
1841
  /**
1757
- * DescribeAsyncRecognitionTasks返回参数结构体
1842
+ * ModifyCustomizationState返回参数结构体
1758
1843
  */
1759
- export interface DescribeAsyncRecognitionTasksResponse {
1844
+ export interface ModifyCustomizationStateResponse {
1760
1845
  /**
1761
- * 任务列表
1762
- 注意:此字段可能返回 null,表示取不到有效值。
1846
+ * 自学习模型ID
1763
1847
  */
1764
- Data?: AsyncRecognitionTasks
1848
+ ModelId?: string
1765
1849
  /**
1766
1850
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1767
1851
  */
@@ -1769,39 +1853,53 @@ export interface DescribeAsyncRecognitionTasksResponse {
1769
1853
  }
1770
1854
 
1771
1855
  /**
1772
- * GetAsrVocabList返回参数结构体
1856
+ * GetUsageByDate请求参数结构体
1773
1857
  */
1774
- export interface GetAsrVocabListResponse {
1858
+ export interface GetUsageByDateRequest {
1775
1859
  /**
1776
- * 热词表列表
1860
+ * 需要查询的业务类型名字列表
1861
+ - asr_rt 实时识别
1862
+ - asr_rec 录音文件识别
1777
1863
  */
1778
- VocabList?: Array<Vocab>
1864
+ BizNameList: Array<string>
1779
1865
  /**
1780
- * 热词列表总数
1866
+ * 查询开始时间
1867
+ 开始时间包含当天,支持 YYYY-MM-DD 日期以国内时区为准
1868
+ 开始时间到结束时间需要在3个月以内
1781
1869
  */
1782
- TotalCount?: number
1870
+ StartDate: string
1783
1871
  /**
1784
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1872
+ * 查询结束时间
1873
+ 结束时间包含当天,,支持 YYYY-MM-DD 日期以国内时区为准
1874
+ 开始时间到结束时间需要在3个月以内
1785
1875
  */
1786
- RequestId?: string
1876
+ EndDate: string
1787
1877
  }
1788
1878
 
1789
1879
  /**
1790
- * [一句话识别](https://cloud.tencent.com/document/product/1093/35646#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)返回的词时间戳
1880
+ * VoicePrintEnroll请求参数结构体
1791
1881
  */
1792
- export interface SentenceWord {
1882
+ export interface VoicePrintEnrollRequest {
1793
1883
  /**
1794
- * 词结果
1884
+ * 音频格式 0: pcm, 1: wav
1795
1885
  */
1796
- Word?: string
1886
+ VoiceFormat: number
1797
1887
  /**
1798
- * 词在音频中的开始时间
1888
+ * 音频采样率,目前支持16000,单位:Hz,必填
1799
1889
  */
1800
- StartTime?: number
1890
+ SampleRate: number
1801
1891
  /**
1802
- * 词在音频中的结束时间
1892
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1803
1893
  */
1804
- EndTime?: number
1894
+ Data: string
1895
+ /**
1896
+ * 说话人昵称 不超过32字节
1897
+ */
1898
+ SpeakerNick?: string
1899
+ /**
1900
+ * 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符
1901
+ */
1902
+ GroupId?: string
1805
1903
  }
1806
1904
 
1807
1905
  /**
@@ -1824,29 +1922,3 @@ export interface SentenceWords {
1824
1922
  */
1825
1923
  OffsetEndMs: number
1826
1924
  }
1827
-
1828
- /**
1829
- * 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1830
- */
1831
- export interface VoicePrintCountData {
1832
- /**
1833
- * 总数
1834
- 注意:此字段可能返回 null,表示取不到有效值。
1835
- */
1836
- Total?: number
1837
- /**
1838
- * 说话人id列表
1839
- 注意:此字段可能返回 null,表示取不到有效值。
1840
- */
1841
- VoicePrintList?: Array<VoicePrintBaseData>
1842
- }
1843
-
1844
- /**
1845
- * DownloadCustomization请求参数结构体
1846
- */
1847
- export interface DownloadCustomizationRequest {
1848
- /**
1849
- * 自学习模型ID
1850
- */
1851
- ModelId: string
1852
- }