tencentcloud-sdk-nodejs 4.0.940 → 4.0.942

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (72) hide show
  1. package/CHANGELOG.md +383 -0
  2. package/SERVICE_CHANGELOG.md +611 -38
  3. package/package.json +1 -1
  4. package/products.md +15 -14
  5. package/src/common/sdk_version.ts +1 -1
  6. package/src/services/as/v20180419/as_models.ts +8 -0
  7. package/src/services/asr/v20190614/asr_client.ts +71 -57
  8. package/src/services/asr/v20190614/asr_models.ts +967 -895
  9. package/src/services/cfg/v20210820/cfg_models.ts +4 -0
  10. package/src/services/cwp/v20180228/cwp_client.ts +5 -3
  11. package/src/services/cwp/v20180228/cwp_models.ts +131 -48
  12. package/src/services/dlc/v20210125/dlc_models.ts +4 -0
  13. package/src/services/dsgc/v20190723/dsgc_models.ts +1 -1
  14. package/src/services/ims/v20201229/ims_client.ts +1 -1
  15. package/src/services/ims/v20201229/ims_models.ts +3 -3
  16. package/src/services/index.ts +1 -0
  17. package/src/services/lke/v20231130/lke_client.ts +576 -478
  18. package/src/services/lke/v20231130/lke_models.ts +516 -98
  19. package/src/services/mps/v20190612/mps_models.ts +8 -3
  20. package/src/services/mqtt/index.ts +5 -0
  21. package/src/services/mqtt/v20240516/index.ts +6 -0
  22. package/src/services/mqtt/v20240516/mqtt_client.ts +275 -0
  23. package/src/services/mqtt/v20240516/mqtt_models.ts +1112 -0
  24. package/src/services/tcss/v20201101/tcss_client.ts +4 -2
  25. package/src/services/tke/v20180525/tke_client.ts +40 -16
  26. package/src/services/tke/v20180525/tke_models.ts +154 -70
  27. package/src/services/vdb/v20230616/vdb_models.ts +5 -0
  28. package/src/services/vod/v20180717/vod_client.ts +2 -1
  29. package/src/services/vod/v20180717/vod_models.ts +34 -1
  30. package/src/services/vpc/v20170312/vpc_models.ts +17 -1
  31. package/tencentcloud/common/sdk_version.d.ts +1 -1
  32. package/tencentcloud/common/sdk_version.js +1 -1
  33. package/tencentcloud/services/as/v20180419/as_models.d.ts +8 -0
  34. package/tencentcloud/services/asr/v20190614/asr_client.d.ts +5 -1
  35. package/tencentcloud/services/asr/v20190614/asr_client.js +6 -0
  36. package/tencentcloud/services/asr/v20190614/asr_models.d.ts +998 -930
  37. package/tencentcloud/services/cfg/v20210820/cfg_models.d.ts +4 -0
  38. package/tencentcloud/services/cwp/v20180228/cwp_client.d.ts +1 -1
  39. package/tencentcloud/services/cwp/v20180228/cwp_models.d.ts +128 -47
  40. package/tencentcloud/services/dlc/v20210125/dlc_models.d.ts +4 -0
  41. package/tencentcloud/services/dsgc/v20190723/dsgc_models.d.ts +1 -1
  42. package/tencentcloud/services/ims/v20201229/ims_client.d.ts +1 -1
  43. package/tencentcloud/services/ims/v20201229/ims_client.js +1 -1
  44. package/tencentcloud/services/ims/v20201229/ims_models.d.ts +3 -3
  45. package/tencentcloud/services/index.d.ts +1 -0
  46. package/tencentcloud/services/index.js +2 -0
  47. package/tencentcloud/services/lke/v20231130/lke_client.d.ts +195 -163
  48. package/tencentcloud/services/lke/v20231130/lke_client.js +288 -240
  49. package/tencentcloud/services/lke/v20231130/lke_models.d.ts +497 -97
  50. package/tencentcloud/services/mps/v20190612/mps_models.d.ts +7 -2
  51. package/tencentcloud/services/mqtt/index.d.ts +6 -0
  52. package/tencentcloud/services/mqtt/index.js +7 -0
  53. package/tencentcloud/services/mqtt/v20240516/index.d.ts +6 -0
  54. package/tencentcloud/services/mqtt/v20240516/index.js +9 -0
  55. package/tencentcloud/services/mqtt/v20240516/mqtt_client.d.ts +95 -0
  56. package/tencentcloud/services/mqtt/v20240516/mqtt_client.js +154 -0
  57. package/tencentcloud/services/mqtt/v20240516/mqtt_models.d.ts +1051 -0
  58. package/tencentcloud/services/mqtt/v20240516/mqtt_models.js +18 -0
  59. package/tencentcloud/services/tcss/v20201101/tcss_client.d.ts +3 -1
  60. package/tencentcloud/services/tcss/v20201101/tcss_client.js +3 -1
  61. package/tencentcloud/services/tke/v20180525/tke_client.d.ts +13 -5
  62. package/tencentcloud/services/tke/v20180525/tke_client.js +18 -6
  63. package/tencentcloud/services/tke/v20180525/tke_models.d.ts +150 -70
  64. package/tencentcloud/services/vdb/v20230616/vdb_models.d.ts +5 -0
  65. package/tencentcloud/services/vod/v20180717/vod_client.d.ts +1 -1
  66. package/tencentcloud/services/vod/v20180717/vod_client.js +1 -1
  67. package/tencentcloud/services/vod/v20180717/vod_models.d.ts +33 -1
  68. package/tencentcloud/services/vpc/v20170312/vpc_models.d.ts +17 -1
  69. package/test/asr.v20190614.test.js +10 -0
  70. package/test/lke.v20231130.test.js +238 -158
  71. package/test/mqtt.v20240516.test.js +211 -0
  72. package/test/tke.v20180525.test.js +24 -4
@@ -1,16 +1,3 @@
1
- /**
2
- * SetVocabState返回参数结构体
3
- */
4
- export interface SetVocabStateResponse {
5
- /**
6
- * 热词表ID
7
- */
8
- VocabId?: string;
9
- /**
10
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
11
- */
12
- RequestId?: string;
13
- }
14
1
  /**
15
2
  * CreateCustomization返回参数结构体
16
3
  */
@@ -24,26 +11,6 @@ export interface CreateCustomizationResponse {
24
11
  */
25
12
  RequestId?: string;
26
13
  }
27
- /**
28
- * VoicePrintDelete请求参数结构体
29
- */
30
- export interface VoicePrintDeleteRequest {
31
- /**
32
- * 说话人id,说话人唯一标识
33
- */
34
- VoicePrintId?: string;
35
- /**
36
- * 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
37
- */
38
- GroupId?: string;
39
- /**
40
- * 删除模式:
41
- 0.默认值,删除该条声纹
42
- 1.从分组中删除该条声纹,声纹本身不删除
43
- 2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
44
- */
45
- DelMod?: number;
46
- }
47
14
  /**
48
15
  * 关键字识别结果
49
16
  */
@@ -64,10 +31,6 @@ export interface KeyWordResult {
64
31
  */
65
32
  KeyWords?: Array<string>;
66
33
  }
67
- /**
68
- * DescribeAsyncRecognitionTasks请求参数结构体
69
- */
70
- export declare type DescribeAsyncRecognitionTasksRequest = null;
71
34
  /**
72
35
  * ModifyCustomizationState请求参数结构体
73
36
  */
@@ -82,176 +45,194 @@ export interface ModifyCustomizationStateRequest {
82
45
  ToState: number;
83
46
  }
84
47
  /**
85
- * GetAsrKeyWordLibList返回参数结构体
48
+ * CreateRecTask返回参数结构体
86
49
  */
87
- export interface GetAsrKeyWordLibListResponse {
50
+ export interface CreateRecTaskResponse {
88
51
  /**
89
- * 关键词列表返回数据
52
+ * 录音文件识别的请求返回结果,包含结果查询需要的TaskId。
53
+ **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
54
+
90
55
  */
91
- Data?: KeyWordLibListData;
56
+ Data?: Task;
92
57
  /**
93
58
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
94
59
  */
95
60
  RequestId?: string;
96
61
  }
97
62
  /**
98
- * VoicePrintEnroll返回参数结构体
63
+ * UpdateAsrVocab返回参数结构体
99
64
  */
100
- export interface VoicePrintEnrollResponse {
65
+ export interface UpdateAsrVocabResponse {
101
66
  /**
102
- * 说话人基本数据
67
+ * 热词表ID
103
68
  */
104
- Data?: VoicePrintBaseData;
69
+ VocabId?: string;
105
70
  /**
106
71
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
107
72
  */
108
73
  RequestId?: string;
109
74
  }
110
75
  /**
111
- * VoicePrintUpdate请求参数结构体
76
+ * DeleteAsrKeyWordLib返回参数结构体
112
77
  */
113
- export interface VoicePrintUpdateRequest {
78
+ export interface DeleteAsrKeyWordLibResponse {
79
+ /**
80
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
81
+ */
82
+ RequestId?: string;
83
+ }
84
+ /**
85
+ * CreateAsrKeyWordLib请求参数结构体
86
+ */
87
+ export interface CreateAsrKeyWordLibRequest {
88
+ /**
89
+ * 词表名称,长度在1-20之间
90
+ 仅限中英文数字-_
91
+ */
92
+ Name: string;
93
+ /**
94
+ * 词文件(纯文本文件)的二进制base64编码,以行分隔
95
+ 格式要求:TXT
96
+ 每行只有一个词,不满足格式则报错无法上传
97
+ 每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
98
+ 注意不要有空行,尤其是最后一行
99
+ */
100
+ KeyWordFile?: string;
101
+ }
102
+ /**
103
+ * VoicePrintGroupVerify请求参数结构体
104
+ */
105
+ export interface VoicePrintGroupVerifyRequest {
114
106
  /**
115
107
  * 音频格式 0: pcm, 1: wav
116
108
  */
117
109
  VoiceFormat: number;
118
110
  /**
119
- * 音频采样率 目前仅支持16000 单位Hz
111
+ * 音频采样率,目前支持16000,单位:Hz,必填
120
112
  */
121
113
  SampleRate: number;
122
- /**
123
- * 说话人id, 说话人唯一标识
124
- */
125
- VoicePrintId: string;
126
114
  /**
127
115
  * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
128
116
  */
129
117
  Data: string;
130
118
  /**
131
- * 说话人昵称 不超过32字节
119
+ * 分组id, 支持数字,字母,下划线,长度不超过128
132
120
  */
133
- SpeakerNick?: string;
121
+ GroupId: string;
122
+ /**
123
+ * 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
124
+ */
125
+ TopN: number;
134
126
  }
135
127
  /**
136
- * CreateAsrKeyWordLib返回参数结构体
128
+ * GetCustomizationList返回参数结构体
137
129
  */
138
- export interface CreateAsrKeyWordLibResponse {
130
+ export interface GetCustomizationListResponse {
139
131
  /**
140
- * 词表ID数据
132
+ * 自学习模型数组
133
+ 注意:此字段可能返回 null,表示取不到有效值。
141
134
  */
142
- Data?: KeyWordLibIdData;
135
+ Data?: Array<Model>;
136
+ /**
137
+ * 自学习模型总量
138
+ 注意:此字段可能返回 null,表示取不到有效值。
139
+ */
140
+ TotalCount?: number;
143
141
  /**
144
142
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
145
143
  */
146
144
  RequestId?: string;
147
145
  }
148
146
  /**
149
- * CreateAsyncRecognitionTask请求参数结构体
147
+ * CloseAsyncRecognitionTask请求参数结构体
150
148
  */
151
- export interface CreateAsyncRecognitionTaskRequest {
152
- /**
153
- * 引擎模型类型。
154
- • 16k_zh:中文普通话通用;
155
- • 16k_en:英语;
156
- • 16k_yue:粤语;
157
- • 16k_id:印度尼西亚语;
158
- • 16k_fil:菲律宾语;
159
- • 16k_th:泰语;
160
- • 16k_pt:葡萄牙语;
161
- • 16k_tr:土耳其语;
162
- • 16k_ar:阿拉伯语;
163
- • 16k_es:西班牙语;
164
- • 16k_hi:印地语;
165
- • 16k_fr:法语;
166
- • 16k_de:德语;
167
- */
168
- EngineType: string;
169
- /**
170
- * 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
171
- */
172
- Url: string;
149
+ export interface CloseAsyncRecognitionTaskRequest {
173
150
  /**
174
- * 支持HTTP和HTTPS协议,用于接收识别结果,您需要自行搭建公网可调用的服务。回调格式&内容详见:[语音流异步识别回调说明](https://cloud.tencent.com/document/product/1093/52633)
151
+ * 语音流异步识别任务的唯一标识,在创建任务时会返回
175
152
  */
176
- CallbackUrl: string;
153
+ TaskId: number;
154
+ }
155
+ /**
156
+ * [录音文件识别](https://cloud.tencent.com/document/product/1093/37823#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)、[实时语音异步识别](https://cloud.tencent.com/document/product/1093/52061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)请求的返回数据
157
+ */
158
+ export interface Task {
177
159
  /**
178
- * 用于生成回调通知中的签名
160
+ * 任务ID,可通过此ID在轮询接口获取识别状态与结果。TaskId数据类型为**uint64**。
161
+ **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
179
162
  */
180
- SignToken?: string;
163
+ TaskId?: number;
164
+ }
165
+ /**
166
+ * [音频流异步识别任务列表](https://cloud.tencent.com/document/product/1093/52060#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
167
+ */
168
+ export interface AsyncRecognitionTasks {
181
169
  /**
182
- * 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0
170
+ * 任务列表
171
+ 注意:此字段可能返回 null,表示取不到有效值。
183
172
  */
184
- FilterDirty?: number;
173
+ Tasks?: Array<AsyncRecognitionTaskInfo>;
174
+ }
175
+ /**
176
+ * DeleteCustomization返回参数结构体
177
+ */
178
+ export interface DeleteCustomizationResponse {
185
179
  /**
186
- * 是否过语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0
180
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
187
181
  */
188
- FilterModal?: number;
182
+ RequestId?: string;
183
+ }
184
+ /**
185
+ * [获取录音识别结果的返回参数](https://cloud.tencent.com/document/product/1093/37822#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
186
+ */
187
+ export interface TaskStatus {
189
188
  /**
190
- * 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认为0
189
+ * 任务标识。注意:TaskId数据类型为uint64。
191
190
  */
192
- FilterPunc?: number;
191
+ TaskId?: number;
193
192
  /**
194
- * 是否进行阿拉伯数字智能转换。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字。默认值为1
193
+ * 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
195
194
  */
196
- ConvertNumMode?: number;
195
+ Status?: number;
197
196
  /**
198
- * 是否显示词级别时间戳。0:不显示;1:显示,不包含标点时间戳,2:显示,包含标点时间戳。默认为0
197
+ * 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
199
198
  */
200
- WordInfo?: number;
199
+ StatusStr?: string;
201
200
  /**
202
- * 热词id。用于调用对应的热词表,如果在调用语音识别服务时,不进行单独的热词id设置,自动生效默认热词;如果进行了单独的热词id设置,那么将生效单独设置的热词id。
201
+ * 识别结果。
203
202
  */
204
- HotwordId?: string;
203
+ Result?: string;
205
204
  /**
206
- * 回调数据中,是否需要对应音频数据。
205
+ * 失败原因说明。
207
206
  */
208
- AudioData?: boolean;
209
- }
210
- /**
211
- * [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
212
- */
213
- export interface HotWord {
207
+ ErrorMsg?: string;
214
208
  /**
215
- * 热词
209
+ * 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
216
210
  注意:此字段可能返回 null,表示取不到有效值。
217
211
  */
218
- Word: string;
212
+ ResultDetail?: Array<SentenceDetail>;
219
213
  /**
220
- * 权重
214
+ * 音频时长(秒)。
221
215
  注意:此字段可能返回 null,表示取不到有效值。
222
216
  */
223
- Weight: number;
224
- }
225
- /**
226
- * GetModelInfo请求参数结构体
227
- */
228
- export interface GetModelInfoRequest {
229
- /**
230
- * 模型id
231
- */
232
- ModelId: string;
217
+ AudioDuration?: number;
233
218
  }
234
219
  /**
235
- * GetAsrVocab请求参数结构体
220
+ * GetCustomizationList请求参数结构体
236
221
  */
237
- export interface GetAsrVocabRequest {
222
+ export interface GetCustomizationListRequest {
238
223
  /**
239
- * 热词表ID
224
+ * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
225
+ * @deprecated
240
226
  */
241
- VocabId: string;
242
- }
243
- /**
244
- * DescribeTaskStatus返回参数结构体
245
- */
246
- export interface DescribeTaskStatusResponse {
227
+ TagInfos?: Array<string>;
247
228
  /**
248
- * 录音文件识别的请求返回结果。
229
+ * 分页大小,默认1000
249
230
  */
250
- Data?: TaskStatus;
231
+ Limit?: number;
251
232
  /**
252
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
233
+ * 分页offset,默认0
253
234
  */
254
- RequestId?: string;
235
+ Offset?: number;
255
236
  }
256
237
  /**
257
238
  * SentenceRecognition请求参数结构体
@@ -375,304 +356,294 @@ export interface SentenceRecognitionRequest {
375
356
  InputSampleRate?: number;
376
357
  }
377
358
  /**
378
- * [说话人验证数据](https://cloud.tencent.com/document/product/1093/94481#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
359
+ * VoicePrintCount请求参数结构体
379
360
  */
380
- export interface VoicePrintVerifyData {
361
+ export interface VoicePrintCountRequest {
381
362
  /**
382
- * 说话人id
383
- 注意:此字段可能返回 null,表示取不到有效值。
363
+ * 分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
384
364
  */
385
- VoicePrintId?: string;
365
+ GroupId?: string;
386
366
  /**
387
- * 匹配度 取值范围(0.0 - 100.0)
388
- 注意:此字段可能返回 null,表示取不到有效值。
367
+ * 统计模式
368
+ 0: 统计所有声纹数量
369
+ 1: 统计指定分组下的声纹数量
389
370
  */
390
- Score?: string;
391
- /**
392
- * 验证结果 0: 未通过 1: 通过
393
- 注意:此字段可能返回 null,表示取不到有效值。
394
- */
395
- Decision?: number;
371
+ CountMod?: number;
396
372
  }
397
373
  /**
398
- * 关键词表信息
374
+ * VoicePrintCompare返回参数结构体
399
375
  */
400
- export interface KeyWordLib {
376
+ export interface VoicePrintCompareResponse {
401
377
  /**
402
- * 关键词表ID
403
- 注意:此字段可能返回 null,表示取不到有效值。
378
+ * 音频声纹比对结果,包含相似度打分
404
379
  */
405
- KeyWordLibId?: string;
380
+ Data?: VoicePrintCompareData;
406
381
  /**
407
- * 关键词表名称
408
- 注意:此字段可能返回 null,表示取不到有效值。
382
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
409
383
  */
410
- Name?: string;
384
+ RequestId?: string;
385
+ }
386
+ /**
387
+ * 声纹组对比结果top数据
388
+ */
389
+ export interface VerifyTop {
411
390
  /**
412
- * 关键词列表
391
+ * 相似度打分
413
392
  注意:此字段可能返回 null,表示取不到有效值。
414
393
  */
415
- KeyWordList?: Array<string>;
394
+ Score?: string;
416
395
  /**
417
- * 创建时间
396
+ * 说话人id
418
397
  注意:此字段可能返回 null,表示取不到有效值。
419
398
  */
420
- CreateTime?: string;
399
+ VoicePrintId?: string;
421
400
  /**
422
- * 更新时间
401
+ * 说话人昵称
423
402
  注意:此字段可能返回 null,表示取不到有效值。
424
403
  */
425
- UpdateTime?: string;
404
+ SpeakerId?: string;
426
405
  }
427
406
  /**
428
- * CloseAsyncRecognitionTask返回参数结构体
407
+ * SetVocabState返回参数结构体
429
408
  */
430
- export interface CloseAsyncRecognitionTaskResponse {
409
+ export interface SetVocabStateResponse {
410
+ /**
411
+ * 热词表ID
412
+ */
413
+ VocabId?: string;
431
414
  /**
432
415
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
433
416
  */
434
417
  RequestId?: string;
435
418
  }
436
419
  /**
437
- * 单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。
420
+ * 用户用量信息
438
421
  */
439
- export interface SentenceDetail {
440
- /**
441
- * 单句最终识别结果
442
- 注意:此字段可能返回 null,表示取不到有效值。
443
- */
444
- FinalSentence?: string;
445
- /**
446
- * 单句中间识别结果,使用空格拆分为多个词
447
- 注意:此字段可能返回 null,表示取不到有效值。
448
- */
449
- SliceSentence?: string;
450
- /**
451
- * 口语转书面语结果,开启改功能才有值
452
- 注意:此字段可能返回 null,表示取不到有效值。
453
- */
454
- WrittenText?: string;
455
- /**
456
- * 单句开始时间(毫秒)
457
- 注意:此字段可能返回 null,表示取不到有效值。
458
- */
459
- StartMs?: number;
460
- /**
461
- * 单句结束时间(毫秒)
462
- 注意:此字段可能返回 null,表示取不到有效值。
463
- */
464
- EndMs?: number;
465
- /**
466
- * 单句中词个数
467
- 注意:此字段可能返回 null,表示取不到有效值。
468
- */
469
- WordsNum?: number;
470
- /**
471
- * 单句中词详情
472
- 注意:此字段可能返回 null,表示取不到有效值。
473
- */
474
- Words?: Array<SentenceWords>;
475
- /**
476
- * 单句语速,单位:字数/秒
477
- 注意:此字段可能返回 null,表示取不到有效值。
478
- */
479
- SpeechSpeed?: number;
480
- /**
481
- * 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
482
- 注意:此字段可能返回 null,表示取不到有效值。
483
- */
484
- SpeakerId?: number;
422
+ export interface UsageByDateInfoData {
485
423
  /**
486
- * 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
424
+ * 用量信息列表
487
425
  注意:此字段可能返回 null,表示取不到有效值。
488
426
  */
489
- EmotionalEnergy?: number;
427
+ UsageByDateInfoList?: Array<UsageByDateInfo>;
428
+ }
429
+ /**
430
+ * VoicePrintDelete请求参数结构体
431
+ */
432
+ export interface VoicePrintDeleteRequest {
490
433
  /**
491
- * 本句与上一句之间的静音时长
492
- 注意:此字段可能返回 null,表示取不到有效值。
434
+ * 说话人id,说话人唯一标识
493
435
  */
494
- SilenceTime?: number;
436
+ VoicePrintId?: string;
495
437
  /**
496
- * 情绪类型(可能为空)
497
- 注意:此字段可能返回 null,表示取不到有效值。
438
+ * 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
498
439
  */
499
- EmotionType?: Array<string>;
440
+ GroupId?: string;
500
441
  /**
501
- * 关键词识别结果列表
502
- 注意:此字段可能返回 null,表示取不到有效值。
442
+ * 删除模式:
443
+ 0.默认值,删除该条声纹
444
+ 1.从分组中删除该条声纹,声纹本身不删除
445
+ 2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
503
446
  */
504
- KeyWordResults?: Array<KeyWordResult>;
447
+ DelMod?: number;
505
448
  }
506
449
  /**
507
- * CreateCustomization请求参数结构体
450
+ * DescribeAsyncRecognitionTasks请求参数结构体
508
451
  */
509
- export interface CreateCustomizationRequest {
452
+ export declare type DescribeAsyncRecognitionTasksRequest = null;
453
+ /**
454
+ * GetAsrKeyWordLibList返回参数结构体
455
+ */
456
+ export interface GetAsrKeyWordLibListResponse {
510
457
  /**
511
- * 自学习模型名称,需在1-20字符之间
458
+ * 关键词列表返回数据
512
459
  */
513
- ModelName: string;
460
+ Data?: KeyWordLibListData;
514
461
  /**
515
- * 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
462
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
516
463
  */
517
- TextUrl: string;
464
+ RequestId?: string;
465
+ }
466
+ /**
467
+ * VoicePrintEnroll返回参数结构体
468
+ */
469
+ export interface VoicePrintEnrollResponse {
518
470
  /**
519
- * 自学习模型类型,填写8k或者16k
471
+ * 说话人基本数据
520
472
  */
521
- ModelType: string;
473
+ Data?: VoicePrintBaseData;
522
474
  /**
523
- * 标签信息
524
- * @deprecated
475
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
525
476
  */
526
- TagInfos?: Array<string>;
477
+ RequestId?: string;
527
478
  }
528
479
  /**
529
- * DownloadAsrVocab返回参数结构体
480
+ * CreateAsrKeyWordLib返回参数结构体
530
481
  */
531
- export interface DownloadAsrVocabResponse {
532
- /**
533
- * 词表ID。
534
- */
535
- VocabId?: string;
482
+ export interface CreateAsrKeyWordLibResponse {
536
483
  /**
537
- * 词表权重文件形式的base64值。
484
+ * 词表ID数据
538
485
  */
539
- WordWeightStr?: string;
486
+ Data?: KeyWordLibIdData;
540
487
  /**
541
488
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
542
489
  */
543
490
  RequestId?: string;
544
491
  }
545
492
  /**
546
- * [词表内容](https://cloud.tencent.com/document/product/1093/41484#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
493
+ * CreateAsyncRecognitionTask请求参数结构体
547
494
  */
548
- export interface Vocab {
495
+ export interface CreateAsyncRecognitionTaskRequest {
549
496
  /**
550
- * 热词表名称
497
+ * 引擎模型类型。
498
+ • 16k_zh:中文普通话通用;
499
+ • 16k_en:英语;
500
+ • 16k_yue:粤语;
501
+ • 16k_id:印度尼西亚语;
502
+ • 16k_fil:菲律宾语;
503
+ • 16k_th:泰语;
504
+ • 16k_pt:葡萄牙语;
505
+ • 16k_tr:土耳其语;
506
+ • 16k_ar:阿拉伯语;
507
+ • 16k_es:西班牙语;
508
+ • 16k_hi:印地语;
509
+ • 16k_fr:法语;
510
+ • 16k_de:德语;
551
511
  */
552
- Name?: string;
512
+ EngineType: string;
553
513
  /**
554
- * 热词表描述
514
+ * 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
555
515
  */
556
- Description?: string;
516
+ Url: string;
557
517
  /**
558
- * 热词表ID
518
+ * 支持HTTP和HTTPS协议,用于接收识别结果,您需要自行搭建公网可调用的服务。回调格式&内容详见:[语音流异步识别回调说明](https://cloud.tencent.com/document/product/1093/52633)
559
519
  */
560
- VocabId?: string;
520
+ CallbackUrl: string;
561
521
  /**
562
- * 词权重列表
522
+ * 用于生成回调通知中的签名
563
523
  */
564
- WordWeights?: Array<HotWord>;
524
+ SignToken?: string;
565
525
  /**
566
- * 词表创建时间
526
+ * 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0
567
527
  */
568
- CreateTime?: string;
528
+ FilterDirty?: number;
569
529
  /**
570
- * 词表更新时间
530
+ * 是否过语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0
571
531
  */
572
- UpdateTime?: string;
532
+ FilterModal?: number;
573
533
  /**
574
- * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
534
+ * 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认为0
575
535
  */
576
- State?: number;
536
+ FilterPunc?: number;
577
537
  /**
578
- * 标签数组
579
- 注意:此字段可能返回 null,表示取不到有效值。
538
+ * 是否进行阿拉伯数字智能转换。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字。默认值为1
580
539
  */
581
- TagInfos?: Array<string>;
582
- }
583
- /**
584
- * CreateRecTask返回参数结构体
585
- */
586
- export interface CreateRecTaskResponse {
540
+ ConvertNumMode?: number;
587
541
  /**
588
- * 录音文件识别的请求返回结果,包含结果查询需要的TaskId。
589
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
590
-
542
+ * 是否显示词级别时间戳。0:不显示;1:显示,不包含标点时间戳,2:显示,包含标点时间戳。默认为0
591
543
  */
592
- Data?: Task;
544
+ WordInfo?: number;
593
545
  /**
594
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId
546
+ * 热词id。用于调用对应的热词表,如果在调用语音识别服务时,不进行单独的热词id设置,自动生效默认热词;如果进行了单独的热词id设置,那么将生效单独设置的热词id
595
547
  */
596
- RequestId?: string;
548
+ HotwordId?: string;
549
+ /**
550
+ * 回调数据中,是否需要对应音频数据。
551
+ */
552
+ AudioData?: boolean;
597
553
  }
598
554
  /**
599
- * UpdateAsrKeyWordLib请求参数结构体
555
+ * GetAsrVocab请求参数结构体
600
556
  */
601
- export interface UpdateAsrKeyWordLibRequest {
602
- /**
603
- * 关键词表ID
604
- */
605
- KeyWordLibId: string;
606
- /**
607
- * 词表名称,长度在1-20之间
608
- 仅限中英文数字-_
609
- */
610
- Name?: string;
557
+ export interface GetAsrVocabRequest {
611
558
  /**
612
- * - 词文件(纯文本文件)以行分隔 ,进行二进制base64编码
613
- - 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
614
- - 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
615
- - 此参数为空则只更新词表名称
559
+ * 热词表ID
616
560
  */
617
- KeyWordFile?: string;
561
+ VocabId: string;
618
562
  }
619
563
  /**
620
- * ModifyCustomization返回参数结构体
564
+ * DescribeTaskStatus返回参数结构体
621
565
  */
622
- export interface ModifyCustomizationResponse {
566
+ export interface DescribeTaskStatusResponse {
567
+ /**
568
+ * 录音文件识别的请求返回结果。
569
+ */
570
+ Data?: TaskStatus;
623
571
  /**
624
572
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
625
573
  */
626
574
  RequestId?: string;
627
575
  }
628
576
  /**
629
- * DeleteAsrKeyWordLib返回参数结构体
577
+ * [说话人验证数据](https://cloud.tencent.com/document/product/1093/94481#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
630
578
  */
631
- export interface DeleteAsrKeyWordLibResponse {
579
+ export interface VoicePrintVerifyData {
632
580
  /**
633
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
581
+ * 说话人id
582
+ 注意:此字段可能返回 null,表示取不到有效值。
634
583
  */
635
- RequestId?: string;
584
+ VoicePrintId?: string;
585
+ /**
586
+ * 匹配度 取值范围(0.0 - 100.0)
587
+ 注意:此字段可能返回 null,表示取不到有效值。
588
+ */
589
+ Score?: string;
590
+ /**
591
+ * 验证结果 0: 未通过 1: 通过
592
+ 注意:此字段可能返回 null,表示取不到有效值。
593
+ */
594
+ Decision?: number;
636
595
  }
637
596
  /**
638
- * DeleteAsrVocab返回参数结构体
597
+ * [一句话识别](https://cloud.tencent.com/document/product/1093/35646#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)返回的词时间戳
639
598
  */
640
- export interface DeleteAsrVocabResponse {
599
+ export interface SentenceWord {
641
600
  /**
642
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
601
+ * 词结果
643
602
  */
644
- RequestId?: string;
603
+ Word?: string;
604
+ /**
605
+ * 词在音频中的开始时间
606
+ */
607
+ StartTime?: number;
608
+ /**
609
+ * 词在音频中的结束时间
610
+ */
611
+ EndTime?: number;
645
612
  }
646
613
  /**
647
- * CreateAsyncRecognitionTask返回参数结构体
614
+ * DownloadAsrVocab返回参数结构体
648
615
  */
649
- export interface CreateAsyncRecognitionTaskResponse {
616
+ export interface DownloadAsrVocabResponse {
650
617
  /**
651
- * 请求返回结果,包含本次的任务ID(TaskId)
618
+ * 词表ID
652
619
  */
653
- Data?: Task;
620
+ VocabId?: string;
621
+ /**
622
+ * 词表权重文件形式的base64值。
623
+ */
624
+ WordWeightStr?: string;
654
625
  /**
655
626
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
656
627
  */
657
628
  RequestId?: string;
658
629
  }
659
630
  /**
660
- * VoicePrintDelete返回参数结构体
631
+ * ModifyCustomization返回参数结构体
661
632
  */
662
- export interface VoicePrintDeleteResponse {
663
- /**
664
- * 说话人基本信息
665
- */
666
- Data?: VoicePrintBaseData;
633
+ export interface ModifyCustomizationResponse {
667
634
  /**
668
635
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
669
636
  */
670
637
  RequestId?: string;
671
638
  }
672
639
  /**
673
- * GetAsrKeyWordLibList请求参数结构体
640
+ * GetAsrVocabList请求参数结构体
674
641
  */
675
- export interface GetAsrKeyWordLibListRequest {
642
+ export interface GetAsrVocabListRequest {
643
+ /**
644
+ * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
645
+ */
646
+ TagInfos?: Array<string>;
676
647
  /**
677
648
  * 分页Offset
678
649
  */
@@ -681,317 +652,187 @@ export interface GetAsrKeyWordLibListRequest {
681
652
  * 分页Limit
682
653
  */
683
654
  Limit?: number;
655
+ }
656
+ /**
657
+ * 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
658
+ */
659
+ export interface VoicePrintCountData {
684
660
  /**
685
- * 词库名称或者UIN检索
661
+ * 总数
662
+ 注意:此字段可能返回 null,表示取不到有效值。
686
663
  */
687
- SpecifyNames?: Array<string>;
664
+ Total?: number;
688
665
  /**
689
- * 只看用户自己创建的
666
+ * 说话人id列表
667
+ 注意:此字段可能返回 null,表示取不到有效值。
690
668
  */
691
- OnlySelf?: boolean;
669
+ VoicePrintList?: Array<VoicePrintBaseData>;
692
670
  }
693
671
  /**
694
- * CreateAsrKeyWordLib请求参数结构体
672
+ * VoicePrintUpdate请求参数结构体
695
673
  */
696
- export interface CreateAsrKeyWordLibRequest {
674
+ export interface VoicePrintUpdateRequest {
697
675
  /**
698
- * 词表名称,长度在1-20之间
699
- 仅限中英文数字-_
676
+ * 音频格式 0: pcm, 1: wav
700
677
  */
701
- Name: string;
678
+ VoiceFormat: number;
702
679
  /**
703
- * 词文件(纯文本文件)的二进制base64编码,以行分隔
704
- 格式要求:TXT
705
- 每行只有一个词,不满足格式则报错无法上传
706
- 每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
707
- 注意不要有空行,尤其是最后一行
680
+ * 音频采样率 目前仅支持16000 单位Hz
708
681
  */
709
- KeyWordFile?: string;
710
- }
711
- /**
712
- * DownloadCustomization返回参数结构体
713
- */
714
- export interface DownloadCustomizationResponse {
682
+ SampleRate: number;
715
683
  /**
716
- * 下载地址
684
+ * 说话人id, 说话人唯一标识
717
685
  */
718
- DownloadUrl?: string;
686
+ VoicePrintId: string;
719
687
  /**
720
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
688
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
721
689
  */
722
- RequestId?: string;
690
+ Data: string;
691
+ /**
692
+ * 说话人昵称 不超过32字节
693
+ */
694
+ SpeakerNick?: string;
723
695
  }
724
696
  /**
725
- * CreateRecTask请求参数结构体
697
+ * DeleteAsrVocab请求参数结构体
726
698
  */
727
- export interface CreateRecTaskRequest {
699
+ export interface DeleteAsrVocabRequest {
728
700
  /**
729
- * 引擎模型类型
730
- 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
731
-
732
- 电话通讯场景引擎:
733
- **注意:电话通讯场景,请务必使用以下8k引擎**
734
- • 8k_zh:中文电话通讯;
735
- • 8k_en:英文电话通讯;
736
- • **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
737
-
738
- 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
739
-
740
- 通用场景引擎:
741
- **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
742
- • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
743
- • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
744
- • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
745
- • **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
746
- • **16k_en:**英语;
747
- • **16k_yue:**粤语;
748
- • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
749
- • **16k_ja:**日语;
750
- • **16k_ko:**韩语;
751
- • **16k_vi:**越南语;
752
- • **16k_ms:**马来语;
753
- • **16k_id:**印度尼西亚语;
754
- • **16k_fil:**菲律宾语;
755
- • **16k_th:**泰语;
756
- • **16k_pt:**葡萄牙语;
757
- • **16k_tr:**土耳其语;
758
- • **16k_ar:**阿拉伯语;
759
- • **16k_es:**西班牙语;
760
- • **16k_hi:**印地语;
761
- • **16k_fr:**法语;
762
- • **16k_zh_medical:**中文医疗引擎;
763
- • **16k_de:**德语;
701
+ * 热词表Id
764
702
  */
765
- EngineModelType: string;
703
+ VocabId: string;
704
+ }
705
+ /**
706
+ * UpdateAsrVocab请求参数结构体
707
+ */
708
+ export interface UpdateAsrVocabRequest {
766
709
  /**
767
- * 识别声道数
768
- 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
769
- 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
770
-
771
- 注意:
772
- • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
773
- • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
710
+ * 热词表ID
774
711
  */
775
- ChannelNum: number;
712
+ VocabId: string;
776
713
  /**
777
- * 识别结果返回样式
778
- 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
779
- 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
780
- 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
781
- 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
782
- 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
783
- 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
784
-
785
- 注意:
786
- 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
787
- 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
714
+ * 热词表名称,长度在1-255之间
788
715
  */
789
- ResTextFormat: number;
716
+ Name?: string;
790
717
  /**
791
- * 音频数据来源
792
- 0:音频URL;
793
- 1:音频数据(post body)
718
+ * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或100,数组长度不大于1000 (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
794
719
  */
795
- SourceType: number;
720
+ WordWeights?: Array<HotWord>;
796
721
  /**
797
- * 音频数据base64编码
798
- **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
799
-
800
- 注意:音频数据要小于5MB(含)
722
+ * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
723
+ 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
724
+ (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
801
725
  */
802
- Data?: string;
726
+ WordWeightStr?: string;
803
727
  /**
804
- * 数据长度(此数据长度为数据未进行base64编码时的长度)
728
+ * 热词表描述,长度在0-1000之间
805
729
  */
806
- DataLen?: number;
730
+ Description?: string;
731
+ }
732
+ /**
733
+ * CreateAsrVocab返回参数结构体
734
+ */
735
+ export interface CreateAsrVocabResponse {
807
736
  /**
808
- * 音频URL的地址(需要公网环境浏览器可下载)
809
- **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
810
-
811
- 注意:
812
- 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
813
- 2. 请保证文件的下载速度,否则可能下载失败
737
+ * 词表ID,可用于获取词表信息
814
738
  */
815
- Url?: string;
739
+ VocabId?: string;
816
740
  /**
817
- * 回调 URL
818
- 用户自行搭建的用于接收识别结果的服务URL
819
- 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
820
-
821
- 注意:
822
-
823
- - 如果用户使用轮询方式获取识别结果,则无需提交该参数
824
- - 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
741
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
825
742
  */
826
- CallbackUrl?: string;
743
+ RequestId?: string;
744
+ }
745
+ /**
746
+ * SentenceRecognition返回参数结构体
747
+ */
748
+ export interface SentenceRecognitionResponse {
827
749
  /**
828
- * 是否开启说话人分离
829
- 0:不开启;
830
- 1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect,且ChannelNum=1时可用);
831
- 默认值为 0
832
-
833
- 注意:
834
- 8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
750
+ * 识别结果。
835
751
  */
836
- SpeakerDiarization?: number;
752
+ Result?: string;
837
753
  /**
838
- * 说话人分离人数
839
- **需配合开启说话人分离使用,不开启无效**,取值范围:0-10
840
- 0:自动分离(最多分离出20个人);
841
- 1-10:指定人数分离;
842
- 默认值为 0
754
+ * 请求的音频时长,单位为ms
843
755
  */
844
- SpeakerNumber?: number;
756
+ AudioDuration?: number;
845
757
  /**
846
- * 热词表id
847
- 如不设置该参数,将自动生效默认热词表;
848
- 如设置该参数,将生效对应id的热词表;
849
- 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
758
+ * 词时间戳列表的长度
759
+ 注意:此字段可能返回 null,表示取不到有效值。
850
760
  */
851
- HotwordId?: string;
852
- /**
853
- * 热词增强功能(目前仅支持8k_zh/16k_zh引擎)
854
- 1:开启热词增强功能
855
-
856
- 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
857
- * @deprecated
858
- */
859
- ReinforceHotword?: number;
860
- /**
861
- * 自学习定制模型 id
862
- 如设置了该参数,将生效对应id的自学习定制模型;
863
- 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
864
- */
865
- CustomizationId?: string;
866
- /**
867
- * **【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh)
868
- 0:不开启;
869
- 1:开启情绪识别,但不在文本展示情绪标签;
870
- 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
871
- 默认值为0
872
- 支持的情绪分类为:高兴、伤心、愤怒
873
-
874
- 注意:
875
- 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
876
- 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
877
- 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
878
- */
879
- EmotionRecognition?: number;
761
+ WordSize?: number;
880
762
  /**
881
- * 情绪能量值
882
- 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
883
- 0:不开启;
884
- 1:开启;
885
- 默认值为0
763
+ * 词时间戳列表
764
+ 注意:此字段可能返回 null,表示取不到有效值。
886
765
  */
887
- EmotionalEnergy?: number;
766
+ WordList?: Array<SentenceWord>;
888
767
  /**
889
- * 阿拉伯数字智能转换(目前支持中文普通话引擎)
890
- 0:不转换,直接输出中文数字;
891
- 1:根据场景智能转换为阿拉伯数字;
892
- 3:打开数学相关数字转换(如:阿尔法转写为α);
893
- 默认值为 1
768
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
894
769
  */
895
- ConvertNumMode?: number;
770
+ RequestId?: string;
771
+ }
772
+ /**
773
+ * [说话人基础数据](https://cloud.tencent.com/document/product/1093/94483#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0),包括说话人id和说话人昵称
774
+ */
775
+ export interface VoicePrintBaseData {
896
776
  /**
897
- * 脏词过滤(目前支持中文普通话引擎)
898
- 0:不过滤脏词;
899
- 1:过滤脏词;
900
- 2:将脏词替换为 * ;
901
- 默认值为 0
777
+ * 说话人id
778
+ 注意:此字段可能返回 null,表示取不到有效值。
902
779
  */
903
- FilterDirty?: number;
780
+ VoicePrintId?: string;
904
781
  /**
905
- * 标点符号过滤(目前支持中文普通话引擎)
906
- 0:不过滤标点;
907
- 1:过滤句末标点;
908
- 2:过滤所有标点;
909
- 默认值为 0
782
+ * 说话人昵称
783
+ 注意:此字段可能返回 null,表示取不到有效值。
910
784
  */
911
- FilterPunc?: number;
785
+ SpeakerNick?: string;
786
+ }
787
+ /**
788
+ * DescribeAsyncRecognitionTasks返回参数结构体
789
+ */
790
+ export interface DescribeAsyncRecognitionTasksResponse {
912
791
  /**
913
- * 语气词过滤(目前支持中文普通话引擎)
914
- 0:不过滤语气词;
915
- 1:过滤部分语气词;
916
- 2:严格过滤语气词;
917
- 默认值为 0
792
+ * 任务列表
793
+ 注意:此字段可能返回 null,表示取不到有效值。
918
794
  */
919
- FilterModal?: number;
795
+ Data?: AsyncRecognitionTasks;
920
796
  /**
921
- * 单标点最多字数(目前支持中文普通话引擎)
922
- **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
923
- 0:不开启该功能;
924
- 默认值为0
925
-
926
- 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
797
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
927
798
  */
928
- SentenceMaxLength?: number;
799
+ RequestId?: string;
800
+ }
801
+ /**
802
+ * GetAsrVocabList返回参数结构体
803
+ */
804
+ export interface GetAsrVocabListResponse {
929
805
  /**
930
- * 附加参数**(该参数无意义,忽略即可)**
806
+ * 热词表列表
931
807
  */
932
- Extra?: string;
808
+ VocabList?: Array<Vocab>;
933
809
  /**
934
- * 临时热词表:该参数用于提升识别准确率。
935
-
936
- - 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
937
-
938
- - 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
939
-
940
- - 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
941
-
942
- - hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
943
-
944
- - hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
945
-
946
- 注意:
947
-
948
- - 如果同时传入了 hotword_id 和 hotword_list,会优先使用 hotword_list;
949
-
950
- - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
951
-
952
- - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
810
+ * 热词列表总数
953
811
  */
954
- HotwordList?: string;
812
+ TotalCount?: number;
955
813
  /**
956
- * 关键词识别ID列表,默认空为不进行识别,最多10个
957
-
814
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
958
815
  */
959
- KeyWordLibIdList?: Array<string>;
816
+ RequestId?: string;
960
817
  }
961
818
  /**
962
- * 关键词ID
819
+ * DownloadCustomization请求参数结构体
963
820
  */
964
- export interface KeyWordLibIdData {
821
+ export interface DownloadCustomizationRequest {
965
822
  /**
966
- * 关键词ID
967
- 注意:此字段可能返回 null,表示取不到有效值。
823
+ * 自学习模型ID
968
824
  */
969
- KeyWordLibId?: string;
825
+ ModelId: string;
970
826
  }
971
827
  /**
972
- * VoicePrintGroupVerify请求参数结构体
828
+ * 说话人验证1:N返回结果
973
829
  */
974
- export interface VoicePrintGroupVerifyRequest {
975
- /**
976
- * 音频格式 0: pcm, 1: wav
977
- */
978
- VoiceFormat: number;
979
- /**
980
- * 音频采样率,目前支持16000,单位:Hz,必填
981
- */
982
- SampleRate: number;
983
- /**
984
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
985
- */
986
- Data: string;
987
- /**
988
- * 分组id, 支持数字,字母,下划线,长度不超过128
989
- */
990
- GroupId: string;
830
+ export interface VerifyTopResult {
991
831
  /**
992
- * 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
832
+ * 对比打分结果,按照打分降序排列返回
833
+ 注意:此字段可能返回 null,表示取不到有效值。
993
834
  */
994
- TopN: number;
835
+ VerifyTops?: Array<VerifyTop>;
995
836
  }
996
837
  /**
997
838
  * GetAsrVocab返回参数结构体
@@ -1031,273 +872,484 @@ export interface GetAsrVocabResponse {
1031
872
  RequestId?: string;
1032
873
  }
1033
874
  /**
1034
- * GetAsrVocabList请求参数结构体
875
+ * [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
1035
876
  */
1036
- export interface GetAsrVocabListRequest {
1037
- /**
1038
- * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
1039
- */
1040
- TagInfos?: Array<string>;
877
+ export interface HotWord {
1041
878
  /**
1042
- * 分页Offset
879
+ * 热词
880
+ 注意:此字段可能返回 null,表示取不到有效值。
1043
881
  */
1044
- Offset?: number;
882
+ Word: string;
1045
883
  /**
1046
- * 分页Limit
884
+ * 权重
885
+ 注意:此字段可能返回 null,表示取不到有效值。
1047
886
  */
1048
- Limit?: number;
887
+ Weight: number;
1049
888
  }
1050
889
  /**
1051
- * GetCustomizationList返回参数结构体
890
+ * UpdateAsrKeyWordLib请求参数结构体
1052
891
  */
1053
- export interface GetCustomizationListResponse {
892
+ export interface UpdateAsrKeyWordLibRequest {
1054
893
  /**
1055
- * 自学习模型数组
1056
- 注意:此字段可能返回 null,表示取不到有效值。
894
+ * 关键词表ID
1057
895
  */
1058
- Data?: Array<Model>;
896
+ KeyWordLibId: string;
1059
897
  /**
1060
- * 自学习模型总量
1061
- 注意:此字段可能返回 null,表示取不到有效值。
898
+ * 词表名称,长度在1-20之间
899
+ 仅限中英文数字-_
1062
900
  */
1063
- TotalCount?: number;
901
+ Name?: string;
1064
902
  /**
1065
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
903
+ * - 词文件(纯文本文件)以行分隔 ,进行二进制base64编码
904
+ - 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
905
+ - 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
906
+ - 此参数为空则只更新词表名称
1066
907
  */
1067
- RequestId?: string;
908
+ KeyWordFile?: string;
1068
909
  }
1069
910
  /**
1070
- * VoicePrintGroupVerify返回参数结构体
911
+ * GetUsageByDate返回参数结构体
1071
912
  */
1072
- export interface VoicePrintGroupVerifyResponse {
913
+ export interface GetUsageByDateResponse {
1073
914
  /**
1074
- * TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
915
+ * 用量次数
1075
916
  */
1076
- Data?: VerifyTopResult;
917
+ Data?: UsageByDateInfoData;
1077
918
  /**
1078
919
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1079
920
  */
1080
921
  RequestId?: string;
1081
922
  }
1082
923
  /**
1083
- * DownloadAsrVocab请求参数结构体
1084
- */
1085
- export interface DownloadAsrVocabRequest {
1086
- /**
1087
- * 词表ID。
1088
- */
1089
- VocabId: string;
1090
- }
1091
- /**
1092
- * SetVocabState请求参数结构体
924
+ * VoicePrintDelete返回参数结构体
1093
925
  */
1094
- export interface SetVocabStateRequest {
926
+ export interface VoicePrintDeleteResponse {
1095
927
  /**
1096
- * 热词表ID。
928
+ * 说话人基本信息
1097
929
  */
1098
- VocabId: string;
930
+ Data?: VoicePrintBaseData;
1099
931
  /**
1100
- * 热词表状态,1:设为默认状态;0:设为非默认状态。
932
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1101
933
  */
1102
- State: number;
934
+ RequestId?: string;
1103
935
  }
1104
936
  /**
1105
- * 查询列表返回数据
937
+ * DownloadCustomization返回参数结构体
1106
938
  */
1107
- export interface KeyWordLibListData {
1108
- /**
1109
- * 关键词表列表
1110
- 注意:此字段可能返回 null,表示取不到有效值。
1111
- */
1112
- KeyWordLibList?: Array<KeyWordLib>;
939
+ export interface DownloadCustomizationResponse {
1113
940
  /**
1114
- * 关键词列表总数
1115
- 注意:此字段可能返回 null,表示取不到有效值。
941
+ * 下载地址
1116
942
  */
1117
- TotalCount?: number;
1118
- }
1119
- /**
1120
- * CloseAsyncRecognitionTask请求参数结构体
1121
- */
1122
- export interface CloseAsyncRecognitionTaskRequest {
943
+ DownloadUrl?: string;
1123
944
  /**
1124
- * 语音流异步识别任务的唯一标识,在创建任务时会返回
945
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1125
946
  */
1126
- TaskId: number;
947
+ RequestId?: string;
1127
948
  }
1128
949
  /**
1129
- * [录音文件识别](https://cloud.tencent.com/document/product/1093/37823#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)、[实时语音异步识别](https://cloud.tencent.com/document/product/1093/52061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)请求的返回数据
950
+ * CreateRecTask请求参数结构体
1130
951
  */
1131
- export interface Task {
952
+ export interface CreateRecTaskRequest {
1132
953
  /**
1133
- * 任务ID,可通过此ID在轮询接口获取识别状态与结果。TaskId数据类型为**uint64**。
1134
- **注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
954
+ * 引擎模型类型
955
+ 识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
956
+
957
+ 电话通讯场景引擎:
958
+ **注意:电话通讯场景,请务必使用以下8k引擎**
959
+ • 8k_zh:中文电话通讯;
960
+ • 8k_en:英文电话通讯;
961
+ • **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
962
+
963
+ 注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
964
+
965
+ 通用场景引擎:
966
+ **注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
967
+ • **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
968
+ • **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
969
+ • **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
970
+ • **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
971
+ • **16k_en:**英语;
972
+ • **16k_yue:**粤语;
973
+ • **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
974
+ • **16k_ja:**日语;
975
+ • **16k_ko:**韩语;
976
+ • **16k_vi:**越南语;
977
+ • **16k_ms:**马来语;
978
+ • **16k_id:**印度尼西亚语;
979
+ • **16k_fil:**菲律宾语;
980
+ • **16k_th:**泰语;
981
+ • **16k_pt:**葡萄牙语;
982
+ • **16k_tr:**土耳其语;
983
+ • **16k_ar:**阿拉伯语;
984
+ • **16k_es:**西班牙语;
985
+ • **16k_hi:**印地语;
986
+ • **16k_fr:**法语;
987
+ • **16k_zh_medical:**中文医疗引擎;
988
+ • **16k_de:**德语;
1135
989
  */
1136
- TaskId?: number;
990
+ EngineModelType: string;
991
+ /**
992
+ * 识别声道数
993
+ 1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
994
+ 2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
995
+
996
+ 注意:
997
+ • 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
998
+ • 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
999
+ */
1000
+ ChannelNum: number;
1001
+ /**
1002
+ * 识别结果返回样式
1003
+ 0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
1004
+ 1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
1005
+ 2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
1006
+ 3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
1007
+ 4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
1008
+ 5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
1009
+
1010
+ 注意:
1011
+ 如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
1012
+ 如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
1013
+ */
1014
+ ResTextFormat: number;
1015
+ /**
1016
+ * 音频数据来源
1017
+ 0:音频URL;
1018
+ 1:音频数据(post body)
1019
+ */
1020
+ SourceType: number;
1021
+ /**
1022
+ * 音频数据base64编码
1023
+ **当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
1024
+
1025
+ 注意:音频数据要小于5MB(含)
1026
+ */
1027
+ Data?: string;
1028
+ /**
1029
+ * 数据长度(此数据长度为数据未进行base64编码时的长度)
1030
+ */
1031
+ DataLen?: number;
1032
+ /**
1033
+ * 音频URL的地址(需要公网环境浏览器可下载)
1034
+ **当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
1035
+
1036
+ 注意:
1037
+ 1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
1038
+ 2. 请保证文件的下载速度,否则可能下载失败
1039
+ */
1040
+ Url?: string;
1041
+ /**
1042
+ * 回调 URL
1043
+ 用户自行搭建的用于接收识别结果的服务URL
1044
+ 回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
1045
+
1046
+ 注意:
1047
+
1048
+ - 如果用户使用轮询方式获取识别结果,则无需提交该参数
1049
+ - 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
1050
+ */
1051
+ CallbackUrl?: string;
1052
+ /**
1053
+ * 是否开启说话人分离
1054
+ 0:不开启;
1055
+ 1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect,且ChannelNum=1时可用);
1056
+ 默认值为 0
1057
+
1058
+ 注意:
1059
+ 8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
1060
+ */
1061
+ SpeakerDiarization?: number;
1062
+ /**
1063
+ * 说话人分离人数
1064
+ **需配合开启说话人分离使用,不开启无效**,取值范围:0-10
1065
+ 0:自动分离(最多分离出20个人);
1066
+ 1-10:指定人数分离;
1067
+ 默认值为 0
1068
+ */
1069
+ SpeakerNumber?: number;
1070
+ /**
1071
+ * 热词表id
1072
+ 如不设置该参数,将自动生效默认热词表;
1073
+ 如设置该参数,将生效对应id的热词表;
1074
+ 点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
1075
+ */
1076
+ HotwordId?: string;
1077
+ /**
1078
+ * 热词增强功能(目前仅支持8k_zh/16k_zh引擎)
1079
+ 1:开启热词增强功能
1080
+
1081
+ 注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
1082
+ * @deprecated
1083
+ */
1084
+ ReinforceHotword?: number;
1085
+ /**
1086
+ * 自学习定制模型 id
1087
+ 如设置了该参数,将生效对应id的自学习定制模型;
1088
+ 点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
1089
+ */
1090
+ CustomizationId?: string;
1091
+ /**
1092
+ * **【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh)
1093
+ 0:不开启;
1094
+ 1:开启情绪识别,但不在文本展示情绪标签;
1095
+ 2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
1096
+ 默认值为0
1097
+ 支持的情绪分类为:高兴、伤心、愤怒
1098
+
1099
+ 注意:
1100
+ 1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
1101
+ 2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
1102
+ 3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
1103
+ */
1104
+ EmotionRecognition?: number;
1105
+ /**
1106
+ * 情绪能量值
1107
+ 取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
1108
+ 0:不开启;
1109
+ 1:开启;
1110
+ 默认值为0
1111
+ */
1112
+ EmotionalEnergy?: number;
1113
+ /**
1114
+ * 阿拉伯数字智能转换(目前支持中文普通话引擎)
1115
+ 0:不转换,直接输出中文数字;
1116
+ 1:根据场景智能转换为阿拉伯数字;
1117
+ 3:打开数学相关数字转换(如:阿尔法转写为α);
1118
+ 默认值为 1
1119
+ */
1120
+ ConvertNumMode?: number;
1121
+ /**
1122
+ * 脏词过滤(目前支持中文普通话引擎)
1123
+ 0:不过滤脏词;
1124
+ 1:过滤脏词;
1125
+ 2:将脏词替换为 * ;
1126
+ 默认值为 0
1127
+ */
1128
+ FilterDirty?: number;
1129
+ /**
1130
+ * 标点符号过滤(目前支持中文普通话引擎)
1131
+ 0:不过滤标点;
1132
+ 1:过滤句末标点;
1133
+ 2:过滤所有标点;
1134
+ 默认值为 0
1135
+ */
1136
+ FilterPunc?: number;
1137
+ /**
1138
+ * 语气词过滤(目前支持中文普通话引擎)
1139
+ 0:不过滤语气词;
1140
+ 1:过滤部分语气词;
1141
+ 2:严格过滤语气词;
1142
+ 默认值为 0
1143
+ */
1144
+ FilterModal?: number;
1145
+ /**
1146
+ * 单标点最多字数(目前支持中文普通话引擎)
1147
+ **可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
1148
+ 0:不开启该功能;
1149
+ 默认值为0
1150
+
1151
+ 注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
1152
+ */
1153
+ SentenceMaxLength?: number;
1154
+ /**
1155
+ * 附加参数**(该参数无意义,忽略即可)**
1156
+ */
1157
+ Extra?: string;
1158
+ /**
1159
+ * 临时热词表:该参数用于提升识别准确率。
1160
+
1161
+ - 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
1162
+
1163
+ - 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
1164
+
1165
+ - 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
1166
+
1167
+ - hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
1168
+
1169
+ - hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
1170
+
1171
+ 注意:
1172
+
1173
+ - 如果同时传入了 hotword_id 和 hotword_list,会优先使用 hotword_list;
1174
+
1175
+ - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1176
+
1177
+ - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1178
+ */
1179
+ HotwordList?: string;
1180
+ /**
1181
+ * 关键词识别ID列表,默认空为不进行识别,最多10个
1182
+
1183
+ */
1184
+ KeyWordLibIdList?: Array<string>;
1137
1185
  }
1138
1186
  /**
1139
- * [音频流异步识别任务列表](https://cloud.tencent.com/document/product/1093/52060#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1187
+ * 单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。
1140
1188
  */
1141
- export interface AsyncRecognitionTasks {
1189
+ export interface SentenceDetail {
1142
1190
  /**
1143
- * 任务列表
1191
+ * 单句最终识别结果
1144
1192
  注意:此字段可能返回 null,表示取不到有效值。
1145
1193
  */
1146
- Tasks?: Array<AsyncRecognitionTaskInfo>;
1147
- }
1148
- /**
1149
- * VoicePrintVerify请求参数结构体
1150
- */
1151
- export interface VoicePrintVerifyRequest {
1194
+ FinalSentence?: string;
1152
1195
  /**
1153
- * 音频格式 0: pcm, 1: wav
1196
+ * 单句中间识别结果,使用空格拆分为多个词
1197
+ 注意:此字段可能返回 null,表示取不到有效值。
1154
1198
  */
1155
- VoiceFormat: number;
1199
+ SliceSentence?: string;
1156
1200
  /**
1157
- * 音频采样率,目前支持16000,单位:Hz,必填
1201
+ * 口语转书面语结果,开启改功能才有值
1202
+ 注意:此字段可能返回 null,表示取不到有效值。
1158
1203
  */
1159
- SampleRate: number;
1204
+ WrittenText?: string;
1160
1205
  /**
1161
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1206
+ * 单句开始时间(毫秒)
1207
+ 注意:此字段可能返回 null,表示取不到有效值。
1162
1208
  */
1163
- Data: string;
1209
+ StartMs?: number;
1164
1210
  /**
1165
- * 说话人id, 说话人唯一标识
1211
+ * 单句结束时间(毫秒)
1212
+ 注意:此字段可能返回 null,表示取不到有效值。
1166
1213
  */
1167
- VoicePrintId: string;
1168
- }
1169
- /**
1170
- * ModifyCustomization请求参数结构体
1171
- */
1172
- export interface ModifyCustomizationRequest {
1214
+ EndMs?: number;
1173
1215
  /**
1174
- * 要修改的模型ID
1216
+ * 单句中词个数
1217
+ 注意:此字段可能返回 null,表示取不到有效值。
1175
1218
  */
1176
- ModelId: string;
1219
+ WordsNum?: number;
1177
1220
  /**
1178
- * 要修改的模型名称,长度需在1-20个字符之间
1221
+ * 单句中词详情
1222
+ 注意:此字段可能返回 null,表示取不到有效值。
1179
1223
  */
1180
- ModelName?: string;
1224
+ Words?: Array<SentenceWords>;
1181
1225
  /**
1182
- * 要修改的模型类型,为8k或者16k
1226
+ * 单句语速,单位:字数/秒
1227
+ 注意:此字段可能返回 null,表示取不到有效值。
1183
1228
  */
1184
- ModelType?: string;
1229
+ SpeechSpeed?: number;
1185
1230
  /**
1186
- * 要修改的模型语料的下载地址,目前仅支持腾讯云cos
1231
+ * 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
1232
+ 注意:此字段可能返回 null,表示取不到有效值。
1187
1233
  */
1188
- TextUrl?: string;
1234
+ SpeakerId?: number;
1235
+ /**
1236
+ * 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
1237
+ 注意:此字段可能返回 null,表示取不到有效值。
1238
+ */
1239
+ EmotionalEnergy?: number;
1240
+ /**
1241
+ * 本句与上一句之间的静音时长
1242
+ 注意:此字段可能返回 null,表示取不到有效值。
1243
+ */
1244
+ SilenceTime?: number;
1245
+ /**
1246
+ * 情绪类型(可能为空)
1247
+ 注意:此字段可能返回 null,表示取不到有效值。
1248
+ */
1249
+ EmotionType?: Array<string>;
1250
+ /**
1251
+ * 关键词识别结果列表
1252
+ 注意:此字段可能返回 null,表示取不到有效值。
1253
+ */
1254
+ KeyWordResults?: Array<KeyWordResult>;
1189
1255
  }
1190
1256
  /**
1191
- * DeleteCustomization返回参数结构体
1257
+ * DownloadAsrVocab请求参数结构体
1192
1258
  */
1193
- export interface DeleteCustomizationResponse {
1259
+ export interface DownloadAsrVocabRequest {
1194
1260
  /**
1195
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId
1261
+ * 词表ID。
1196
1262
  */
1197
- RequestId?: string;
1263
+ VocabId: string;
1198
1264
  }
1199
1265
  /**
1200
- * [获取录音识别结果的返回参数](https://cloud.tencent.com/document/product/1093/37822#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1266
+ * [词表内容](https://cloud.tencent.com/document/product/1093/41484#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1201
1267
  */
1202
- export interface TaskStatus {
1268
+ export interface Vocab {
1203
1269
  /**
1204
- * 任务标识。注意:TaskId数据类型为uint64。
1270
+ * 热词表名称
1205
1271
  */
1206
- TaskId?: number;
1272
+ Name?: string;
1207
1273
  /**
1208
- * 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
1274
+ * 热词表描述
1209
1275
  */
1210
- Status?: number;
1276
+ Description?: string;
1211
1277
  /**
1212
- * 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
1278
+ * 热词表ID
1213
1279
  */
1214
- StatusStr?: string;
1280
+ VocabId?: string;
1215
1281
  /**
1216
- * 识别结果。
1282
+ * 词权重列表
1217
1283
  */
1218
- Result?: string;
1284
+ WordWeights?: Array<HotWord>;
1219
1285
  /**
1220
- * 失败原因说明。
1286
+ * 词表创建时间
1221
1287
  */
1222
- ErrorMsg?: string;
1288
+ CreateTime?: string;
1223
1289
  /**
1224
- * 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
1225
- 注意:此字段可能返回 null,表示取不到有效值。
1290
+ * 词表更新时间
1226
1291
  */
1227
- ResultDetail?: Array<SentenceDetail>;
1292
+ UpdateTime?: string;
1228
1293
  /**
1229
- * 音频时长(秒)。
1230
- 注意:此字段可能返回 null,表示取不到有效值。
1294
+ * 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
1231
1295
  */
1232
- AudioDuration?: number;
1233
- }
1234
- /**
1235
- * DeleteAsrVocab请求参数结构体
1236
- */
1237
- export interface DeleteAsrVocabRequest {
1296
+ State?: number;
1238
1297
  /**
1239
- * 热词表Id
1298
+ * 标签数组
1299
+ 注意:此字段可能返回 null,表示取不到有效值。
1240
1300
  */
1241
- VocabId: string;
1301
+ TagInfos?: Array<string>;
1242
1302
  }
1243
1303
  /**
1244
- * GetCustomizationList请求参数结构体
1304
+ * 关键词表信息
1245
1305
  */
1246
- export interface GetCustomizationListRequest {
1306
+ export interface KeyWordLib {
1247
1307
  /**
1248
- * 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
1249
- * @deprecated
1308
+ * 关键词表ID
1309
+ 注意:此字段可能返回 null,表示取不到有效值。
1250
1310
  */
1251
- TagInfos?: Array<string>;
1311
+ KeyWordLibId?: string;
1252
1312
  /**
1253
- * 分页大小,默认1000
1313
+ * 关键词表名称
1314
+ 注意:此字段可能返回 null,表示取不到有效值。
1254
1315
  */
1255
- Limit?: number;
1316
+ Name?: string;
1256
1317
  /**
1257
- * 分页offset,默认0
1318
+ * 关键词列表
1319
+ 注意:此字段可能返回 null,表示取不到有效值。
1258
1320
  */
1259
- Offset?: number;
1260
- }
1261
- /**
1262
- * UpdateAsrVocab返回参数结构体
1263
- */
1264
- export interface UpdateAsrVocabResponse {
1321
+ KeyWordList?: Array<string>;
1265
1322
  /**
1266
- * 热词表ID
1323
+ * 创建时间
1324
+ 注意:此字段可能返回 null,表示取不到有效值。
1267
1325
  */
1268
- VocabId?: string;
1326
+ CreateTime?: string;
1269
1327
  /**
1270
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1328
+ * 更新时间
1329
+ 注意:此字段可能返回 null,表示取不到有效值。
1271
1330
  */
1272
- RequestId?: string;
1331
+ UpdateTime?: string;
1273
1332
  }
1274
1333
  /**
1275
- * VoicePrintCount返回参数结构体
1334
+ * ModifyCustomization请求参数结构体
1276
1335
  */
1277
- export interface VoicePrintCountResponse {
1336
+ export interface ModifyCustomizationRequest {
1278
1337
  /**
1279
- * 统计数据
1338
+ * 要修改的模型ID
1280
1339
  */
1281
- Data?: VoicePrintCountData;
1340
+ ModelId: string;
1282
1341
  /**
1283
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1342
+ * 要修改的模型名称,长度需在1-20个字符之间
1284
1343
  */
1285
- RequestId?: string;
1286
- }
1287
- /**
1288
- * 音频声纹比对结果,包含比对分数
1289
- */
1290
- export interface VoicePrintCompareData {
1344
+ ModelName?: string;
1291
1345
  /**
1292
- * 匹配度 取值范围(0.0 - 100.0)
1293
- 注意:此字段可能返回 null,表示取不到有效值。
1346
+ * 要修改的模型类型,为8k或者16k
1294
1347
  */
1295
- Score?: string;
1348
+ ModelType?: string;
1296
1349
  /**
1297
- * 验证结果 0: 未通过 1: 通过
1298
- 注意:此字段可能返回 null,表示取不到有效值。
1350
+ * 要修改的模型语料的下载地址,目前仅支持腾讯云cos
1299
1351
  */
1300
- Decision?: number;
1352
+ TextUrl?: string;
1301
1353
  }
1302
1354
  /**
1303
1355
  * VoicePrintVerify返回参数结构体
@@ -1312,6 +1364,19 @@ export interface VoicePrintVerifyResponse {
1312
1364
  */
1313
1365
  RequestId?: string;
1314
1366
  }
1367
+ /**
1368
+ * GetModelInfo返回参数结构体
1369
+ */
1370
+ export interface GetModelInfoResponse {
1371
+ /**
1372
+ * 模型信息
1373
+ */
1374
+ Data?: Model;
1375
+ /**
1376
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1377
+ */
1378
+ RequestId?: string;
1379
+ }
1315
1380
  /**
1316
1381
  * DescribeTaskStatus请求参数结构体
1317
1382
  */
@@ -1323,390 +1388,417 @@ export interface DescribeTaskStatusRequest {
1323
1388
  TaskId: number;
1324
1389
  }
1325
1390
  /**
1326
- * [自学习模型信息](https://cloud.tencent.com/document/product/1093/90813#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1391
+ * VoicePrintCompare请求参数结构体
1327
1392
  */
1328
- export interface Model {
1329
- /**
1330
- * 模型名称
1331
- */
1332
- ModelName?: string;
1393
+ export interface VoicePrintCompareRequest {
1333
1394
  /**
1334
- * 模型文件名称
1395
+ * 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
1335
1396
  */
1336
- DictName?: string;
1397
+ VoiceFormat: number;
1337
1398
  /**
1338
- * 模型Id
1399
+ * 音频采样率,目前仅支持16k,请填写16000
1339
1400
  */
1340
- ModelId?: string;
1401
+ SampleRate: number;
1341
1402
  /**
1342
- * 模型类型,“8k”或者”16k
1403
+ * 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1343
1404
  */
1344
- ModelType?: string;
1405
+ SrcAudioData: string;
1345
1406
  /**
1346
- * 服务类型
1407
+ * 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1347
1408
  */
1348
- ServiceType?: string;
1409
+ DestAudioData: string;
1410
+ }
1411
+ /**
1412
+ * DeleteCustomization请求参数结构体
1413
+ */
1414
+ export interface DeleteCustomizationRequest {
1349
1415
  /**
1350
- * 模型状态:
1351
- -2:模型训练失败;
1352
- -1:已下线;
1353
- 0:训练中;
1354
- 1:已上线;
1355
- 3:上线中;
1356
- 4:下线中;
1416
+ * 要删除的模型ID
1357
1417
  */
1358
- ModelState?: number;
1418
+ ModelId: string;
1419
+ }
1420
+ /**
1421
+ * [音频流异步识别](https://cloud.tencent.com/document/api/1093/37824#AsyncRecognitionTasks)任务信息
1422
+ */
1423
+ export interface AsyncRecognitionTaskInfo {
1359
1424
  /**
1360
- * 最后更新时间
1425
+ * 任务ID
1361
1426
  */
1362
- AtUpdated?: string;
1427
+ TaskId?: number;
1363
1428
  /**
1364
- * 标签信息
1365
- 注意:此字段可能返回 null,表示取不到有效值。
1429
+ * 音频流Url
1366
1430
  */
1367
- TagInfos?: Array<string>;
1431
+ Url?: string;
1368
1432
  }
1369
1433
  /**
1370
- * CreateAsrVocab请求参数结构体
1434
+ * VoicePrintCount返回参数结构体
1371
1435
  */
1372
- export interface CreateAsrVocabRequest {
1436
+ export interface VoicePrintCountResponse {
1373
1437
  /**
1374
- * 热词表名称,长度在1-255之间
1438
+ * 统计数据
1375
1439
  */
1376
- Name: string;
1440
+ Data?: VoicePrintCountData;
1377
1441
  /**
1378
- * 热词表描述,长度在0-1000之间
1442
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1379
1443
  */
1380
- Description?: string;
1444
+ RequestId?: string;
1445
+ }
1446
+ /**
1447
+ * 查询列表返回数据
1448
+ */
1449
+ export interface KeyWordLibListData {
1381
1450
  /**
1382
- * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或者100,数组长度不大于1000
1383
- 注意:
1384
- - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1385
- - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1451
+ * 关键词表列表
1452
+ 注意:此字段可能返回 null,表示取不到有效值。
1386
1453
  */
1387
- WordWeights?: Array<HotWord>;
1454
+ KeyWordLibList?: Array<KeyWordLib>;
1388
1455
  /**
1389
- * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1390
- 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1456
+ * 关键词列表总数
1457
+ 注意:此字段可能返回 null,表示取不到有效值。
1391
1458
  */
1392
- WordWeightStr?: string;
1459
+ TotalCount?: number;
1393
1460
  }
1394
1461
  /**
1395
- * GetModelInfo返回参数结构体
1462
+ * CloseAsyncRecognitionTask返回参数结构体
1396
1463
  */
1397
- export interface GetModelInfoResponse {
1398
- /**
1399
- * 模型信息
1400
- */
1401
- Data?: Model;
1464
+ export interface CloseAsyncRecognitionTaskResponse {
1402
1465
  /**
1403
1466
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1404
1467
  */
1405
1468
  RequestId?: string;
1406
1469
  }
1407
1470
  /**
1408
- * UpdateAsrVocab请求参数结构体
1471
+ * VoicePrintGroupVerify返回参数结构体
1409
1472
  */
1410
- export interface UpdateAsrVocabRequest {
1411
- /**
1412
- * 热词表ID
1413
- */
1414
- VocabId: string;
1473
+ export interface VoicePrintGroupVerifyResponse {
1415
1474
  /**
1416
- * 热词表名称,长度在1-255之间
1475
+ * TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
1417
1476
  */
1418
- Name?: string;
1477
+ Data?: VerifyTopResult;
1419
1478
  /**
1420
- * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或100,数组长度不大于1000 (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
1479
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1421
1480
  */
1422
- WordWeights?: Array<HotWord>;
1481
+ RequestId?: string;
1482
+ }
1483
+ /**
1484
+ * CreateCustomization请求参数结构体
1485
+ */
1486
+ export interface CreateCustomizationRequest {
1423
1487
  /**
1424
- * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1425
- 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1426
- (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
1488
+ * 自学习模型名称,需在1-20字符之间
1427
1489
  */
1428
- WordWeightStr?: string;
1490
+ ModelName: string;
1429
1491
  /**
1430
- * 热词表描述,长度在0-1000之间
1492
+ * 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
1431
1493
  */
1432
- Description?: string;
1433
- }
1434
- /**
1435
- * VoicePrintCount请求参数结构体
1436
- */
1437
- export interface VoicePrintCountRequest {
1494
+ TextUrl: string;
1438
1495
  /**
1439
- * 分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
1496
+ * 自学习模型类型,填写8k或者16k
1440
1497
  */
1441
- GroupId?: string;
1498
+ ModelType: string;
1442
1499
  /**
1443
- * 统计模式
1444
- 0: 统计所有声纹数量
1445
- 1: 统计指定分组下的声纹数量
1500
+ * 标签信息
1501
+ * @deprecated
1446
1502
  */
1447
- CountMod?: number;
1503
+ TagInfos?: Array<string>;
1448
1504
  }
1449
1505
  /**
1450
- * VoicePrintEnroll请求参数结构体
1506
+ * 用户用量信息
1451
1507
  */
1452
- export interface VoicePrintEnrollRequest {
1508
+ export interface UsageByDateInfo {
1453
1509
  /**
1454
- * 音频格式 0: pcm, 1: wav
1510
+ * 业务类型名称
1511
+ 注意:此字段可能返回 null,表示取不到有效值。
1455
1512
  */
1456
- VoiceFormat: number;
1513
+ BizName?: string;
1457
1514
  /**
1458
- * 音频采样率,目前支持16000,单位:Hz,必填
1515
+ * 识别次数
1516
+ 单位:次
1517
+ 注意:此字段可能返回 null,表示取不到有效值。
1459
1518
  */
1460
- SampleRate: number;
1519
+ Count?: number;
1461
1520
  /**
1462
- * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1521
+ * 识别时长
1522
+ 单位:秒
1523
+ 注意:此字段可能返回 null,表示取不到有效值。
1463
1524
  */
1464
- Data: string;
1525
+ Duration?: number;
1526
+ }
1527
+ /**
1528
+ * UpdateAsrKeyWordLib返回参数结构体
1529
+ */
1530
+ export interface UpdateAsrKeyWordLibResponse {
1465
1531
  /**
1466
- * 说话人昵称 不超过32字节
1532
+ * 关键词表ID数据
1467
1533
  */
1468
- SpeakerNick?: string;
1534
+ Data?: KeyWordLibIdData;
1469
1535
  /**
1470
- * 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符
1536
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1471
1537
  */
1472
- GroupId?: string;
1538
+ RequestId?: string;
1473
1539
  }
1474
1540
  /**
1475
- * CreateAsrVocab返回参数结构体
1541
+ * CreateAsyncRecognitionTask返回参数结构体
1476
1542
  */
1477
- export interface CreateAsrVocabResponse {
1543
+ export interface CreateAsyncRecognitionTaskResponse {
1478
1544
  /**
1479
- * 词表ID,可用于获取词表信息
1545
+ * 请求返回结果,包含本次的任务ID(TaskId)
1480
1546
  */
1481
- VocabId?: string;
1547
+ Data?: Task;
1482
1548
  /**
1483
1549
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1484
1550
  */
1485
1551
  RequestId?: string;
1486
1552
  }
1487
1553
  /**
1488
- * SentenceRecognition返回参数结构体
1489
- */
1490
- export interface SentenceRecognitionResponse {
1491
- /**
1492
- * 识别结果。
1493
- */
1494
- Result?: string;
1554
+ * GetAsrKeyWordLibList请求参数结构体
1555
+ */
1556
+ export interface GetAsrKeyWordLibListRequest {
1495
1557
  /**
1496
- * 请求的音频时长,单位为ms
1558
+ * 分页Offset
1497
1559
  */
1498
- AudioDuration?: number;
1560
+ Offset?: number;
1499
1561
  /**
1500
- * 词时间戳列表的长度
1501
- 注意:此字段可能返回 null,表示取不到有效值。
1562
+ * 分页Limit
1502
1563
  */
1503
- WordSize?: number;
1564
+ Limit?: number;
1504
1565
  /**
1505
- * 词时间戳列表
1506
- 注意:此字段可能返回 null,表示取不到有效值。
1566
+ * 词库名称或者UIN检索
1507
1567
  */
1508
- WordList?: Array<SentenceWord>;
1568
+ SpecifyNames?: Array<string>;
1509
1569
  /**
1510
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1570
+ * 只看用户自己创建的
1511
1571
  */
1512
- RequestId?: string;
1572
+ OnlySelf?: boolean;
1513
1573
  }
1514
1574
  /**
1515
- * VoicePrintUpdate返回参数结构体
1575
+ * DeleteAsrVocab返回参数结构体
1516
1576
  */
1517
- export interface VoicePrintUpdateResponse {
1518
- /**
1519
- * 说话人基础数据
1520
- */
1521
- Data?: VoicePrintBaseData;
1577
+ export interface DeleteAsrVocabResponse {
1522
1578
  /**
1523
1579
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1524
1580
  */
1525
1581
  RequestId?: string;
1526
1582
  }
1527
1583
  /**
1528
- * DeleteAsrKeyWordLib请求参数结构体
1584
+ * 关键词ID
1529
1585
  */
1530
- export interface DeleteAsrKeyWordLibRequest {
1586
+ export interface KeyWordLibIdData {
1531
1587
  /**
1532
- * 关键词表ID
1588
+ * 关键词ID
1589
+ 注意:此字段可能返回 null,表示取不到有效值。
1533
1590
  */
1534
- KeyWordLibId: string;
1591
+ KeyWordLibId?: string;
1535
1592
  }
1536
1593
  /**
1537
- * [说话人基础数据](https://cloud.tencent.com/document/product/1093/94483#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0),包括说话人id和说话人昵称
1594
+ * 音频声纹比对结果,包含比对分数
1538
1595
  */
1539
- export interface VoicePrintBaseData {
1596
+ export interface VoicePrintCompareData {
1540
1597
  /**
1541
- * 说话人id
1598
+ * 匹配度 取值范围(0.0 - 100.0)
1542
1599
  注意:此字段可能返回 null,表示取不到有效值。
1543
1600
  */
1544
- VoicePrintId?: string;
1601
+ Score?: string;
1545
1602
  /**
1546
- * 说话人昵称
1603
+ * 验证结果 0: 未通过 1: 通过
1547
1604
  注意:此字段可能返回 null,表示取不到有效值。
1548
1605
  */
1549
- SpeakerNick?: string;
1606
+ Decision?: number;
1550
1607
  }
1551
1608
  /**
1552
- * UpdateAsrKeyWordLib返回参数结构体
1609
+ * VoicePrintVerify请求参数结构体
1553
1610
  */
1554
- export interface UpdateAsrKeyWordLibResponse {
1611
+ export interface VoicePrintVerifyRequest {
1555
1612
  /**
1556
- * 关键词表ID数据
1613
+ * 音频格式 0: pcm, 1: wav
1557
1614
  */
1558
- Data?: KeyWordLibIdData;
1615
+ VoiceFormat: number;
1559
1616
  /**
1560
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1617
+ * 音频采样率,目前支持16000,单位:Hz,必填
1561
1618
  */
1562
- RequestId?: string;
1619
+ SampleRate: number;
1620
+ /**
1621
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1622
+ */
1623
+ Data: string;
1624
+ /**
1625
+ * 说话人id, 说话人唯一标识
1626
+ */
1627
+ VoicePrintId: string;
1563
1628
  }
1564
1629
  /**
1565
- * 说话人验证1:N返回结果
1630
+ * SetVocabState请求参数结构体
1566
1631
  */
1567
- export interface VerifyTopResult {
1632
+ export interface SetVocabStateRequest {
1568
1633
  /**
1569
- * 对比打分结果,按照打分降序排列返回
1570
- 注意:此字段可能返回 null,表示取不到有效值。
1634
+ * 热词表ID。
1571
1635
  */
1572
- VerifyTops?: Array<VerifyTop>;
1636
+ VocabId: string;
1637
+ /**
1638
+ * 热词表状态,1:设为默认状态;0:设为非默认状态。
1639
+ */
1640
+ State: number;
1573
1641
  }
1574
1642
  /**
1575
- * VoicePrintCompare请求参数结构体
1643
+ * [自学习模型信息](https://cloud.tencent.com/document/product/1093/90813#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1576
1644
  */
1577
- export interface VoicePrintCompareRequest {
1645
+ export interface Model {
1578
1646
  /**
1579
- * 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
1647
+ * 模型名称
1580
1648
  */
1581
- VoiceFormat: number;
1649
+ ModelName?: string;
1582
1650
  /**
1583
- * 音频采样率,目前仅支持16k,请填写16000
1651
+ * 模型文件名称
1584
1652
  */
1585
- SampleRate: number;
1653
+ DictName?: string;
1586
1654
  /**
1587
- * 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1655
+ * 模型Id
1588
1656
  */
1589
- SrcAudioData: string;
1657
+ ModelId?: string;
1590
1658
  /**
1591
- * 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
1659
+ * 模型类型,“8k”或者”16k
1592
1660
  */
1593
- DestAudioData: string;
1594
- }
1595
- /**
1596
- * VoicePrintCompare返回参数结构体
1597
- */
1598
- export interface VoicePrintCompareResponse {
1661
+ ModelType?: string;
1599
1662
  /**
1600
- * 音频声纹比对结果,包含相似度打分
1663
+ * 服务类型
1601
1664
  */
1602
- Data?: VoicePrintCompareData;
1665
+ ServiceType?: string;
1603
1666
  /**
1604
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1667
+ * 模型状态:
1668
+ -2:模型训练失败;
1669
+ -1:已下线;
1670
+ 0:训练中;
1671
+ 1:已上线;
1672
+ 3:上线中;
1673
+ 4:下线中;
1605
1674
  */
1606
- RequestId?: string;
1607
- }
1608
- /**
1609
- * DeleteCustomization请求参数结构体
1610
- */
1611
- export interface DeleteCustomizationRequest {
1675
+ ModelState?: number;
1612
1676
  /**
1613
- * 要删除的模型ID
1677
+ * 最后更新时间
1614
1678
  */
1615
- ModelId: string;
1679
+ AtUpdated?: string;
1680
+ /**
1681
+ * 标签信息
1682
+ 注意:此字段可能返回 null,表示取不到有效值。
1683
+ */
1684
+ TagInfos?: Array<string>;
1616
1685
  }
1617
1686
  /**
1618
- * 声纹组对比结果top数据
1687
+ * CreateAsrVocab请求参数结构体
1619
1688
  */
1620
- export interface VerifyTop {
1689
+ export interface CreateAsrVocabRequest {
1621
1690
  /**
1622
- * 相似度打分
1623
- 注意:此字段可能返回 null,表示取不到有效值。
1691
+ * 热词表名称,长度在1-255之间
1624
1692
  */
1625
- Score?: string;
1693
+ Name: string;
1626
1694
  /**
1627
- * 说话人id
1628
- 注意:此字段可能返回 null,表示取不到有效值。
1695
+ * 热词表描述,长度在0-1000之间
1629
1696
  */
1630
- VoicePrintId?: string;
1697
+ Description?: string;
1631
1698
  /**
1632
- * 说话人昵称
1633
- 注意:此字段可能返回 null,表示取不到有效值。
1699
+ * 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或者100,数组长度不大于1000
1700
+ 注意:
1701
+ - 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
1702
+ - 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
1634
1703
  */
1635
- SpeakerId?: string;
1704
+ WordWeights?: Array<HotWord>;
1705
+ /**
1706
+ * 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
1707
+ 当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
1708
+ */
1709
+ WordWeightStr?: string;
1636
1710
  }
1637
1711
  /**
1638
- * [音频流异步识别](https://cloud.tencent.com/document/api/1093/37824#AsyncRecognitionTasks)任务信息
1712
+ * VoicePrintUpdate返回参数结构体
1639
1713
  */
1640
- export interface AsyncRecognitionTaskInfo {
1714
+ export interface VoicePrintUpdateResponse {
1641
1715
  /**
1642
- * 任务ID
1716
+ * 说话人基础数据
1643
1717
  */
1644
- TaskId?: number;
1718
+ Data?: VoicePrintBaseData;
1645
1719
  /**
1646
- * 音频流Url
1720
+ * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1647
1721
  */
1648
- Url?: string;
1722
+ RequestId?: string;
1649
1723
  }
1650
1724
  /**
1651
- * ModifyCustomizationState返回参数结构体
1725
+ * DeleteAsrKeyWordLib请求参数结构体
1652
1726
  */
1653
- export interface ModifyCustomizationStateResponse {
1727
+ export interface DeleteAsrKeyWordLibRequest {
1654
1728
  /**
1655
- * 自学习模型ID
1729
+ * 关键词表ID
1656
1730
  */
1657
- ModelId?: string;
1731
+ KeyWordLibId: string;
1732
+ }
1733
+ /**
1734
+ * GetModelInfo请求参数结构体
1735
+ */
1736
+ export interface GetModelInfoRequest {
1658
1737
  /**
1659
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1738
+ * 模型id
1660
1739
  */
1661
- RequestId?: string;
1740
+ ModelId: string;
1662
1741
  }
1663
1742
  /**
1664
- * DescribeAsyncRecognitionTasks返回参数结构体
1743
+ * ModifyCustomizationState返回参数结构体
1665
1744
  */
1666
- export interface DescribeAsyncRecognitionTasksResponse {
1745
+ export interface ModifyCustomizationStateResponse {
1667
1746
  /**
1668
- * 任务列表
1669
- 注意:此字段可能返回 null,表示取不到有效值。
1747
+ * 自学习模型ID
1670
1748
  */
1671
- Data?: AsyncRecognitionTasks;
1749
+ ModelId?: string;
1672
1750
  /**
1673
1751
  * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1674
1752
  */
1675
1753
  RequestId?: string;
1676
1754
  }
1677
1755
  /**
1678
- * GetAsrVocabList返回参数结构体
1756
+ * GetUsageByDate请求参数结构体
1679
1757
  */
1680
- export interface GetAsrVocabListResponse {
1758
+ export interface GetUsageByDateRequest {
1681
1759
  /**
1682
- * 热词表列表
1760
+ * 需要查询的业务类型名字列表
1761
+ - asr_rt 实时识别
1762
+ - asr_rec 录音文件识别
1683
1763
  */
1684
- VocabList?: Array<Vocab>;
1764
+ BizNameList: Array<string>;
1685
1765
  /**
1686
- * 热词列表总数
1766
+ * 查询开始时间
1767
+ 开始时间包含当天,支持 YYYY-MM-DD 日期以国内时区为准
1768
+ 开始时间到结束时间需要在3个月以内
1687
1769
  */
1688
- TotalCount?: number;
1770
+ StartDate: string;
1689
1771
  /**
1690
- * 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
1772
+ * 查询结束时间
1773
+ 结束时间包含当天,,支持 YYYY-MM-DD 日期以国内时区为准
1774
+ 开始时间到结束时间需要在3个月以内
1691
1775
  */
1692
- RequestId?: string;
1776
+ EndDate: string;
1693
1777
  }
1694
1778
  /**
1695
- * [一句话识别](https://cloud.tencent.com/document/product/1093/35646#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)返回的词时间戳
1779
+ * VoicePrintEnroll请求参数结构体
1696
1780
  */
1697
- export interface SentenceWord {
1781
+ export interface VoicePrintEnrollRequest {
1698
1782
  /**
1699
- * 词结果
1783
+ * 音频格式 0: pcm, 1: wav
1700
1784
  */
1701
- Word?: string;
1785
+ VoiceFormat: number;
1702
1786
  /**
1703
- * 词在音频中的开始时间
1787
+ * 音频采样率,目前支持16000,单位:Hz,必填
1704
1788
  */
1705
- StartTime?: number;
1789
+ SampleRate: number;
1706
1790
  /**
1707
- * 词在音频中的结束时间
1791
+ * 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
1708
1792
  */
1709
- EndTime?: number;
1793
+ Data: string;
1794
+ /**
1795
+ * 说话人昵称 不超过32字节
1796
+ */
1797
+ SpeakerNick?: string;
1798
+ /**
1799
+ * 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符
1800
+ */
1801
+ GroupId?: string;
1710
1802
  }
1711
1803
  /**
1712
1804
  * 识别结果中词文本,以及对应时间偏移
@@ -1728,27 +1820,3 @@ export interface SentenceWords {
1728
1820
  */
1729
1821
  OffsetEndMs: number;
1730
1822
  }
1731
- /**
1732
- * 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
1733
- */
1734
- export interface VoicePrintCountData {
1735
- /**
1736
- * 总数
1737
- 注意:此字段可能返回 null,表示取不到有效值。
1738
- */
1739
- Total?: number;
1740
- /**
1741
- * 说话人id列表
1742
- 注意:此字段可能返回 null,表示取不到有效值。
1743
- */
1744
- VoicePrintList?: Array<VoicePrintBaseData>;
1745
- }
1746
- /**
1747
- * DownloadCustomization请求参数结构体
1748
- */
1749
- export interface DownloadCustomizationRequest {
1750
- /**
1751
- * 自学习模型ID
1752
- */
1753
- ModelId: string;
1754
- }