tencentcloud-sdk-nodejs 4.0.941 → 4.0.942
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +358 -0
- package/SERVICE_CHANGELOG.md +637 -12
- package/package.json +1 -1
- package/products.md +15 -15
- package/src/common/sdk_version.ts +1 -1
- package/src/services/as/v20180419/as_models.ts +8 -0
- package/src/services/asr/v20190614/asr_client.ts +71 -57
- package/src/services/asr/v20190614/asr_models.ts +967 -895
- package/src/services/cfg/v20210820/cfg_models.ts +4 -0
- package/src/services/cwp/v20180228/cwp_client.ts +5 -3
- package/src/services/cwp/v20180228/cwp_models.ts +131 -48
- package/src/services/dlc/v20210125/dlc_models.ts +4 -0
- package/src/services/dsgc/v20190723/dsgc_models.ts +1 -1
- package/src/services/ims/v20201229/ims_client.ts +1 -1
- package/src/services/ims/v20201229/ims_models.ts +3 -3
- package/src/services/lke/v20231130/lke_client.ts +576 -478
- package/src/services/lke/v20231130/lke_models.ts +516 -98
- package/src/services/mps/v20190612/mps_models.ts +8 -3
- package/src/services/mqtt/v20240516/mqtt_client.ts +215 -4
- package/src/services/mqtt/v20240516/mqtt_models.ts +894 -97
- package/src/services/tcss/v20201101/tcss_client.ts +4 -2
- package/src/services/tke/v20180525/tke_client.ts +40 -16
- package/src/services/tke/v20180525/tke_models.ts +154 -70
- package/src/services/vdb/v20230616/vdb_models.ts +5 -0
- package/src/services/vod/v20180717/vod_client.ts +2 -1
- package/src/services/vod/v20180717/vod_models.ts +34 -1
- package/src/services/vpc/v20170312/vpc_models.ts +17 -1
- package/tencentcloud/common/sdk_version.d.ts +1 -1
- package/tencentcloud/common/sdk_version.js +1 -1
- package/tencentcloud/services/as/v20180419/as_models.d.ts +8 -0
- package/tencentcloud/services/asr/v20190614/asr_client.d.ts +5 -1
- package/tencentcloud/services/asr/v20190614/asr_client.js +6 -0
- package/tencentcloud/services/asr/v20190614/asr_models.d.ts +998 -930
- package/tencentcloud/services/cfg/v20210820/cfg_models.d.ts +4 -0
- package/tencentcloud/services/cwp/v20180228/cwp_client.d.ts +1 -1
- package/tencentcloud/services/cwp/v20180228/cwp_models.d.ts +128 -47
- package/tencentcloud/services/dlc/v20210125/dlc_models.d.ts +4 -0
- package/tencentcloud/services/dsgc/v20190723/dsgc_models.d.ts +1 -1
- package/tencentcloud/services/ims/v20201229/ims_client.d.ts +1 -1
- package/tencentcloud/services/ims/v20201229/ims_client.js +1 -1
- package/tencentcloud/services/ims/v20201229/ims_models.d.ts +3 -3
- package/tencentcloud/services/lke/v20231130/lke_client.d.ts +195 -163
- package/tencentcloud/services/lke/v20231130/lke_client.js +288 -240
- package/tencentcloud/services/lke/v20231130/lke_models.d.ts +497 -97
- package/tencentcloud/services/mps/v20190612/mps_models.d.ts +7 -2
- package/tencentcloud/services/mqtt/v20240516/mqtt_client.d.ts +72 -1
- package/tencentcloud/services/mqtt/v20240516/mqtt_client.js +105 -0
- package/tencentcloud/services/mqtt/v20240516/mqtt_models.d.ts +856 -97
- package/tencentcloud/services/tcss/v20201101/tcss_client.d.ts +3 -1
- package/tencentcloud/services/tcss/v20201101/tcss_client.js +3 -1
- package/tencentcloud/services/tke/v20180525/tke_client.d.ts +13 -5
- package/tencentcloud/services/tke/v20180525/tke_client.js +18 -6
- package/tencentcloud/services/tke/v20180525/tke_models.d.ts +150 -70
- package/tencentcloud/services/vdb/v20230616/vdb_models.d.ts +5 -0
- package/tencentcloud/services/vod/v20180717/vod_client.d.ts +1 -1
- package/tencentcloud/services/vod/v20180717/vod_client.js +1 -1
- package/tencentcloud/services/vod/v20180717/vod_models.d.ts +33 -1
- package/tencentcloud/services/vpc/v20170312/vpc_models.d.ts +17 -1
- package/test/asr.v20190614.test.js +10 -0
- package/test/lke.v20231130.test.js +238 -158
- package/test/mqtt.v20240516.test.js +170 -0
- package/test/tke.v20180525.test.js +24 -4
|
@@ -1,16 +1,3 @@
|
|
|
1
|
-
/**
|
|
2
|
-
* SetVocabState返回参数结构体
|
|
3
|
-
*/
|
|
4
|
-
export interface SetVocabStateResponse {
|
|
5
|
-
/**
|
|
6
|
-
* 热词表ID
|
|
7
|
-
*/
|
|
8
|
-
VocabId?: string;
|
|
9
|
-
/**
|
|
10
|
-
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
11
|
-
*/
|
|
12
|
-
RequestId?: string;
|
|
13
|
-
}
|
|
14
1
|
/**
|
|
15
2
|
* CreateCustomization返回参数结构体
|
|
16
3
|
*/
|
|
@@ -24,26 +11,6 @@ export interface CreateCustomizationResponse {
|
|
|
24
11
|
*/
|
|
25
12
|
RequestId?: string;
|
|
26
13
|
}
|
|
27
|
-
/**
|
|
28
|
-
* VoicePrintDelete请求参数结构体
|
|
29
|
-
*/
|
|
30
|
-
export interface VoicePrintDeleteRequest {
|
|
31
|
-
/**
|
|
32
|
-
* 说话人id,说话人唯一标识
|
|
33
|
-
*/
|
|
34
|
-
VoicePrintId?: string;
|
|
35
|
-
/**
|
|
36
|
-
* 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
|
|
37
|
-
*/
|
|
38
|
-
GroupId?: string;
|
|
39
|
-
/**
|
|
40
|
-
* 删除模式:
|
|
41
|
-
0.默认值,删除该条声纹
|
|
42
|
-
1.从分组中删除该条声纹,声纹本身不删除
|
|
43
|
-
2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
|
|
44
|
-
*/
|
|
45
|
-
DelMod?: number;
|
|
46
|
-
}
|
|
47
14
|
/**
|
|
48
15
|
* 关键字识别结果
|
|
49
16
|
*/
|
|
@@ -64,10 +31,6 @@ export interface KeyWordResult {
|
|
|
64
31
|
*/
|
|
65
32
|
KeyWords?: Array<string>;
|
|
66
33
|
}
|
|
67
|
-
/**
|
|
68
|
-
* DescribeAsyncRecognitionTasks请求参数结构体
|
|
69
|
-
*/
|
|
70
|
-
export declare type DescribeAsyncRecognitionTasksRequest = null;
|
|
71
34
|
/**
|
|
72
35
|
* ModifyCustomizationState请求参数结构体
|
|
73
36
|
*/
|
|
@@ -82,176 +45,194 @@ export interface ModifyCustomizationStateRequest {
|
|
|
82
45
|
ToState: number;
|
|
83
46
|
}
|
|
84
47
|
/**
|
|
85
|
-
*
|
|
48
|
+
* CreateRecTask返回参数结构体
|
|
86
49
|
*/
|
|
87
|
-
export interface
|
|
50
|
+
export interface CreateRecTaskResponse {
|
|
88
51
|
/**
|
|
89
|
-
*
|
|
52
|
+
* 录音文件识别的请求返回结果,包含结果查询需要的TaskId。
|
|
53
|
+
**注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
|
|
54
|
+
|
|
90
55
|
*/
|
|
91
|
-
Data?:
|
|
56
|
+
Data?: Task;
|
|
92
57
|
/**
|
|
93
58
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
94
59
|
*/
|
|
95
60
|
RequestId?: string;
|
|
96
61
|
}
|
|
97
62
|
/**
|
|
98
|
-
*
|
|
63
|
+
* UpdateAsrVocab返回参数结构体
|
|
99
64
|
*/
|
|
100
|
-
export interface
|
|
65
|
+
export interface UpdateAsrVocabResponse {
|
|
101
66
|
/**
|
|
102
|
-
*
|
|
67
|
+
* 热词表ID
|
|
103
68
|
*/
|
|
104
|
-
|
|
69
|
+
VocabId?: string;
|
|
105
70
|
/**
|
|
106
71
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
107
72
|
*/
|
|
108
73
|
RequestId?: string;
|
|
109
74
|
}
|
|
110
75
|
/**
|
|
111
|
-
*
|
|
76
|
+
* DeleteAsrKeyWordLib返回参数结构体
|
|
112
77
|
*/
|
|
113
|
-
export interface
|
|
78
|
+
export interface DeleteAsrKeyWordLibResponse {
|
|
79
|
+
/**
|
|
80
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
81
|
+
*/
|
|
82
|
+
RequestId?: string;
|
|
83
|
+
}
|
|
84
|
+
/**
|
|
85
|
+
* CreateAsrKeyWordLib请求参数结构体
|
|
86
|
+
*/
|
|
87
|
+
export interface CreateAsrKeyWordLibRequest {
|
|
88
|
+
/**
|
|
89
|
+
* 词表名称,长度在1-20之间
|
|
90
|
+
仅限中英文数字-_
|
|
91
|
+
*/
|
|
92
|
+
Name: string;
|
|
93
|
+
/**
|
|
94
|
+
* 词文件(纯文本文件)的二进制base64编码,以行分隔
|
|
95
|
+
格式要求:TXT
|
|
96
|
+
每行只有一个词,不满足格式则报错无法上传
|
|
97
|
+
每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
|
|
98
|
+
注意不要有空行,尤其是最后一行
|
|
99
|
+
*/
|
|
100
|
+
KeyWordFile?: string;
|
|
101
|
+
}
|
|
102
|
+
/**
|
|
103
|
+
* VoicePrintGroupVerify请求参数结构体
|
|
104
|
+
*/
|
|
105
|
+
export interface VoicePrintGroupVerifyRequest {
|
|
114
106
|
/**
|
|
115
107
|
* 音频格式 0: pcm, 1: wav
|
|
116
108
|
*/
|
|
117
109
|
VoiceFormat: number;
|
|
118
110
|
/**
|
|
119
|
-
*
|
|
111
|
+
* 音频采样率,目前支持16000,单位:Hz,必填
|
|
120
112
|
*/
|
|
121
113
|
SampleRate: number;
|
|
122
|
-
/**
|
|
123
|
-
* 说话人id, 说话人唯一标识
|
|
124
|
-
*/
|
|
125
|
-
VoicePrintId: string;
|
|
126
114
|
/**
|
|
127
115
|
* 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
|
|
128
116
|
*/
|
|
129
117
|
Data: string;
|
|
130
118
|
/**
|
|
131
|
-
*
|
|
119
|
+
* 分组id, 支持数字,字母,下划线,长度不超过128
|
|
132
120
|
*/
|
|
133
|
-
|
|
121
|
+
GroupId: string;
|
|
122
|
+
/**
|
|
123
|
+
* 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
|
|
124
|
+
*/
|
|
125
|
+
TopN: number;
|
|
134
126
|
}
|
|
135
127
|
/**
|
|
136
|
-
*
|
|
128
|
+
* GetCustomizationList返回参数结构体
|
|
137
129
|
*/
|
|
138
|
-
export interface
|
|
130
|
+
export interface GetCustomizationListResponse {
|
|
139
131
|
/**
|
|
140
|
-
*
|
|
132
|
+
* 自学习模型数组
|
|
133
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
141
134
|
*/
|
|
142
|
-
Data?:
|
|
135
|
+
Data?: Array<Model>;
|
|
136
|
+
/**
|
|
137
|
+
* 自学习模型总量
|
|
138
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
139
|
+
*/
|
|
140
|
+
TotalCount?: number;
|
|
143
141
|
/**
|
|
144
142
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
145
143
|
*/
|
|
146
144
|
RequestId?: string;
|
|
147
145
|
}
|
|
148
146
|
/**
|
|
149
|
-
*
|
|
147
|
+
* CloseAsyncRecognitionTask请求参数结构体
|
|
150
148
|
*/
|
|
151
|
-
export interface
|
|
152
|
-
/**
|
|
153
|
-
* 引擎模型类型。
|
|
154
|
-
• 16k_zh:中文普通话通用;
|
|
155
|
-
• 16k_en:英语;
|
|
156
|
-
• 16k_yue:粤语;
|
|
157
|
-
• 16k_id:印度尼西亚语;
|
|
158
|
-
• 16k_fil:菲律宾语;
|
|
159
|
-
• 16k_th:泰语;
|
|
160
|
-
• 16k_pt:葡萄牙语;
|
|
161
|
-
• 16k_tr:土耳其语;
|
|
162
|
-
• 16k_ar:阿拉伯语;
|
|
163
|
-
• 16k_es:西班牙语;
|
|
164
|
-
• 16k_hi:印地语;
|
|
165
|
-
• 16k_fr:法语;
|
|
166
|
-
• 16k_de:德语;
|
|
167
|
-
*/
|
|
168
|
-
EngineType: string;
|
|
169
|
-
/**
|
|
170
|
-
* 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
|
|
171
|
-
*/
|
|
172
|
-
Url: string;
|
|
149
|
+
export interface CloseAsyncRecognitionTaskRequest {
|
|
173
150
|
/**
|
|
174
|
-
*
|
|
151
|
+
* 语音流异步识别任务的唯一标识,在创建任务时会返回
|
|
175
152
|
*/
|
|
176
|
-
|
|
153
|
+
TaskId: number;
|
|
154
|
+
}
|
|
155
|
+
/**
|
|
156
|
+
* [录音文件识别](https://cloud.tencent.com/document/product/1093/37823#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)、[实时语音异步识别](https://cloud.tencent.com/document/product/1093/52061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)请求的返回数据
|
|
157
|
+
*/
|
|
158
|
+
export interface Task {
|
|
177
159
|
/**
|
|
178
|
-
*
|
|
160
|
+
* 任务ID,可通过此ID在轮询接口获取识别状态与结果。TaskId数据类型为**uint64**。
|
|
161
|
+
**注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
|
|
179
162
|
*/
|
|
180
|
-
|
|
163
|
+
TaskId?: number;
|
|
164
|
+
}
|
|
165
|
+
/**
|
|
166
|
+
* [音频流异步识别任务列表](https://cloud.tencent.com/document/product/1093/52060#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
167
|
+
*/
|
|
168
|
+
export interface AsyncRecognitionTasks {
|
|
181
169
|
/**
|
|
182
|
-
*
|
|
170
|
+
* 任务列表
|
|
171
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
183
172
|
*/
|
|
184
|
-
|
|
173
|
+
Tasks?: Array<AsyncRecognitionTaskInfo>;
|
|
174
|
+
}
|
|
175
|
+
/**
|
|
176
|
+
* DeleteCustomization返回参数结构体
|
|
177
|
+
*/
|
|
178
|
+
export interface DeleteCustomizationResponse {
|
|
185
179
|
/**
|
|
186
|
-
*
|
|
180
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
187
181
|
*/
|
|
188
|
-
|
|
182
|
+
RequestId?: string;
|
|
183
|
+
}
|
|
184
|
+
/**
|
|
185
|
+
* [获取录音识别结果的返回参数](https://cloud.tencent.com/document/product/1093/37822#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
186
|
+
*/
|
|
187
|
+
export interface TaskStatus {
|
|
189
188
|
/**
|
|
190
|
-
*
|
|
189
|
+
* 任务标识。注意:TaskId数据类型为uint64。
|
|
191
190
|
*/
|
|
192
|
-
|
|
191
|
+
TaskId?: number;
|
|
193
192
|
/**
|
|
194
|
-
*
|
|
193
|
+
* 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
|
|
195
194
|
*/
|
|
196
|
-
|
|
195
|
+
Status?: number;
|
|
197
196
|
/**
|
|
198
|
-
*
|
|
197
|
+
* 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
|
|
199
198
|
*/
|
|
200
|
-
|
|
199
|
+
StatusStr?: string;
|
|
201
200
|
/**
|
|
202
|
-
*
|
|
201
|
+
* 识别结果。
|
|
203
202
|
*/
|
|
204
|
-
|
|
203
|
+
Result?: string;
|
|
205
204
|
/**
|
|
206
|
-
*
|
|
205
|
+
* 失败原因说明。
|
|
207
206
|
*/
|
|
208
|
-
|
|
209
|
-
}
|
|
210
|
-
/**
|
|
211
|
-
* [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
|
|
212
|
-
*/
|
|
213
|
-
export interface HotWord {
|
|
207
|
+
ErrorMsg?: string;
|
|
214
208
|
/**
|
|
215
|
-
*
|
|
209
|
+
* 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
|
|
216
210
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
217
211
|
*/
|
|
218
|
-
|
|
212
|
+
ResultDetail?: Array<SentenceDetail>;
|
|
219
213
|
/**
|
|
220
|
-
*
|
|
214
|
+
* 音频时长(秒)。
|
|
221
215
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
222
216
|
*/
|
|
223
|
-
|
|
224
|
-
}
|
|
225
|
-
/**
|
|
226
|
-
* GetModelInfo请求参数结构体
|
|
227
|
-
*/
|
|
228
|
-
export interface GetModelInfoRequest {
|
|
229
|
-
/**
|
|
230
|
-
* 模型id
|
|
231
|
-
*/
|
|
232
|
-
ModelId: string;
|
|
217
|
+
AudioDuration?: number;
|
|
233
218
|
}
|
|
234
219
|
/**
|
|
235
|
-
*
|
|
220
|
+
* GetCustomizationList请求参数结构体
|
|
236
221
|
*/
|
|
237
|
-
export interface
|
|
222
|
+
export interface GetCustomizationListRequest {
|
|
238
223
|
/**
|
|
239
|
-
*
|
|
224
|
+
* 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
|
|
225
|
+
* @deprecated
|
|
240
226
|
*/
|
|
241
|
-
|
|
242
|
-
}
|
|
243
|
-
/**
|
|
244
|
-
* DescribeTaskStatus返回参数结构体
|
|
245
|
-
*/
|
|
246
|
-
export interface DescribeTaskStatusResponse {
|
|
227
|
+
TagInfos?: Array<string>;
|
|
247
228
|
/**
|
|
248
|
-
*
|
|
229
|
+
* 分页大小,默认1000
|
|
249
230
|
*/
|
|
250
|
-
|
|
231
|
+
Limit?: number;
|
|
251
232
|
/**
|
|
252
|
-
*
|
|
233
|
+
* 分页offset,默认0
|
|
253
234
|
*/
|
|
254
|
-
|
|
235
|
+
Offset?: number;
|
|
255
236
|
}
|
|
256
237
|
/**
|
|
257
238
|
* SentenceRecognition请求参数结构体
|
|
@@ -375,304 +356,294 @@ export interface SentenceRecognitionRequest {
|
|
|
375
356
|
InputSampleRate?: number;
|
|
376
357
|
}
|
|
377
358
|
/**
|
|
378
|
-
*
|
|
359
|
+
* VoicePrintCount请求参数结构体
|
|
379
360
|
*/
|
|
380
|
-
export interface
|
|
361
|
+
export interface VoicePrintCountRequest {
|
|
381
362
|
/**
|
|
382
|
-
*
|
|
383
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
363
|
+
* 分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
|
|
384
364
|
*/
|
|
385
|
-
|
|
365
|
+
GroupId?: string;
|
|
386
366
|
/**
|
|
387
|
-
*
|
|
388
|
-
|
|
367
|
+
* 统计模式
|
|
368
|
+
0: 统计所有声纹数量
|
|
369
|
+
1: 统计指定分组下的声纹数量
|
|
389
370
|
*/
|
|
390
|
-
|
|
391
|
-
/**
|
|
392
|
-
* 验证结果 0: 未通过 1: 通过
|
|
393
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
394
|
-
*/
|
|
395
|
-
Decision?: number;
|
|
371
|
+
CountMod?: number;
|
|
396
372
|
}
|
|
397
373
|
/**
|
|
398
|
-
*
|
|
374
|
+
* VoicePrintCompare返回参数结构体
|
|
399
375
|
*/
|
|
400
|
-
export interface
|
|
376
|
+
export interface VoicePrintCompareResponse {
|
|
401
377
|
/**
|
|
402
|
-
*
|
|
403
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
378
|
+
* 音频声纹比对结果,包含相似度打分
|
|
404
379
|
*/
|
|
405
|
-
|
|
380
|
+
Data?: VoicePrintCompareData;
|
|
406
381
|
/**
|
|
407
|
-
*
|
|
408
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
382
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
409
383
|
*/
|
|
410
|
-
|
|
384
|
+
RequestId?: string;
|
|
385
|
+
}
|
|
386
|
+
/**
|
|
387
|
+
* 声纹组对比结果top数据
|
|
388
|
+
*/
|
|
389
|
+
export interface VerifyTop {
|
|
411
390
|
/**
|
|
412
|
-
*
|
|
391
|
+
* 相似度打分
|
|
413
392
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
414
393
|
*/
|
|
415
|
-
|
|
394
|
+
Score?: string;
|
|
416
395
|
/**
|
|
417
|
-
*
|
|
396
|
+
* 说话人id
|
|
418
397
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
419
398
|
*/
|
|
420
|
-
|
|
399
|
+
VoicePrintId?: string;
|
|
421
400
|
/**
|
|
422
|
-
*
|
|
401
|
+
* 说话人昵称
|
|
423
402
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
424
403
|
*/
|
|
425
|
-
|
|
404
|
+
SpeakerId?: string;
|
|
426
405
|
}
|
|
427
406
|
/**
|
|
428
|
-
*
|
|
407
|
+
* SetVocabState返回参数结构体
|
|
429
408
|
*/
|
|
430
|
-
export interface
|
|
409
|
+
export interface SetVocabStateResponse {
|
|
410
|
+
/**
|
|
411
|
+
* 热词表ID
|
|
412
|
+
*/
|
|
413
|
+
VocabId?: string;
|
|
431
414
|
/**
|
|
432
415
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
433
416
|
*/
|
|
434
417
|
RequestId?: string;
|
|
435
418
|
}
|
|
436
419
|
/**
|
|
437
|
-
*
|
|
420
|
+
* 用户用量信息
|
|
438
421
|
*/
|
|
439
|
-
export interface
|
|
440
|
-
/**
|
|
441
|
-
* 单句最终识别结果
|
|
442
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
443
|
-
*/
|
|
444
|
-
FinalSentence?: string;
|
|
445
|
-
/**
|
|
446
|
-
* 单句中间识别结果,使用空格拆分为多个词
|
|
447
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
448
|
-
*/
|
|
449
|
-
SliceSentence?: string;
|
|
450
|
-
/**
|
|
451
|
-
* 口语转书面语结果,开启改功能才有值
|
|
452
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
453
|
-
*/
|
|
454
|
-
WrittenText?: string;
|
|
455
|
-
/**
|
|
456
|
-
* 单句开始时间(毫秒)
|
|
457
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
458
|
-
*/
|
|
459
|
-
StartMs?: number;
|
|
460
|
-
/**
|
|
461
|
-
* 单句结束时间(毫秒)
|
|
462
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
463
|
-
*/
|
|
464
|
-
EndMs?: number;
|
|
465
|
-
/**
|
|
466
|
-
* 单句中词个数
|
|
467
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
468
|
-
*/
|
|
469
|
-
WordsNum?: number;
|
|
470
|
-
/**
|
|
471
|
-
* 单句中词详情
|
|
472
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
473
|
-
*/
|
|
474
|
-
Words?: Array<SentenceWords>;
|
|
475
|
-
/**
|
|
476
|
-
* 单句语速,单位:字数/秒
|
|
477
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
478
|
-
*/
|
|
479
|
-
SpeechSpeed?: number;
|
|
480
|
-
/**
|
|
481
|
-
* 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
|
|
482
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
483
|
-
*/
|
|
484
|
-
SpeakerId?: number;
|
|
422
|
+
export interface UsageByDateInfoData {
|
|
485
423
|
/**
|
|
486
|
-
*
|
|
424
|
+
* 用量信息列表
|
|
487
425
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
488
426
|
*/
|
|
489
|
-
|
|
427
|
+
UsageByDateInfoList?: Array<UsageByDateInfo>;
|
|
428
|
+
}
|
|
429
|
+
/**
|
|
430
|
+
* VoicePrintDelete请求参数结构体
|
|
431
|
+
*/
|
|
432
|
+
export interface VoicePrintDeleteRequest {
|
|
490
433
|
/**
|
|
491
|
-
*
|
|
492
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
434
|
+
* 说话人id,说话人唯一标识
|
|
493
435
|
*/
|
|
494
|
-
|
|
436
|
+
VoicePrintId?: string;
|
|
495
437
|
/**
|
|
496
|
-
*
|
|
497
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
438
|
+
* 说话人分组ID,仅支持大小写字母和下划线的组合,不超过128个字符
|
|
498
439
|
*/
|
|
499
|
-
|
|
440
|
+
GroupId?: string;
|
|
500
441
|
/**
|
|
501
|
-
*
|
|
502
|
-
|
|
442
|
+
* 删除模式:
|
|
443
|
+
0.默认值,删除该条声纹
|
|
444
|
+
1.从分组中删除该条声纹,声纹本身不删除
|
|
445
|
+
2.从声纹库中删除分组,仅删除分组信息,不会真正删除分组中的声纹
|
|
503
446
|
*/
|
|
504
|
-
|
|
447
|
+
DelMod?: number;
|
|
505
448
|
}
|
|
506
449
|
/**
|
|
507
|
-
*
|
|
450
|
+
* DescribeAsyncRecognitionTasks请求参数结构体
|
|
508
451
|
*/
|
|
509
|
-
export
|
|
452
|
+
export declare type DescribeAsyncRecognitionTasksRequest = null;
|
|
453
|
+
/**
|
|
454
|
+
* GetAsrKeyWordLibList返回参数结构体
|
|
455
|
+
*/
|
|
456
|
+
export interface GetAsrKeyWordLibListResponse {
|
|
510
457
|
/**
|
|
511
|
-
*
|
|
458
|
+
* 关键词列表返回数据
|
|
512
459
|
*/
|
|
513
|
-
|
|
460
|
+
Data?: KeyWordLibListData;
|
|
514
461
|
/**
|
|
515
|
-
*
|
|
462
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
516
463
|
*/
|
|
517
|
-
|
|
464
|
+
RequestId?: string;
|
|
465
|
+
}
|
|
466
|
+
/**
|
|
467
|
+
* VoicePrintEnroll返回参数结构体
|
|
468
|
+
*/
|
|
469
|
+
export interface VoicePrintEnrollResponse {
|
|
518
470
|
/**
|
|
519
|
-
*
|
|
471
|
+
* 说话人基本数据
|
|
520
472
|
*/
|
|
521
|
-
|
|
473
|
+
Data?: VoicePrintBaseData;
|
|
522
474
|
/**
|
|
523
|
-
*
|
|
524
|
-
* @deprecated
|
|
475
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
525
476
|
*/
|
|
526
|
-
|
|
477
|
+
RequestId?: string;
|
|
527
478
|
}
|
|
528
479
|
/**
|
|
529
|
-
*
|
|
480
|
+
* CreateAsrKeyWordLib返回参数结构体
|
|
530
481
|
*/
|
|
531
|
-
export interface
|
|
532
|
-
/**
|
|
533
|
-
* 词表ID。
|
|
534
|
-
*/
|
|
535
|
-
VocabId?: string;
|
|
482
|
+
export interface CreateAsrKeyWordLibResponse {
|
|
536
483
|
/**
|
|
537
|
-
*
|
|
484
|
+
* 词表ID数据
|
|
538
485
|
*/
|
|
539
|
-
|
|
486
|
+
Data?: KeyWordLibIdData;
|
|
540
487
|
/**
|
|
541
488
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
542
489
|
*/
|
|
543
490
|
RequestId?: string;
|
|
544
491
|
}
|
|
545
492
|
/**
|
|
546
|
-
*
|
|
493
|
+
* CreateAsyncRecognitionTask请求参数结构体
|
|
547
494
|
*/
|
|
548
|
-
export interface
|
|
495
|
+
export interface CreateAsyncRecognitionTaskRequest {
|
|
549
496
|
/**
|
|
550
|
-
*
|
|
497
|
+
* 引擎模型类型。
|
|
498
|
+
• 16k_zh:中文普通话通用;
|
|
499
|
+
• 16k_en:英语;
|
|
500
|
+
• 16k_yue:粤语;
|
|
501
|
+
• 16k_id:印度尼西亚语;
|
|
502
|
+
• 16k_fil:菲律宾语;
|
|
503
|
+
• 16k_th:泰语;
|
|
504
|
+
• 16k_pt:葡萄牙语;
|
|
505
|
+
• 16k_tr:土耳其语;
|
|
506
|
+
• 16k_ar:阿拉伯语;
|
|
507
|
+
• 16k_es:西班牙语;
|
|
508
|
+
• 16k_hi:印地语;
|
|
509
|
+
• 16k_fr:法语;
|
|
510
|
+
• 16k_de:德语;
|
|
551
511
|
*/
|
|
552
|
-
|
|
512
|
+
EngineType: string;
|
|
553
513
|
/**
|
|
554
|
-
*
|
|
514
|
+
* 语音流地址,支持rtmp、rtsp等流媒体协议,以及各类基于http协议的直播流(不支持hls, m3u8)
|
|
555
515
|
*/
|
|
556
|
-
|
|
516
|
+
Url: string;
|
|
557
517
|
/**
|
|
558
|
-
*
|
|
518
|
+
* 支持HTTP和HTTPS协议,用于接收识别结果,您需要自行搭建公网可调用的服务。回调格式&内容详见:[语音流异步识别回调说明](https://cloud.tencent.com/document/product/1093/52633)
|
|
559
519
|
*/
|
|
560
|
-
|
|
520
|
+
CallbackUrl: string;
|
|
561
521
|
/**
|
|
562
|
-
*
|
|
522
|
+
* 用于生成回调通知中的签名
|
|
563
523
|
*/
|
|
564
|
-
|
|
524
|
+
SignToken?: string;
|
|
565
525
|
/**
|
|
566
|
-
*
|
|
526
|
+
* 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0
|
|
567
527
|
*/
|
|
568
|
-
|
|
528
|
+
FilterDirty?: number;
|
|
569
529
|
/**
|
|
570
|
-
*
|
|
530
|
+
* 是否过语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0
|
|
571
531
|
*/
|
|
572
|
-
|
|
532
|
+
FilterModal?: number;
|
|
573
533
|
/**
|
|
574
|
-
*
|
|
534
|
+
* 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认为0
|
|
575
535
|
*/
|
|
576
|
-
|
|
536
|
+
FilterPunc?: number;
|
|
577
537
|
/**
|
|
578
|
-
*
|
|
579
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
538
|
+
* 是否进行阿拉伯数字智能转换。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字。默认值为1
|
|
580
539
|
*/
|
|
581
|
-
|
|
582
|
-
}
|
|
583
|
-
/**
|
|
584
|
-
* CreateRecTask返回参数结构体
|
|
585
|
-
*/
|
|
586
|
-
export interface CreateRecTaskResponse {
|
|
540
|
+
ConvertNumMode?: number;
|
|
587
541
|
/**
|
|
588
|
-
*
|
|
589
|
-
**注意:TaskId有效期为24小时,不同日期可能出现重复TaskId,请不要依赖TaskId作为您业务系统里的唯一ID。**
|
|
590
|
-
|
|
542
|
+
* 是否显示词级别时间戳。0:不显示;1:显示,不包含标点时间戳,2:显示,包含标点时间戳。默认为0
|
|
591
543
|
*/
|
|
592
|
-
|
|
544
|
+
WordInfo?: number;
|
|
593
545
|
/**
|
|
594
|
-
*
|
|
546
|
+
* 热词id。用于调用对应的热词表,如果在调用语音识别服务时,不进行单独的热词id设置,自动生效默认热词;如果进行了单独的热词id设置,那么将生效单独设置的热词id。
|
|
595
547
|
*/
|
|
596
|
-
|
|
548
|
+
HotwordId?: string;
|
|
549
|
+
/**
|
|
550
|
+
* 回调数据中,是否需要对应音频数据。
|
|
551
|
+
*/
|
|
552
|
+
AudioData?: boolean;
|
|
597
553
|
}
|
|
598
554
|
/**
|
|
599
|
-
*
|
|
555
|
+
* GetAsrVocab请求参数结构体
|
|
600
556
|
*/
|
|
601
|
-
export interface
|
|
602
|
-
/**
|
|
603
|
-
* 关键词表ID
|
|
604
|
-
*/
|
|
605
|
-
KeyWordLibId: string;
|
|
606
|
-
/**
|
|
607
|
-
* 词表名称,长度在1-20之间
|
|
608
|
-
仅限中英文数字-_
|
|
609
|
-
*/
|
|
610
|
-
Name?: string;
|
|
557
|
+
export interface GetAsrVocabRequest {
|
|
611
558
|
/**
|
|
612
|
-
*
|
|
613
|
-
- 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
|
|
614
|
-
- 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
|
|
615
|
-
- 此参数为空则只更新词表名称
|
|
559
|
+
* 热词表ID
|
|
616
560
|
*/
|
|
617
|
-
|
|
561
|
+
VocabId: string;
|
|
618
562
|
}
|
|
619
563
|
/**
|
|
620
|
-
*
|
|
564
|
+
* DescribeTaskStatus返回参数结构体
|
|
621
565
|
*/
|
|
622
|
-
export interface
|
|
566
|
+
export interface DescribeTaskStatusResponse {
|
|
567
|
+
/**
|
|
568
|
+
* 录音文件识别的请求返回结果。
|
|
569
|
+
*/
|
|
570
|
+
Data?: TaskStatus;
|
|
623
571
|
/**
|
|
624
572
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
625
573
|
*/
|
|
626
574
|
RequestId?: string;
|
|
627
575
|
}
|
|
628
576
|
/**
|
|
629
|
-
*
|
|
577
|
+
* [说话人验证数据](https://cloud.tencent.com/document/product/1093/94481#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
630
578
|
*/
|
|
631
|
-
export interface
|
|
579
|
+
export interface VoicePrintVerifyData {
|
|
632
580
|
/**
|
|
633
|
-
*
|
|
581
|
+
* 说话人id
|
|
582
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
634
583
|
*/
|
|
635
|
-
|
|
584
|
+
VoicePrintId?: string;
|
|
585
|
+
/**
|
|
586
|
+
* 匹配度 取值范围(0.0 - 100.0)
|
|
587
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
588
|
+
*/
|
|
589
|
+
Score?: string;
|
|
590
|
+
/**
|
|
591
|
+
* 验证结果 0: 未通过 1: 通过
|
|
592
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
593
|
+
*/
|
|
594
|
+
Decision?: number;
|
|
636
595
|
}
|
|
637
596
|
/**
|
|
638
|
-
*
|
|
597
|
+
* [一句话识别](https://cloud.tencent.com/document/product/1093/35646#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)返回的词时间戳
|
|
639
598
|
*/
|
|
640
|
-
export interface
|
|
599
|
+
export interface SentenceWord {
|
|
641
600
|
/**
|
|
642
|
-
*
|
|
601
|
+
* 词结果
|
|
643
602
|
*/
|
|
644
|
-
|
|
603
|
+
Word?: string;
|
|
604
|
+
/**
|
|
605
|
+
* 词在音频中的开始时间
|
|
606
|
+
*/
|
|
607
|
+
StartTime?: number;
|
|
608
|
+
/**
|
|
609
|
+
* 词在音频中的结束时间
|
|
610
|
+
*/
|
|
611
|
+
EndTime?: number;
|
|
645
612
|
}
|
|
646
613
|
/**
|
|
647
|
-
*
|
|
614
|
+
* DownloadAsrVocab返回参数结构体
|
|
648
615
|
*/
|
|
649
|
-
export interface
|
|
616
|
+
export interface DownloadAsrVocabResponse {
|
|
650
617
|
/**
|
|
651
|
-
*
|
|
618
|
+
* 词表ID。
|
|
652
619
|
*/
|
|
653
|
-
|
|
620
|
+
VocabId?: string;
|
|
621
|
+
/**
|
|
622
|
+
* 词表权重文件形式的base64值。
|
|
623
|
+
*/
|
|
624
|
+
WordWeightStr?: string;
|
|
654
625
|
/**
|
|
655
626
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
656
627
|
*/
|
|
657
628
|
RequestId?: string;
|
|
658
629
|
}
|
|
659
630
|
/**
|
|
660
|
-
*
|
|
631
|
+
* ModifyCustomization返回参数结构体
|
|
661
632
|
*/
|
|
662
|
-
export interface
|
|
663
|
-
/**
|
|
664
|
-
* 说话人基本信息
|
|
665
|
-
*/
|
|
666
|
-
Data?: VoicePrintBaseData;
|
|
633
|
+
export interface ModifyCustomizationResponse {
|
|
667
634
|
/**
|
|
668
635
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
669
636
|
*/
|
|
670
637
|
RequestId?: string;
|
|
671
638
|
}
|
|
672
639
|
/**
|
|
673
|
-
*
|
|
640
|
+
* GetAsrVocabList请求参数结构体
|
|
674
641
|
*/
|
|
675
|
-
export interface
|
|
642
|
+
export interface GetAsrVocabListRequest {
|
|
643
|
+
/**
|
|
644
|
+
* 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
|
|
645
|
+
*/
|
|
646
|
+
TagInfos?: Array<string>;
|
|
676
647
|
/**
|
|
677
648
|
* 分页Offset
|
|
678
649
|
*/
|
|
@@ -681,317 +652,187 @@ export interface GetAsrKeyWordLibListRequest {
|
|
|
681
652
|
* 分页Limit
|
|
682
653
|
*/
|
|
683
654
|
Limit?: number;
|
|
655
|
+
}
|
|
656
|
+
/**
|
|
657
|
+
* 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
658
|
+
*/
|
|
659
|
+
export interface VoicePrintCountData {
|
|
684
660
|
/**
|
|
685
|
-
*
|
|
661
|
+
* 总数
|
|
662
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
686
663
|
*/
|
|
687
|
-
|
|
664
|
+
Total?: number;
|
|
688
665
|
/**
|
|
689
|
-
*
|
|
666
|
+
* 说话人id列表
|
|
667
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
690
668
|
*/
|
|
691
|
-
|
|
669
|
+
VoicePrintList?: Array<VoicePrintBaseData>;
|
|
692
670
|
}
|
|
693
671
|
/**
|
|
694
|
-
*
|
|
672
|
+
* VoicePrintUpdate请求参数结构体
|
|
695
673
|
*/
|
|
696
|
-
export interface
|
|
674
|
+
export interface VoicePrintUpdateRequest {
|
|
697
675
|
/**
|
|
698
|
-
*
|
|
699
|
-
仅限中英文数字-_
|
|
676
|
+
* 音频格式 0: pcm, 1: wav
|
|
700
677
|
*/
|
|
701
|
-
|
|
678
|
+
VoiceFormat: number;
|
|
702
679
|
/**
|
|
703
|
-
*
|
|
704
|
-
格式要求:TXT
|
|
705
|
-
每行只有一个词,不满足格式则报错无法上传
|
|
706
|
-
每个词限制**5个汉字,15个字符**,单个词库最多不超过100个词
|
|
707
|
-
注意不要有空行,尤其是最后一行
|
|
680
|
+
* 音频采样率 目前仅支持16000 单位Hz
|
|
708
681
|
*/
|
|
709
|
-
|
|
710
|
-
}
|
|
711
|
-
/**
|
|
712
|
-
* DownloadCustomization返回参数结构体
|
|
713
|
-
*/
|
|
714
|
-
export interface DownloadCustomizationResponse {
|
|
682
|
+
SampleRate: number;
|
|
715
683
|
/**
|
|
716
|
-
*
|
|
684
|
+
* 说话人id, 说话人唯一标识
|
|
717
685
|
*/
|
|
718
|
-
|
|
686
|
+
VoicePrintId: string;
|
|
719
687
|
/**
|
|
720
|
-
*
|
|
688
|
+
* 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
|
|
721
689
|
*/
|
|
722
|
-
|
|
690
|
+
Data: string;
|
|
691
|
+
/**
|
|
692
|
+
* 说话人昵称 不超过32字节
|
|
693
|
+
*/
|
|
694
|
+
SpeakerNick?: string;
|
|
723
695
|
}
|
|
724
696
|
/**
|
|
725
|
-
*
|
|
697
|
+
* DeleteAsrVocab请求参数结构体
|
|
726
698
|
*/
|
|
727
|
-
export interface
|
|
699
|
+
export interface DeleteAsrVocabRequest {
|
|
728
700
|
/**
|
|
729
|
-
*
|
|
730
|
-
识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
|
|
731
|
-
|
|
732
|
-
电话通讯场景引擎:
|
|
733
|
-
**注意:电话通讯场景,请务必使用以下8k引擎**
|
|
734
|
-
• 8k_zh:中文电话通讯;
|
|
735
|
-
• 8k_en:英文电话通讯;
|
|
736
|
-
• **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
|
|
737
|
-
|
|
738
|
-
注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
|
|
739
|
-
|
|
740
|
-
通用场景引擎:
|
|
741
|
-
**注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
|
|
742
|
-
• **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
|
|
743
|
-
• **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
|
|
744
|
-
• **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
|
|
745
|
-
• **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
|
|
746
|
-
• **16k_en:**英语;
|
|
747
|
-
• **16k_yue:**粤语;
|
|
748
|
-
• **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
|
|
749
|
-
• **16k_ja:**日语;
|
|
750
|
-
• **16k_ko:**韩语;
|
|
751
|
-
• **16k_vi:**越南语;
|
|
752
|
-
• **16k_ms:**马来语;
|
|
753
|
-
• **16k_id:**印度尼西亚语;
|
|
754
|
-
• **16k_fil:**菲律宾语;
|
|
755
|
-
• **16k_th:**泰语;
|
|
756
|
-
• **16k_pt:**葡萄牙语;
|
|
757
|
-
• **16k_tr:**土耳其语;
|
|
758
|
-
• **16k_ar:**阿拉伯语;
|
|
759
|
-
• **16k_es:**西班牙语;
|
|
760
|
-
• **16k_hi:**印地语;
|
|
761
|
-
• **16k_fr:**法语;
|
|
762
|
-
• **16k_zh_medical:**中文医疗引擎;
|
|
763
|
-
• **16k_de:**德语;
|
|
701
|
+
* 热词表Id
|
|
764
702
|
*/
|
|
765
|
-
|
|
703
|
+
VocabId: string;
|
|
704
|
+
}
|
|
705
|
+
/**
|
|
706
|
+
* UpdateAsrVocab请求参数结构体
|
|
707
|
+
*/
|
|
708
|
+
export interface UpdateAsrVocabRequest {
|
|
766
709
|
/**
|
|
767
|
-
*
|
|
768
|
-
1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
|
|
769
|
-
2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
|
|
770
|
-
|
|
771
|
-
注意:
|
|
772
|
-
• 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
|
|
773
|
-
• 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
|
|
710
|
+
* 热词表ID
|
|
774
711
|
*/
|
|
775
|
-
|
|
712
|
+
VocabId: string;
|
|
776
713
|
/**
|
|
777
|
-
*
|
|
778
|
-
0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
|
|
779
|
-
1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
|
|
780
|
-
2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
|
|
781
|
-
3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
|
|
782
|
-
4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
|
|
783
|
-
5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
|
|
784
|
-
|
|
785
|
-
注意:
|
|
786
|
-
如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
787
|
-
如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
714
|
+
* 热词表名称,长度在1-255之间
|
|
788
715
|
*/
|
|
789
|
-
|
|
716
|
+
Name?: string;
|
|
790
717
|
/**
|
|
791
|
-
*
|
|
792
|
-
0:音频URL;
|
|
793
|
-
1:音频数据(post body)
|
|
718
|
+
* 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或100,数组长度不大于1000 (注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
|
|
794
719
|
*/
|
|
795
|
-
|
|
720
|
+
WordWeights?: Array<HotWord>;
|
|
796
721
|
/**
|
|
797
|
-
*
|
|
798
|
-
|
|
799
|
-
|
|
800
|
-
注意:音频数据要小于5MB(含)
|
|
722
|
+
* 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
|
|
723
|
+
当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
|
|
724
|
+
(注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
|
|
801
725
|
*/
|
|
802
|
-
|
|
726
|
+
WordWeightStr?: string;
|
|
803
727
|
/**
|
|
804
|
-
*
|
|
728
|
+
* 热词表描述,长度在0-1000之间
|
|
805
729
|
*/
|
|
806
|
-
|
|
730
|
+
Description?: string;
|
|
731
|
+
}
|
|
732
|
+
/**
|
|
733
|
+
* CreateAsrVocab返回参数结构体
|
|
734
|
+
*/
|
|
735
|
+
export interface CreateAsrVocabResponse {
|
|
807
736
|
/**
|
|
808
|
-
*
|
|
809
|
-
**当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
|
|
810
|
-
|
|
811
|
-
注意:
|
|
812
|
-
1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
|
|
813
|
-
2. 请保证文件的下载速度,否则可能下载失败
|
|
737
|
+
* 词表ID,可用于获取词表信息
|
|
814
738
|
*/
|
|
815
|
-
|
|
739
|
+
VocabId?: string;
|
|
816
740
|
/**
|
|
817
|
-
*
|
|
818
|
-
用户自行搭建的用于接收识别结果的服务URL
|
|
819
|
-
回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
|
820
|
-
|
|
821
|
-
注意:
|
|
822
|
-
|
|
823
|
-
- 如果用户使用轮询方式获取识别结果,则无需提交该参数
|
|
824
|
-
- 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
|
|
741
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
825
742
|
*/
|
|
826
|
-
|
|
743
|
+
RequestId?: string;
|
|
744
|
+
}
|
|
745
|
+
/**
|
|
746
|
+
* SentenceRecognition返回参数结构体
|
|
747
|
+
*/
|
|
748
|
+
export interface SentenceRecognitionResponse {
|
|
827
749
|
/**
|
|
828
|
-
*
|
|
829
|
-
0:不开启;
|
|
830
|
-
1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect,且ChannelNum=1时可用);
|
|
831
|
-
默认值为 0
|
|
832
|
-
|
|
833
|
-
注意:
|
|
834
|
-
8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
|
|
750
|
+
* 识别结果。
|
|
835
751
|
*/
|
|
836
|
-
|
|
752
|
+
Result?: string;
|
|
837
753
|
/**
|
|
838
|
-
*
|
|
839
|
-
**需配合开启说话人分离使用,不开启无效**,取值范围:0-10
|
|
840
|
-
0:自动分离(最多分离出20个人);
|
|
841
|
-
1-10:指定人数分离;
|
|
842
|
-
默认值为 0
|
|
754
|
+
* 请求的音频时长,单位为ms
|
|
843
755
|
*/
|
|
844
|
-
|
|
756
|
+
AudioDuration?: number;
|
|
845
757
|
/**
|
|
846
|
-
*
|
|
847
|
-
|
|
848
|
-
如设置该参数,将生效对应id的热词表;
|
|
849
|
-
点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
|
|
758
|
+
* 词时间戳列表的长度
|
|
759
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
850
760
|
*/
|
|
851
|
-
|
|
852
|
-
/**
|
|
853
|
-
* 热词增强功能(目前仅支持8k_zh/16k_zh引擎)
|
|
854
|
-
1:开启热词增强功能
|
|
855
|
-
|
|
856
|
-
注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
|
|
857
|
-
* @deprecated
|
|
858
|
-
*/
|
|
859
|
-
ReinforceHotword?: number;
|
|
860
|
-
/**
|
|
861
|
-
* 自学习定制模型 id
|
|
862
|
-
如设置了该参数,将生效对应id的自学习定制模型;
|
|
863
|
-
点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
|
|
864
|
-
*/
|
|
865
|
-
CustomizationId?: string;
|
|
866
|
-
/**
|
|
867
|
-
* **【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh)
|
|
868
|
-
0:不开启;
|
|
869
|
-
1:开启情绪识别,但不在文本展示情绪标签;
|
|
870
|
-
2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
|
|
871
|
-
默认值为0
|
|
872
|
-
支持的情绪分类为:高兴、伤心、愤怒
|
|
873
|
-
|
|
874
|
-
注意:
|
|
875
|
-
1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
|
|
876
|
-
2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
|
|
877
|
-
3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
|
|
878
|
-
*/
|
|
879
|
-
EmotionRecognition?: number;
|
|
761
|
+
WordSize?: number;
|
|
880
762
|
/**
|
|
881
|
-
*
|
|
882
|
-
|
|
883
|
-
0:不开启;
|
|
884
|
-
1:开启;
|
|
885
|
-
默认值为0
|
|
763
|
+
* 词时间戳列表
|
|
764
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
886
765
|
*/
|
|
887
|
-
|
|
766
|
+
WordList?: Array<SentenceWord>;
|
|
888
767
|
/**
|
|
889
|
-
*
|
|
890
|
-
0:不转换,直接输出中文数字;
|
|
891
|
-
1:根据场景智能转换为阿拉伯数字;
|
|
892
|
-
3:打开数学相关数字转换(如:阿尔法转写为α);
|
|
893
|
-
默认值为 1
|
|
768
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
894
769
|
*/
|
|
895
|
-
|
|
770
|
+
RequestId?: string;
|
|
771
|
+
}
|
|
772
|
+
/**
|
|
773
|
+
* [说话人基础数据](https://cloud.tencent.com/document/product/1093/94483#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0),包括说话人id和说话人昵称
|
|
774
|
+
*/
|
|
775
|
+
export interface VoicePrintBaseData {
|
|
896
776
|
/**
|
|
897
|
-
*
|
|
898
|
-
|
|
899
|
-
1:过滤脏词;
|
|
900
|
-
2:将脏词替换为 * ;
|
|
901
|
-
默认值为 0
|
|
777
|
+
* 说话人id
|
|
778
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
902
779
|
*/
|
|
903
|
-
|
|
780
|
+
VoicePrintId?: string;
|
|
904
781
|
/**
|
|
905
|
-
*
|
|
906
|
-
|
|
907
|
-
1:过滤句末标点;
|
|
908
|
-
2:过滤所有标点;
|
|
909
|
-
默认值为 0
|
|
782
|
+
* 说话人昵称
|
|
783
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
910
784
|
*/
|
|
911
|
-
|
|
785
|
+
SpeakerNick?: string;
|
|
786
|
+
}
|
|
787
|
+
/**
|
|
788
|
+
* DescribeAsyncRecognitionTasks返回参数结构体
|
|
789
|
+
*/
|
|
790
|
+
export interface DescribeAsyncRecognitionTasksResponse {
|
|
912
791
|
/**
|
|
913
|
-
*
|
|
914
|
-
|
|
915
|
-
1:过滤部分语气词;
|
|
916
|
-
2:严格过滤语气词;
|
|
917
|
-
默认值为 0
|
|
792
|
+
* 任务列表
|
|
793
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
918
794
|
*/
|
|
919
|
-
|
|
795
|
+
Data?: AsyncRecognitionTasks;
|
|
920
796
|
/**
|
|
921
|
-
*
|
|
922
|
-
**可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
|
|
923
|
-
0:不开启该功能;
|
|
924
|
-
默认值为0
|
|
925
|
-
|
|
926
|
-
注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
|
|
797
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
927
798
|
*/
|
|
928
|
-
|
|
799
|
+
RequestId?: string;
|
|
800
|
+
}
|
|
801
|
+
/**
|
|
802
|
+
* GetAsrVocabList返回参数结构体
|
|
803
|
+
*/
|
|
804
|
+
export interface GetAsrVocabListResponse {
|
|
929
805
|
/**
|
|
930
|
-
*
|
|
806
|
+
* 热词表列表
|
|
931
807
|
*/
|
|
932
|
-
|
|
808
|
+
VocabList?: Array<Vocab>;
|
|
933
809
|
/**
|
|
934
|
-
*
|
|
935
|
-
|
|
936
|
-
- 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
|
|
937
|
-
|
|
938
|
-
- 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
|
|
939
|
-
|
|
940
|
-
- 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
|
|
941
|
-
|
|
942
|
-
- hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
|
|
943
|
-
|
|
944
|
-
- hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
|
|
945
|
-
|
|
946
|
-
注意:
|
|
947
|
-
|
|
948
|
-
- 如果同时传入了 hotword_id 和 hotword_list,会优先使用 hotword_list;
|
|
949
|
-
|
|
950
|
-
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
951
|
-
|
|
952
|
-
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
810
|
+
* 热词列表总数
|
|
953
811
|
*/
|
|
954
|
-
|
|
812
|
+
TotalCount?: number;
|
|
955
813
|
/**
|
|
956
|
-
*
|
|
957
|
-
|
|
814
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
958
815
|
*/
|
|
959
|
-
|
|
816
|
+
RequestId?: string;
|
|
960
817
|
}
|
|
961
818
|
/**
|
|
962
|
-
*
|
|
819
|
+
* DownloadCustomization请求参数结构体
|
|
963
820
|
*/
|
|
964
|
-
export interface
|
|
821
|
+
export interface DownloadCustomizationRequest {
|
|
965
822
|
/**
|
|
966
|
-
*
|
|
967
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
823
|
+
* 自学习模型ID
|
|
968
824
|
*/
|
|
969
|
-
|
|
825
|
+
ModelId: string;
|
|
970
826
|
}
|
|
971
827
|
/**
|
|
972
|
-
*
|
|
828
|
+
* 说话人验证1:N返回结果
|
|
973
829
|
*/
|
|
974
|
-
export interface
|
|
975
|
-
/**
|
|
976
|
-
* 音频格式 0: pcm, 1: wav
|
|
977
|
-
*/
|
|
978
|
-
VoiceFormat: number;
|
|
979
|
-
/**
|
|
980
|
-
* 音频采样率,目前支持16000,单位:Hz,必填
|
|
981
|
-
*/
|
|
982
|
-
SampleRate: number;
|
|
983
|
-
/**
|
|
984
|
-
* 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
|
|
985
|
-
*/
|
|
986
|
-
Data: string;
|
|
987
|
-
/**
|
|
988
|
-
* 分组id, 支持数字,字母,下划线,长度不超过128
|
|
989
|
-
*/
|
|
990
|
-
GroupId: string;
|
|
830
|
+
export interface VerifyTopResult {
|
|
991
831
|
/**
|
|
992
|
-
*
|
|
832
|
+
* 对比打分结果,按照打分降序排列返回
|
|
833
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
993
834
|
*/
|
|
994
|
-
|
|
835
|
+
VerifyTops?: Array<VerifyTop>;
|
|
995
836
|
}
|
|
996
837
|
/**
|
|
997
838
|
* GetAsrVocab返回参数结构体
|
|
@@ -1031,273 +872,484 @@ export interface GetAsrVocabResponse {
|
|
|
1031
872
|
RequestId?: string;
|
|
1032
873
|
}
|
|
1033
874
|
/**
|
|
1034
|
-
*
|
|
875
|
+
* [热词的词和权重](https://cloud.tencent.com/document/product/1093/41111#2.-.E8.BE.93.E5.85.A5.E5.8F.82.E6.95.B0)
|
|
1035
876
|
*/
|
|
1036
|
-
export interface
|
|
1037
|
-
/**
|
|
1038
|
-
* 标签信息,格式为“$TagKey : $TagValue ”,中间分隔符为“空格”+“:”+“空格”
|
|
1039
|
-
*/
|
|
1040
|
-
TagInfos?: Array<string>;
|
|
877
|
+
export interface HotWord {
|
|
1041
878
|
/**
|
|
1042
|
-
*
|
|
879
|
+
* 热词
|
|
880
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1043
881
|
*/
|
|
1044
|
-
|
|
882
|
+
Word: string;
|
|
1045
883
|
/**
|
|
1046
|
-
*
|
|
884
|
+
* 权重
|
|
885
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1047
886
|
*/
|
|
1048
|
-
|
|
887
|
+
Weight: number;
|
|
1049
888
|
}
|
|
1050
889
|
/**
|
|
1051
|
-
*
|
|
890
|
+
* UpdateAsrKeyWordLib请求参数结构体
|
|
1052
891
|
*/
|
|
1053
|
-
export interface
|
|
892
|
+
export interface UpdateAsrKeyWordLibRequest {
|
|
1054
893
|
/**
|
|
1055
|
-
*
|
|
1056
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
894
|
+
* 关键词表ID
|
|
1057
895
|
*/
|
|
1058
|
-
|
|
896
|
+
KeyWordLibId: string;
|
|
1059
897
|
/**
|
|
1060
|
-
*
|
|
1061
|
-
|
|
898
|
+
* 词表名称,长度在1-20之间
|
|
899
|
+
仅限中英文数字-_
|
|
1062
900
|
*/
|
|
1063
|
-
|
|
901
|
+
Name?: string;
|
|
1064
902
|
/**
|
|
1065
|
-
*
|
|
903
|
+
* - 词文件(纯文本文件)以行分隔 ,进行二进制base64编码
|
|
904
|
+
- 格式要求:TXT 每行只有一个词,不满足格式则报错无法上传
|
|
905
|
+
- 每个词最多5个汉字或15个字符,单个词库最多不超过100个词
|
|
906
|
+
- 此参数为空则只更新词表名称
|
|
1066
907
|
*/
|
|
1067
|
-
|
|
908
|
+
KeyWordFile?: string;
|
|
1068
909
|
}
|
|
1069
910
|
/**
|
|
1070
|
-
*
|
|
911
|
+
* GetUsageByDate返回参数结构体
|
|
1071
912
|
*/
|
|
1072
|
-
export interface
|
|
913
|
+
export interface GetUsageByDateResponse {
|
|
1073
914
|
/**
|
|
1074
|
-
*
|
|
915
|
+
* 用量次数
|
|
1075
916
|
*/
|
|
1076
|
-
Data?:
|
|
917
|
+
Data?: UsageByDateInfoData;
|
|
1077
918
|
/**
|
|
1078
919
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1079
920
|
*/
|
|
1080
921
|
RequestId?: string;
|
|
1081
922
|
}
|
|
1082
923
|
/**
|
|
1083
|
-
*
|
|
1084
|
-
*/
|
|
1085
|
-
export interface DownloadAsrVocabRequest {
|
|
1086
|
-
/**
|
|
1087
|
-
* 词表ID。
|
|
1088
|
-
*/
|
|
1089
|
-
VocabId: string;
|
|
1090
|
-
}
|
|
1091
|
-
/**
|
|
1092
|
-
* SetVocabState请求参数结构体
|
|
924
|
+
* VoicePrintDelete返回参数结构体
|
|
1093
925
|
*/
|
|
1094
|
-
export interface
|
|
926
|
+
export interface VoicePrintDeleteResponse {
|
|
1095
927
|
/**
|
|
1096
|
-
*
|
|
928
|
+
* 说话人基本信息
|
|
1097
929
|
*/
|
|
1098
|
-
|
|
930
|
+
Data?: VoicePrintBaseData;
|
|
1099
931
|
/**
|
|
1100
|
-
*
|
|
932
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1101
933
|
*/
|
|
1102
|
-
|
|
934
|
+
RequestId?: string;
|
|
1103
935
|
}
|
|
1104
936
|
/**
|
|
1105
|
-
*
|
|
937
|
+
* DownloadCustomization返回参数结构体
|
|
1106
938
|
*/
|
|
1107
|
-
export interface
|
|
1108
|
-
/**
|
|
1109
|
-
* 关键词表列表
|
|
1110
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1111
|
-
*/
|
|
1112
|
-
KeyWordLibList?: Array<KeyWordLib>;
|
|
939
|
+
export interface DownloadCustomizationResponse {
|
|
1113
940
|
/**
|
|
1114
|
-
*
|
|
1115
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
941
|
+
* 下载地址
|
|
1116
942
|
*/
|
|
1117
|
-
|
|
1118
|
-
}
|
|
1119
|
-
/**
|
|
1120
|
-
* CloseAsyncRecognitionTask请求参数结构体
|
|
1121
|
-
*/
|
|
1122
|
-
export interface CloseAsyncRecognitionTaskRequest {
|
|
943
|
+
DownloadUrl?: string;
|
|
1123
944
|
/**
|
|
1124
|
-
*
|
|
945
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1125
946
|
*/
|
|
1126
|
-
|
|
947
|
+
RequestId?: string;
|
|
1127
948
|
}
|
|
1128
949
|
/**
|
|
1129
|
-
*
|
|
950
|
+
* CreateRecTask请求参数结构体
|
|
1130
951
|
*/
|
|
1131
|
-
export interface
|
|
952
|
+
export interface CreateRecTaskRequest {
|
|
1132
953
|
/**
|
|
1133
|
-
*
|
|
1134
|
-
|
|
954
|
+
* 引擎模型类型
|
|
955
|
+
识别引擎采用分级计费方案,标记为“大模型版”的引擎适用大模型计费方案,[点击这里](https://cloud.tencent.com/document/product/1093/35686) 查看产品计费说明
|
|
956
|
+
|
|
957
|
+
电话通讯场景引擎:
|
|
958
|
+
**注意:电话通讯场景,请务必使用以下8k引擎**
|
|
959
|
+
• 8k_zh:中文电话通讯;
|
|
960
|
+
• 8k_en:英文电话通讯;
|
|
961
|
+
• **8k_zh_large:**普方大模型引擎【大模型版】。当前模型同时支持中文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比常规版本与普方大模型版本的识别效果;
|
|
962
|
+
|
|
963
|
+
注意:如您有电话通讯场景识别需求,但发现需求语种仅支持16k,可将8k音频传入下方16k引擎,亦能获取识别结果。但**16k引擎并非基于电话通讯数据训练,无法承诺此种调用方式的识别效果,需由您自行验证识别结果是否可用**
|
|
964
|
+
|
|
965
|
+
通用场景引擎:
|
|
966
|
+
**注意:除电话通讯场景以外的其它识别场景,请务必使用以下16k引擎**
|
|
967
|
+
• **16k_zh:**中文普通话通用引擎,支持中文普通话和少量英语,使用丰富的中文普通话语料训练,覆盖场景广泛,适用于除电话通讯外的所有中文普通话识别场景;
|
|
968
|
+
• **16k_zh_large:**普方英大模型引擎【大模型版】。当前模型同时支持中文、英文、[多种中文方言](https://cloud.tencent.com/document/product/1093/35682)等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,[点击这里](https://console.cloud.tencent.com/asr/demonstrate) 对比中文普通话常规版本与普方英大模型版本的识别效果;
|
|
969
|
+
• **16k_multi_lang:**多语种大模型引擎【大模型版】。当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别);
|
|
970
|
+
• **16k_zh_dialect:**中文普通话+多方言混合引擎,除普通话外支持23种方言(上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话);
|
|
971
|
+
• **16k_en:**英语;
|
|
972
|
+
• **16k_yue:**粤语;
|
|
973
|
+
• **16k_zh-PY:**中英粤混合引擎,使用一个引擎同时识别中文普通话、英语、粤语三个语言;
|
|
974
|
+
• **16k_ja:**日语;
|
|
975
|
+
• **16k_ko:**韩语;
|
|
976
|
+
• **16k_vi:**越南语;
|
|
977
|
+
• **16k_ms:**马来语;
|
|
978
|
+
• **16k_id:**印度尼西亚语;
|
|
979
|
+
• **16k_fil:**菲律宾语;
|
|
980
|
+
• **16k_th:**泰语;
|
|
981
|
+
• **16k_pt:**葡萄牙语;
|
|
982
|
+
• **16k_tr:**土耳其语;
|
|
983
|
+
• **16k_ar:**阿拉伯语;
|
|
984
|
+
• **16k_es:**西班牙语;
|
|
985
|
+
• **16k_hi:**印地语;
|
|
986
|
+
• **16k_fr:**法语;
|
|
987
|
+
• **16k_zh_medical:**中文医疗引擎;
|
|
988
|
+
• **16k_de:**德语;
|
|
1135
989
|
*/
|
|
1136
|
-
|
|
990
|
+
EngineModelType: string;
|
|
991
|
+
/**
|
|
992
|
+
* 识别声道数
|
|
993
|
+
1:单声道(16k音频仅支持单声道,**请勿**设置为双声道);
|
|
994
|
+
2:双声道(仅支持8k电话音频,且双声道应分别为通话双方)
|
|
995
|
+
|
|
996
|
+
注意:
|
|
997
|
+
• 16k音频:仅支持单声道识别,**需设置ChannelNum=1**;
|
|
998
|
+
• 8k电话音频:支持单声道、双声道识别,**建议设置ChannelNum=2,即双声道**。双声道能够物理区分说话人、避免说话双方重叠产生的识别错误,能达到最好的说话人分离效果和识别效果。设置双声道后,将自动区分说话人,因此**无需再开启说话人分离功能**,相关参数(**SpeakerDiarization、SpeakerNumber**)使用默认值即可
|
|
999
|
+
*/
|
|
1000
|
+
ChannelNum: number;
|
|
1001
|
+
/**
|
|
1002
|
+
* 识别结果返回样式
|
|
1003
|
+
0:基础识别结果(仅包含有效人声时间戳,无词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail));
|
|
1004
|
+
1:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值,**不含标点**);
|
|
1005
|
+
2:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点);
|
|
1006
|
+
3:基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按标点符号分段,**适用字幕场景**;
|
|
1007
|
+
4:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),且识别结果按nlp语义分段,**适用会议、庭审记录转写等场景**,仅支持8k_zh/16k_zh引擎
|
|
1008
|
+
5:**【增值付费功能】**基础识别结果之上,增加词粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(包含词级别时间戳、语速值和标点),并输出口语转书面语转写结果,该结果去除语气词、重复词、精简冗余表达,并修正发言人口误,实现口语转书面语的效果,**适用于线上、线下会议直接总结为书面会议纪要的场景**,仅支持8k_zh/16k_zh引擎
|
|
1009
|
+
|
|
1010
|
+
注意:
|
|
1011
|
+
如果传入参数值4,需确保账号已购买[语义分段资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值4,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
1012
|
+
如果传入参数值5,需确保账号已购买[口语转书面语资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值5,将自动计费[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852)**
|
|
1013
|
+
*/
|
|
1014
|
+
ResTextFormat: number;
|
|
1015
|
+
/**
|
|
1016
|
+
* 音频数据来源
|
|
1017
|
+
0:音频URL;
|
|
1018
|
+
1:音频数据(post body)
|
|
1019
|
+
*/
|
|
1020
|
+
SourceType: number;
|
|
1021
|
+
/**
|
|
1022
|
+
* 音频数据base64编码
|
|
1023
|
+
**当 SourceType 值为 1 时须填写该字段,为 0 时不需要填写**
|
|
1024
|
+
|
|
1025
|
+
注意:音频数据要小于5MB(含)
|
|
1026
|
+
*/
|
|
1027
|
+
Data?: string;
|
|
1028
|
+
/**
|
|
1029
|
+
* 数据长度(此数据长度为数据未进行base64编码时的长度)
|
|
1030
|
+
*/
|
|
1031
|
+
DataLen?: number;
|
|
1032
|
+
/**
|
|
1033
|
+
* 音频URL的地址(需要公网环境浏览器可下载)
|
|
1034
|
+
**当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写**
|
|
1035
|
+
|
|
1036
|
+
注意:
|
|
1037
|
+
1. 请确保录音文件时长在5个小时(含)之内,否则可能识别失败;
|
|
1038
|
+
2. 请保证文件的下载速度,否则可能下载失败
|
|
1039
|
+
*/
|
|
1040
|
+
Url?: string;
|
|
1041
|
+
/**
|
|
1042
|
+
* 回调 URL
|
|
1043
|
+
用户自行搭建的用于接收识别结果的服务URL
|
|
1044
|
+
回调格式和内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
|
1045
|
+
|
|
1046
|
+
注意:
|
|
1047
|
+
|
|
1048
|
+
- 如果用户使用轮询方式获取识别结果,则无需提交该参数
|
|
1049
|
+
- 建议在回调URL中带上您的业务ID等信息,以便处理业务逻辑
|
|
1050
|
+
*/
|
|
1051
|
+
CallbackUrl?: string;
|
|
1052
|
+
/**
|
|
1053
|
+
* 是否开启说话人分离
|
|
1054
|
+
0:不开启;
|
|
1055
|
+
1:开启(仅支持以下引擎:8k_zh/16k_zh/16k_ms/16k_en/16k_id/16k_zh_large/16k_zh_dialect,且ChannelNum=1时可用);
|
|
1056
|
+
默认值为 0
|
|
1057
|
+
|
|
1058
|
+
注意:
|
|
1059
|
+
8k双声道电话音频请按 **ChannelNum 识别声道数** 的参数描述使用默认值
|
|
1060
|
+
*/
|
|
1061
|
+
SpeakerDiarization?: number;
|
|
1062
|
+
/**
|
|
1063
|
+
* 说话人分离人数
|
|
1064
|
+
**需配合开启说话人分离使用,不开启无效**,取值范围:0-10
|
|
1065
|
+
0:自动分离(最多分离出20个人);
|
|
1066
|
+
1-10:指定人数分离;
|
|
1067
|
+
默认值为 0
|
|
1068
|
+
*/
|
|
1069
|
+
SpeakerNumber?: number;
|
|
1070
|
+
/**
|
|
1071
|
+
* 热词表id
|
|
1072
|
+
如不设置该参数,将自动生效默认热词表;
|
|
1073
|
+
如设置该参数,将生效对应id的热词表;
|
|
1074
|
+
点击这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)
|
|
1075
|
+
*/
|
|
1076
|
+
HotwordId?: string;
|
|
1077
|
+
/**
|
|
1078
|
+
* 热词增强功能(目前仅支持8k_zh/16k_zh引擎)
|
|
1079
|
+
1:开启热词增强功能
|
|
1080
|
+
|
|
1081
|
+
注意:热词增强功能开启后,将对传入的热词表id开启同音替换功能,可以在这里查看[热词表配置方法](https://cloud.tencent.com/document/product/1093/40996)。效果举例:在热词表中配置“蜜制”一词,并开启增强功能,与“蜜制”(mìzhì)同音同调的“秘制”(mìzhì)的识别结果会被强制替换成“蜜制”。**建议客户根据实际的业务需求开启该功能**
|
|
1082
|
+
* @deprecated
|
|
1083
|
+
*/
|
|
1084
|
+
ReinforceHotword?: number;
|
|
1085
|
+
/**
|
|
1086
|
+
* 自学习定制模型 id
|
|
1087
|
+
如设置了该参数,将生效对应id的自学习定制模型;
|
|
1088
|
+
点击这里查看[自学习定制模型配置方法](https://cloud.tencent.com/document/product/1093/38416)
|
|
1089
|
+
*/
|
|
1090
|
+
CustomizationId?: string;
|
|
1091
|
+
/**
|
|
1092
|
+
* **【增值付费功能】**情绪识别能力(目前仅支持16k_zh,8k_zh)
|
|
1093
|
+
0:不开启;
|
|
1094
|
+
1:开启情绪识别,但不在文本展示情绪标签;
|
|
1095
|
+
2:开启情绪识别,并且在文本展示情绪标签(**该功能需要设置ResTextFormat 大于0**)
|
|
1096
|
+
默认值为0
|
|
1097
|
+
支持的情绪分类为:高兴、伤心、愤怒
|
|
1098
|
+
|
|
1099
|
+
注意:
|
|
1100
|
+
1. **本功能为增值服务**,需将参数设置为1或2时方可按对应方式生效;
|
|
1101
|
+
2. 如果传入参数值1或2,需确保账号已购买[情绪识别资源包](https://cloud.tencent.com/document/product/1093/35686#97ae4aa0-29a0-4066-9f07-ccaf8856a16b),或账号开启后付费;**若当前账号已开启后付费功能,并传入参数值1或2,将[自动计费](https://cloud.tencent.com/document/product/1093/35686#d912167d-ffd5-41a9-8b1c-2e89845a6852))**;
|
|
1102
|
+
3. 参数设置为0时,无需购买资源包,也不会消耗情绪识别对应资源
|
|
1103
|
+
*/
|
|
1104
|
+
EmotionRecognition?: number;
|
|
1105
|
+
/**
|
|
1106
|
+
* 情绪能量值
|
|
1107
|
+
取值为音量分贝值/10,取值范围:[1,10],值越高情绪越强烈
|
|
1108
|
+
0:不开启;
|
|
1109
|
+
1:开启;
|
|
1110
|
+
默认值为0
|
|
1111
|
+
*/
|
|
1112
|
+
EmotionalEnergy?: number;
|
|
1113
|
+
/**
|
|
1114
|
+
* 阿拉伯数字智能转换(目前支持中文普通话引擎)
|
|
1115
|
+
0:不转换,直接输出中文数字;
|
|
1116
|
+
1:根据场景智能转换为阿拉伯数字;
|
|
1117
|
+
3:打开数学相关数字转换(如:阿尔法转写为α);
|
|
1118
|
+
默认值为 1
|
|
1119
|
+
*/
|
|
1120
|
+
ConvertNumMode?: number;
|
|
1121
|
+
/**
|
|
1122
|
+
* 脏词过滤(目前支持中文普通话引擎)
|
|
1123
|
+
0:不过滤脏词;
|
|
1124
|
+
1:过滤脏词;
|
|
1125
|
+
2:将脏词替换为 * ;
|
|
1126
|
+
默认值为 0
|
|
1127
|
+
*/
|
|
1128
|
+
FilterDirty?: number;
|
|
1129
|
+
/**
|
|
1130
|
+
* 标点符号过滤(目前支持中文普通话引擎)
|
|
1131
|
+
0:不过滤标点;
|
|
1132
|
+
1:过滤句末标点;
|
|
1133
|
+
2:过滤所有标点;
|
|
1134
|
+
默认值为 0
|
|
1135
|
+
*/
|
|
1136
|
+
FilterPunc?: number;
|
|
1137
|
+
/**
|
|
1138
|
+
* 语气词过滤(目前支持中文普通话引擎)
|
|
1139
|
+
0:不过滤语气词;
|
|
1140
|
+
1:过滤部分语气词;
|
|
1141
|
+
2:严格过滤语气词;
|
|
1142
|
+
默认值为 0
|
|
1143
|
+
*/
|
|
1144
|
+
FilterModal?: number;
|
|
1145
|
+
/**
|
|
1146
|
+
* 单标点最多字数(目前支持中文普通话引擎)
|
|
1147
|
+
**可控制单行字幕最大字数,适用于字幕生成场景**,取值范围:[6,40]
|
|
1148
|
+
0:不开启该功能;
|
|
1149
|
+
默认值为0
|
|
1150
|
+
|
|
1151
|
+
注意:需设置ResTextFormat为3,解析返回的ResultDetail列表,通过结构中FinalSentence获取单个标点断句结果
|
|
1152
|
+
*/
|
|
1153
|
+
SentenceMaxLength?: number;
|
|
1154
|
+
/**
|
|
1155
|
+
* 附加参数**(该参数无意义,忽略即可)**
|
|
1156
|
+
*/
|
|
1157
|
+
Extra?: string;
|
|
1158
|
+
/**
|
|
1159
|
+
* 临时热词表:该参数用于提升识别准确率。
|
|
1160
|
+
|
|
1161
|
+
- 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或“ASR|11”;
|
|
1162
|
+
|
|
1163
|
+
- 临时热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
|
|
1164
|
+
|
|
1165
|
+
- 参数 hotword_id(热词表) 与 hotword_list(临时热词表) 区别:
|
|
1166
|
+
|
|
1167
|
+
- hotword_id:热词表。需要先在控制台或接口创建热词表,获得对应hotword_id传入参数来使用热词功能;
|
|
1168
|
+
|
|
1169
|
+
- hotword_list:临时热词表。每次请求时直接传入临时热词表来使用热词功能,云端不保留临时热词表。适用于有极大量热词需求的用户;
|
|
1170
|
+
|
|
1171
|
+
注意:
|
|
1172
|
+
|
|
1173
|
+
- 如果同时传入了 hotword_id 和 hotword_list,会优先使用 hotword_list;
|
|
1174
|
+
|
|
1175
|
+
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
1176
|
+
|
|
1177
|
+
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
1178
|
+
*/
|
|
1179
|
+
HotwordList?: string;
|
|
1180
|
+
/**
|
|
1181
|
+
* 关键词识别ID列表,默认空为不进行识别,最多10个
|
|
1182
|
+
|
|
1183
|
+
*/
|
|
1184
|
+
KeyWordLibIdList?: Array<string>;
|
|
1137
1185
|
}
|
|
1138
1186
|
/**
|
|
1139
|
-
*
|
|
1187
|
+
* 单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。
|
|
1140
1188
|
*/
|
|
1141
|
-
export interface
|
|
1189
|
+
export interface SentenceDetail {
|
|
1142
1190
|
/**
|
|
1143
|
-
*
|
|
1191
|
+
* 单句最终识别结果
|
|
1144
1192
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
1145
1193
|
*/
|
|
1146
|
-
|
|
1147
|
-
}
|
|
1148
|
-
/**
|
|
1149
|
-
* VoicePrintVerify请求参数结构体
|
|
1150
|
-
*/
|
|
1151
|
-
export interface VoicePrintVerifyRequest {
|
|
1194
|
+
FinalSentence?: string;
|
|
1152
1195
|
/**
|
|
1153
|
-
*
|
|
1196
|
+
* 单句中间识别结果,使用空格拆分为多个词
|
|
1197
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1154
1198
|
*/
|
|
1155
|
-
|
|
1199
|
+
SliceSentence?: string;
|
|
1156
1200
|
/**
|
|
1157
|
-
*
|
|
1201
|
+
* 口语转书面语结果,开启改功能才有值
|
|
1202
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1158
1203
|
*/
|
|
1159
|
-
|
|
1204
|
+
WrittenText?: string;
|
|
1160
1205
|
/**
|
|
1161
|
-
*
|
|
1206
|
+
* 单句开始时间(毫秒)
|
|
1207
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1162
1208
|
*/
|
|
1163
|
-
|
|
1209
|
+
StartMs?: number;
|
|
1164
1210
|
/**
|
|
1165
|
-
*
|
|
1211
|
+
* 单句结束时间(毫秒)
|
|
1212
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1166
1213
|
*/
|
|
1167
|
-
|
|
1168
|
-
}
|
|
1169
|
-
/**
|
|
1170
|
-
* ModifyCustomization请求参数结构体
|
|
1171
|
-
*/
|
|
1172
|
-
export interface ModifyCustomizationRequest {
|
|
1214
|
+
EndMs?: number;
|
|
1173
1215
|
/**
|
|
1174
|
-
*
|
|
1216
|
+
* 单句中词个数
|
|
1217
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1175
1218
|
*/
|
|
1176
|
-
|
|
1219
|
+
WordsNum?: number;
|
|
1177
1220
|
/**
|
|
1178
|
-
*
|
|
1221
|
+
* 单句中词详情
|
|
1222
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1179
1223
|
*/
|
|
1180
|
-
|
|
1224
|
+
Words?: Array<SentenceWords>;
|
|
1181
1225
|
/**
|
|
1182
|
-
*
|
|
1226
|
+
* 单句语速,单位:字数/秒
|
|
1227
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1183
1228
|
*/
|
|
1184
|
-
|
|
1229
|
+
SpeechSpeed?: number;
|
|
1185
1230
|
/**
|
|
1186
|
-
*
|
|
1231
|
+
* 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
|
|
1232
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1187
1233
|
*/
|
|
1188
|
-
|
|
1234
|
+
SpeakerId?: number;
|
|
1235
|
+
/**
|
|
1236
|
+
* 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
|
|
1237
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1238
|
+
*/
|
|
1239
|
+
EmotionalEnergy?: number;
|
|
1240
|
+
/**
|
|
1241
|
+
* 本句与上一句之间的静音时长
|
|
1242
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1243
|
+
*/
|
|
1244
|
+
SilenceTime?: number;
|
|
1245
|
+
/**
|
|
1246
|
+
* 情绪类型(可能为空)
|
|
1247
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1248
|
+
*/
|
|
1249
|
+
EmotionType?: Array<string>;
|
|
1250
|
+
/**
|
|
1251
|
+
* 关键词识别结果列表
|
|
1252
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1253
|
+
*/
|
|
1254
|
+
KeyWordResults?: Array<KeyWordResult>;
|
|
1189
1255
|
}
|
|
1190
1256
|
/**
|
|
1191
|
-
*
|
|
1257
|
+
* DownloadAsrVocab请求参数结构体
|
|
1192
1258
|
*/
|
|
1193
|
-
export interface
|
|
1259
|
+
export interface DownloadAsrVocabRequest {
|
|
1194
1260
|
/**
|
|
1195
|
-
*
|
|
1261
|
+
* 词表ID。
|
|
1196
1262
|
*/
|
|
1197
|
-
|
|
1263
|
+
VocabId: string;
|
|
1198
1264
|
}
|
|
1199
1265
|
/**
|
|
1200
|
-
* [
|
|
1266
|
+
* [词表内容](https://cloud.tencent.com/document/product/1093/41484#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
1201
1267
|
*/
|
|
1202
|
-
export interface
|
|
1268
|
+
export interface Vocab {
|
|
1203
1269
|
/**
|
|
1204
|
-
*
|
|
1270
|
+
* 热词表名称
|
|
1205
1271
|
*/
|
|
1206
|
-
|
|
1272
|
+
Name?: string;
|
|
1207
1273
|
/**
|
|
1208
|
-
*
|
|
1274
|
+
* 热词表描述
|
|
1209
1275
|
*/
|
|
1210
|
-
|
|
1276
|
+
Description?: string;
|
|
1211
1277
|
/**
|
|
1212
|
-
*
|
|
1278
|
+
* 热词表ID
|
|
1213
1279
|
*/
|
|
1214
|
-
|
|
1280
|
+
VocabId?: string;
|
|
1215
1281
|
/**
|
|
1216
|
-
*
|
|
1282
|
+
* 词权重列表
|
|
1217
1283
|
*/
|
|
1218
|
-
|
|
1284
|
+
WordWeights?: Array<HotWord>;
|
|
1219
1285
|
/**
|
|
1220
|
-
*
|
|
1286
|
+
* 词表创建时间
|
|
1221
1287
|
*/
|
|
1222
|
-
|
|
1288
|
+
CreateTime?: string;
|
|
1223
1289
|
/**
|
|
1224
|
-
*
|
|
1225
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1290
|
+
* 词表更新时间
|
|
1226
1291
|
*/
|
|
1227
|
-
|
|
1292
|
+
UpdateTime?: string;
|
|
1228
1293
|
/**
|
|
1229
|
-
*
|
|
1230
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1294
|
+
* 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
|
|
1231
1295
|
*/
|
|
1232
|
-
|
|
1233
|
-
}
|
|
1234
|
-
/**
|
|
1235
|
-
* DeleteAsrVocab请求参数结构体
|
|
1236
|
-
*/
|
|
1237
|
-
export interface DeleteAsrVocabRequest {
|
|
1296
|
+
State?: number;
|
|
1238
1297
|
/**
|
|
1239
|
-
*
|
|
1298
|
+
* 标签数组
|
|
1299
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1240
1300
|
*/
|
|
1241
|
-
|
|
1301
|
+
TagInfos?: Array<string>;
|
|
1242
1302
|
}
|
|
1243
1303
|
/**
|
|
1244
|
-
*
|
|
1304
|
+
* 关键词表信息
|
|
1245
1305
|
*/
|
|
1246
|
-
export interface
|
|
1306
|
+
export interface KeyWordLib {
|
|
1247
1307
|
/**
|
|
1248
|
-
*
|
|
1249
|
-
|
|
1308
|
+
* 关键词表ID
|
|
1309
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1250
1310
|
*/
|
|
1251
|
-
|
|
1311
|
+
KeyWordLibId?: string;
|
|
1252
1312
|
/**
|
|
1253
|
-
*
|
|
1313
|
+
* 关键词表名称
|
|
1314
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1254
1315
|
*/
|
|
1255
|
-
|
|
1316
|
+
Name?: string;
|
|
1256
1317
|
/**
|
|
1257
|
-
*
|
|
1318
|
+
* 关键词列表
|
|
1319
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1258
1320
|
*/
|
|
1259
|
-
|
|
1260
|
-
}
|
|
1261
|
-
/**
|
|
1262
|
-
* UpdateAsrVocab返回参数结构体
|
|
1263
|
-
*/
|
|
1264
|
-
export interface UpdateAsrVocabResponse {
|
|
1321
|
+
KeyWordList?: Array<string>;
|
|
1265
1322
|
/**
|
|
1266
|
-
*
|
|
1323
|
+
* 创建时间
|
|
1324
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1267
1325
|
*/
|
|
1268
|
-
|
|
1326
|
+
CreateTime?: string;
|
|
1269
1327
|
/**
|
|
1270
|
-
*
|
|
1328
|
+
* 更新时间
|
|
1329
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1271
1330
|
*/
|
|
1272
|
-
|
|
1331
|
+
UpdateTime?: string;
|
|
1273
1332
|
}
|
|
1274
1333
|
/**
|
|
1275
|
-
*
|
|
1334
|
+
* ModifyCustomization请求参数结构体
|
|
1276
1335
|
*/
|
|
1277
|
-
export interface
|
|
1336
|
+
export interface ModifyCustomizationRequest {
|
|
1278
1337
|
/**
|
|
1279
|
-
*
|
|
1338
|
+
* 要修改的模型ID
|
|
1280
1339
|
*/
|
|
1281
|
-
|
|
1340
|
+
ModelId: string;
|
|
1282
1341
|
/**
|
|
1283
|
-
*
|
|
1342
|
+
* 要修改的模型名称,长度需在1-20个字符之间
|
|
1284
1343
|
*/
|
|
1285
|
-
|
|
1286
|
-
}
|
|
1287
|
-
/**
|
|
1288
|
-
* 音频声纹比对结果,包含比对分数
|
|
1289
|
-
*/
|
|
1290
|
-
export interface VoicePrintCompareData {
|
|
1344
|
+
ModelName?: string;
|
|
1291
1345
|
/**
|
|
1292
|
-
*
|
|
1293
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1346
|
+
* 要修改的模型类型,为8k或者16k
|
|
1294
1347
|
*/
|
|
1295
|
-
|
|
1348
|
+
ModelType?: string;
|
|
1296
1349
|
/**
|
|
1297
|
-
*
|
|
1298
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1350
|
+
* 要修改的模型语料的下载地址,目前仅支持腾讯云cos
|
|
1299
1351
|
*/
|
|
1300
|
-
|
|
1352
|
+
TextUrl?: string;
|
|
1301
1353
|
}
|
|
1302
1354
|
/**
|
|
1303
1355
|
* VoicePrintVerify返回参数结构体
|
|
@@ -1312,6 +1364,19 @@ export interface VoicePrintVerifyResponse {
|
|
|
1312
1364
|
*/
|
|
1313
1365
|
RequestId?: string;
|
|
1314
1366
|
}
|
|
1367
|
+
/**
|
|
1368
|
+
* GetModelInfo返回参数结构体
|
|
1369
|
+
*/
|
|
1370
|
+
export interface GetModelInfoResponse {
|
|
1371
|
+
/**
|
|
1372
|
+
* 模型信息
|
|
1373
|
+
*/
|
|
1374
|
+
Data?: Model;
|
|
1375
|
+
/**
|
|
1376
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1377
|
+
*/
|
|
1378
|
+
RequestId?: string;
|
|
1379
|
+
}
|
|
1315
1380
|
/**
|
|
1316
1381
|
* DescribeTaskStatus请求参数结构体
|
|
1317
1382
|
*/
|
|
@@ -1323,390 +1388,417 @@ export interface DescribeTaskStatusRequest {
|
|
|
1323
1388
|
TaskId: number;
|
|
1324
1389
|
}
|
|
1325
1390
|
/**
|
|
1326
|
-
*
|
|
1391
|
+
* VoicePrintCompare请求参数结构体
|
|
1327
1392
|
*/
|
|
1328
|
-
export interface
|
|
1329
|
-
/**
|
|
1330
|
-
* 模型名称
|
|
1331
|
-
*/
|
|
1332
|
-
ModelName?: string;
|
|
1393
|
+
export interface VoicePrintCompareRequest {
|
|
1333
1394
|
/**
|
|
1334
|
-
*
|
|
1395
|
+
* 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
|
|
1335
1396
|
*/
|
|
1336
|
-
|
|
1397
|
+
VoiceFormat: number;
|
|
1337
1398
|
/**
|
|
1338
|
-
*
|
|
1399
|
+
* 音频采样率,目前仅支持16k,请填写16000
|
|
1339
1400
|
*/
|
|
1340
|
-
|
|
1401
|
+
SampleRate: number;
|
|
1341
1402
|
/**
|
|
1342
|
-
*
|
|
1403
|
+
* 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
|
|
1343
1404
|
*/
|
|
1344
|
-
|
|
1405
|
+
SrcAudioData: string;
|
|
1345
1406
|
/**
|
|
1346
|
-
*
|
|
1407
|
+
* 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
|
|
1347
1408
|
*/
|
|
1348
|
-
|
|
1409
|
+
DestAudioData: string;
|
|
1410
|
+
}
|
|
1411
|
+
/**
|
|
1412
|
+
* DeleteCustomization请求参数结构体
|
|
1413
|
+
*/
|
|
1414
|
+
export interface DeleteCustomizationRequest {
|
|
1349
1415
|
/**
|
|
1350
|
-
*
|
|
1351
|
-
-2:模型训练失败;
|
|
1352
|
-
-1:已下线;
|
|
1353
|
-
0:训练中;
|
|
1354
|
-
1:已上线;
|
|
1355
|
-
3:上线中;
|
|
1356
|
-
4:下线中;
|
|
1416
|
+
* 要删除的模型ID
|
|
1357
1417
|
*/
|
|
1358
|
-
|
|
1418
|
+
ModelId: string;
|
|
1419
|
+
}
|
|
1420
|
+
/**
|
|
1421
|
+
* [音频流异步识别](https://cloud.tencent.com/document/api/1093/37824#AsyncRecognitionTasks)任务信息
|
|
1422
|
+
*/
|
|
1423
|
+
export interface AsyncRecognitionTaskInfo {
|
|
1359
1424
|
/**
|
|
1360
|
-
*
|
|
1425
|
+
* 任务ID
|
|
1361
1426
|
*/
|
|
1362
|
-
|
|
1427
|
+
TaskId?: number;
|
|
1363
1428
|
/**
|
|
1364
|
-
*
|
|
1365
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1429
|
+
* 音频流Url
|
|
1366
1430
|
*/
|
|
1367
|
-
|
|
1431
|
+
Url?: string;
|
|
1368
1432
|
}
|
|
1369
1433
|
/**
|
|
1370
|
-
*
|
|
1434
|
+
* VoicePrintCount返回参数结构体
|
|
1371
1435
|
*/
|
|
1372
|
-
export interface
|
|
1436
|
+
export interface VoicePrintCountResponse {
|
|
1373
1437
|
/**
|
|
1374
|
-
*
|
|
1438
|
+
* 统计数据
|
|
1375
1439
|
*/
|
|
1376
|
-
|
|
1440
|
+
Data?: VoicePrintCountData;
|
|
1377
1441
|
/**
|
|
1378
|
-
*
|
|
1442
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1379
1443
|
*/
|
|
1380
|
-
|
|
1444
|
+
RequestId?: string;
|
|
1445
|
+
}
|
|
1446
|
+
/**
|
|
1447
|
+
* 查询列表返回数据
|
|
1448
|
+
*/
|
|
1449
|
+
export interface KeyWordLibListData {
|
|
1381
1450
|
/**
|
|
1382
|
-
*
|
|
1383
|
-
|
|
1384
|
-
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
1385
|
-
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
1451
|
+
* 关键词表列表
|
|
1452
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1386
1453
|
*/
|
|
1387
|
-
|
|
1454
|
+
KeyWordLibList?: Array<KeyWordLib>;
|
|
1388
1455
|
/**
|
|
1389
|
-
*
|
|
1390
|
-
|
|
1456
|
+
* 关键词列表总数
|
|
1457
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1391
1458
|
*/
|
|
1392
|
-
|
|
1459
|
+
TotalCount?: number;
|
|
1393
1460
|
}
|
|
1394
1461
|
/**
|
|
1395
|
-
*
|
|
1462
|
+
* CloseAsyncRecognitionTask返回参数结构体
|
|
1396
1463
|
*/
|
|
1397
|
-
export interface
|
|
1398
|
-
/**
|
|
1399
|
-
* 模型信息
|
|
1400
|
-
*/
|
|
1401
|
-
Data?: Model;
|
|
1464
|
+
export interface CloseAsyncRecognitionTaskResponse {
|
|
1402
1465
|
/**
|
|
1403
1466
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1404
1467
|
*/
|
|
1405
1468
|
RequestId?: string;
|
|
1406
1469
|
}
|
|
1407
1470
|
/**
|
|
1408
|
-
*
|
|
1471
|
+
* VoicePrintGroupVerify返回参数结构体
|
|
1409
1472
|
*/
|
|
1410
|
-
export interface
|
|
1411
|
-
/**
|
|
1412
|
-
* 热词表ID
|
|
1413
|
-
*/
|
|
1414
|
-
VocabId: string;
|
|
1473
|
+
export interface VoicePrintGroupVerifyResponse {
|
|
1415
1474
|
/**
|
|
1416
|
-
*
|
|
1475
|
+
* TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
|
|
1417
1476
|
*/
|
|
1418
|
-
|
|
1477
|
+
Data?: VerifyTopResult;
|
|
1419
1478
|
/**
|
|
1420
|
-
*
|
|
1479
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1421
1480
|
*/
|
|
1422
|
-
|
|
1481
|
+
RequestId?: string;
|
|
1482
|
+
}
|
|
1483
|
+
/**
|
|
1484
|
+
* CreateCustomization请求参数结构体
|
|
1485
|
+
*/
|
|
1486
|
+
export interface CreateCustomizationRequest {
|
|
1423
1487
|
/**
|
|
1424
|
-
*
|
|
1425
|
-
当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
|
|
1426
|
-
(注意:如果仅更新热词表名称或者描述字段,请求不用带本参数)
|
|
1488
|
+
* 自学习模型名称,需在1-20字符之间
|
|
1427
1489
|
*/
|
|
1428
|
-
|
|
1490
|
+
ModelName: string;
|
|
1429
1491
|
/**
|
|
1430
|
-
*
|
|
1492
|
+
* 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
|
|
1431
1493
|
*/
|
|
1432
|
-
|
|
1433
|
-
}
|
|
1434
|
-
/**
|
|
1435
|
-
* VoicePrintCount请求参数结构体
|
|
1436
|
-
*/
|
|
1437
|
-
export interface VoicePrintCountRequest {
|
|
1494
|
+
TextUrl: string;
|
|
1438
1495
|
/**
|
|
1439
|
-
*
|
|
1496
|
+
* 自学习模型类型,填写8k或者16k
|
|
1440
1497
|
*/
|
|
1441
|
-
|
|
1498
|
+
ModelType: string;
|
|
1442
1499
|
/**
|
|
1443
|
-
*
|
|
1444
|
-
|
|
1445
|
-
1: 统计指定分组下的声纹数量
|
|
1500
|
+
* 标签信息
|
|
1501
|
+
* @deprecated
|
|
1446
1502
|
*/
|
|
1447
|
-
|
|
1503
|
+
TagInfos?: Array<string>;
|
|
1448
1504
|
}
|
|
1449
1505
|
/**
|
|
1450
|
-
*
|
|
1506
|
+
* 用户用量信息
|
|
1451
1507
|
*/
|
|
1452
|
-
export interface
|
|
1508
|
+
export interface UsageByDateInfo {
|
|
1453
1509
|
/**
|
|
1454
|
-
*
|
|
1510
|
+
* 业务类型名称
|
|
1511
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1455
1512
|
*/
|
|
1456
|
-
|
|
1513
|
+
BizName?: string;
|
|
1457
1514
|
/**
|
|
1458
|
-
*
|
|
1515
|
+
* 识别次数
|
|
1516
|
+
单位:次
|
|
1517
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1459
1518
|
*/
|
|
1460
|
-
|
|
1519
|
+
Count?: number;
|
|
1461
1520
|
/**
|
|
1462
|
-
*
|
|
1521
|
+
* 识别时长
|
|
1522
|
+
单位:秒
|
|
1523
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1463
1524
|
*/
|
|
1464
|
-
|
|
1525
|
+
Duration?: number;
|
|
1526
|
+
}
|
|
1527
|
+
/**
|
|
1528
|
+
* UpdateAsrKeyWordLib返回参数结构体
|
|
1529
|
+
*/
|
|
1530
|
+
export interface UpdateAsrKeyWordLibResponse {
|
|
1465
1531
|
/**
|
|
1466
|
-
*
|
|
1532
|
+
* 关键词表ID数据
|
|
1467
1533
|
*/
|
|
1468
|
-
|
|
1534
|
+
Data?: KeyWordLibIdData;
|
|
1469
1535
|
/**
|
|
1470
|
-
*
|
|
1536
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1471
1537
|
*/
|
|
1472
|
-
|
|
1538
|
+
RequestId?: string;
|
|
1473
1539
|
}
|
|
1474
1540
|
/**
|
|
1475
|
-
*
|
|
1541
|
+
* CreateAsyncRecognitionTask返回参数结构体
|
|
1476
1542
|
*/
|
|
1477
|
-
export interface
|
|
1543
|
+
export interface CreateAsyncRecognitionTaskResponse {
|
|
1478
1544
|
/**
|
|
1479
|
-
*
|
|
1545
|
+
* 请求返回结果,包含本次的任务ID(TaskId)
|
|
1480
1546
|
*/
|
|
1481
|
-
|
|
1547
|
+
Data?: Task;
|
|
1482
1548
|
/**
|
|
1483
1549
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1484
1550
|
*/
|
|
1485
1551
|
RequestId?: string;
|
|
1486
1552
|
}
|
|
1487
1553
|
/**
|
|
1488
|
-
*
|
|
1489
|
-
*/
|
|
1490
|
-
export interface
|
|
1491
|
-
/**
|
|
1492
|
-
* 识别结果。
|
|
1493
|
-
*/
|
|
1494
|
-
Result?: string;
|
|
1554
|
+
* GetAsrKeyWordLibList请求参数结构体
|
|
1555
|
+
*/
|
|
1556
|
+
export interface GetAsrKeyWordLibListRequest {
|
|
1495
1557
|
/**
|
|
1496
|
-
*
|
|
1558
|
+
* 分页Offset
|
|
1497
1559
|
*/
|
|
1498
|
-
|
|
1560
|
+
Offset?: number;
|
|
1499
1561
|
/**
|
|
1500
|
-
*
|
|
1501
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1562
|
+
* 分页Limit
|
|
1502
1563
|
*/
|
|
1503
|
-
|
|
1564
|
+
Limit?: number;
|
|
1504
1565
|
/**
|
|
1505
|
-
*
|
|
1506
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1566
|
+
* 词库名称或者UIN检索
|
|
1507
1567
|
*/
|
|
1508
|
-
|
|
1568
|
+
SpecifyNames?: Array<string>;
|
|
1509
1569
|
/**
|
|
1510
|
-
*
|
|
1570
|
+
* 只看用户自己创建的
|
|
1511
1571
|
*/
|
|
1512
|
-
|
|
1572
|
+
OnlySelf?: boolean;
|
|
1513
1573
|
}
|
|
1514
1574
|
/**
|
|
1515
|
-
*
|
|
1575
|
+
* DeleteAsrVocab返回参数结构体
|
|
1516
1576
|
*/
|
|
1517
|
-
export interface
|
|
1518
|
-
/**
|
|
1519
|
-
* 说话人基础数据
|
|
1520
|
-
*/
|
|
1521
|
-
Data?: VoicePrintBaseData;
|
|
1577
|
+
export interface DeleteAsrVocabResponse {
|
|
1522
1578
|
/**
|
|
1523
1579
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1524
1580
|
*/
|
|
1525
1581
|
RequestId?: string;
|
|
1526
1582
|
}
|
|
1527
1583
|
/**
|
|
1528
|
-
*
|
|
1584
|
+
* 关键词ID
|
|
1529
1585
|
*/
|
|
1530
|
-
export interface
|
|
1586
|
+
export interface KeyWordLibIdData {
|
|
1531
1587
|
/**
|
|
1532
|
-
*
|
|
1588
|
+
* 关键词ID
|
|
1589
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1533
1590
|
*/
|
|
1534
|
-
KeyWordLibId
|
|
1591
|
+
KeyWordLibId?: string;
|
|
1535
1592
|
}
|
|
1536
1593
|
/**
|
|
1537
|
-
*
|
|
1594
|
+
* 音频声纹比对结果,包含比对分数
|
|
1538
1595
|
*/
|
|
1539
|
-
export interface
|
|
1596
|
+
export interface VoicePrintCompareData {
|
|
1540
1597
|
/**
|
|
1541
|
-
*
|
|
1598
|
+
* 匹配度 取值范围(0.0 - 100.0)
|
|
1542
1599
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
1543
1600
|
*/
|
|
1544
|
-
|
|
1601
|
+
Score?: string;
|
|
1545
1602
|
/**
|
|
1546
|
-
*
|
|
1603
|
+
* 验证结果 0: 未通过 1: 通过
|
|
1547
1604
|
注意:此字段可能返回 null,表示取不到有效值。
|
|
1548
1605
|
*/
|
|
1549
|
-
|
|
1606
|
+
Decision?: number;
|
|
1550
1607
|
}
|
|
1551
1608
|
/**
|
|
1552
|
-
*
|
|
1609
|
+
* VoicePrintVerify请求参数结构体
|
|
1553
1610
|
*/
|
|
1554
|
-
export interface
|
|
1611
|
+
export interface VoicePrintVerifyRequest {
|
|
1555
1612
|
/**
|
|
1556
|
-
*
|
|
1613
|
+
* 音频格式 0: pcm, 1: wav
|
|
1557
1614
|
*/
|
|
1558
|
-
|
|
1615
|
+
VoiceFormat: number;
|
|
1559
1616
|
/**
|
|
1560
|
-
*
|
|
1617
|
+
* 音频采样率,目前支持16000,单位:Hz,必填
|
|
1561
1618
|
*/
|
|
1562
|
-
|
|
1619
|
+
SampleRate: number;
|
|
1620
|
+
/**
|
|
1621
|
+
* 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
|
|
1622
|
+
*/
|
|
1623
|
+
Data: string;
|
|
1624
|
+
/**
|
|
1625
|
+
* 说话人id, 说话人唯一标识
|
|
1626
|
+
*/
|
|
1627
|
+
VoicePrintId: string;
|
|
1563
1628
|
}
|
|
1564
1629
|
/**
|
|
1565
|
-
*
|
|
1630
|
+
* SetVocabState请求参数结构体
|
|
1566
1631
|
*/
|
|
1567
|
-
export interface
|
|
1632
|
+
export interface SetVocabStateRequest {
|
|
1568
1633
|
/**
|
|
1569
|
-
*
|
|
1570
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1634
|
+
* 热词表ID。
|
|
1571
1635
|
*/
|
|
1572
|
-
|
|
1636
|
+
VocabId: string;
|
|
1637
|
+
/**
|
|
1638
|
+
* 热词表状态,1:设为默认状态;0:设为非默认状态。
|
|
1639
|
+
*/
|
|
1640
|
+
State: number;
|
|
1573
1641
|
}
|
|
1574
1642
|
/**
|
|
1575
|
-
*
|
|
1643
|
+
* [自学习模型信息](https://cloud.tencent.com/document/product/1093/90813#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
1576
1644
|
*/
|
|
1577
|
-
export interface
|
|
1645
|
+
export interface Model {
|
|
1578
1646
|
/**
|
|
1579
|
-
*
|
|
1647
|
+
* 模型名称
|
|
1580
1648
|
*/
|
|
1581
|
-
|
|
1649
|
+
ModelName?: string;
|
|
1582
1650
|
/**
|
|
1583
|
-
*
|
|
1651
|
+
* 模型文件名称
|
|
1584
1652
|
*/
|
|
1585
|
-
|
|
1653
|
+
DictName?: string;
|
|
1586
1654
|
/**
|
|
1587
|
-
*
|
|
1655
|
+
* 模型Id
|
|
1588
1656
|
*/
|
|
1589
|
-
|
|
1657
|
+
ModelId?: string;
|
|
1590
1658
|
/**
|
|
1591
|
-
*
|
|
1659
|
+
* 模型类型,“8k”或者”16k“
|
|
1592
1660
|
*/
|
|
1593
|
-
|
|
1594
|
-
}
|
|
1595
|
-
/**
|
|
1596
|
-
* VoicePrintCompare返回参数结构体
|
|
1597
|
-
*/
|
|
1598
|
-
export interface VoicePrintCompareResponse {
|
|
1661
|
+
ModelType?: string;
|
|
1599
1662
|
/**
|
|
1600
|
-
*
|
|
1663
|
+
* 服务类型
|
|
1601
1664
|
*/
|
|
1602
|
-
|
|
1665
|
+
ServiceType?: string;
|
|
1603
1666
|
/**
|
|
1604
|
-
*
|
|
1667
|
+
* 模型状态:
|
|
1668
|
+
-2:模型训练失败;
|
|
1669
|
+
-1:已下线;
|
|
1670
|
+
0:训练中;
|
|
1671
|
+
1:已上线;
|
|
1672
|
+
3:上线中;
|
|
1673
|
+
4:下线中;
|
|
1605
1674
|
*/
|
|
1606
|
-
|
|
1607
|
-
}
|
|
1608
|
-
/**
|
|
1609
|
-
* DeleteCustomization请求参数结构体
|
|
1610
|
-
*/
|
|
1611
|
-
export interface DeleteCustomizationRequest {
|
|
1675
|
+
ModelState?: number;
|
|
1612
1676
|
/**
|
|
1613
|
-
*
|
|
1677
|
+
* 最后更新时间
|
|
1614
1678
|
*/
|
|
1615
|
-
|
|
1679
|
+
AtUpdated?: string;
|
|
1680
|
+
/**
|
|
1681
|
+
* 标签信息
|
|
1682
|
+
注意:此字段可能返回 null,表示取不到有效值。
|
|
1683
|
+
*/
|
|
1684
|
+
TagInfos?: Array<string>;
|
|
1616
1685
|
}
|
|
1617
1686
|
/**
|
|
1618
|
-
*
|
|
1687
|
+
* CreateAsrVocab请求参数结构体
|
|
1619
1688
|
*/
|
|
1620
|
-
export interface
|
|
1689
|
+
export interface CreateAsrVocabRequest {
|
|
1621
1690
|
/**
|
|
1622
|
-
*
|
|
1623
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1691
|
+
* 热词表名称,长度在1-255之间
|
|
1624
1692
|
*/
|
|
1625
|
-
|
|
1693
|
+
Name: string;
|
|
1626
1694
|
/**
|
|
1627
|
-
*
|
|
1628
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1695
|
+
* 热词表描述,长度在0-1000之间
|
|
1629
1696
|
*/
|
|
1630
|
-
|
|
1697
|
+
Description?: string;
|
|
1631
1698
|
/**
|
|
1632
|
-
*
|
|
1633
|
-
|
|
1699
|
+
* 词权重数组,包含全部的热词和对应的权重。每个热词的长度不大于10个汉字或30个英文字符,权重为[1,11]之间整数或者100,数组长度不大于1000
|
|
1700
|
+
注意:
|
|
1701
|
+
- 热词权重设置为11时,当前热词将升级为超级热词,建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
|
|
1702
|
+
- 热词权重设置为100时,当前热词开启热词增强同音替换功能(仅支持8k_zh,16k_zh),举例:热词配置“蜜制|100”时,与“蜜制”同拼音(mizhi)的“秘制”的识别结果会被强制替换成“蜜制”。因此建议客户根据自己的实际情况开启该功能。建议仅将重要且必须生效的热词设置到100,设置过多权重为100的热词将影响整体字准率。
|
|
1634
1703
|
*/
|
|
1635
|
-
|
|
1704
|
+
WordWeights?: Array<HotWord>;
|
|
1705
|
+
/**
|
|
1706
|
+
* 词权重文件(纯文本文件)的二进制base64编码,以行分隔,每行的格式为word|weight,即以英文符号|为分割,左边为词,右边为权重,如:你好|5。
|
|
1707
|
+
当用户传此参数(参数长度大于0),即以此参数解析词权重,WordWeights会被忽略
|
|
1708
|
+
*/
|
|
1709
|
+
WordWeightStr?: string;
|
|
1636
1710
|
}
|
|
1637
1711
|
/**
|
|
1638
|
-
*
|
|
1712
|
+
* VoicePrintUpdate返回参数结构体
|
|
1639
1713
|
*/
|
|
1640
|
-
export interface
|
|
1714
|
+
export interface VoicePrintUpdateResponse {
|
|
1641
1715
|
/**
|
|
1642
|
-
*
|
|
1716
|
+
* 说话人基础数据
|
|
1643
1717
|
*/
|
|
1644
|
-
|
|
1718
|
+
Data?: VoicePrintBaseData;
|
|
1645
1719
|
/**
|
|
1646
|
-
*
|
|
1720
|
+
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1647
1721
|
*/
|
|
1648
|
-
|
|
1722
|
+
RequestId?: string;
|
|
1649
1723
|
}
|
|
1650
1724
|
/**
|
|
1651
|
-
*
|
|
1725
|
+
* DeleteAsrKeyWordLib请求参数结构体
|
|
1652
1726
|
*/
|
|
1653
|
-
export interface
|
|
1727
|
+
export interface DeleteAsrKeyWordLibRequest {
|
|
1654
1728
|
/**
|
|
1655
|
-
*
|
|
1729
|
+
* 关键词表ID
|
|
1656
1730
|
*/
|
|
1657
|
-
|
|
1731
|
+
KeyWordLibId: string;
|
|
1732
|
+
}
|
|
1733
|
+
/**
|
|
1734
|
+
* GetModelInfo请求参数结构体
|
|
1735
|
+
*/
|
|
1736
|
+
export interface GetModelInfoRequest {
|
|
1658
1737
|
/**
|
|
1659
|
-
*
|
|
1738
|
+
* 模型id
|
|
1660
1739
|
*/
|
|
1661
|
-
|
|
1740
|
+
ModelId: string;
|
|
1662
1741
|
}
|
|
1663
1742
|
/**
|
|
1664
|
-
*
|
|
1743
|
+
* ModifyCustomizationState返回参数结构体
|
|
1665
1744
|
*/
|
|
1666
|
-
export interface
|
|
1745
|
+
export interface ModifyCustomizationStateResponse {
|
|
1667
1746
|
/**
|
|
1668
|
-
*
|
|
1669
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1747
|
+
* 自学习模型ID
|
|
1670
1748
|
*/
|
|
1671
|
-
|
|
1749
|
+
ModelId?: string;
|
|
1672
1750
|
/**
|
|
1673
1751
|
* 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。
|
|
1674
1752
|
*/
|
|
1675
1753
|
RequestId?: string;
|
|
1676
1754
|
}
|
|
1677
1755
|
/**
|
|
1678
|
-
*
|
|
1756
|
+
* GetUsageByDate请求参数结构体
|
|
1679
1757
|
*/
|
|
1680
|
-
export interface
|
|
1758
|
+
export interface GetUsageByDateRequest {
|
|
1681
1759
|
/**
|
|
1682
|
-
*
|
|
1760
|
+
* 需要查询的业务类型名字列表
|
|
1761
|
+
- asr_rt 实时识别
|
|
1762
|
+
- asr_rec 录音文件识别
|
|
1683
1763
|
*/
|
|
1684
|
-
|
|
1764
|
+
BizNameList: Array<string>;
|
|
1685
1765
|
/**
|
|
1686
|
-
*
|
|
1766
|
+
* 查询开始时间
|
|
1767
|
+
开始时间包含当天,支持 YYYY-MM-DD 日期以国内时区为准
|
|
1768
|
+
开始时间到结束时间需要在3个月以内
|
|
1687
1769
|
*/
|
|
1688
|
-
|
|
1770
|
+
StartDate: string;
|
|
1689
1771
|
/**
|
|
1690
|
-
*
|
|
1772
|
+
* 查询结束时间
|
|
1773
|
+
结束时间包含当天,,支持 YYYY-MM-DD 日期以国内时区为准
|
|
1774
|
+
开始时间到结束时间需要在3个月以内
|
|
1691
1775
|
*/
|
|
1692
|
-
|
|
1776
|
+
EndDate: string;
|
|
1693
1777
|
}
|
|
1694
1778
|
/**
|
|
1695
|
-
*
|
|
1779
|
+
* VoicePrintEnroll请求参数结构体
|
|
1696
1780
|
*/
|
|
1697
|
-
export interface
|
|
1781
|
+
export interface VoicePrintEnrollRequest {
|
|
1698
1782
|
/**
|
|
1699
|
-
*
|
|
1783
|
+
* 音频格式 0: pcm, 1: wav
|
|
1700
1784
|
*/
|
|
1701
|
-
|
|
1785
|
+
VoiceFormat: number;
|
|
1702
1786
|
/**
|
|
1703
|
-
*
|
|
1787
|
+
* 音频采样率,目前支持16000,单位:Hz,必填
|
|
1704
1788
|
*/
|
|
1705
|
-
|
|
1789
|
+
SampleRate: number;
|
|
1706
1790
|
/**
|
|
1707
|
-
*
|
|
1791
|
+
* 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
|
|
1708
1792
|
*/
|
|
1709
|
-
|
|
1793
|
+
Data: string;
|
|
1794
|
+
/**
|
|
1795
|
+
* 说话人昵称 不超过32字节
|
|
1796
|
+
*/
|
|
1797
|
+
SpeakerNick?: string;
|
|
1798
|
+
/**
|
|
1799
|
+
* 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符
|
|
1800
|
+
*/
|
|
1801
|
+
GroupId?: string;
|
|
1710
1802
|
}
|
|
1711
1803
|
/**
|
|
1712
1804
|
* 识别结果中词文本,以及对应时间偏移
|
|
@@ -1728,27 +1820,3 @@ export interface SentenceWords {
|
|
|
1728
1820
|
*/
|
|
1729
1821
|
OffsetEndMs: number;
|
|
1730
1822
|
}
|
|
1731
|
-
/**
|
|
1732
|
-
* 统计返回[说话人注册数量](https://cloud.tencent.com/document/product/1093/96061#3.-.E8.BE.93.E5.87.BA.E5.8F.82.E6.95.B0)
|
|
1733
|
-
*/
|
|
1734
|
-
export interface VoicePrintCountData {
|
|
1735
|
-
/**
|
|
1736
|
-
* 总数
|
|
1737
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1738
|
-
*/
|
|
1739
|
-
Total?: number;
|
|
1740
|
-
/**
|
|
1741
|
-
* 说话人id列表
|
|
1742
|
-
注意:此字段可能返回 null,表示取不到有效值。
|
|
1743
|
-
*/
|
|
1744
|
-
VoicePrintList?: Array<VoicePrintBaseData>;
|
|
1745
|
-
}
|
|
1746
|
-
/**
|
|
1747
|
-
* DownloadCustomization请求参数结构体
|
|
1748
|
-
*/
|
|
1749
|
-
export interface DownloadCustomizationRequest {
|
|
1750
|
-
/**
|
|
1751
|
-
* 自学习模型ID
|
|
1752
|
-
*/
|
|
1753
|
-
ModelId: string;
|
|
1754
|
-
}
|