@clickzetta/cz-cli-darwin-arm64 0.3.19 → 0.3.21

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (40) hide show
  1. package/bin/cz-cli +0 -0
  2. package/bin/skills/clickzetta-access-control/eval_cases.jsonl +1 -1
  3. package/bin/skills/clickzetta-batch-sync-pipeline/eval_cases.jsonl +5 -0
  4. package/bin/skills/clickzetta-cdc-sync-pipeline/eval_cases.jsonl +5 -0
  5. package/bin/skills/clickzetta-dba-guide/SKILL.md +542 -0
  6. package/bin/skills/clickzetta-dba-guide/eval_cases.jsonl +3 -0
  7. package/bin/skills/clickzetta-dw-modeling/eval_cases.jsonl +1 -1
  8. package/bin/skills/clickzetta-dynamic-table/eval_cases.jsonl +5 -0
  9. package/bin/skills/clickzetta-file-import-pipeline/eval_cases.jsonl +5 -0
  10. package/bin/skills/clickzetta-lakehouse-connect/SKILL.md +218 -0
  11. package/bin/skills/clickzetta-lakehouse-connect/eval_cases.jsonl +3 -0
  12. package/bin/skills/clickzetta-lakehouse-connect/evals/evals.json +35 -0
  13. package/bin/skills/clickzetta-lakehouse-connect/references/config-file.md +435 -0
  14. package/bin/skills/clickzetta-lakehouse-connect/references/jdbc.md +478 -0
  15. package/bin/skills/clickzetta-lakehouse-connect/references/python-sdk.md +225 -0
  16. package/bin/skills/clickzetta-lakehouse-connect/references/sqlalchemy.md +468 -0
  17. package/bin/skills/clickzetta-lakehouse-connect/references/zettapark-session.md +445 -0
  18. package/bin/skills/clickzetta-manage-comments/SKILL.md +219 -0
  19. package/bin/skills/clickzetta-manage-comments/eval_cases.jsonl +3 -0
  20. package/bin/skills/clickzetta-metadata/SKILL.md +483 -0
  21. package/bin/skills/clickzetta-metadata/eval_cases.jsonl +5 -0
  22. package/bin/skills/clickzetta-metadata/references/instance-views-reference.md +276 -0
  23. package/bin/skills/clickzetta-metadata/references/metering-views-reference.md +137 -0
  24. package/bin/skills/clickzetta-metadata/references/show-desc-reference.md +326 -0
  25. package/bin/skills/clickzetta-metadata/references/views-reference.md +271 -0
  26. package/bin/skills/clickzetta-oss-ingest-pipeline/eval_cases.jsonl +5 -0
  27. package/bin/skills/clickzetta-overview/SKILL.md +102 -0
  28. package/bin/skills/clickzetta-overview/eval_cases.jsonl +5 -0
  29. package/bin/skills/clickzetta-overview/references/brands-and-endpoints.md +79 -0
  30. package/bin/skills/clickzetta-overview/references/object-model.md +311 -0
  31. package/bin/skills/clickzetta-overview/references/studio-modules.md +173 -0
  32. package/bin/skills/clickzetta-realtime-sync-pipeline/eval_cases.jsonl +5 -0
  33. package/bin/skills/clickzetta-sql-pipeline-manager/eval_cases.jsonl +12 -0
  34. package/bin/skills/clickzetta-table-stream-pipeline/eval_cases.jsonl +5 -0
  35. package/bin/skills/clickzetta-vcluster-manager/eval_cases.jsonl +5 -0
  36. package/bin/skills/clickzetta-volume-manager/eval_cases.jsonl +5 -0
  37. package/bin/skills/cz-cli-inner/SKILL.md +5 -4
  38. package/package.json +1 -1
  39. package/bin/skills/clickzetta-data-ingest-pipeline/SKILL.md +0 -220
  40. package/bin/skills/clickzetta-data-ingest-pipeline/eval_cases.jsonl +0 -5
@@ -0,0 +1,326 @@
1
+ # SHOW / DESC 命令完整语法参考
2
+
3
+ > 已通过实际 Lakehouse 连接验证(cn-shanghai-alicloud, f8866243, quick_start)
4
+
5
+ ---
6
+
7
+ ## SHOW 命令通用语法
8
+
9
+ ```sql
10
+ SHOW <object_type_plural>
11
+ [ IN <scope> ]
12
+ [ LIKE '<pattern>' | WHERE <expression> ]
13
+ [ LIMIT <num> ]
14
+ ```
15
+
16
+ ### 作用域(IN)对应关系
17
+
18
+ | 对象类型 | IN 作用域 | 示例 |
19
+ |---|---|---|
20
+ | TABLE / VIEW / SYNONYM / TABLE STREAM / PIPE | `IN schema_name` | `SHOW TABLES IN sales` |
21
+ | SCHEMA / VCLUSTER / USERS / ROLES / PIPES | `IN workspace_name` | `SHOW SCHEMAS IN my_ws` |
22
+ | 作业 | `IN VCLUSTER vc_name`(可选) | `SHOW JOBS IN VCLUSTER prod` |
23
+ | 索引 / 列 | `IN table_name` 或 `FROM table_name` | `SHOW COLUMNS IN orders` |
24
+ | 分区 | 不支持 IN,直接跟表名 | `SHOW PARTITIONS my_table` |
25
+ | VOLUME | 不支持 IN,用 WHERE external/connection 过滤 | `SHOW VOLUMES WHERE external=true` |
26
+ | CONNECTION / SHARE / FUNCTION / CATALOG | 不支持作用域限定 | `SHOW CONNECTIONS` |
27
+
28
+ ### WHERE 支持的对象和字段(实测验证)
29
+
30
+ | 对象 | LIKE | WHERE | 可过滤字段 |
31
+ |---|---|---|---|
32
+ | TABLE | ✅ | ✅ | `table_name`, `is_view`, `is_materialized_view`, `is_external`, `is_dynamic` |
33
+ | TABLE STREAM | ✅ | ✅ | `create_time`, `name`, `table_name`, `mode`, `comment` |
34
+ | CONNECTION | ✅ | ✅ | `name`, `category`, `type`, `enabled`, `created_time` |
35
+ | VCLUSTER | ✅ | ✅ | `name`, `vcluster_type`, `state`, `creator`, `create_time`, `running_jobs`, `queued_jobs` 等 |
36
+ | VOLUME | ✅ | ✅ | `external`(true/false), `connection` — ⚠️ 不支持 `schema_name` 过滤 |
37
+ | JOB | ❌ | ✅ | `status`, `creator`, `priority`, `vcluster_name`, `job_id`, `start_time`, `end_time` |
38
+ | SHARE | ✅ | ✅ | `share_name`, `provider`, `provider_instance`, `scope`, `kind` |
39
+ | SYNONYM | ✅ | ✅ | `synonym_name`, `create_time`, `target_type`, `target_name` |
40
+ | PIPE | ✅ | ✅ | `pipe_name`, `pipe_kind`, `status`, `copy_statement` |
41
+ | SCHEMA | ✅ | ✅ | `schema_name` — ⚠️ `type` 字段不存在 |
42
+ | TABLE_HISTORY | ❌ | ✅ | `table_name` |
43
+ | CATALOG | ✅ | ✅ | `category` |
44
+ | ROLE | ✅ | ❌ | — |
45
+ | USER | ❌ | ❌ | — |
46
+ | FUNCTION | ❌ | ❌ | `SHOW FUNCTIONS` 不支持 LIKE/WHERE;用 `SHOW EXTERNAL FUNCTIONS LIKE '%xxx%'` 查用户自定义函数 |
47
+ | GRANT | ❌ | ❌ | 用 `SHOW GRANTS ON/TO` 语法代替;⚠️ 不支持 LIMIT |
48
+
49
+ ---
50
+
51
+ ## SHOW TABLES 返回字段
52
+
53
+ | 字段 | 类型 | 说明 |
54
+ |---|---|---|
55
+ | schema_name | STRING | 所属 Schema |
56
+ | table_name | STRING | 对象名称 |
57
+ | is_view | BOOLEAN | 是否为视图 |
58
+ | is_materialized_view | BOOLEAN | 是否为物化视图 |
59
+ | is_external | BOOLEAN | 是否为外部表 |
60
+ | is_dynamic | BOOLEAN | 是否为动态表 |
61
+
62
+ 常用过滤示例:
63
+
64
+ ```sql
65
+ -- 列出指定 Schema 下所有 Dynamic Table(最常用)
66
+ SHOW TABLES IN my_schema WHERE is_dynamic;
67
+
68
+ -- 列出当前 Schema 下所有 Dynamic Table
69
+ SHOW TABLES WHERE is_dynamic;
70
+
71
+ -- 其他类型过滤
72
+ SHOW TABLES WHERE is_view = true;
73
+ SHOW TABLES WHERE is_materialized_view = true;
74
+ SHOW TABLES WHERE is_external = true;
75
+ SHOW TABLES WHERE is_view = false AND is_materialized_view = false; -- 普通表
76
+ ```
77
+
78
+ **注意**:`SHOW VIEWS IN schema` 语法不支持,需用 `SHOW TABLES WHERE is_view=true`
79
+
80
+ ---
81
+
82
+ ## SHOW CATALOGS 返回字段
83
+
84
+ | 字段 | 说明 |
85
+ |---|---|
86
+ | workspace_name | Catalog 名称 |
87
+ | created_time | 创建时间 |
88
+ | category | SHARED(共享 Catalog)/ EXTERNAL(外部 Catalog) |
89
+
90
+ ---
91
+
92
+ ## SHOW VOLUMES 返回字段
93
+
94
+ | 字段 | 说明 |
95
+ |---|---|
96
+ | schema_name | 所属 Schema |
97
+ | volume_name | Volume 名称 |
98
+ | create_time | 创建时间 |
99
+ | external | 是否为外部 Volume(BOOLEAN) |
100
+ | workspace_name | 所属工作空间 |
101
+ | url | 绑定的存储路径 |
102
+ | recursive_file_lookup | 是否递归扫描 |
103
+ | connection | 引用的 Connection 名称 |
104
+
105
+ **注意**:`SHOW VOLUMES IN schema` 语法不支持;`WHERE schema_name='x'` 也不支持 — 只能用 `WHERE external=true/false` 或 `WHERE connection='xxx'` 过滤
106
+
107
+ ---
108
+
109
+ ## SHOW SHARES 返回字段
110
+
111
+ | 字段 | 说明 |
112
+ |---|---|
113
+ | share_name | Share 名称 |
114
+ | provider | 提供方账户名 |
115
+ | provider_instance | 提供方实例 ID |
116
+ | provider_workspace | 提供方工作空间 |
117
+ | scope | PRIVATE / PUBLIC |
118
+ | to_instance | 消费方实例(逗号分隔) |
119
+ | kind | OUTBOUND(对外共享)/ INBOUND(接收共享) |
120
+
121
+ ---
122
+
123
+ ## SHOW TABLES HISTORY 返回字段
124
+
125
+ | 字段 | 类型 | 说明 |
126
+ |---|---|---|
127
+ | schema_name | STRING | 所属 Schema |
128
+ | table_name | STRING | 表名 |
129
+ | create_time | TIMESTAMP | 创建时间 |
130
+ | creator | STRING | 创建者 |
131
+ | rows | BIGINT | 行数 |
132
+ | bytes | BIGINT | 大小 |
133
+ | comment | STRING | 注释 |
134
+ | retention_time | INT | 数据保留天数 |
135
+ | delete_time | TIMESTAMP | 删除时间(NULL 表示未删除) |
136
+
137
+ ---
138
+
139
+ ## SHOW PARTITIONS EXTENDED 返回字段
140
+
141
+ | 字段 | 说明 |
142
+ |---|---|
143
+ | partitions | 分区值(如 `dt=2024-01`) |
144
+ | total_rows | 分区行数 |
145
+ | bytes | 分区大小 |
146
+ | total_files | 文件数 |
147
+ | created_time | 分区创建时间 |
148
+ | last_modified_time | 最后修改时间(生命周期从此起算) |
149
+ | last_data_time | 最后数据写入时间 |
150
+ | last_compaction_time | 最后 compaction 时间 |
151
+
152
+ **注意**:`SHOW PARTITIONS WHERE dt='2024-01'` 不支持,需用 `SHOW PARTITIONS my_table PARTITION(dt='2024-01')`
153
+
154
+ ---
155
+
156
+ ## SHOW JOBS 返回字段
157
+
158
+ | 字段 | 说明 |
159
+ |---|---|
160
+ | job_id | 作业 ID |
161
+ | status | SETUP / SUCCEED / FAILED / CANCELLED |
162
+ | creator | 提交用户 |
163
+ | priority | 优先级 |
164
+ | start_time | 开始时间 |
165
+ | end_time | 结束时间 |
166
+ | execution_time | 执行时长(INTERVAL 类型) |
167
+ | vcluster_name | 使用的集群 |
168
+ | job_text | SQL 语句 |
169
+ | query_tag | 用户标签 |
170
+
171
+ ---
172
+
173
+ ## SHOW FUNCTIONS / SHOW EXTERNAL FUNCTIONS 返回字段
174
+
175
+ | 字段 | 说明 |
176
+ |---|---|
177
+ | name | 函数名称(注意:列名是 `name`,不是 `function_name`) |
178
+ | type | 函数类型 |
179
+
180
+ > `SHOW FUNCTIONS` 列出所有内置函数和用户自定义函数,不支持 LIKE/WHERE。
181
+ > `SHOW EXTERNAL FUNCTIONS` 只列用户创建的外部函数,支持 `LIKE '%pattern%'`。
182
+
183
+ ---
184
+
185
+ ## SHOW DYNAMIC TABLE REFRESH HISTORY 返回字段
186
+
187
+ ```sql
188
+ -- 全局(所有动态表,最近 7 天)
189
+ SHOW DYNAMIC TABLE REFRESH HISTORY LIMIT 20;
190
+ SHOW DYNAMIC TABLE REFRESH HISTORY WHERE state = 'FAILED';
191
+
192
+ -- 指定表
193
+ SHOW DYNAMIC TABLE REFRESH HISTORY WHERE name = 'my_dt' LIMIT 10;
194
+ SHOW DYNAMIC TABLE REFRESH HISTORY WHERE name = 'my_dt' AND state = 'SUCCEED' LIMIT 20;
195
+ ```
196
+
197
+ | 字段 | 说明 |
198
+ |---|---|
199
+ | workspace_name | 工作空间 |
200
+ | schema_name | Schema |
201
+ | name | 动态表名 |
202
+ | virtual_cluster | 使用集群 |
203
+ | start_time / end_time | 刷新时间 |
204
+ | duration | 耗时(INTERVAL) |
205
+ | state | SUCCEED / FAILED / RUNNING |
206
+ | refresh_trigger | MANUAL / SYSTEM_SCHEDULED |
207
+ | refresh_mode | NO_DATA / FULL / INCREMENTAL |
208
+ | error_message | 失败信息 |
209
+ | source_tables | 基表信息 |
210
+ | stats | 增量刷新条数 |
211
+
212
+ ---
213
+
214
+ ## SHOW CONNECTIONS 返回字段
215
+
216
+ | 字段 | 说明 |
217
+ |---|---|
218
+ | name | 连接名称(注意:列名是 `name`,不是 `connection_name`) |
219
+ | category | STORAGE / API / CATALOG |
220
+ | type | OSS / COS / S3 / KAFKA / CLOUD_FUNCTION / DATABRICKS_UNITY_CATALOG 等 |
221
+ | enabled | ENABLED / DISABLED |
222
+ | created_time | 创建时间 |
223
+
224
+ ---
225
+
226
+ ## DESC 命令支持的对象类型
227
+
228
+ | 对象类型 | 语法 | EXTENDED 支持 | 说明 |
229
+ |---|---|---|---|
230
+ | table/view/dynamic_table/materialized_view/external_table | `DESC TABLE [EXTENDED] name` | ✅ | 所有表类型统一用 DESC TABLE |
231
+ | semantic_view | `DESC EXTENDED name` | — | 返回维度/指标/逻辑表定义 |
232
+ | schema | `DESC SCHEMA [EXTENDED] name` | ✅ | EXTENDED 返回创建者、时间、权限等 |
233
+ | vcluster | `DESC VCLUSTER name` | ❌ | — |
234
+ | connection | `DESC CONNECTION [EXTENDED] name` | ✅ | EXTENDED 返回完整属性 |
235
+ | catalog | `DESC CATALOG name` | ❌ | — |
236
+ | stream/table_stream | `DESC TABLE STREAM name` | ❌ | — |
237
+ | job | `DESC JOB job_id` | ❌ | object_name 为 job_id |
238
+ | share | `DESC SHARE name` | ❌ | 返回 share 中包含的对象 |
239
+ | index | `DESC INDEX [EXTENDED] name` | ✅ | — |
240
+ | function/external_function | `DESC FUNCTION [EXTENDED] name` | ✅ | 仅支持用户创建的函数 |
241
+ | volume | `DESC VOLUME name` | ❌ | — |
242
+ | pipe | `DESC PIPE name` | ❌ | — |
243
+
244
+ > ⚠️ `DESC FUNCTION` 不支持内置函数(如 `year`、`count`),只支持用户创建的外部函数。
245
+
246
+ ---
247
+
248
+ ## DESC HISTORY 返回字段
249
+
250
+ | 字段 | 说明 |
251
+ |---|---|
252
+ | version | 版本号 |
253
+ | time | 操作时间 |
254
+ | total_rows | 该版本行数 |
255
+ | total_bytes | 该版本大小 |
256
+ | user | 操作用户 |
257
+ | operation | INSERT_INTO / UPDATE / DELETE / ALTER / CREATE / REFRESH 等 |
258
+ | job_id | 对应作业 ID |
259
+ | stats | 增量刷新统计(动态表专有) |
260
+ | source_tables | 基表信息(动态表专有) |
261
+
262
+ ---
263
+
264
+ ## load_history() 语法
265
+
266
+ ```sql
267
+ -- 正确:参数为带引号的字符串
268
+ SELECT * FROM load_history('schema_name.table_name');
269
+ SELECT * FROM load_history('schema_name.table_name') LIMIT 100;
270
+
271
+ -- 错误:不能用裸表名
272
+ -- SELECT * FROM load_history(schema.table); ❌
273
+ -- SELECT * FROM load_history(TABLE schema.table); ❌
274
+ ```
275
+
276
+ 返回字段:`file_path`, `last_copy_time`, `file_size`, `status`, `first_error_message`
277
+
278
+ 保留时间:7 天
279
+
280
+ ---
281
+
282
+ ## FROM (SHOW ...) 子查询
283
+
284
+ 大多数 SHOW 命令支持作为子查询使用,可实现排序、过滤、JOIN 等操作:
285
+
286
+ ```sql
287
+ -- ✅ 支持子查询的 SHOW 命令
288
+ SELECT * FROM (SHOW TABLES) WHERE is_view = false ORDER BY table_name;
289
+ SELECT * FROM (SHOW SCHEMAS) WHERE schema_name LIKE 'mcp%';
290
+ SELECT * FROM (SHOW VCLUSTERS) WHERE state = 'RUNNING' ORDER BY name;
291
+ SELECT * FROM (SHOW USERS);
292
+ SELECT * FROM (SHOW ROLES);
293
+ SELECT * FROM (SHOW SHARES);
294
+ SELECT * FROM (SHOW CONNECTIONS);
295
+ SELECT * FROM (SHOW JOBS) WHERE status = 'FAILED';
296
+ SELECT * FROM (SHOW GRANTS);
297
+ SELECT * FROM (SHOW FUNCTIONS) WHERE name LIKE '%count%';
298
+ SELECT * FROM (SHOW DYNAMIC TABLE REFRESH HISTORY) WHERE state = 'FAILED';
299
+ SELECT * FROM (SHOW COLUMNS FROM my_table);
300
+
301
+ -- ❌ 不支持子查询
302
+ -- SELECT * FROM (SHOW CREATE TABLE my_table); -- parser return null
303
+ ```
304
+
305
+ > 💡 **SHOW 结果排序的唯一方法**:`SHOW ... ORDER BY` 不支持,但可用子查询:
306
+ > ```sql
307
+ > SELECT * FROM (SHOW TABLES) ORDER BY table_name;
308
+ > SELECT * FROM (SHOW VCLUSTERS) ORDER BY create_time DESC;
309
+ > ```
310
+
311
+ ---
312
+
313
+ ## 常见陷阱
314
+
315
+ | 命令 | 陷阱 | 正确做法 |
316
+ |---|---|---|
317
+ | `SHOW SCHEMAS WHERE type=...` | `type` 字段不存在 | `SHOW SCHEMAS WHERE schema_name LIKE '%xxx%'` |
318
+ | `SHOW VIEWS IN schema` | 语法不支持 | `SHOW TABLES WHERE is_view=true` |
319
+ | `SHOW VOLUMES IN schema` | 语法不支持 | `SHOW VOLUMES WHERE external=true/false` 或 `WHERE connection='xxx'` |
320
+ | `SHOW VOLUMES WHERE schema_name='x'` | `schema_name` 字段不可过滤 | `SHOW VOLUMES LIKE '%name%'` |
321
+ | `SHOW PARTITIONS t WHERE dt='x'` | 不支持按分区列 WHERE | `SHOW PARTITIONS t PARTITION(dt='x')` |
322
+ | `load_history(schema.table)` | 需要字符串 | `load_history('schema.table')` |
323
+ | `DESC FUNCTION year` | 不支持内置函数 | 仅支持用户创建的外部函数 |
324
+ | `LIKE` + `WHERE` 同时用 | 不支持 | 用 `WHERE table_name LIKE 'x%'` 代替,或用子查询 `SELECT * FROM (SHOW TABLES) WHERE table_name LIKE 'x%'` |
325
+ | `SHOW GRANTS ... LIMIT n` | 不支持 LIMIT | 直接 `SHOW GRANTS TO USER name` |
326
+ | `SHOW FUNCTIONS LIKE '%xxx%'` | 不支持 LIKE | 用 `SHOW EXTERNAL FUNCTIONS LIKE '%xxx%'` |
@@ -0,0 +1,271 @@
1
+ # 空间级 INFORMATION_SCHEMA 视图字段说明
2
+
3
+ > 来源:https://www.yunqi.tech/documents/worksapce-informaiton_schema-views
4
+ > 已通过实际 Lakehouse 连接验证(cn-shanghai-alicloud, f8866243, quick_start)
5
+
6
+ 访问路径:`information_schema.<视图名>`
7
+ 权限要求:workspace_admin
8
+
9
+ ---
10
+
11
+ ## SCHEMAS 视图
12
+
13
+ 实际字段(8列):
14
+
15
+ | 字段名 | 类型 | 说明 |
16
+ |---|---|---|
17
+ | CATALOG_NAME | STRING | 当前 WORKSPACE 的名称 |
18
+ | SCHEMA_NAME | STRING | Schema 名称 |
19
+ | TYPE | STRING | EXTERNAL(外部)/ MANAGED(内部) |
20
+ | SCHEMA_CREATOR | STRING | Schema 所有者账号名称 |
21
+ | CREATE_TIME | TIMESTAMP | 创建时间 |
22
+ | LAST_MODIFY_TIME | TIMESTAMP | 修改时间 |
23
+ | COMMENT | STRING | 创建时的注释 |
24
+ | PROPERTIES | ARRAY | 自定义属性 |
25
+
26
+ ---
27
+
28
+ ## TABLES 视图
29
+
30
+ 实际字段(14列):
31
+
32
+ | 字段名 | 类型 | 说明 |
33
+ |---|---|---|
34
+ | TABLE_CATALOG | STRING | 当前 WORKSPACE 名称 |
35
+ | TABLE_SCHEMA | STRING | 所属 Schema |
36
+ | TABLE_NAME | STRING | 表名 |
37
+ | TABLE_CREATOR | STRING | 表所有者账号名称 |
38
+ | TABLE_TYPE | STRING | MANAGED_TABLE / EXTERNAL_TABLE / VIRTUAL_VIEW / MATERIALIZED_VIEW |
39
+ | ROW_COUNT | BIGINT | 行数(估计值,VIEW 为 NULL) |
40
+ | BYTES | BIGINT | 存储大小字节(估计值,VIEW 为 NULL) |
41
+ | CREATE_TIME | TIMESTAMP | 创建时间 |
42
+ | LAST_MODIFY_TIME | TIMESTAMP | 修改时间 |
43
+ | IS_PARTITIONED | BOOLEAN | 是否分区表 |
44
+ | IS_CLUSTERED | BOOLEAN | 是否分桶表 |
45
+ | COMMENT | STRING | 表注释 |
46
+ | PROPERTIES | ARRAY | 自定义属性 |
47
+ | DATA_LIFECYCLE | BIGINT | 生命周期(天),-1 表示永久 |
48
+
49
+ ---
50
+
51
+ ## COLUMNS 视图
52
+
53
+ 实际字段(11列):
54
+
55
+ | 字段名 | 类型 | 说明 |
56
+ |---|---|---|
57
+ | TABLE_CATALOG | STRING | 当前 WORKSPACE 名称 |
58
+ | TABLE_SCHEMA | STRING | 所属 Schema |
59
+ | TABLE_NAME | STRING | 表名 |
60
+ | COLUMN_NAME | STRING | 字段名 |
61
+ | COLUMN_DEFAULT | STRING | 字段默认值 |
62
+ | IS_NULLABLE | BOOLEAN | 是否可为 NULL |
63
+ | DATA_TYPE | STRING | 字段类型 |
64
+ | COMMENT | STRING | 字段注释 |
65
+ | IS_PRIMARY_KEY | BOOLEAN | 是否主键 |
66
+ | IS_CLUSTERING_COLUMN | BOOLEAN | 是否 CLUSTER 字段 |
67
+ | CREATE_TIME | TIMESTAMP | 表创建时间 |
68
+
69
+ ---
70
+
71
+ ## VIEWS 视图
72
+
73
+ 实际字段(8列):
74
+
75
+ | 字段名 | 类型 | 说明 |
76
+ |---|---|---|
77
+ | TABLE_CATALOG | STRING | 当前 WORKSPACE 名称 |
78
+ | TABLE_SCHEMA | STRING | 所属 Schema |
79
+ | TABLE_NAME | STRING | 视图名 |
80
+ | TABLE_CREATOR | STRING | 视图所有者账号名称 |
81
+ | VIEW_DEFINITION | STRING | 创建视图的 SQL 语句 |
82
+ | CREATE_TIME | TIMESTAMP | 创建时间 |
83
+ | LAST_MODIFY_TIME | TIMESTAMP | 修改时间 |
84
+ | COMMENT | STRING | 视图注释 |
85
+
86
+ ---
87
+
88
+ ## USERS 视图
89
+
90
+ 实际字段(8列):
91
+
92
+ | 字段名 | 类型 | 说明 |
93
+ |---|---|---|
94
+ | WORKSPACE_NAME | STRING | 空间名称 |
95
+ | USER_NAME | STRING | 用户名称 |
96
+ | ROLE_NAMES | STRING | 拥有的角色(多个用逗号分隔)⚠️ 注意:是 ROLE_NAMES 不是 ROLE_NAME |
97
+ | CREATE_TIME | TIMESTAMP | 用户加入时间 |
98
+ | EMAIL | STRING | 用户邮箱 |
99
+ | TELPHONE | STRING | 用户电话 ⚠️ 注意:拼写为 TELPHONE(非 TELEPHONE) |
100
+ | COMMENT | STRING | 描述信息 |
101
+ | PROPERTIES | ARRAY | 保留字段 |
102
+
103
+ ---
104
+
105
+ ## ROLES 视图
106
+
107
+ 实际字段(5列):
108
+
109
+ | 字段名 | 类型 | 说明 |
110
+ |---|---|---|
111
+ | WORKSPACE_NAME | STRING | 空间名称 |
112
+ | ROLE_NAME | STRING | 角色名称 |
113
+ | USER_NAMES | STRING | 被授予该角色的用户(逗号分隔) |
114
+ | COMMENT | STRING | 描述信息 |
115
+ | PROPERTIES | ARRAY | 保留字段 |
116
+
117
+ 注意:无 `CREATE_TIME` 字段。
118
+
119
+ ---
120
+
121
+ ## JOB_HISTORY 视图
122
+
123
+ 实际字段(31列):
124
+
125
+ | 字段名 | 类型 | 说明 |
126
+ |---|---|---|
127
+ | WORKSPACE_NAME | STRING | 作业所在空间 |
128
+ | WORKSPACE_ID | BIGINT | 空间 ID |
129
+ | JOB_ID | STRING | 作业 ID |
130
+ | JOB_NAME | STRING | 作业名称 |
131
+ | JOB_CREATOR | STRING | 执行用户 |
132
+ | STATUS | STRING | SUCCEED / FAILED / CANCELLED / RUNNING |
133
+ | CRU | DECIMAL | 消耗的计算资源 |
134
+ | ERROR_MESSAGE | STRING | 错误信息(失败时有值) |
135
+ | JOB_TYPE | STRING | 作业类型:SQL_JOB 等 |
136
+ | JOB_SUB_TYPE | STRING | 作业子类型 |
137
+ | JOB_TEXT | STRING | 执行的 SQL 语句 |
138
+ | START_TIME | TIMESTAMP | 开始时间 |
139
+ | END_TIME | TIMESTAMP | 结束时间 |
140
+ | EXECUTION_TIME | DOUBLE | 执行时间(秒) |
141
+ | INPUT_OBJECTS | STRING | 输入表名(schema.table 格式) |
142
+ | OUTPUT_OBJECTS | STRING | 输出表名 |
143
+ | INPUT_TABLES | STRING | 输入表详情(JSON 格式) |
144
+ | OUTPUT_TABLES | STRING | 输出表详情(JSON 格式) |
145
+ | INPUT_BYTES | BIGINT | 实际扫描数据量 |
146
+ | OUTPUT_BYTES | BIGINT | 输出字节数 |
147
+ | CACHE_HIT | BIGINT | 从缓存读取的数据量 |
148
+ | ROWS_PRODUCED | BIGINT | 处理的总记录数 ⚠️ 注意:是 ROWS_PRODUCED 不是 ROW_PRODUCED |
149
+ | ROWS_INSERTED | BIGINT | 插入行数 ⚠️ 注意:是 ROWS_INSERTED 不是 ROW_INSERTED |
150
+ | ROWS_UPDATED | BIGINT | 更新行数 ⚠️ 注意:是 ROWS_UPDATED 不是 ROW_UPDATED |
151
+ | ROWS_DELETED | BIGINT | 删除行数 ⚠️ 注意:是 ROWS_DELETED 不是 ROW_DELETED |
152
+ | VIRTUAL_CLUSTER | STRING | 使用的计算集群 |
153
+ | JOB_CONFIG | STRING | 提交时的参数信息(JSON) |
154
+ | JOB_PRIORITY | STRING | 作业优先级 |
155
+ | QUERY_TAG | STRING | 用户设置的 TAG |
156
+ | CLIENT_INFO | STRING | 客户端信息(JDBC/SDK/Web) |
157
+ | PT_DATE | DATE | 分区日期(用于按日期过滤,性能更好) |
158
+
159
+ ---
160
+
161
+ ## MATERIALIZED_VIEW_REFRESH_HISTORY 视图
162
+
163
+ 实际字段(12列):
164
+
165
+ | 字段名 | 类型 | 说明 |
166
+ |---|---|---|
167
+ | WORKSPACE_NAME | STRING | 空间名称 |
168
+ | SCHEMA_NAME | STRING | Schema 名称 |
169
+ | MATERIALIZED_VIEW_NAME | STRING | 物化视图名称 |
170
+ | CRU | DECIMAL | 刷新消耗的计费 |
171
+ | VIRTUAL_CLUSTER_NAME | STRING | 使用的虚拟集群 |
172
+ | STATUS | STRING | SUCCEED / FAILED / RUNNING |
173
+ | SCHEDULED_START_TIME | TIMESTAMP | 计划刷新时间 |
174
+ | START_TIME | TIMESTAMP | 实际开始时间 |
175
+ | END_TIME | TIMESTAMP | 结束时间 |
176
+ | ERROR_CODE | STRING | 错误码 |
177
+ | ERROR_MESSAGE | STRING | 刷新失败信息 |
178
+ | PT_DATE | DATE | 分区日期 |
179
+
180
+ ---
181
+
182
+ ## AUTOMV_REFRESH_HISTORY 视图
183
+
184
+ 实际字段(12列):
185
+
186
+ | 字段名 | 类型 | 说明 |
187
+ |---|---|---|
188
+ | WORKSPACE_NAME | STRING | 空间名称 |
189
+ | SCHEMA_NAME | STRING | Schema 名称 |
190
+ | MATERIALIZED_VIEW_NAME | STRING | 物化视图名称 |
191
+ | CRU | DECIMAL | 刷新消耗的计费 |
192
+ | STATUS | STRING | PROCESSING / SUCCEEDED / FAILED / CANCELLED |
193
+ | MV_PROCESS_TYPE | STRING | BUILD(构建)/ REFRESH(刷新) |
194
+ | START_TIME | TIMESTAMP | 开始时间 |
195
+ | END_TIME | TIMESTAMP | 结束时间 |
196
+ | BUILD_FROM_WORKSPACE | STRING | 构建 MV 对应的源表空间 |
197
+ | JOB_ID | STRING | 构建 MV 的作业 ID |
198
+ | ERROR_MESSAGE | STRING | 刷新失败信息 |
199
+ | PT_DATE | DATE | 分区日期 |
200
+
201
+ ---
202
+
203
+ ## VOLUMES 视图
204
+
205
+ 实际字段(12列):
206
+
207
+ | 字段名 | 类型 | 说明 |
208
+ |---|---|---|
209
+ | VOLUME_CATALOG | STRING | 所属 Workspace 名称 |
210
+ | VOLUME_SCHEMA | STRING | 所属 Schema 名称 |
211
+ | VOLUME_NAME | STRING | Volume 名称 |
212
+ | VOLUME_URL | STRING | Volume 绑定的 URL |
213
+ | VOLUME_REGION | STRING | Volume 所属区域 |
214
+ | VOLUME_TYPE | STRING | INTERNAL / EXTERNAL |
215
+ | VOLUME_CREATOR | STRING | Volume 的 owner |
216
+ | CONNECTION_NAME | STRING | 引用的 Connection 名称 |
217
+ | COMMENT | STRING | 注释 |
218
+ | PROPERTIES | ARRAY | 保留字段 |
219
+ | CREATE_TIME | TIMESTAMP | 创建时间 |
220
+ | LAST_MODIFY_TIME | TIMESTAMP | 修改时间 |
221
+
222
+ ---
223
+
224
+ ## CONNECTIONS 视图
225
+
226
+ 实际字段(11列):
227
+
228
+ | 字段名 | 类型 | 说明 |
229
+ |---|---|---|
230
+ | WORKSPACE_NAME | STRING | 所在空间 |
231
+ | CONNECTION_NAME | STRING | 连接对象名称 |
232
+ | CONNECTION_KIND | STRING | STORAGE / API |
233
+ | TYPE | STRING | FILE_SYSTEM(存储)/ CLOUD_FUNCTION(云函数) |
234
+ | PROVIDER | STRING | FILE_SYSTEM 时:OSS / COS;CLOUD_FUNCTION 时:aliyun / tencent |
235
+ | REGION | STRING | 连接的 region(如 ap-shanghai / cn-beijing) |
236
+ | SOURCE_CREATOR | STRING | 创建者 |
237
+ | CREATE_TIME | TIMESTAMP | 创建时间 ⚠️ 注意:是 CREATE_TIME 不是 CREATED_TIME |
238
+ | LAST_MODIFY_TIME | TIMESTAMP | 修改时间 |
239
+ | COMMENT | STRING | 注释 |
240
+ | PROPERTIES | ARRAY | 保留字段 |
241
+
242
+ ---
243
+
244
+ ## SORTKEY_CANDIDATES 视图
245
+
246
+ 实际字段(12列):
247
+
248
+ | 字段名 | 类型 | 说明 |
249
+ |---|---|---|
250
+ | INSTANCE_ID | STRING | 实例 ID |
251
+ | WORKSPACE_ID | BIGINT | 空间 ID |
252
+ | WORKSPACE_NAME | STRING | 空间名称 |
253
+ | SCHEMA_ID | BIGINT | Schema ID |
254
+ | SCHEMA_NAME | STRING | Schema 名称 |
255
+ | TABLE_ID | BIGINT | 表 ID |
256
+ | TABLE_NAME | STRING | 表名 |
257
+ | COL | STRING | 推荐作为排序列的字段名 |
258
+ | STATEMENT | STRING | 对应的 ALTER TABLE 设置 SQL |
259
+ | RATIO | DOUBLE | 预估提升效果比例 |
260
+ | INSERT_TIME | TIMESTAMP | 记录插入时间 |
261
+ | P_DATE | DATE | 分区日期 |
262
+
263
+ ---
264
+
265
+ ## 授权管理
266
+
267
+ ```sql
268
+ -- 授予用户查询 information_schema 的权限
269
+ GRANT ALL ON ALL VIEWS IN SCHEMA information_schema TO ROLE <role_name>;
270
+ GRANT ALL ON ALL VIEWS IN SCHEMA information_schema TO USER <user_name>;
271
+ ```
@@ -0,0 +1,5 @@
1
+ {"case_id":"001","type":"should_call","user_input":"怎么从阿里云 OSS 持续自动导入数据到 Lakehouse?","expected_skill":"clickzetta-oss-ingest-pipeline","expected_output_contains":["PIPE","LIST_PURGE"]}
2
+ {"case_id":"002","type":"should_call","user_input":"OSS PIPE 的 LIST_PURGE 和 EVENT_NOTIFICATION 模式有什么区别?","expected_skill":"clickzetta-oss-ingest-pipeline","expected_output_contains":["LIST_PURGE","EVENT_NOTIFICATION"]}
3
+ {"case_id":"003","type":"should_call","user_input":"怎么从 S3 批量导入 Parquet 文件到 Lakehouse?","expected_skill":"clickzetta-oss-ingest-pipeline","expected_output_contains":["Volume","COPY INTO"]}
4
+ {"case_id":"004","type":"should_call","user_input":"OSS 持续导入的前置步骤是什么?需要先创建什么对象?","expected_skill":"clickzetta-oss-ingest-pipeline","expected_output_contains":["CREATE STORAGE CONNECTION","External Volume"]}
5
+ {"case_id":"005","type":"should_call","user_input":"腾讯云 COS 的数据怎么导入 ClickZetta?","expected_skill":"clickzetta-oss-ingest-pipeline","expected_output_contains":["COS","PIPE"]}