ccbot-cli 2.0.0 → 2.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (83) hide show
  1. package/LICENSE +21 -0
  2. package/bin/adapters/claude.js +150 -0
  3. package/bin/adapters/codex.js +439 -0
  4. package/bin/install.js +509 -349
  5. package/bin/lib/ccline.js +82 -0
  6. package/bin/lib/utils.js +87 -34
  7. package/bin/uninstall.js +48 -0
  8. package/config/AGENTS.md +630 -0
  9. package/config/CLAUDE.md +229 -20
  10. package/config/ccline/config.toml +161 -0
  11. package/config/codex-config.example.toml +22 -0
  12. package/config/settings.example.json +32 -0
  13. package/output-styles/abyss-cultivator.md +399 -0
  14. package/package.json +14 -5
  15. package/skills/SKILL.md +159 -0
  16. package/skills/domains/ai/SKILL.md +34 -0
  17. package/skills/domains/ai/agent-dev.md +242 -0
  18. package/skills/domains/ai/llm-security.md +288 -0
  19. package/skills/domains/ai/prompt-and-eval.md +279 -0
  20. package/skills/domains/ai/rag-system.md +542 -0
  21. package/skills/domains/architecture/SKILL.md +42 -0
  22. package/skills/domains/architecture/api-design.md +225 -0
  23. package/skills/domains/architecture/caching.md +299 -0
  24. package/skills/domains/architecture/cloud-native.md +285 -0
  25. package/skills/domains/architecture/message-queue.md +329 -0
  26. package/skills/domains/architecture/security-arch.md +297 -0
  27. package/skills/domains/data-engineering/SKILL.md +207 -0
  28. package/skills/domains/development/SKILL.md +46 -0
  29. package/skills/domains/development/cpp.md +246 -0
  30. package/skills/domains/development/go.md +323 -0
  31. package/skills/domains/development/java.md +277 -0
  32. package/skills/domains/development/python.md +288 -0
  33. package/skills/domains/development/rust.md +313 -0
  34. package/skills/domains/development/shell.md +313 -0
  35. package/skills/domains/development/typescript.md +277 -0
  36. package/skills/domains/devops/SKILL.md +39 -0
  37. package/skills/domains/devops/cost-optimization.md +272 -0
  38. package/skills/domains/devops/database.md +217 -0
  39. package/skills/domains/devops/devsecops.md +198 -0
  40. package/skills/domains/devops/git-workflow.md +181 -0
  41. package/skills/domains/devops/observability.md +280 -0
  42. package/skills/domains/devops/performance.md +336 -0
  43. package/skills/domains/devops/testing.md +283 -0
  44. package/skills/domains/frontend-design/SKILL.md +38 -0
  45. package/skills/domains/frontend-design/claymorphism/SKILL.md +119 -0
  46. package/skills/domains/frontend-design/claymorphism/references/tokens.css +52 -0
  47. package/skills/domains/frontend-design/component-patterns.md +202 -0
  48. package/skills/domains/frontend-design/engineering.md +287 -0
  49. package/skills/domains/frontend-design/glassmorphism/SKILL.md +140 -0
  50. package/skills/domains/frontend-design/glassmorphism/references/tokens.css +32 -0
  51. package/skills/domains/frontend-design/liquid-glass/SKILL.md +137 -0
  52. package/skills/domains/frontend-design/liquid-glass/references/tokens.css +81 -0
  53. package/skills/domains/frontend-design/neubrutalism/SKILL.md +143 -0
  54. package/skills/domains/frontend-design/neubrutalism/references/tokens.css +44 -0
  55. package/skills/domains/frontend-design/state-management.md +680 -0
  56. package/skills/domains/frontend-design/ui-aesthetics.md +110 -0
  57. package/skills/domains/frontend-design/ux-principles.md +156 -0
  58. package/skills/domains/infrastructure/SKILL.md +200 -0
  59. package/skills/domains/mobile/SKILL.md +224 -0
  60. package/skills/domains/orchestration/SKILL.md +29 -0
  61. package/skills/domains/orchestration/multi-agent.md +263 -0
  62. package/skills/domains/security/SKILL.md +54 -0
  63. package/skills/domains/security/blue-team.md +436 -0
  64. package/skills/domains/security/code-audit.md +265 -0
  65. package/skills/domains/security/pentest.md +226 -0
  66. package/skills/domains/security/red-team.md +375 -0
  67. package/skills/domains/security/threat-intel.md +372 -0
  68. package/skills/domains/security/vuln-research.md +369 -0
  69. package/skills/orchestration/multi-agent/SKILL.md +493 -0
  70. package/skills/run_skill.js +129 -0
  71. package/skills/tools/gen-docs/SKILL.md +116 -0
  72. package/skills/tools/gen-docs/scripts/doc_generator.js +435 -0
  73. package/skills/tools/lib/shared.js +98 -0
  74. package/skills/tools/verify-change/SKILL.md +140 -0
  75. package/skills/tools/verify-change/scripts/change_analyzer.js +289 -0
  76. package/skills/tools/verify-module/SKILL.md +127 -0
  77. package/skills/tools/verify-module/scripts/module_scanner.js +171 -0
  78. package/skills/tools/verify-quality/SKILL.md +160 -0
  79. package/skills/tools/verify-quality/scripts/quality_checker.js +337 -0
  80. package/skills/tools/verify-security/SKILL.md +143 -0
  81. package/skills/tools/verify-security/scripts/security_scanner.js +283 -0
  82. package/bin/lib/registry.js +0 -61
  83. package/config/.claudeignore +0 -11
@@ -0,0 +1,297 @@
1
+ ---
2
+ name: security-arch
3
+ description: 安全架构设计。零信任、身份认证、威胁建模。当用户提到安全架构、零信任、IAM、身份认证、威胁建模时使用。
4
+ ---
5
+
6
+ # 🏗 阵法秘典 · 安全架构设计
7
+
8
+
9
+ ## 零信任架构
10
+
11
+ ```
12
+ ┌─────────────────────────────────────────────────────────────┐
13
+ │ 零信任原则 │
14
+ ├─────────────────────────────────────────────────────────────┤
15
+ │ 1. 永不信任,始终验证 │
16
+ │ 2. 最小权限访问 │
17
+ │ 3. 假设已被入侵 │
18
+ │ 4. 显式验证每个请求 │
19
+ │ 5. 持续监控和验证 │
20
+ └─────────────────────────────────────────────────────────────┘
21
+ ```
22
+
23
+ ### 核心组件
24
+ ```yaml
25
+ 身份验证:
26
+ - 多因素认证 (MFA)
27
+ - 单点登录 (SSO)
28
+ - 证书认证
29
+
30
+ 设备信任:
31
+ - 设备健康检查
32
+ - 端点检测响应 (EDR)
33
+ - 移动设备管理 (MDM)
34
+
35
+ 网络分段:
36
+ - 微分段
37
+ - 软件定义边界 (SDP)
38
+ - 网络访问控制
39
+
40
+ 数据保护:
41
+ - 加密传输/存储
42
+ - 数据分类
43
+ - DLP
44
+ ```
45
+
46
+ ## 身份与访问管理 (IAM)
47
+
48
+ ### 认证方式
49
+ ```yaml
50
+ 密码认证:
51
+ - 强密码策略
52
+ - 密码哈希 (bcrypt/argon2)
53
+ - 防暴力破解
54
+
55
+ 多因素认证:
56
+ - TOTP (Google Authenticator)
57
+ - FIDO2/WebAuthn
58
+ - 短信/邮件验证码
59
+
60
+ 单点登录:
61
+ - SAML 2.0
62
+ - OAuth 2.0 / OIDC
63
+ - Kerberos
64
+ ```
65
+
66
+ ### 授权模型
67
+ ```yaml
68
+ RBAC (基于角色):
69
+ 用户 → 角色 → 权限
70
+ 示例:
71
+ - admin: [read, write, delete]
72
+ - editor: [read, write]
73
+ - viewer: [read]
74
+
75
+ ABAC (基于属性):
76
+ 策略 = f(主体属性, 资源属性, 环境属性)
77
+ 示例:
78
+ - 部门=财务 AND 级别>=3 → 访问财务报表
79
+
80
+ PBAC (基于策略):
81
+ 使用策略语言定义复杂规则
82
+ 示例: OPA/Rego
83
+ ```
84
+
85
+ ### JWT 最佳实践
86
+ ```yaml
87
+ 签名算法:
88
+ - 使用 RS256 或 ES256
89
+ - 避免 HS256 (共享密钥)
90
+ - 禁止 none 算法
91
+
92
+ Token 管理:
93
+ - 短期访问令牌 (15分钟)
94
+ - 长期刷新令牌 (7天)
95
+ - 令牌轮换
96
+ - 黑名单机制
97
+
98
+ Claims:
99
+ - iss: 签发者
100
+ - sub: 主题
101
+ - aud: 受众
102
+ - exp: 过期时间
103
+ - iat: 签发时间
104
+ - jti: 唯一标识
105
+ ```
106
+
107
+ ## 威胁建模
108
+
109
+ ### STRIDE 模型
110
+ ```yaml
111
+ S - Spoofing (欺骗):
112
+ 威胁: 冒充用户身份
113
+ 缓解: 强认证、MFA
114
+
115
+ T - Tampering (篡改):
116
+ 威胁: 修改数据
117
+ 缓解: 完整性校验、签名
118
+
119
+ R - Repudiation (抵赖):
120
+ 威胁: 否认操作
121
+ 缓解: 审计日志、数字签名
122
+
123
+ I - Information Disclosure (信息泄露):
124
+ 威胁: 数据泄露
125
+ 缓解: 加密、访问控制
126
+
127
+ D - Denial of Service (拒绝服务):
128
+ 威胁: 服务不可用
129
+ 缓解: 限流、冗余
130
+
131
+ E - Elevation of Privilege (权限提升):
132
+ 威胁: 获取更高权限
133
+ 缓解: 最小权限、输入验证
134
+ ```
135
+
136
+ ### 威胁建模流程
137
+ ```
138
+ 1. 识别资产
139
+ └─ 数据、服务、基础设施
140
+
141
+ 2. 绘制数据流图
142
+ └─ 信任边界、数据流向
143
+
144
+ 3. 识别威胁
145
+ └─ 使用 STRIDE 分析
146
+
147
+ 4. 评估风险
148
+ └─ 可能性 × 影响
149
+
150
+ 5. 制定缓解措施
151
+ └─ 技术控制、流程控制
152
+
153
+ 6. 验证和迭代
154
+ └─ 渗透测试、代码审计
155
+ ```
156
+
157
+ ## 安全设计原则
158
+
159
+ ```yaml
160
+ 纵深防御:
161
+ - 多层安全控制
162
+ - 单点失效不致命
163
+
164
+ 最小权限:
165
+ - 仅授予必要权限
166
+ - 定期审查权限
167
+
168
+ 安全默认:
169
+ - 默认拒绝
170
+ - 显式允许
171
+
172
+ 失败安全:
173
+ - 失败时拒绝访问
174
+ - 不泄露敏感信息
175
+
176
+ 分离职责:
177
+ - 关键操作需多人
178
+ - 开发/运维分离
179
+ ```
180
+
181
+ ## 安全架构检查清单
182
+
183
+ ```yaml
184
+ 认证:
185
+ - [ ] 实施 MFA
186
+ - [ ] 密码策略
187
+ - [ ] 会话管理
188
+ - [ ] 账户锁定
189
+
190
+ 授权:
191
+ - [ ] 最小权限
192
+ - [ ] RBAC/ABAC
193
+ - [ ] API 授权
194
+
195
+ 数据保护:
196
+ - [ ] 传输加密 (TLS)
197
+ - [ ] 存储加密
198
+ - [ ] 密钥管理
199
+
200
+ 日志审计:
201
+ - [ ] 安全事件日志
202
+ - [ ] 访问日志
203
+ - [ ] 日志保护
204
+
205
+ 网络:
206
+ - [ ] 网络分段
207
+ - [ ] 防火墙规则
208
+ - [ ] WAF
209
+ ```
210
+
211
+ ## 数据安全
212
+
213
+ ### 数据分类
214
+ | 级别 | 类型 | 保护措施 | 示例 |
215
+ |------|------|----------|------|
216
+ | 公开 | Public | 无特殊要求 | 产品文档 |
217
+ | 内部 | Internal | 访问控制 | 内部Wiki |
218
+ | 机密 | Confidential | 加密+审计 | 客户数据 |
219
+ | 受限 | Restricted | 加密+审计+MFA | 密钥、PII |
220
+
221
+ ### 加密要求
222
+ ```yaml
223
+ 传输加密:
224
+ - TLS 1.2+(禁用 1.0/1.1)
225
+ - 推荐: TLS_AES_256_GCM_SHA384 / TLS_CHACHA20_POLY1305_SHA256
226
+ - HSTS + 证书管理
227
+
228
+ 存储加密:
229
+ - AES-256-GCM(对称)+ 密钥与数据分离(KMS/Vault)+ 定期轮换
230
+
231
+ 密码存储:
232
+ - bcrypt (rounds>=12) 或 argon2,禁止 MD5/SHA1
233
+ ```
234
+
235
+ ### 隐私保护
236
+ ```yaml
237
+ 数据脱敏: 姓名(张**) / 手机(138****1234) / 邮箱(z***@x.com)
238
+ 数据最小化: 只收集必要数据 / 限制保留期限 / 定期清理 / 匿名化
239
+ 生命周期: 创建(分类)→存储(加密)→使用(审计)→共享(脱敏)→归档(压缩)→销毁(安全删除)
240
+ ```
241
+
242
+ ### 数据安全检查清单
243
+ ```yaml
244
+ - [ ] 数据资产清单 + 敏感数据识别 + 数据流映射
245
+ - [ ] 传输加密 + 存储加密 + 访问控制 + 数据脱敏
246
+ - [ ] 访问日志 + 异常检测 + DLP
247
+ ```
248
+
249
+ ## 合规审计
250
+
251
+ ### 合规框架速查
252
+ | 框架 | 适用范围 | 核心要求 | 处罚 |
253
+ |------|----------|----------|------|
254
+ | GDPR | 欧盟用户数据 | 数据保护、用户权利 | 营收4%或2000万欧 |
255
+ | SOC 2 | SaaS/云服务 | 安全、可用、机密、隐私 | 失去客户信任 |
256
+ | HIPAA | 医疗健康数据 | PHI保护 | $50K-$1.5M/次 |
257
+ | PCI DSS | 支付卡数据 | 持卡人数据保护 | $5K-$100K/月 |
258
+
259
+ ### GDPR 用户权利 (DSAR)
260
+ | 权利 | API | SLA |
261
+ |------|-----|-----|
262
+ | 访问权 | `GET /users/{id}/data-export` | 30天 |
263
+ | 删除权 | `DELETE /users/{id}/data` | 30天 |
264
+ | 可携带权 | `GET /users/{id}/data-export?format=json` | 30天 |
265
+ | 限制处理 | `POST /users/{id}/restrict` | 72小时 |
266
+
267
+ ### SOC 2 关键控制
268
+ ```yaml
269
+ 访问控制: MFA强制 + RBAC + 最小权限 + 季度审查 + 离职即撤权
270
+ 变更管理: PR审查 + 分环境部署 + 审批流程 + 回滚方案
271
+ 监控告警: 安全事件监控 + 异常登录检测 + 数据访问审计
272
+ 事件响应: IR计划文档化 + 定期演练 + 72小时通知 + 事后复盘
273
+ ```
274
+
275
+ ### 审计日志要求
276
+ ```yaml
277
+ 必须审计: 登录/MFA/密码变更 | 权限/角色变更 | 敏感数据访问/导出/删除 | 配置/部署变更
278
+ 存储: 不可篡改(WORM) + 加密 + 异地备份
279
+ 保留: 安全事件>=1年 / 访问日志>=90天 / 变更>=3年 / 合规审计>=7年
280
+ ```
281
+
282
+ ### 合规即代码 (OPA)
283
+ ```rego
284
+ deny[msg] {
285
+ input.resource_type == "aws_s3_bucket"
286
+ input.resource.acl == "public-read"
287
+ msg := sprintf("S3 %s must not be public", [input.resource.name])
288
+ }
289
+ ```
290
+
291
+ ### 合规检查清单
292
+ ```yaml
293
+ GDPR: 隐私政策 + 同意管理 + DSAR(30天) + 加密 + 保留策略 + 泄露通知(72h)
294
+ SOC2: 访问控制+MFA + 变更管理 + IR计划 + 漏洞管理 + 安全培训
295
+ 审计: 日志覆盖关键操作 + 不可篡改 + 保留期限合规
296
+ ```
297
+
@@ -0,0 +1,207 @@
1
+ ---
2
+ name: data-engineering
3
+ description: 数据工程。Airflow、Dagster、Kafka Streams、Flink、dbt、数据管道、流处理、数据质量。当用户提到数据管道、ETL、流处理、数据质量时路由到此。
4
+ license: MIT
5
+ user-invocable: false
6
+ disable-model-invocation: false
7
+ ---
8
+
9
+ # 数据工程域 · Data Engineering
10
+
11
+ ## 域概览
12
+
13
+ 数据工程域涵盖数据管道编排、流式处理、数据质量保障三大核心领域。
14
+
15
+ ```
16
+ 数据管道层 流处理层 质量保障层
17
+ ├── Airflow (调度编排) ├── Kafka Streams ├── Great Expectations
18
+ ├── Dagster (资产管理) ├── Flink ├── dbt
19
+ └── Prefect (现代工作流) └── Spark Streaming └── Soda Core
20
+ ```
21
+
22
+ ---
23
+
24
+ ## 数据管道编排
25
+
26
+ ### 框架对比
27
+
28
+ | 特性 | Airflow | Dagster | Prefect |
29
+ |------|---------|---------|---------|
30
+ | 核心模型 | DAG + Task | Asset + Op | Flow + Task |
31
+ | 学习曲线 | 陡峭 | 中等 | 平缓 |
32
+ | 资产管理 | 无 | 原生支持 | 无 |
33
+ | 动态任务 | 支持 | 支持 | 支持 |
34
+ | 本地开发 | 复杂 | 简单 | 简单 |
35
+ | 社区生态 | 最大 | 成长中 | 成长中 |
36
+
37
+ ### Airflow 核心模式
38
+
39
+ - DAG 定义:`with DAG(dag_id, schedule, default_args) as dag`
40
+ - TaskFlow API:`@task` 装饰器,自动 XCom 传递
41
+ - 动态任务:`@task` + `.expand()` 实现 dynamic task mapping
42
+ - Operators:PythonOperator / BashOperator / SQL / HTTP / S3
43
+ - Sensors:FileSensor / HttpSensor / ExternalTaskSensor
44
+ - 重试策略:`retries=3, retry_delay=timedelta(minutes=5), retry_exponential_backoff=True`
45
+ - 失败回调:`on_failure_callback` 发送告警
46
+ - SLA 监控:`sla=timedelta(hours=2)` + `sla_miss_callback`
47
+
48
+ ### Dagster 核心模式
49
+
50
+ - Asset 定义:`@asset(group_name, deps)` 声明数据资产
51
+ - MaterializeResult:返回元数据(行数、预览等)
52
+ - Resources:`ConfigurableResource` 管理外部连接
53
+ - Jobs:`define_asset_job(selection=AssetSelection.groups(...))`
54
+ - Schedules:`ScheduleDefinition(job, cron_schedule)`
55
+ - Sensors:`@sensor(job)` 监听外部事件触发
56
+ - Partitions:`DailyPartitionsDefinition` 按日分区
57
+ - Asset Checks:`@asset_check` 验证数据新鲜度/质量
58
+
59
+ ### Prefect 核心模式
60
+
61
+ - Flow/Task:`@flow` + `@task(retries=3, cache_key_fn=task_input_hash)`
62
+ - 并发:`ConcurrentTaskRunner` + `task.map(items)`
63
+ - Deployments:`Deployment.build_from_flow(schedule=CronSchedule(...))`
64
+ - Blocks:`Secret` / `JSON` 管理配置和密钥
65
+
66
+ ### 调度策略 Checklist
67
+
68
+ - [ ] Cron 表达式正确(`0 2 * * *` 日批 / `*/15 * * * *` 实时)
69
+ - [ ] 事件驱动:文件到达 / S3 / API 触发
70
+ - [ ] 跨 DAG 依赖:ExternalTaskSensor / Asset deps
71
+ - [ ] 幂等性:UPSERT / 分区覆盖写入
72
+ - [ ] 增量处理:`WHERE updated_at > last_run`
73
+ - [ ] 数据血缘:Dagster 原生 / Airflow Lineage / dbt ref()
74
+
75
+ ---
76
+
77
+ ## 流式处理
78
+
79
+ ### 框架对比
80
+
81
+ | 特性 | Kafka Streams | Flink | Spark Streaming |
82
+ |------|---------------|-------|-----------------|
83
+ | 部署模式 | 嵌入式(JVM) | 独立集群 | 独立集群 |
84
+ | 状态管理 | RocksDB | 内存/RocksDB | 内存 |
85
+ | Exactly-Once | 支持 | 支持 | 支持 |
86
+ | 窗口类型 | 丰富 | 最丰富 | 基础 |
87
+ | 学习曲线 | 平缓 | 陡峭 | 中等 |
88
+ | Python API | kafka-python | PyFlink | PySpark |
89
+
90
+ ### Kafka Streams 核心模式
91
+
92
+ - 拓扑构建:`StreamsBuilder` → `stream()` → `filter/map/flatMap` → `to()`
93
+ - 聚合:`groupByKey().count()` / `.aggregate()` / `.reduce()`
94
+ - Join:Stream-Stream(时间窗口)/ Stream-Table / Table-Table
95
+ - 状态存储:`Stores.persistentKeyValueStore` + Transformer
96
+ - Exactly-Once:`PROCESSING_GUARANTEE_CONFIG = EXACTLY_ONCE_V2`
97
+ - 性能调优:`NUM_STREAM_THREADS=4` / `CACHE_MAX_BYTES_BUFFERING` / RocksDB 配置
98
+
99
+ ### Flink 核心模式
100
+
101
+ - DataStream API:`env.addSource()` → `filter/map` → `addSink()`
102
+ - 窗口类型:
103
+ - 滚动窗口 `TumblingProcessingTimeWindows.of(Time.minutes(5))`
104
+ - 滑动窗口 `SlidingProcessingTimeWindows.of(size, slide)`
105
+ - 会话窗口 `ProcessingTimeSessionWindows.withGap(gap)`
106
+ - 全局窗口 `GlobalWindows.create()` + 自定义 Trigger
107
+ - 窗口聚合:`aggregate(AggregateFunction, WindowFunction)` 增量+全窗口
108
+ - ProcessFunction:低级 API,访问时间戳、注册定时器
109
+ - 状态管理:ValueState / ListState / MapState + TTL 清理
110
+ - Checkpoint:`env.enableCheckpointing(60000)` + EXACTLY_ONCE
111
+ - Savepoint:`flink run -s /path/to/savepoint`
112
+ - 时间语义:Event Time + Watermark(`forBoundedOutOfOrderness`)
113
+ - 延迟数据:`allowedLateness()` + `sideOutputLateData()`
114
+ - 数据倾斜:添加随机前缀打散 key
115
+
116
+ ### 流处理 Checklist
117
+
118
+ - [ ] 选择时间语义:Event Time vs Processing Time
119
+ - [ ] Watermark 策略:乱序容忍度设置
120
+ - [ ] 窗口类型匹配业务场景
121
+ - [ ] 状态 TTL 防止无限增长
122
+ - [ ] Checkpoint 间隔和超时配置
123
+ - [ ] Exactly-Once 语义端到端保证
124
+ - [ ] 背压监控和处理
125
+ - [ ] 并行度调优
126
+
127
+ ---
128
+
129
+ ## 数据质量
130
+
131
+ ### 质量维度
132
+
133
+ ```
134
+ 完整性(非空) → 准确性(范围) → 一致性(关联) → 及时性(新鲜度) → 有效性(格式)
135
+ ```
136
+
137
+ ### 工具对比
138
+
139
+ | 工具 | 优势 | 适用场景 |
140
+ |------|------|----------|
141
+ | Great Expectations | 丰富 Expectations、Data Docs | Python 生态、复杂验证 |
142
+ | dbt | SQL 原生、血缘追踪 | 数据仓库、转换测试 |
143
+ | Soda Core | 简洁 YAML 配置 | 快速验证、CI/CD |
144
+
145
+ ### Great Expectations 核心模式
146
+
147
+ - Data Context:`gx.get_context()` → 添加数据源 → 构建批次
148
+ - 常用 Expectations:
149
+ - `expect_table_row_count_to_be_between(min, max)`
150
+ - `expect_column_values_to_not_be_null(column)`
151
+ - `expect_column_values_to_be_unique(column)`
152
+ - `expect_column_values_to_be_between(column, min, max)`
153
+ - `expect_column_values_to_be_in_set(column, value_set)`
154
+ - `expect_column_values_to_match_regex(column, regex)`
155
+ - Checkpoints:批量运行验证 + 生成 Data Docs
156
+ - 自定义 Expectation:继承 `ColumnMapExpectation`
157
+
158
+ ### dbt 测试核心模式
159
+
160
+ - Schema 测试:`unique` / `not_null` / `accepted_values` / `relationships`
161
+ - Generic 测试:`{% test name(model, column_name, params) %}`
162
+ - Singular 测试:`tests/` 目录下自定义 SQL,返回行 = 失败
163
+ - dbt_expectations 包:`expect_column_mean_to_be_between` / `expect_row_values_to_have_recent_data`
164
+ - 执行:`dbt test` / `dbt test --select model` / `dbt test --store-failures`
165
+ - 血缘:`{{ ref('model') }}` + `{{ source('schema', 'table') }}` → `dbt docs generate`
166
+
167
+ ### Soda Core 核心模式
168
+
169
+ ```yaml
170
+ checks for table_name:
171
+ - row_count > 100
172
+ - missing_count(column) = 0
173
+ - duplicate_count(column) = 0
174
+ - invalid_count(column) = 0:
175
+ valid format: email
176
+ - freshness(timestamp_col) < 1d
177
+ ```
178
+
179
+ ### 数据质量 Checklist
180
+
181
+ - [ ] 分层验证:源数据 → 转换后 → 目标数据
182
+ - [ ] 完整性:必需列非空、无空字符串
183
+ - [ ] 准确性:数值范围、格式正则、逻辑一致
184
+ - [ ] 一致性:跨表主键匹配、值一致
185
+ - [ ] 及时性:数据新鲜度 < 阈值
186
+ - [ ] 唯一性:主键/业务键无重复
187
+ - [ ] 质量指标:完整性/唯一性/有效性加权评分
188
+ - [ ] 告警:指标低于阈值自动通知(Slack/Email/PagerDuty)
189
+ - [ ] 持续监控:定时执行质量检查
190
+
191
+ ---
192
+
193
+ ## 最佳实践
194
+
195
+ | 实践 | 说明 |
196
+ |------|------|
197
+ | 幂等性设计 | UPSERT / 分区覆盖,重跑不产生副作用 |
198
+ | 增量处理 | 基于时间戳/CDC 增量提取,减少全量扫描 |
199
+ | 数据血缘 | dbt ref() / Dagster Asset deps 追踪上下游 |
200
+ | 分层验证 | 源→转换→目标每层都验证 |
201
+ | 监控告警 | 管道 SLA + 质量指标 + 延迟告警 |
202
+ | 状态管理 | 流处理状态 TTL + Checkpoint + Savepoint |
203
+ | 容错设计 | 重试策略 + 死信队列 + 回滚方案 |
204
+
205
+ ## 触发词
206
+
207
+ 数据管道、Airflow、Dagster、Prefect、ETL、流处理、Kafka Streams、Flink、数据质量、Great Expectations、dbt、数据验证、数据血缘
@@ -0,0 +1,46 @@
1
+ ---
2
+ name: development
3
+ description: 开发语言能力索引。Python、Go、Rust、TypeScript、Java、C++、Shell。当用户提到编程、开发、代码、语言时路由到此。
4
+ license: MIT
5
+ user-invocable: false
6
+ disable-model-invocation: false
7
+ ---
8
+
9
+ # 符箓秘典 · 开发语言能力中枢
10
+
11
+ ## 能力矩阵
12
+
13
+ | Skill | 语言 | 核心能力 |
14
+ |-------|------|----------|
15
+ | [python](python.md) | Python | Web框架、数据处理、自动化 |
16
+ | [go](go.md) | Go | 高并发、微服务、云原生 |
17
+ | [rust](rust.md) | Rust | 系统编程、内存安全、高性能 |
18
+ | [typescript](typescript.md) | TS/JS | 前后端、Node.js、React/Vue |
19
+ | [java](java.md) | Java | 企业级、Spring、微服务 |
20
+ | [cpp](cpp.md) | C/C++ | 系统底层、性能优化 |
21
+ | [shell](shell.md) | Bash | 脚本自动化、系统管理 |
22
+
23
+ ## 语言选型指南
24
+
25
+ ```yaml
26
+ Web 后端:
27
+ - 快速开发: Python (FastAPI/Django)
28
+ - 高性能: Go (Gin/Echo)
29
+ - 企业级: Java (Spring Boot)
30
+
31
+ Web 前端:
32
+ - SPA: TypeScript + React/Vue
33
+ - SSR: Next.js/Nuxt.js
34
+
35
+ 系统编程:
36
+ - 内存安全: Rust
37
+ - 传统: C/C++
38
+
39
+ 脚本自动化:
40
+ - 通用: Python
41
+ - 系统: Bash/Shell
42
+
43
+ 安全工具:
44
+ - 快速原型: Python
45
+ - 高性能: Go/Rust
46
+ ```