superlab 0.1.0 → 0.1.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (49) hide show
  1. package/README.md +23 -23
  2. package/README.zh-CN.md +22 -21
  3. package/lib/i18n.cjs +626 -23
  4. package/lib/install.cjs +31 -0
  5. package/package-assets/claude/commands/lab/spec.md +1 -1
  6. package/package-assets/claude/commands/lab/write.md +1 -1
  7. package/package-assets/codex/prompts/lab-spec.md +1 -1
  8. package/package-assets/codex/prompts/lab-write.md +1 -1
  9. package/package-assets/shared/changes/README.md +10 -0
  10. package/package-assets/shared/config/workflow.json +5 -0
  11. package/package-assets/shared/context/decisions.md +11 -0
  12. package/package-assets/shared/context/evidence-index.md +16 -0
  13. package/package-assets/shared/context/mission.md +27 -0
  14. package/package-assets/shared/context/open-questions.md +11 -0
  15. package/package-assets/shared/context/state.md +19 -0
  16. package/package-assets/shared/examples/minimal-uplift-workflow.md +4 -4
  17. package/package-assets/shared/skills/lab/SKILL.md +54 -9
  18. package/package-assets/shared/skills/lab/references/brainstorming-integration.md +21 -0
  19. package/package-assets/shared/skills/lab/references/paper-writing/abstract.md +102 -0
  20. package/package-assets/shared/skills/lab/references/paper-writing/conclusion.md +35 -0
  21. package/package-assets/shared/skills/lab/references/paper-writing/does-my-writing-flow-source.md +45 -0
  22. package/package-assets/shared/skills/lab/references/paper-writing/experiments.md +102 -0
  23. package/package-assets/shared/skills/lab/references/paper-writing/introduction.md +408 -0
  24. package/package-assets/shared/skills/lab/references/paper-writing/method.md +196 -0
  25. package/package-assets/shared/skills/lab/references/paper-writing/paper-review.md +86 -0
  26. package/package-assets/shared/skills/lab/references/paper-writing/related-work.md +41 -0
  27. package/package-assets/shared/skills/lab/references/paper-writing-integration.md +29 -28
  28. package/package-assets/shared/skills/lab/references/workflow.md +1 -1
  29. package/package-assets/shared/skills/lab/stages/idea.md +43 -7
  30. package/package-assets/shared/skills/lab/stages/iterate.md +32 -0
  31. package/package-assets/shared/skills/lab/stages/report.md +19 -0
  32. package/package-assets/shared/skills/lab/stages/review.md +30 -0
  33. package/package-assets/shared/skills/lab/stages/run.md +17 -0
  34. package/package-assets/shared/skills/lab/stages/spec.md +36 -4
  35. package/package-assets/shared/skills/lab/stages/write.md +47 -15
  36. package/package-assets/shared/templates/design.md +10 -0
  37. package/package-assets/shared/templates/idea.md +76 -8
  38. package/package-assets/shared/templates/iteration-report.md +4 -0
  39. package/package-assets/shared/templates/paper-plan.md +12 -0
  40. package/package-assets/shared/templates/paper-section.md +24 -6
  41. package/package-assets/shared/templates/paper-section.tex +10 -0
  42. package/package-assets/shared/templates/paper.tex +29 -0
  43. package/package-assets/shared/templates/proposal.md +10 -0
  44. package/package-assets/shared/templates/review-checklist.md +23 -0
  45. package/package-assets/shared/templates/spec.md +7 -2
  46. package/package-assets/shared/templates/tasks.md +3 -1
  47. package/package-assets/shared/templates/write-iteration.md +5 -0
  48. package/package.json +3 -3
  49. package/package-assets/shared/scripts/check_openspec.sh +0 -10
package/lib/i18n.cjs CHANGED
@@ -26,12 +26,12 @@ const ZH_CONTENT = {
26
26
  [path.join(".codex", "prompts", "lab-idea.md")]: codexPrompt(
27
27
  "在进入规格前调研并打磨论文或实验想法",
28
28
  "idea 或 research problem",
29
- "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:idea` 阶段。它必须先调研相关文献、数据集、指标和 baseline,再进行批评与收敛,不得在此阶段直接实现代码。"
29
+ "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:idea` 阶段。它必须先用清晰简洁的话定义问题与失败场景,说明现有方法哪里不够、我们的想法为何更好,再做 idea classification、contribution category、breakthrough level 的归类,并收束出至少三个一眼就有意义的点,最后保留进入 `/lab:spec` 前的 approval gate。"
30
30
  ),
31
31
  [path.join(".codex", "prompts", "lab-spec.md")]: codexPrompt(
32
- "把已批准的 idea 转成 OpenSpec spec-driven 工件",
32
+ "把已批准的 idea 转成统一的 lab change 目录",
33
33
  "approved idea context",
34
- "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须要求 OpenSpec CLI、生成 proposal/design/spec/tasks,并在规格完成前禁止进入实现。"
34
+ "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须围绕一个 change id,在 `.superlab/changes/<change-id>/` 下生成 proposal/design/spec/tasks,并让这个 change 成为后续 run 和 iterate 的统一入口。"
35
35
  ),
36
36
  [path.join(".codex", "prompts", "lab-run.md")]: codexPrompt(
37
37
  "执行最小可行实验并标准化输出",
@@ -41,12 +41,12 @@ const ZH_CONTENT = {
41
41
  [path.join(".codex", "prompts", "lab-iterate.md")]: codexPrompt(
42
42
  "在固定成功标准下执行有边界的实验迭代",
43
43
  "iteration mission",
44
- "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:iterate` 阶段。它必须冻结 mission、只做小步改动、每轮生成评估和 iteration report,并在达标或到上限时停止。"
44
+ "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:iterate` 阶段。它必须冻结 mission、声明 completion_promise、只做小步改动、每轮生成评估和 iteration report;若风险连续两轮升高则切 diagnostic mode,并在失败结束时记录 blockers 与 next actions。"
45
45
  ),
46
46
  [path.join(".codex", "prompts", "lab-review.md")]: codexPrompt(
47
47
  "以审稿人模式审查研究方案或结果",
48
48
  "artifact or result to review",
49
- "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段,优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
49
+ "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段。它必须先给简洁摘要,再按 findings -> fatal flaws -> fix priority -> residual risks 的顺序输出,优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
50
50
  ),
51
51
  [path.join(".codex", "prompts", "lab-report.md")]: codexPrompt(
52
52
  "基于验证后的迭代工件生成最终报告",
@@ -56,19 +56,19 @@ const ZH_CONTENT = {
56
56
  [path.join(".codex", "prompts", "lab-write.md")]: codexPrompt(
57
57
  "把验证过的研究工件转成论文 section,并按小步方式修订",
58
58
  "section or writing target",
59
- "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:write` 阶段。它必须先读取 companion `research-paper-writing` 技能中与当前 section 对应的参考文件,并结合 `paper-review.md` 与 `does-my-writing-flow-source.md` 后,再只修改一个 section。"
59
+ "使用已安装的 `lab` 技能:`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:write` 阶段。它必须先读取 `.codex/skills/lab/references/paper-writing/` 下与当前 section 对应的参考文件,并结合 `paper-review.md` 与 `does-my-writing-flow-source.md`,先写 mini-outline,再只修改一个 section。"
60
60
  ),
61
61
  [path.join(".claude", "commands", "lab", "idea.md")]: claudeCommand(
62
62
  "LAB: Idea",
63
63
  "在进入规格前调研并打磨论文或实验想法",
64
64
  "workflow, research, idea",
65
- "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:idea` 阶段。它必须先调研相关文献、数据集、指标和 baseline,再进行批评与收敛,不得在此阶段直接实现代码。"
65
+ "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:idea` 阶段。它必须先用清晰简洁的话定义问题与失败场景,说明现有方法哪里不够、我们的想法为何更好,再做 idea classification、contribution category、breakthrough level 的归类,并收束出至少三个一眼就有意义的点,最后保留进入 `/lab:spec` 前的 approval gate。"
66
66
  ),
67
67
  [path.join(".claude", "commands", "lab", "spec.md")]: claudeCommand(
68
68
  "LAB: Spec",
69
- "把已批准的 idea 转成 OpenSpec spec-driven 工件",
69
+ "把已批准的 idea 转成统一的 lab change 目录",
70
70
  "workflow, research, spec",
71
- "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须要求 OpenSpec CLI、生成 proposal/design/spec/tasks,并在规格完成前禁止进入实现。"
71
+ "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须围绕一个 change id,在 `.superlab/changes/<change-id>/` 下生成 proposal/design/spec/tasks,并让这个 change 成为后续 run 和 iterate 的统一入口。"
72
72
  ),
73
73
  [path.join(".claude", "commands", "lab", "run.md")]: claudeCommand(
74
74
  "LAB: Run",
@@ -80,13 +80,13 @@ const ZH_CONTENT = {
80
80
  "LAB: Iterate",
81
81
  "在固定成功标准下执行有边界的实验迭代",
82
82
  "workflow, research, iterate",
83
- "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:iterate` 阶段。它必须冻结 mission、只做小步改动、每轮生成评估和 iteration report,并在达标或到上限时停止。"
83
+ "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:iterate` 阶段。它必须冻结 mission、声明 completion_promise、只做小步改动、每轮生成评估和 iteration report;若风险连续两轮升高则切 diagnostic mode,并在失败结束时记录 blockers 与 next actions。"
84
84
  ),
85
85
  [path.join(".claude", "commands", "lab", "review.md")]: claudeCommand(
86
86
  "LAB: Review",
87
87
  "以审稿人模式审查研究方案或结果",
88
88
  "workflow, research, review",
89
- "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段,优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
89
+ "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段。它必须先给简洁摘要,再按 findings -> fatal flaws -> fix priority -> residual risks 的顺序输出,优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
90
90
  ),
91
91
  [path.join(".claude", "commands", "lab", "report.md")]: claudeCommand(
92
92
  "LAB: Report",
@@ -98,7 +98,7 @@ const ZH_CONTENT = {
98
98
  "LAB: Write",
99
99
  "把验证过的研究工件转成论文 section,并按小步方式修订",
100
100
  "workflow, research, writing",
101
- "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:write` 阶段。它必须先读取 companion `research-paper-writing` 技能中与当前 section 对应的参考文件,并结合 `paper-review.md` 与 `does-my-writing-flow-source.md` 后,再只修改一个 section。"
101
+ "使用已安装的 `lab` 技能:`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:write` 阶段。它必须先读取 `.claude/skills/lab/references/paper-writing/` 下与当前 section 对应的参考文件,并结合 `paper-review.md` 与 `does-my-writing-flow-source.md`,先写 mini-outline,再只修改一个 section。"
102
102
  ),
103
103
  };
104
104
 
@@ -115,12 +115,79 @@ description: 严格研究工作流,覆盖 idea、spec、run、iterate、review
115
115
 
116
116
  ## 全局规则
117
117
 
118
- - 从 \`/lab:spec\` 开始,OpenSpec CLI 视为必需依赖。
119
118
  - 把 idea、spec、execution、review、report、write 分成明确阶段。
120
119
  - 论文写作阶段要与实验执行阶段分离。
121
120
  - 关键决策必须落盘,不能只留在聊天里。
121
+ - 每个 stage 都要先给用户一个简洁简介,再决定是否落盘;如果落盘,最后必须回报路径和下一步。
122
+ - 如果缺少的前提会改变结论,一次只追问一个问题。
123
+ - 如果存在多条可行路径,先给 2-3 个方案、trade-offs 和推荐项,再收敛。
124
+ - 如果某个 stage 会决定后续方向,就要保留明确的 approval gate。
125
+ - 使用 \`.superlab/config/workflow.json\` 作为全局约束,统一管理 workflow language、paper language 和 paper format。
126
+ - 工作流中间工件默认跟随安装语言。
127
+ - 最终论文默认输出为 LaTeX,论文语言与工作流语言分开决定。
122
128
  - 区分“来源事实”和“模型假设”。
123
129
  - 保留失败实验、失败想法和局限性。
130
+ - \`/lab:write\` 使用内置 vendored paper-writing references,不依赖外部写作 skill 路径。
131
+ - \`/lab:idea\` 需要 candidate approaches 和 approval gate。
132
+ - \`/lab:idea\` 还需要 problem/failure case、idea classification、contribution category、breakthrough level。
133
+ - \`/lab:idea\` 还需要 existing methods 对照、why ours is different、three meaningful points。
134
+ - \`/lab:iterate\` 需要 completion_promise 与失败退出记录。
135
+ `,
136
+ [path.join(".codex", "skills", "lab", "stages", "idea.md")]:
137
+ `# \`/lab:idea\` 阶段指南
138
+
139
+ ## 必要输出
140
+
141
+ - 一句话问题定义
142
+ - failure case
143
+ - idea classification
144
+ - contribution category
145
+ - breakthrough level
146
+ - existing methods 总结
147
+ - 为什么我们的想法优于现有方法
148
+ - 三个一眼就有意义的点
149
+ - 进入 \`/lab:spec\` 前的 approval gate
150
+
151
+ ## Evidence Discipline
152
+
153
+ - 明确区分来源事实与生成假设。
154
+ - 如果关键前提不清楚,一次只追问一个问题。
155
+ - 在写完整工件前,先给用户一个简洁简介:问题、现有方法的缺口、三个 meaningful points。
156
+
157
+ ## Writing Standard
158
+
159
+ - 定义要清晰、简洁、明了。
160
+ - 现有方法对照必须显式写出,不能只说“更创新”。
161
+ - 三个 meaningful points 每个都控制在一句直接的话里。
162
+ `,
163
+ [path.join(".codex", "skills", "lab", "stages", "review.md")]:
164
+ `# \`/lab:review\` 阶段指南
165
+
166
+ ## Required Flow
167
+
168
+ 1. 先给一段简洁摘要,说明当前审查对象和最关键的问题。
169
+ 2. 进入 reviewer mode,而不是实现 mode。
170
+ 3. 如果存在 fatal flaws,优先列出。
171
+ 4. 明确 fix priority。
172
+ 5. 最后给 residual risks 和下一步建议。
173
+
174
+ ## Reviewer Priorities
175
+
176
+ - baseline 是否弱或不公平
177
+ - 是否存在泄漏风险
178
+ - metric 是否错配
179
+ - 是否有 unsupported claims
180
+ - 是否缺关键消融
181
+ - 报告是否不可复现
182
+
183
+ ## Output Style
184
+
185
+ - concise summary first
186
+ - findings first
187
+ - fatal flaws 要单独列出
188
+ - fix priority 要排序
189
+ - critique 必须绑定证据
190
+ - residual risks 不能省略
124
191
  `,
125
192
  [path.join(".codex", "skills", "lab", "stages", "write.md")]:
126
193
  `# \`/lab:write\` 阶段指南
@@ -131,23 +198,559 @@ description: 严格研究工作流,覆盖 idea、spec、run、iterate、review
131
198
  - iteration reports
132
199
  - normalized summaries
133
200
  - reviewer notes(如有)
134
- - 当前 section 对应的 companion \`research-paper-writing\` 参考文件
201
+ - \`skills/lab/references/paper-writing/\` 下 vendored 的章节参考文件
135
202
 
136
- ## Companion References
203
+ ## Required References
137
204
 
138
205
  按当前目标加载精确章节文件:
139
206
 
140
- - abstract -> \`research-paper-writing/references/abstract.md\`
141
- - introduction -> \`research-paper-writing/references/introduction.md\`
142
- - related work -> \`research-paper-writing/references/related-work.md\`
143
- - method -> \`research-paper-writing/references/method.md\`
144
- - experiments -> \`research-paper-writing/references/experiments.md\`
145
- - conclusion -> \`research-paper-writing/references/conclusion.md\`
207
+ - abstract -> \`skills/lab/references/paper-writing/abstract.md\`
208
+ - introduction -> \`skills/lab/references/paper-writing/introduction.md\`
209
+ - related work -> \`skills/lab/references/paper-writing/related-work.md\`
210
+ - method -> \`skills/lab/references/paper-writing/method.md\`
211
+ - experiments -> \`skills/lab/references/paper-writing/experiments.md\`
212
+ - conclusion -> \`skills/lab/references/paper-writing/conclusion.md\`
146
213
 
147
214
  每轮还必须运行:
148
215
 
149
- - flow check -> \`research-paper-writing/references/does-my-writing-flow-source.md\`
150
- - reviewer pass -> \`research-paper-writing/references/paper-review.md\`
216
+ - flow check -> \`skills/lab/references/paper-writing/does-my-writing-flow-source.md\`
217
+ - reviewer pass -> \`skills/lab/references/paper-writing/paper-review.md\`
218
+
219
+ ## Small-Step Writing Rules
220
+
221
+ - 每轮只改一个 section 或一个边界清晰的小节。
222
+ - 只加载当前 section guide,不要一次加载所有章节参考。
223
+ - 先写 mini-outline,再写 prose。
224
+ - 每个 subsection 在适用时必须显式交代 motivation、design、technical advantage。
225
+ - 避免写成“在一个 naive baseline 上不断打补丁”的叙述风格。
226
+ - 全文术语保持一致。
227
+ - 若 claim 没有结果支撑,必须削弱或删除。
228
+ - 每轮结束前都要补五维自评并处理未解决问题。
229
+ `,
230
+ [path.join(".superlab", "templates", "idea.md")]:
231
+ `# Idea 工件
232
+
233
+ ## 一句话问题定义
234
+
235
+ 用一句短话说清楚问题。
236
+
237
+ ## 失败场景
238
+
239
+ - 现有方法在哪里失败:
240
+ - 为什么这个失败重要:
241
+
242
+ ## Idea 分类
243
+
244
+ - Problem type:
245
+ - Research setting:
246
+ - 为什么这不是一个琐碎小修补:
247
+
248
+ ## 贡献类别
249
+
250
+ - Primary category:
251
+ - Secondary category:
252
+
253
+ 常见类别:
254
+ - 新任务
255
+ - 新设定
256
+ - 新数据或新评测
257
+ - 新方法或新模块
258
+ - 新训练策略
259
+ - 新实验发现
260
+ - 新理论或新解释
261
+ - 工程增强
262
+
263
+ ## 突破等级
264
+
265
+ - Level:
266
+ - Justification:
267
+
268
+ 建议分级:
269
+ - L0: 工程或调参
270
+ - L1: 增量改进
271
+ - L2: 明确的方法新意
272
+ - L3: 可能改变问题设定或理解
273
+
274
+ ## 现有方法
275
+
276
+ - Mainstream line 1:
277
+ - Mainstream line 2:
278
+ - Shared assumption:
279
+ - 为什么该假设在这里失效:
280
+
281
+ ## 我们哪里不同
282
+
283
+ - Existing methods rely on:
284
+ - Our idea changes:
285
+ - Expected advantage:
286
+ - 需要什么证据才能证明该优势:
287
+
288
+ ## 三个有意义的点
289
+
290
+ 1. 意义:
291
+ 2. 差异:
292
+ 3. 预期收益:
293
+
294
+ ## 来源证据
295
+
296
+ - Related work:
297
+ - Benchmark conventions:
298
+ - Typical datasets:
299
+ - Typical metrics:
300
+
301
+ ## 候选方案
302
+
303
+ - Approach 1:
304
+ Trade-offs:
305
+ - Approach 2:
306
+ Trade-offs:
307
+ - Approach 3:
308
+ Trade-offs:
309
+ - Recommended approach:
310
+
311
+ ## 可证伪假设
312
+
313
+ - 如果想法正确:
314
+ - 如果想法错误:
315
+
316
+ ## 候选实验
317
+
318
+ - Baseline:
319
+ - Dataset:
320
+ - Primary metric:
321
+ - Secondary metrics:
322
+ - Minimum viable experiment:
323
+
324
+ ## 批评总结
325
+
326
+ - Main weaknesses:
327
+ - 落地前必须先验证什么:
328
+ - Kill criteria:
329
+
330
+ ## Approval Gate
331
+
332
+ - 用户批准的方向:
333
+ - 进入 \`/lab:spec\` 前还有哪些开放问题:
334
+ `,
335
+ [path.join(".superlab", "templates", "proposal.md")]:
336
+ `# Proposal
337
+
338
+ ## Lab Change
339
+
340
+ - Change id:
341
+ - Target path: \`.superlab/changes/<change-id>/proposal.md\`
342
+
343
+ ## 范围
344
+
345
+ 说明要提出的研究变更。
346
+
347
+ ## 动机
348
+
349
+ 为什么这个变更值得评估。
350
+
351
+ ## 成功条件
352
+
353
+ - 主要指标目标:
354
+ - 必须比较的 baseline:
355
+ - 最大迭代预算:
356
+
357
+ ## 风险
358
+
359
+ - 方法学风险:
360
+ - 可复现性风险:
361
+ - 执行风险:
362
+
363
+ ## 验证
364
+
365
+ - 是否完成 change 目录初始化:
366
+ - 是否检查 proposal/design/spec/tasks 一致性:
367
+ `,
368
+ [path.join(".superlab", "templates", "design.md")]:
369
+ `# Design
370
+
371
+ ## Lab Change
372
+
373
+ - Change id:
374
+ - Target path: \`.superlab/changes/<change-id>/design.md\`
375
+
376
+ ## 研究方案
377
+
378
+ 描述方法以及它为什么可信。
379
+
380
+ ## 实验计划
381
+
382
+ - Datasets and splits:
383
+ - Baselines:
384
+ - Metrics:
385
+ - Ablations:
386
+
387
+ ## 实现边界
388
+
389
+ - 哪些改动在范围内:
390
+ - 哪些改动不在范围内:
391
+
392
+ ## 评估工件
393
+
394
+ - Run registry path:
395
+ - Normalized summary path:
396
+ - Iteration report path:
397
+
398
+ ## Change Links
399
+
400
+ - Spec path: \`.superlab/changes/<change-id>/spec.md\`
401
+ - Tasks path: \`.superlab/changes/<change-id>/tasks.md\`
402
+ `,
403
+ [path.join(".superlab", "templates", "spec.md")]:
404
+ `# Spec
405
+
406
+ ## Lab Change
407
+
408
+ - Change id:
409
+ - Target path: \`.superlab/changes/<change-id>/spec.md\`
410
+
411
+ ## 要求
412
+
413
+ - 工作流必须把来源事实和生成假设分开。
414
+ - 工作流必须在单个 change 目录下生成 lab 原生工件。
415
+ - 工作流必须支持有边界的实验迭代。
416
+ - 工作流必须产出标准化评估摘要。
417
+
418
+ ## 验收
419
+
420
+ - Idea 工件已写
421
+ - 已在 \`.superlab/changes/<change-id>/\` 下写出 change 工件
422
+ - Validation run 已执行
423
+ - Iteration reports 已生成
424
+ - Final report 已生成
425
+ `,
426
+ [path.join(".superlab", "templates", "tasks.md")]:
427
+ `# Tasks
428
+
429
+ - [ ] 确认批准后的 lab change id。
430
+ - [ ] 创建 \`.superlab/changes/<change-id>/\`。
431
+ - [ ] 写 idea 工件。
432
+ - [ ] 把 idea 转成 \`.superlab/changes/<change-id>/proposal.md\`、\`.superlab/changes/<change-id>/design.md\`、\`.superlab/changes/<change-id>/spec.md\`、\`.superlab/changes/<change-id>/tasks.md\`。
433
+ - [ ] 跑第一轮 validation experiment。
434
+ - [ ] 标准化并验证评估摘要。
435
+ - [ ] 执行有边界的 iteration rounds。
436
+ - [ ] 产出 final report。
437
+ `,
438
+ [path.join(".superlab", "templates", "iteration-report.md")]:
439
+ `# Iteration Report
440
+
441
+ ## 轮次
442
+
443
+ - Iteration number:
444
+ - Run id:
445
+ - Completion Promise:
446
+
447
+ ## 假设
448
+
449
+ 说明本轮要验证的变更。
450
+
451
+ ## 改动
452
+
453
+ 列出具体实现或实验改动。
454
+
455
+ ## 评估摘要
456
+
457
+ - Dataset:
458
+ - Split:
459
+ - Baseline:
460
+ - Variant:
461
+ - Primary metric:
462
+ - Secondary metrics:
463
+ - Failure count:
464
+
465
+ ## 专家批评
466
+
467
+ - Main concerns:
468
+ - Methodology concerns:
469
+ - Interpretation concerns:
470
+ - 是否进入 diagnostic mode:
471
+
472
+ ## 决策
473
+
474
+ - Continue or stop:
475
+ - Next action:
476
+ - Top blockers:
477
+ - Next best actions:
478
+ `,
479
+ [path.join(".superlab", "templates", "review-checklist.md")]:
480
+ `# Review Checklist
481
+
482
+ ## 简洁摘要
483
+
484
+ - 审查对象:
485
+ - 最关键的问题:
486
+
487
+ ## Fatal Flaws
488
+
489
+ - Fatal flaw 1:
490
+ - Fatal flaw 2:
491
+
492
+ ## Fix Priority
493
+
494
+ 1. 最高优先级修复:
495
+ 2. 第二优先级修复:
496
+ 3. 可以后置的修复:
497
+
498
+ ## Residual Risks
499
+
500
+ - Risk 1:
501
+ - Risk 2:
502
+
503
+ ## Checklist
504
+
505
+ - 是否把 claims 和 evidence 分开写清楚?
506
+ - baseline 是否公平且足够强?
507
+ - 数据集、切分和指标是否合理?
508
+ - 是否存在泄漏、统计不足或 unsupported claims?
509
+ - 消融是否足够?
510
+ - 方差和显著性问题是否交代清楚?
511
+ `,
512
+ [path.join(".superlab", "templates", "final-report.md")]:
513
+ `# Final Report
514
+
515
+ ## 目标
516
+
517
+ - 本轮研究目标:
518
+ - 是否达标:
519
+
520
+ ## 主要结果
521
+
522
+ - Main finding 1:
523
+ - Main finding 2:
524
+
525
+ ## 失败尝试与局限
526
+
527
+ - Failed attempt:
528
+ - Limitation:
529
+
530
+ ## 仍需加强的 claims
531
+
532
+ - Claim:
533
+ - Missing support:
534
+ `,
535
+ [path.join(".superlab", "templates", "paper-plan.md")]:
536
+ `# 论文计划
537
+
538
+ ## 目标
539
+
540
+ - Venue or audience:
541
+ - Paper status:
542
+ - 一句话主线:
543
+ - Terminology lock:
544
+
545
+ ## Section 状态
546
+
547
+ - Abstract:
548
+ - Introduction:
549
+ - Related Work:
550
+ - Method:
551
+ - Experiments:
552
+ - Conclusion:
553
+
554
+ ## 证据地图
555
+
556
+ - Main result sources:
557
+ - Ablation sources:
558
+ - Limitation sources:
559
+ - 哪些 claim 还缺证据:
560
+
561
+ ## 写作顺序
562
+
563
+ 1. 第一优先 section:
564
+ 2. 第二优先 section:
565
+ 3. 延后 section:
566
+
567
+ ## 五维自评状态
568
+
569
+ - Contribution:
570
+ - Writing clarity:
571
+ - Experimental strength:
572
+ - Evaluation completeness:
573
+ - Method design soundness:
574
+ `,
575
+ [path.join(".superlab", "templates", "paper-section.md")]:
576
+ `# 论文 Section 草稿
577
+
578
+ ## Section
579
+
580
+ - Name:
581
+ - 本轮目标:
582
+ - Source guide loaded:
583
+
584
+ ## Mini-Outline
585
+
586
+ - Point 1:
587
+ - Point 2:
588
+ - Point 3:
589
+
590
+ ## Claim-Evidence Map
591
+
592
+ - Claim 1:
593
+ Evidence:
594
+ Status:
595
+ - Claim 2:
596
+ Evidence:
597
+ Status:
598
+
599
+ ## 草稿
600
+
601
+ 把当前 section 写在这里。
602
+
603
+ ## 段落角色
604
+
605
+ - Paragraph 1:
606
+ - Paragraph 2:
607
+ - Paragraph 3:
608
+
609
+ ## 术语检查
610
+
611
+ - 必须保持不变的术语:
612
+ - 本轮新增术语:
613
+
614
+ ## Reviewer Notes
615
+
616
+ - Main concerns:
617
+ - 五维自评总结:
618
+ - Next revision target:
619
+ `,
620
+ [path.join(".superlab", "templates", "write-iteration.md")]:
621
+ `# 写作迭代
622
+
623
+ ## 轮次
624
+
625
+ - Iteration number:
626
+ - Section target:
627
+ - Section guide used:
628
+
629
+ ## 输入
630
+
631
+ - Report artifacts used:
632
+ - Normalized summaries used:
633
+ - Reviewer notes used:
634
+
635
+ ## 改动
636
+
637
+ - What changed:
638
+ - Why it changed:
639
+ - Mini-outline used:
640
+
641
+ ## Review Check
642
+
643
+ - Claim-evidence alignment:
644
+ - Overstatement risk:
645
+ - Missing support:
646
+ - Terminology consistency:
647
+ - Five-dimension self-review outcome:
648
+
649
+ ## 决策
650
+
651
+ - Continue or stop:
652
+ - Next writing target:
653
+ - 是否需要回退到 \`review\` 或 \`iterate\`:
654
+ `,
655
+ [path.join(".superlab", "config", "workflow.json")]:
656
+ `{
657
+ "workflow_language": "zh",
658
+ "paper_language": "en",
659
+ "paper_format": "latex"
660
+ }`,
661
+ [path.join(".superlab", "context", "mission.md")]:
662
+ `# 研究主线
663
+
664
+ ## 核心问题
665
+
666
+ - 一句话问题:
667
+ - 为什么重要:
668
+ - 目标失败场景:
669
+
670
+ ## 成功标准
671
+
672
+ - 主指标:
673
+ - 成功阈值:
674
+ - 必须对比的 baseline:
675
+ - 最低证据要求:
676
+
677
+ ## 冻结边界
678
+
679
+ - 数据集或 benchmark 范围:
680
+ - 切分策略:
681
+ - 评估协议:
682
+ - 硬约束:
683
+
684
+ ## 当前状态
685
+
686
+ - 已批准方向:
687
+ - 当前 owner 或会话:
688
+ - 最近更新该 mission 的 stage:
689
+ `,
690
+ [path.join(".superlab", "context", "state.md")]:
691
+ `# 工作流状态
692
+
693
+ ## 当前阶段
694
+
695
+ - Active stage:
696
+ - 当前目标:
697
+ - 下一项必要输出:
698
+
699
+ ## 最近更新
700
+
701
+ - 最近完成动作:
702
+ - 最新工件路径:
703
+ - 最新 run 或 report id:
704
+
705
+ ## 下一步
706
+
707
+ - 立即要做的动作:
708
+ - 当前阻塞:
709
+ - 是否需要人工决策:
710
+ `,
711
+ [path.join(".superlab", "context", "decisions.md")]:
712
+ `# 决策记录
713
+
714
+ 记录后续阶段不应悄悄推翻的稳定决策。
715
+
716
+ ## 决策列表
717
+
718
+ 1. 决策:
719
+ 原因:
720
+ 所属阶段:
721
+ 证据:
722
+ 何时允许重开:
723
+ `,
724
+ [path.join(".superlab", "context", "evidence-index.md")]:
725
+ `# 证据索引
726
+
727
+ 把重要 claim 映射到具体工件。
728
+
729
+ ## Claims
730
+
731
+ 1. Claim:
732
+ Supporting artifacts:
733
+ Metrics:
734
+ Limits or caveats:
735
+
736
+ ## Rejected Claims
737
+
738
+ 1. Claim:
739
+ 为什么被削弱或删除:
740
+ 对应失败工件:
741
+ `,
742
+ [path.join(".superlab", "context", "open-questions.md")]:
743
+ `# 未决问题
744
+
745
+ 追踪尚未解决的问题,避免工作流静默脑补。
746
+
747
+ ## Active Questions
748
+
749
+ 1. 问题:
750
+ 为什么重要:
751
+ 当前最好的几个选项:
752
+ 负责人:
753
+ 预期在哪个 stage 解决:
151
754
  `,
152
755
  };
153
756