npm - superlab - Versions diffs - 0.1.1 → 0.1.2 - Mend

superlab 0.1.1 → 0.1.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

package/README.md +21 -18
package/README.zh-CN.md +20 -16
package/lib/i18n.cjs +594 -7
package/lib/install.cjs +31 -0
package/package-assets/claude/commands/lab/spec.md +1 -1
package/package-assets/codex/prompts/lab-spec.md +1 -1
package/package-assets/shared/changes/README.md +10 -0
package/package-assets/shared/config/workflow.json +5 -0
package/package-assets/shared/context/decisions.md +11 -0
package/package-assets/shared/context/evidence-index.md +16 -0
package/package-assets/shared/context/mission.md +27 -0
package/package-assets/shared/context/open-questions.md +11 -0
package/package-assets/shared/context/state.md +19 -0
package/package-assets/shared/examples/minimal-uplift-workflow.md +4 -4
package/package-assets/shared/skills/lab/SKILL.md +37 -10
package/package-assets/shared/skills/lab/references/brainstorming-integration.md +21 -0
package/package-assets/shared/skills/lab/references/workflow.md +1 -1
package/package-assets/shared/skills/lab/stages/idea.md +13 -0
package/package-assets/shared/skills/lab/stages/iterate.md +21 -0
package/package-assets/shared/skills/lab/stages/report.md +19 -0
package/package-assets/shared/skills/lab/stages/review.md +30 -0
package/package-assets/shared/skills/lab/stages/run.md +17 -0
package/package-assets/shared/skills/lab/stages/spec.md +36 -17
package/package-assets/shared/skills/lab/stages/write.md +27 -3
package/package-assets/shared/templates/design.md +5 -5
package/package-assets/shared/templates/paper-section.tex +10 -0
package/package-assets/shared/templates/paper.tex +29 -0
package/package-assets/shared/templates/proposal.md +4 -4
package/package-assets/shared/templates/review-checklist.md +23 -0
package/package-assets/shared/templates/spec.md +4 -6
package/package-assets/shared/templates/tasks.md +3 -5
package/package.json +3 -3
package/package-assets/shared/scripts/check_openspec.sh +0 -10
package/package-assets/shared/scripts/openspec_change.sh +0 -50

package/lib/i18n.cjs CHANGED Viewed

@@ -29,9 +29,9 @@ const ZH_CONTENT = {
     "使用已安装的 `lab` 技能：`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:idea` 阶段。它必须先用清晰简洁的话定义问题与失败场景，说明现有方法哪里不够、我们的想法为何更好，再做 idea classification、contribution category、breakthrough level 的归类，并收束出至少三个一眼就有意义的点，最后保留进入 `/lab:spec` 前的 approval gate。"
   ),
   [path.join(".codex", "prompts", "lab-spec.md")]: codexPrompt(
-    "把已批准的 idea 转成 OpenSpec spec-driven 工件",
+    "把已批准的 idea 转成统一的 lab change 目录",
     "approved idea context",
-    "使用已安装的 `lab` 技能：`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须要求 OpenSpec CLI、围绕 active change 生成 proposal/design/spec/tasks，并运行 instructions/status/validate 后才能算完成。"
+    "使用已安装的 `lab` 技能：`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须围绕一个 change id，在 `.superlab/changes/<change-id>/` 下生成 proposal/design/spec/tasks，并让这个 change 成为后续 run 和 iterate 的统一入口。"
   ),
   [path.join(".codex", "prompts", "lab-run.md")]: codexPrompt(
     "执行最小可行实验并标准化输出",
@@ -46,7 +46,7 @@ const ZH_CONTENT = {
   [path.join(".codex", "prompts", "lab-review.md")]: codexPrompt(
     "以审稿人模式审查研究方案或结果",
     "artifact or result to review",
-    "使用已安装的 `lab` 技能：`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段，优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
+    "使用已安装的 `lab` 技能：`.codex/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段。它必须先给简洁摘要，再按 findings -> fatal flaws -> fix priority -> residual risks 的顺序输出，优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
   ),
   [path.join(".codex", "prompts", "lab-report.md")]: codexPrompt(
     "基于验证后的迭代工件生成最终报告",
@@ -66,9 +66,9 @@ const ZH_CONTENT = {
   ),
   [path.join(".claude", "commands", "lab", "spec.md")]: claudeCommand(
     "LAB: Spec",
-    "把已批准的 idea 转成 OpenSpec spec-driven 工件",
+    "把已批准的 idea 转成统一的 lab change 目录",
     "workflow, research, spec",
-    "使用已安装的 `lab` 技能：`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须要求 OpenSpec CLI、围绕 active change 生成 proposal/design/spec/tasks，并运行 instructions/status/validate 后才能算完成。"
+    "使用已安装的 `lab` 技能：`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:spec` 阶段。它必须围绕一个 change id，在 `.superlab/changes/<change-id>/` 下生成 proposal/design/spec/tasks，并让这个 change 成为后续 run 和 iterate 的统一入口。"
   ),
   [path.join(".claude", "commands", "lab", "run.md")]: claudeCommand(
     "LAB: Run",
@@ -86,7 +86,7 @@ const ZH_CONTENT = {
     "LAB: Review",
     "以审稿人模式审查研究方案或结果",
     "workflow, research, review",
-    "使用已安装的 `lab` 技能：`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段，优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
+    "使用已安装的 `lab` 技能：`.claude/skills/lab/SKILL.md`。\n\n本命令运行 `/lab:review` 阶段。它必须先给简洁摘要，再按 findings -> fatal flaws -> fix priority -> residual risks 的顺序输出，优先检查方法学漏洞、对照公平性、数据泄漏、统计不足和 unsupported claims。"
   ),
   [path.join(".claude", "commands", "lab", "report.md")]: claudeCommand(
     "LAB: Report",
@@ -115,10 +115,16 @@ description: 严格研究工作流，覆盖 idea、spec、run、iterate、review
 ## 全局规则
-- 从 \`/lab:spec\` 开始，OpenSpec CLI 视为必需依赖。
 - 把 idea、spec、execution、review、report、write 分成明确阶段。
 - 论文写作阶段要与实验执行阶段分离。
 - 关键决策必须落盘，不能只留在聊天里。
+- 每个 stage 都要先给用户一个简洁简介，再决定是否落盘；如果落盘，最后必须回报路径和下一步。
+- 如果缺少的前提会改变结论，一次只追问一个问题。
+- 如果存在多条可行路径，先给 2-3 个方案、trade-offs 和推荐项，再收敛。
+- 如果某个 stage 会决定后续方向，就要保留明确的 approval gate。
+- 使用 \`.superlab/config/workflow.json\` 作为全局约束，统一管理 workflow language、paper language 和 paper format。
+- 工作流中间工件默认跟随安装语言。
+- 最终论文默认输出为 LaTeX，论文语言与工作流语言分开决定。
 - 区分“来源事实”和“模型假设”。
 - 保留失败实验、失败想法和局限性。
 - \`/lab:write\` 使用内置 vendored paper-writing references，不依赖外部写作 skill 路径。
@@ -126,6 +132,62 @@ description: 严格研究工作流，覆盖 idea、spec、run、iterate、review
 - \`/lab:idea\` 还需要 problem/failure case、idea classification、contribution category、breakthrough level。
 - \`/lab:idea\` 还需要 existing methods 对照、why ours is different、three meaningful points。
 - \`/lab:iterate\` 需要 completion_promise 与失败退出记录。
+`,
+  [path.join(".codex", "skills", "lab", "stages", "idea.md")]:
+`# \`/lab:idea\` 阶段指南
+## 必要输出
+- 一句话问题定义
+- failure case
+- idea classification
+- contribution category
+- breakthrough level
+- existing methods 总结
+- 为什么我们的想法优于现有方法
+- 三个一眼就有意义的点
+- 进入 \`/lab:spec\` 前的 approval gate
+## Evidence Discipline
+- 明确区分来源事实与生成假设。
+- 如果关键前提不清楚，一次只追问一个问题。
+- 在写完整工件前，先给用户一个简洁简介：问题、现有方法的缺口、三个 meaningful points。
+## Writing Standard
+- 定义要清晰、简洁、明了。
+- 现有方法对照必须显式写出，不能只说“更创新”。
+- 三个 meaningful points 每个都控制在一句直接的话里。
+`,
+  [path.join(".codex", "skills", "lab", "stages", "review.md")]:
+`# \`/lab:review\` 阶段指南
+## Required Flow
+1. 先给一段简洁摘要，说明当前审查对象和最关键的问题。
+2. 进入 reviewer mode，而不是实现 mode。
+3. 如果存在 fatal flaws，优先列出。
+4. 明确 fix priority。
+5. 最后给 residual risks 和下一步建议。
+## Reviewer Priorities
+- baseline 是否弱或不公平
+- 是否存在泄漏风险
+- metric 是否错配
+- 是否有 unsupported claims
+- 是否缺关键消融
+- 报告是否不可复现
+## Output Style
+- concise summary first
+- findings first
+- fatal flaws 要单独列出
+- fix priority 要排序
+- critique 必须绑定证据
+- residual risks 不能省略
 `,
   [path.join(".codex", "skills", "lab", "stages", "write.md")]:
 `# \`/lab:write\` 阶段指南
@@ -164,6 +226,531 @@ description: 严格研究工作流，覆盖 idea、spec、run、iterate、review
 - 全文术语保持一致。
 - 若 claim 没有结果支撑，必须削弱或删除。
 - 每轮结束前都要补五维自评并处理未解决问题。
+`,
+  [path.join(".superlab", "templates", "idea.md")]:
+`# Idea 工件
+## 一句话问题定义
+用一句短话说清楚问题。
+## 失败场景
+- 现有方法在哪里失败：
+- 为什么这个失败重要：
+## Idea 分类
+- Problem type:
+- Research setting:
+- 为什么这不是一个琐碎小修补：
+## 贡献类别
+- Primary category:
+- Secondary category:
+常见类别：
+- 新任务
+- 新设定
+- 新数据或新评测
+- 新方法或新模块
+- 新训练策略
+- 新实验发现
+- 新理论或新解释
+- 工程增强
+## 突破等级
+- Level:
+- Justification:
+建议分级：
+- L0: 工程或调参
+- L1: 增量改进
+- L2: 明确的方法新意
+- L3: 可能改变问题设定或理解
+## 现有方法
+- Mainstream line 1:
+- Mainstream line 2:
+- Shared assumption:
+- 为什么该假设在这里失效：
+## 我们哪里不同
+- Existing methods rely on:
+- Our idea changes:
+- Expected advantage:
+- 需要什么证据才能证明该优势：
+## 三个有意义的点
+1. 意义：
+2. 差异：
+3. 预期收益：
+## 来源证据
+- Related work:
+- Benchmark conventions:
+- Typical datasets:
+- Typical metrics:
+## 候选方案
+- Approach 1:
+  Trade-offs:
+- Approach 2:
+  Trade-offs:
+- Approach 3:
+  Trade-offs:
+- Recommended approach:
+## 可证伪假设
+- 如果想法正确：
+- 如果想法错误：
+## 候选实验
+- Baseline:
+- Dataset:
+- Primary metric:
+- Secondary metrics:
+- Minimum viable experiment:
+## 批评总结
+- Main weaknesses:
+- 落地前必须先验证什么：
+- Kill criteria:
+## Approval Gate
+- 用户批准的方向：
+- 进入 \`/lab:spec\` 前还有哪些开放问题：
+`,
+  [path.join(".superlab", "templates", "proposal.md")]:
+`# Proposal
+## Lab Change
+- Change id:
+- Target path: \`.superlab/changes/<change-id>/proposal.md\`
+## 范围
+说明要提出的研究变更。
+## 动机
+为什么这个变更值得评估。
+## 成功条件
+- 主要指标目标：
+- 必须比较的 baseline：
+- 最大迭代预算：
+## 风险
+- 方法学风险：
+- 可复现性风险：
+- 执行风险：
+## 验证
+- 是否完成 change 目录初始化：
+- 是否检查 proposal/design/spec/tasks 一致性：
+`,
+  [path.join(".superlab", "templates", "design.md")]:
+`# Design
+## Lab Change
+- Change id:
+- Target path: \`.superlab/changes/<change-id>/design.md\`
+## 研究方案
+描述方法以及它为什么可信。
+## 实验计划
+- Datasets and splits:
+- Baselines:
+- Metrics:
+- Ablations:
+## 实现边界
+- 哪些改动在范围内：
+- 哪些改动不在范围内：
+## 评估工件
+- Run registry path:
+- Normalized summary path:
+- Iteration report path:
+## Change Links
+- Spec path: \`.superlab/changes/<change-id>/spec.md\`
+- Tasks path: \`.superlab/changes/<change-id>/tasks.md\`
+`,
+  [path.join(".superlab", "templates", "spec.md")]:
+`# Spec
+## Lab Change
+- Change id:
+- Target path: \`.superlab/changes/<change-id>/spec.md\`
+## 要求
+- 工作流必须把来源事实和生成假设分开。
+- 工作流必须在单个 change 目录下生成 lab 原生工件。
+- 工作流必须支持有边界的实验迭代。
+- 工作流必须产出标准化评估摘要。
+## 验收
+- Idea 工件已写
+- 已在 \`.superlab/changes/<change-id>/\` 下写出 change 工件
+- Validation run 已执行
+- Iteration reports 已生成
+- Final report 已生成
+`,
+  [path.join(".superlab", "templates", "tasks.md")]:
+`# Tasks
+- [ ] 确认批准后的 lab change id。
+- [ ] 创建 \`.superlab/changes/<change-id>/\`。
+- [ ] 写 idea 工件。
+- [ ] 把 idea 转成 \`.superlab/changes/<change-id>/proposal.md\`、\`.superlab/changes/<change-id>/design.md\`、\`.superlab/changes/<change-id>/spec.md\`、\`.superlab/changes/<change-id>/tasks.md\`。
+- [ ] 跑第一轮 validation experiment。
+- [ ] 标准化并验证评估摘要。
+- [ ] 执行有边界的 iteration rounds。
+- [ ] 产出 final report。
+`,
+  [path.join(".superlab", "templates", "iteration-report.md")]:
+`# Iteration Report
+## 轮次
+- Iteration number:
+- Run id:
+- Completion Promise:
+## 假设
+说明本轮要验证的变更。
+## 改动
+列出具体实现或实验改动。
+## 评估摘要
+- Dataset:
+- Split:
+- Baseline:
+- Variant:
+- Primary metric:
+- Secondary metrics:
+- Failure count:
+## 专家批评
+- Main concerns:
+- Methodology concerns:
+- Interpretation concerns:
+- 是否进入 diagnostic mode:
+## 决策
+- Continue or stop:
+- Next action:
+- Top blockers:
+- Next best actions:
+`,
+  [path.join(".superlab", "templates", "review-checklist.md")]:
+`# Review Checklist
+## 简洁摘要
+- 审查对象：
+- 最关键的问题：
+## Fatal Flaws
+- Fatal flaw 1:
+- Fatal flaw 2:
+## Fix Priority
+1. 最高优先级修复：
+2. 第二优先级修复：
+3. 可以后置的修复：
+## Residual Risks
+- Risk 1:
+- Risk 2:
+## Checklist
+- 是否把 claims 和 evidence 分开写清楚？
+- baseline 是否公平且足够强？
+- 数据集、切分和指标是否合理？
+- 是否存在泄漏、统计不足或 unsupported claims？
+- 消融是否足够？
+- 方差和显著性问题是否交代清楚？
+`,
+  [path.join(".superlab", "templates", "final-report.md")]:
+`# Final Report
+## 目标
+- 本轮研究目标：
+- 是否达标：
+## 主要结果
+- Main finding 1:
+- Main finding 2:
+## 失败尝试与局限
+- Failed attempt:
+- Limitation:
+## 仍需加强的 claims
+- Claim:
+- Missing support:
+`,
+  [path.join(".superlab", "templates", "paper-plan.md")]:
+`# 论文计划
+## 目标
+- Venue or audience:
+- Paper status:
+- 一句话主线：
+- Terminology lock:
+## Section 状态
+- Abstract:
+- Introduction:
+- Related Work:
+- Method:
+- Experiments:
+- Conclusion:
+## 证据地图
+- Main result sources:
+- Ablation sources:
+- Limitation sources:
+- 哪些 claim 还缺证据：
+## 写作顺序
+1. 第一优先 section:
+2. 第二优先 section:
+3. 延后 section:
+## 五维自评状态
+- Contribution:
+- Writing clarity:
+- Experimental strength:
+- Evaluation completeness:
+- Method design soundness:
+`,
+  [path.join(".superlab", "templates", "paper-section.md")]:
+`# 论文 Section 草稿
+## Section
+- Name:
+- 本轮目标：
+- Source guide loaded:
+## Mini-Outline
+- Point 1:
+- Point 2:
+- Point 3:
+## Claim-Evidence Map
+- Claim 1:
+  Evidence:
+  Status:
+- Claim 2:
+  Evidence:
+  Status:
+## 草稿
+把当前 section 写在这里。
+## 段落角色
+- Paragraph 1:
+- Paragraph 2:
+- Paragraph 3:
+## 术语检查
+- 必须保持不变的术语：
+- 本轮新增术语：
+## Reviewer Notes
+- Main concerns:
+- 五维自评总结：
+- Next revision target:
+`,
+  [path.join(".superlab", "templates", "write-iteration.md")]:
+`# 写作迭代
+## 轮次
+- Iteration number:
+- Section target:
+- Section guide used:
+## 输入
+- Report artifacts used:
+- Normalized summaries used:
+- Reviewer notes used:
+## 改动
+- What changed:
+- Why it changed:
+- Mini-outline used:
+## Review Check
+- Claim-evidence alignment:
+- Overstatement risk:
+- Missing support:
+- Terminology consistency:
+- Five-dimension self-review outcome:
+## 决策
+- Continue or stop:
+- Next writing target:
+- 是否需要回退到 \`review\` 或 \`iterate\`：
+`,
+  [path.join(".superlab", "config", "workflow.json")]:
+`{
+  "workflow_language": "zh",
+  "paper_language": "en",
+  "paper_format": "latex"
+}`,
+  [path.join(".superlab", "context", "mission.md")]:
+`# 研究主线
+## 核心问题
+- 一句话问题：
+- 为什么重要：
+- 目标失败场景：
+## 成功标准
+- 主指标：
+- 成功阈值：
+- 必须对比的 baseline：
+- 最低证据要求：
+## 冻结边界
+- 数据集或 benchmark 范围：
+- 切分策略：
+- 评估协议：
+- 硬约束：
+## 当前状态
+- 已批准方向：
+- 当前 owner 或会话：
+- 最近更新该 mission 的 stage：
+`,
+  [path.join(".superlab", "context", "state.md")]:
+`# 工作流状态
+## 当前阶段
+- Active stage:
+- 当前目标：
+- 下一项必要输出：
+## 最近更新
+- 最近完成动作：
+- 最新工件路径：
+- 最新 run 或 report id：
+## 下一步
+- 立即要做的动作：
+- 当前阻塞：
+- 是否需要人工决策：
+`,
+  [path.join(".superlab", "context", "decisions.md")]:
+`# 决策记录
+记录后续阶段不应悄悄推翻的稳定决策。
+## 决策列表
+1. 决策：
+   原因：
+   所属阶段：
+   证据：
+   何时允许重开：
+`,
+  [path.join(".superlab", "context", "evidence-index.md")]:
+`# 证据索引
+把重要 claim 映射到具体工件。
+## Claims
+1. Claim:
+   Supporting artifacts:
+   Metrics:
+   Limits or caveats:
+## Rejected Claims
+1. Claim:
+   为什么被削弱或删除：
+   对应失败工件：
+`,
+  [path.join(".superlab", "context", "open-questions.md")]:
+`# 未决问题
+追踪尚未解决的问题，避免工作流静默脑补。
+## Active Questions
+1. 问题：
+   为什么重要：
+   当前最好的几个选项：
+   负责人：
+   预期在哪个 stage 解决：
 `,
 };

package/lib/install.cjs CHANGED Viewed

@@ -30,6 +30,14 @@ const ASSET_GROUPS = {
       from: path.join(REPO_ROOT, "package-assets", "shared", "templates"),
       to: path.join(".superlab", "templates"),
     },
+    {
+      from: path.join(REPO_ROOT, "package-assets", "shared", "config"),
+      to: path.join(".superlab", "config"),
+    },
+    {
+      from: path.join(REPO_ROOT, "package-assets", "shared", "changes"),
+      to: path.join(".superlab", "changes"),
+    },
     {
       from: path.join(REPO_ROOT, "package-assets", "shared", "scripts"),
       to: path.join(".superlab", "scripts"),
@@ -38,6 +46,10 @@ const ASSET_GROUPS = {
       from: path.join(REPO_ROOT, "package-assets", "shared", "examples"),
       to: path.join(".superlab", "examples"),
     },
+    {
+      from: path.join(REPO_ROOT, "package-assets", "shared", "context"),
+      to: path.join(".superlab", "context"),
+    },
   ],
 };
@@ -127,9 +139,28 @@ function localizeInstalledAssets(targetDir, lang) {
     path.join(".claude", "commands", "lab", "report.md"),
     path.join(".claude", "commands", "lab", "write.md"),
     path.join(".codex", "skills", "lab", "SKILL.md"),
+    path.join(".codex", "skills", "lab", "stages", "idea.md"),
     path.join(".codex", "skills", "lab", "stages", "write.md"),
     path.join(".claude", "skills", "lab", "SKILL.md"),
+    path.join(".claude", "skills", "lab", "stages", "idea.md"),
     path.join(".claude", "skills", "lab", "stages", "write.md"),
+    path.join(".superlab", "templates", "idea.md"),
+    path.join(".superlab", "templates", "proposal.md"),
+    path.join(".superlab", "templates", "design.md"),
+    path.join(".superlab", "templates", "spec.md"),
+    path.join(".superlab", "templates", "tasks.md"),
+    path.join(".superlab", "templates", "iteration-report.md"),
+    path.join(".superlab", "templates", "review-checklist.md"),
+    path.join(".superlab", "templates", "final-report.md"),
+    path.join(".superlab", "templates", "paper-plan.md"),
+    path.join(".superlab", "templates", "paper-section.md"),
+    path.join(".superlab", "templates", "write-iteration.md"),
+    path.join(".superlab", "config", "workflow.json"),
+    path.join(".superlab", "context", "mission.md"),
+    path.join(".superlab", "context", "state.md"),
+    path.join(".superlab", "context", "decisions.md"),
+    path.join(".superlab", "context", "evidence-index.md"),
+    path.join(".superlab", "context", "open-questions.md"),
   ];
   for (const relativePath of relativePaths) {

package/package-assets/claude/commands/lab/spec.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 name: "LAB: Spec"
-description: Convert an approved idea into OpenSpec spec-driven artifacts
+description: Convert an approved idea into a lab change directory
 category: Workflow
 tags: [workflow, research, spec]
 ---