npm - superlab - Versions diffs - 0.1.13 → 0.1.15 - Mend

superlab 0.1.13 → 0.1.15

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

package/README.md CHANGED Viewed

@@ -179,7 +179,7 @@ superlab auto stop
 - `run` and `iterate` must change persistent outputs under `results_root`
 - `review` must update canonical review context
-- `report` must write `<deliverables_root>/report.md`
+- `report` must write `<deliverables_root>/report.md` and `<deliverables_root>/main-tables.md`
 - `write` must produce LaTeX output under `<deliverables_root>/paper/`
 - a successful promotion must write back into `.lab/context/data-decisions.md`, `.lab/context/decisions.md`, `.lab/context/state.md`, and `.lab/context/session-brief.md`
 - every run must end with `.lab/context/auto-outcome.md`, including why it stopped, whether the terminal goal was reached, and which artifact is the final outcome
@@ -187,6 +187,14 @@ superlab auto stop
 It does not replace manual `idea`, `data`, `framing`, or `spec` decisions.
+Good `/lab:auto` input is explicit. Treat `Autonomy level L1/L2/L3` as execution privilege, and treat `paper layer`, `phase`, or `table` as experiment targets. If the workflow language is Chinese, summaries, checklist items, task labels, and progress updates should also stay in Chinese unless a literal identifier must remain unchanged.
+Example:
+```text
+/lab:auto Autonomy level L2. Objective: advance paper layer 3 organizer enforcement. Terminal goal: task-completion. Scope: bounded protocol, tests, minimal implementation, and one small run. Allowed modifications: evaluator prompt registry, ingestion, and parser only.
+```
 ## Version
 Show the CLI version and the current project asset version:
@@ -238,7 +246,7 @@ Stages should follow that file rather than guess language locally.
 - Python 3.10+
 - Git
-`/lab:write` ships with vendored paper-writing references under the installed `lab` skill, so it does not depend on an extra runtime skill installation.
+`/lab:write` ships with vendored paper-writing references and the upstream example bank for `abstract`, `introduction`, and `method` under the installed `lab` skill, so it does not depend on an extra runtime skill installation.
 ## Command Set
@@ -286,6 +294,7 @@ See the source command docs in [commands/codex/lab.md](/Users/zhouhao119/coding/
 `/lab:write` writes final manuscript output under the configured `deliverables_root` (default: `docs/research`):
 - `docs/research/report.md`
+- `docs/research/main-tables.md`
 - `docs/research/paper/main.tex`
 - `docs/research/paper/sections/*.tex`
@@ -295,7 +304,10 @@ Internal writing-control artifacts stay under:
 - `.lab/writing/plan.md`
 - `.lab/writing/iterations/*.md`
-If `paper_template_root` is configured, `/lab:write` should inspect that template directory first and align drafting to it. If no template is configured, it falls back to the managed default LaTeX scaffold.
+If `paper_template_root` is configured, `/lab:write` should inspect that template directory first and align drafting to it.
+If no template is configured, the first manuscript-writing round should ask once whether to continue with the managed default LaTeX scaffold or attach a template directory first.
+If the user approves the default scaffold, persist that choice in `.lab/config/workflow.json` and stop asking on ordinary rounds.
+At the final export or final-draft boundary, if the project is still on the default scaffold and no attached template exists, ask one final reminder question before finalizing.
 `/lab` treats `.lab/` as the workflow-control layer only. Durable outputs should use natural project roots:

package/README.zh-CN.md CHANGED Viewed

@@ -177,7 +177,7 @@ superlab auto stop
 - `run` 和 `iterate` 必须更新 `results_root` 下的持久输出
 - `review` 必须更新规范的审查上下文
-- `report` 必须写出 `<deliverables_root>/report.md`
+- `report` 必须写出 `<deliverables_root>/report.md` 和 `<deliverables_root>/main-tables.md`
 - `write` 必须写出 `<deliverables_root>/paper/` 下的 LaTeX 论文产物
 - promotion 成功后必须写回 `.lab/context/data-decisions.md`、`.lab/context/decisions.md`、`.lab/context/state.md` 和 `.lab/context/session-brief.md`
 - 每次运行都必须写出 `.lab/context/auto-outcome.md`，记录为什么停止、是否达到终止目标，以及哪一个工件是最终结果
@@ -185,6 +185,14 @@ superlab auto stop
 它不会替代手动的 `idea`、`data`、`framing`、`spec` 决策。
+好的 `/lab:auto` 输入应该显式写清。把 `Autonomy level L1/L2/L3` 当成执行权限级别，把 `paper layer`、`phase`、`table` 当成实验目标，不要混用。如果 workflow language 是中文，摘要、清单条目、任务标签和进度更新也应保持中文，除非某个字面标识符必须保持原样。
+示例：
+```text
+/lab:auto 自治级别 L2。目标：推进 paper layer 3 的 organizer enforcement。终止条件：完成 bounded protocol、测试、最小实现和一轮小规模结果。允许修改：evaluator prompt registry、ingestion、parser。
+```
 ## 版本查询
 查看当前 CLI 版本和当前目录项目的资产版本：
@@ -236,7 +244,7 @@ superlab init --lang en
 - Python 3.10+
 - Git
-`/lab:write` 自带 vendored 的 paper-writing 章节参考，不再依赖额外安装一个运行时写作 skill。
+`/lab:write` 自带 vendored 的 paper-writing 章节参考，以及 `abstract`、`introduction`、`method` 对应的 upstream example bank，不再依赖额外安装一个运行时写作 skill。
 ## 命令集合
@@ -271,6 +279,7 @@ superlab init --lang en
 `/lab:write` 会把最终可交付物写到 `deliverables_root` 指定的目录，默认是 `docs/research`：
 - `docs/research/report.md`
+- `docs/research/main-tables.md`
 - `docs/research/paper/main.tex`
 - `docs/research/paper/sections/*.tex`
@@ -280,7 +289,10 @@ superlab init --lang en
 - `.lab/writing/plan.md`
 - `.lab/writing/iterations/*.md`
-如果配置了 `paper_template_root`，`/lab:write` 应先检查该模板目录并按其结构写作；如果没有配置模板，就回退到内置的默认 LaTeX scaffold。
+如果配置了 `paper_template_root`，`/lab:write` 应先检查该模板目录并按其结构写作。
+如果没有配置模板，第一次进入论文 `.tex` 写作时应先追问一次：继续使用内置默认 LaTeX scaffold，还是先接入模板目录。
+如果用户确认先用默认 scaffold，就把这个决定持久化到 `.lab/config/workflow.json`，后续普通轮次不再重复追问。
+但在最终导出或最终定稿节点，如果项目仍在使用默认 scaffold 且没有接入模板，应再提醒一次，给用户最后切换模板的机会。
 `/lab` 把 `.lab/` 视为工作流控制层，不是正式结果目录。持久输出应按自然根目录放置：

package/bin/superlab.cjs CHANGED Viewed

@@ -603,6 +603,8 @@ function attachPaperTemplate({ targetDir, templatePath }) {
   }
   config.paper_template_root = storedProjectPath(targetDir, normalizedTemplatePath);
+  config.paper_template_decision = "attached-template";
+  config.paper_template_final_reminder_acknowledged = true;
   writeWorkflowConfig(targetDir, config);
   return {
     storedPath: config.paper_template_root,
@@ -660,6 +662,33 @@ function validateWorkflowConfig(config) {
       issues.push("paper_template_root must not point inside .lab");
     }
   }
+  const validTemplateDecisions = new Set(["unconfirmed", "default-scaffold", "attached-template"]);
+  if (
+    config.paper_template_decision !== undefined &&
+    !validTemplateDecisions.has(config.paper_template_decision)
+  ) {
+    issues.push("invalid paper_template_decision");
+  }
+  if (
+    config.paper_template_final_reminder_acknowledged !== undefined &&
+    typeof config.paper_template_final_reminder_acknowledged !== "boolean"
+  ) {
+    issues.push("invalid paper_template_final_reminder_acknowledged");
+  }
+  if (
+    typeof config.paper_template_root === "string" &&
+    config.paper_template_root.trim() !== "" &&
+    config.paper_template_decision === "default-scaffold"
+  ) {
+    issues.push("paper_template_decision conflicts with configured paper_template_root");
+  }
+  if (
+    typeof config.paper_template_root === "string" &&
+    config.paper_template_root.trim() === "" &&
+    config.paper_template_decision === "attached-template"
+  ) {
+    issues.push("paper_template_decision requires a configured paper_template_root");
+  }
   return issues;
 }
@@ -922,6 +951,15 @@ async function main() {
       console.log(`stages executed: ${result.executedStages.join(", ")}`);
       console.log(`goal type: ${result.outcome.goalType}`);
       console.log(`goal target: ${result.outcome.goalTarget}`);
+      if (result.outcome.primaryMetrics) {
+        console.log(`primary metrics: ${result.outcome.primaryMetrics}`);
+      }
+      if (result.outcome.secondaryMetrics) {
+        console.log(`secondary metrics: ${result.outcome.secondaryMetrics}`);
+      }
+      if (result.outcome.requiredTerminalEvidence) {
+        console.log(`required terminal evidence: ${result.outcome.requiredTerminalEvidence}`);
+      }
       if (result.outcome.experimentLadder) {
         console.log(`experiment ladder: ${result.outcome.experimentLadder}`);
       }

package/lib/auto_contracts.cjs CHANGED Viewed

@@ -285,7 +285,10 @@ function stageContractSnapshot(targetDir, stage) {
     run: [resultsRoot],
     iterate: [resultsRoot],
     review: REVIEW_CONTEXT_FILES.map((relativePath) => path.resolve(targetDir, relativePath)),
-    report: [path.join(deliverablesRoot, "report.md")],
+    report: [
+      path.join(deliverablesRoot, "report.md"),
+      path.join(deliverablesRoot, "main-tables.md"),
+    ],
     write: [
       path.join(deliverablesRoot, "paper", "main.tex"),
       path.join(deliverablesRoot, "paper", "sections"),
@@ -322,8 +325,9 @@ function verifyStageContract({ stage, snapshot }) {
   }
   if (stage === "report") {
-    if (changedPaths.length === 0) {
-      throw new Error("report stage did not produce the deliverable report.md under deliverables_root");
+    const missing = Array.from(snapshot.keys()).filter((absolutePath) => !changedPaths.includes(absolutePath));
+    if (missing.length > 0) {
+      throw new Error("report stage did not produce the deliverable report.md and main-tables.md under deliverables_root");
     }
     return;
   }

package/lib/auto_runner.cjs CHANGED Viewed

@@ -264,6 +264,18 @@ async function startAutoMode({ targetDir, now = new Date() }) {
   let promotionApplied = false;
   let stopReason = "";
   let finalRung = "";
+  const outcomeProtocolFields = {
+    primaryMetrics: evalProtocol.primaryMetrics,
+    secondaryMetrics: evalProtocol.secondaryMetrics,
+    requiredTerminalEvidence: evalProtocol.requiredTerminalEvidence,
+    experimentLadder: evalProtocol.experimentLadder,
+    metricGlossary: evalProtocol.metricGlossary,
+    metricSourcePapers: evalProtocol.metricSourcePapers,
+    metricImplementationSource: evalProtocol.metricImplementationSource,
+    comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
+    comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
+    deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+  };
   const writeRunningStatus = (overrides = {}) => {
     currentStatus = {
@@ -287,13 +299,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
       targetDir,
       {
         objective: mode.objective,
-        experimentLadder: evalProtocol.experimentLadder,
-        metricGlossary: evalProtocol.metricGlossary,
-        metricSourcePapers: evalProtocol.metricSourcePapers,
-        metricImplementationSource: evalProtocol.metricImplementationSource,
-        comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-        comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-        deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+        ...outcomeProtocolFields,
         terminalGoalType: mode.terminalGoalType,
         terminalGoalTarget: mode.terminalGoalTarget,
         requiredTerminalArtifact: mode.requiredTerminalArtifact,
@@ -597,8 +603,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
       targetDir,
       {
         objective: mode.objective,
-        experimentLadder: evalProtocol.experimentLadder,
-        metricGlossary: evalProtocol.metricGlossary,
+        ...outcomeProtocolFields,
         terminalGoalType: mode.terminalGoalType,
         terminalGoalTarget: mode.terminalGoalTarget,
         requiredTerminalArtifact: mode.requiredTerminalArtifact,
@@ -620,14 +625,8 @@ async function startAutoMode({ targetDir, now = new Date() }) {
       mode,
       status: currentStatus,
       executedStages,
-      outcome: {
-        experimentLadder: evalProtocol.experimentLadder,
-        metricGlossary: evalProtocol.metricGlossary,
-        metricSourcePapers: evalProtocol.metricSourcePapers,
-        metricImplementationSource: evalProtocol.metricImplementationSource,
-        comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-        comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-        deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+        outcome: {
+        ...outcomeProtocolFields,
         goalType: mode.terminalGoalType,
         goalTarget: mode.terminalGoalTarget,
         goalReached: false,
@@ -656,13 +655,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
           targetDir,
           {
             objective: mode.objective,
-            experimentLadder: evalProtocol.experimentLadder,
-            metricGlossary: evalProtocol.metricGlossary,
-            metricSourcePapers: evalProtocol.metricSourcePapers,
-            metricImplementationSource: evalProtocol.metricImplementationSource,
-            comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-            comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-            deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+            ...outcomeProtocolFields,
             terminalGoalType: mode.terminalGoalType,
             terminalGoalTarget: mode.terminalGoalTarget,
             requiredTerminalArtifact: mode.requiredTerminalArtifact,
@@ -685,13 +678,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
           status: currentStatus,
           executedStages,
           outcome: {
-            experimentLadder: evalProtocol.experimentLadder,
-            metricGlossary: evalProtocol.metricGlossary,
-            metricSourcePapers: evalProtocol.metricSourcePapers,
-            metricImplementationSource: evalProtocol.metricImplementationSource,
-            comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-            comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-            deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+            ...outcomeProtocolFields,
             goalType: mode.terminalGoalType,
             goalTarget: mode.terminalGoalTarget,
             goalReached: false,
@@ -722,13 +709,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
     targetDir,
     {
       objective: mode.objective,
-      experimentLadder: evalProtocol.experimentLadder,
-      metricGlossary: evalProtocol.metricGlossary,
-      metricSourcePapers: evalProtocol.metricSourcePapers,
-      metricImplementationSource: evalProtocol.metricImplementationSource,
-      comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-      comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-      deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+      ...outcomeProtocolFields,
       terminalGoalType: mode.terminalGoalType,
       terminalGoalTarget: mode.terminalGoalTarget,
       requiredTerminalArtifact: mode.requiredTerminalArtifact,
@@ -751,13 +732,7 @@ async function startAutoMode({ targetDir, now = new Date() }) {
     status: currentStatus,
     executedStages,
     outcome: {
-      experimentLadder: evalProtocol.experimentLadder,
-      metricGlossary: evalProtocol.metricGlossary,
-      metricSourcePapers: evalProtocol.metricSourcePapers,
-      metricImplementationSource: evalProtocol.metricImplementationSource,
-      comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-      comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-      deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+      ...outcomeProtocolFields,
       goalType: mode.terminalGoalType,
       goalTarget: mode.terminalGoalTarget,
       goalReached: successReached,
@@ -774,6 +749,18 @@ function stopAutoMode({ targetDir, now = new Date() }) {
   const mode = parseAutoMode(targetDir);
   const evalProtocol = parseEvalProtocol(targetDir);
   const lang = readWorkflowLanguage(targetDir);
+  const outcomeProtocolFields = {
+    primaryMetrics: evalProtocol.primaryMetrics,
+    secondaryMetrics: evalProtocol.secondaryMetrics,
+    requiredTerminalEvidence: evalProtocol.requiredTerminalEvidence,
+    experimentLadder: evalProtocol.experimentLadder,
+    metricGlossary: evalProtocol.metricGlossary,
+    metricSourcePapers: evalProtocol.metricSourcePapers,
+    metricImplementationSource: evalProtocol.metricImplementationSource,
+    comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
+    comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
+    deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+  };
   const status = {
     ...existing,
     status: "stopped",
@@ -785,13 +772,7 @@ function stopAutoMode({ targetDir, now = new Date() }) {
     targetDir,
     {
       objective: mode.objective,
-      experimentLadder: evalProtocol.experimentLadder,
-      metricGlossary: evalProtocol.metricGlossary,
-      metricSourcePapers: evalProtocol.metricSourcePapers,
-      metricImplementationSource: evalProtocol.metricImplementationSource,
-      comparisonSourcePapers: evalProtocol.comparisonSourcePapers,
-      comparisonImplementationSource: evalProtocol.comparisonImplementationSource,
-      deviationFromOriginalImplementation: evalProtocol.deviationFromOriginalImplementation,
+      ...outcomeProtocolFields,
       terminalGoalType: mode.terminalGoalType,
       terminalGoalTarget: mode.terminalGoalTarget,
       requiredTerminalArtifact: mode.requiredTerminalArtifact,

package/lib/auto_state.cjs CHANGED Viewed

@@ -140,30 +140,33 @@ function renderAutoOutcome(outcome, { lang = "en" } = {}) {
 ## 目标
-- Objective: ${outcome.objective || ""}
-- Experiment ladder: ${outcome.experimentLadder || ""}
-- Metric glossary: ${outcome.metricGlossary || ""}
-- Metric source papers: ${outcome.metricSourcePapers || ""}
-- Metric implementation source: ${outcome.metricImplementationSource || ""}
-- Comparison source papers: ${outcome.comparisonSourcePapers || ""}
-- Comparison implementation source: ${outcome.comparisonImplementationSource || ""}
-- Deviation from original implementation: ${outcome.deviationFromOriginalImplementation || ""}
-- Terminal goal type: ${outcome.terminalGoalType || ""}
-- Terminal goal target: ${outcome.terminalGoalTarget || ""}
-- Required terminal artifact: ${outcome.requiredTerminalArtifact || ""}
+- 目标: ${outcome.objective || ""}
+- 主指标: ${outcome.primaryMetrics || ""}
+- 次级指标: ${outcome.secondaryMetrics || ""}
+- 必要终局证据: ${outcome.requiredTerminalEvidence || ""}
+- 实验阶梯: ${outcome.experimentLadder || ""}
+- 指标释义: ${outcome.metricGlossary || ""}
+- 指标来源论文: ${outcome.metricSourcePapers || ""}
+- 指标实现来源: ${outcome.metricImplementationSource || ""}
+- 对比方法来源论文: ${outcome.comparisonSourcePapers || ""}
+- 对比方法实现来源: ${outcome.comparisonImplementationSource || ""}
+- 与原始实现的偏差: ${outcome.deviationFromOriginalImplementation || ""}
+- 终止目标类型: ${outcome.terminalGoalType || ""}
+- 终止目标目标值: ${outcome.terminalGoalTarget || ""}
+- 必要终止工件: ${outcome.requiredTerminalArtifact || ""}
 ## 结果
-- Status: ${outcome.status || ""}
-- Goal reached: ${outcome.goalReached ? "yes" : "no"}
-- Stop reason: ${outcome.stopReason || ""}
-- Promotion applied: ${outcome.promotionApplied ? "yes" : "no"}
-- Final artifact: ${outcome.finalArtifact || ""}
-- Final rung: ${outcome.finalRung || ""}
-- Executed stages: ${outcome.executedStages || ""}
-- Iterations completed: ${outcome.iterationsCompleted || "0"}
-- Started at: ${outcome.startedAt || ""}
-- Finished at: ${outcome.finishedAt || ""}
+- 状态: ${outcome.status || ""}
+- 目标是否达成: ${outcome.goalReached ? "是" : "否"}
+- 停止原因: ${outcome.stopReason || ""}
+- 是否已升格: ${outcome.promotionApplied ? "是" : "否"}
+- 最终工件: ${outcome.finalArtifact || ""}
+- 最终 rung: ${outcome.finalRung || ""}
+- 已执行阶段: ${outcome.executedStages || ""}
+- 已完成迭代数: ${outcome.iterationsCompleted || "0"}
+- 开始时间: ${outcome.startedAt || ""}
+- 结束时间: ${outcome.finishedAt || ""}
 `;
   }
@@ -172,6 +175,9 @@ function renderAutoOutcome(outcome, { lang = "en" } = {}) {
 ## Goal
 - Objective: ${outcome.objective || ""}
+- Primary metrics: ${outcome.primaryMetrics || ""}
+- Secondary metrics: ${outcome.secondaryMetrics || ""}
+- Required terminal evidence: ${outcome.requiredTerminalEvidence || ""}
 - Experiment ladder: ${outcome.experimentLadder || ""}
 - Metric glossary: ${outcome.metricGlossary || ""}
 - Metric source papers: ${outcome.metricSourcePapers || ""}

package/lib/context.cjs CHANGED Viewed

@@ -96,6 +96,9 @@ function renderSummary(lang, data) {
 - Auto final artifact: ${data.autoFinalArtifact || "待补充"}
 - Auto final rung: ${data.autoFinalRung || "待补充"}
 - Eval objective: ${data.evalObjective || "待补充"}
+- Primary metrics: ${data.evalPrimaryMetrics || "待补充"}
+- Secondary metrics: ${data.evalSecondaryMetrics || "待补充"}
+- Required terminal evidence: ${data.evalRequiredTerminalEvidence || "待补充"}
 - Table plan: ${data.evalTablePlan || "待补充"}
 - Metric glossary: ${data.evalMetricGlossary || "待补充"}
 - Metric source papers: ${data.evalMetricSourcePapers || "待补充"}
@@ -148,6 +151,9 @@ function renderSummary(lang, data) {
 - Auto final artifact: ${data.autoFinalArtifact || "TBD"}
 - Auto final rung: ${data.autoFinalRung || "TBD"}
 - Eval objective: ${data.evalObjective || "TBD"}
+- Primary metrics: ${data.evalPrimaryMetrics || "TBD"}
+- Secondary metrics: ${data.evalSecondaryMetrics || "TBD"}
+- Required terminal evidence: ${data.evalRequiredTerminalEvidence || "TBD"}
 - Table plan: ${data.evalTablePlan || "TBD"}
 - Metric glossary: ${data.evalMetricGlossary || "TBD"}
 - Metric source papers: ${data.evalMetricSourcePapers || "TBD"}
@@ -255,6 +261,9 @@ ${data.problem || "待补充"}
 - Auto final artifact: ${data.autoFinalArtifact || "待补充"}
 - Auto final rung: ${data.autoFinalRung || "待补充"}
 - Eval objective: ${data.evalObjective || "待补充"}
+- Primary metrics: ${data.evalPrimaryMetrics || "待补充"}
+- Secondary metrics: ${data.evalSecondaryMetrics || "待补充"}
+- Required terminal evidence: ${data.evalRequiredTerminalEvidence || "待补充"}
 - Table plan: ${data.evalTablePlan || "待补充"}
 - Metric glossary: ${data.evalMetricGlossary || "待补充"}
 - Metric source papers: ${data.evalMetricSourcePapers || "待补充"}
@@ -318,6 +327,9 @@ ${data.problem || "TBD"}
 - Auto final artifact: ${data.autoFinalArtifact || "TBD"}
 - Auto final rung: ${data.autoFinalRung || "TBD"}
 - Eval objective: ${data.evalObjective || "TBD"}
+- Primary metrics: ${data.evalPrimaryMetrics || "TBD"}
+- Secondary metrics: ${data.evalSecondaryMetrics || "TBD"}
+- Required terminal evidence: ${data.evalRequiredTerminalEvidence || "TBD"}
 - Table plan: ${data.evalTablePlan || "TBD"}
 - Metric glossary: ${data.evalMetricGlossary || "TBD"}
 - Metric source papers: ${data.evalMetricSourcePapers || "TBD"}
@@ -569,6 +581,9 @@ function buildContextSnapshot(targetDir) {
     autoFinalArtifact: extractValue(autoOutcome, ["Final artifact", "最终工件"]),
     autoFinalRung: extractValue(autoOutcome, ["Final rung", "最终 rung"]),
     evalObjective: evalProtocol.primaryEvaluationObjective,
+    evalPrimaryMetrics: evalProtocol.primaryMetrics,
+    evalSecondaryMetrics: evalProtocol.secondaryMetrics,
+    evalRequiredTerminalEvidence: evalProtocol.requiredTerminalEvidence,
     evalTablePlan: evalProtocol.tablePlan,
     evalMetricGlossary: evalProtocol.metricGlossary,
     evalMetricSourcePapers: evalProtocol.metricSourcePapers,