npm - scientify - Versions diffs - 2.1.0 → 3.1.0 - Mend

scientify 2.1.0 → 3.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (186) hide show

package/README.en.md +21 -1
package/README.md +27 -0
package/dist/index.d.ts.map +1 -1
package/dist/index.js +2 -77
package/dist/index.js.map +1 -1
package/dist/src/cli/research.d.ts.map +1 -1
package/dist/src/cli/research.js +47 -23
package/dist/src/cli/research.js.map +1 -1
package/dist/src/commands/metabolism-status.d.ts.map +1 -1
package/dist/src/commands/metabolism-status.js +5 -25
package/dist/src/commands/metabolism-status.js.map +1 -1
package/dist/src/commands.d.ts +8 -8
package/dist/src/commands.d.ts.map +1 -1
package/dist/src/commands.js +230 -243
package/dist/src/commands.js.map +1 -1
package/dist/src/release-gate.d.ts +14 -0
package/dist/src/release-gate.d.ts.map +1 -0
package/dist/src/release-gate.js +124 -0
package/dist/src/release-gate.js.map +1 -0
package/dist/src/templates/bootstrap.d.ts.map +1 -1
package/dist/src/templates/bootstrap.js +157 -94
package/dist/src/templates/bootstrap.js.map +1 -1
package/dist/src/types.d.ts +2 -10
package/dist/src/types.d.ts.map +1 -1
package/openclaw.plugin.json +11 -17
package/package.json +2 -3
package/skills/algorithm-selection/SKILL.md +103 -0
package/skills/algorithm-selection/references/candidate-template.md +13 -0
package/skills/algorithm-selection/references/selection-template.md +39 -0
package/skills/artifact-review/SKILL.md +146 -0
package/skills/artifact-review/references/release-gate-template.md +40 -0
package/skills/artifact-review/references/review-checklist.md +45 -0
package/skills/artifact-review/references/style-review-checklist.md +30 -0
package/skills/baseline-runner/SKILL.md +103 -0
package/skills/baseline-runner/references/baseline-matrix-template.md +9 -0
package/skills/baseline-runner/references/baseline-report-template.md +25 -0
package/skills/dataset-validate/SKILL.md +104 -0
package/skills/dataset-validate/references/data-validation-template.md +38 -0
package/skills/figure-standardize/SKILL.md +110 -0
package/skills/figure-standardize/references/caption-template.md +12 -0
package/skills/figure-standardize/references/figure-placement-template.md +30 -0
package/skills/figure-standardize/references/figure-style-guide.md +36 -0
package/skills/idea-generation/SKILL.md +20 -44
package/skills/idea-generation/references/code-mapping.md +3 -3
package/skills/idea-generation/references/idea-template.md +1 -1
package/skills/idea-generation/references/reading-long-papers.md +3 -3
package/skills/metabolism/SKILL.md +80 -36
package/skills/paper-download/SKILL.md +61 -0
package/skills/release-layout/SKILL.md +73 -0
package/skills/release-layout/references/page-structure.md +14 -0
package/skills/research-collect/SKILL.md +41 -111
package/skills/research-experiment/SKILL.md +20 -12
package/skills/research-implement/SKILL.md +10 -11
package/skills/research-pipeline/SKILL.md +23 -31
package/skills/research-plan/SKILL.md +7 -11
package/skills/research-review/SKILL.md +21 -22
package/skills/research-survey/SKILL.md +28 -25
package/skills/write-paper/SKILL.md +252 -0
package/skills/write-paper/references/boundary-notes-template.md +34 -0
package/skills/write-paper/references/claim-inventory-template.md +32 -0
package/skills/write-paper/references/evidence-contract.md +57 -0
package/skills/write-paper/references/figure-callout-template.md +38 -0
package/skills/write-paper/references/figures-manifest-template.md +44 -0
package/skills/write-paper/references/latex/README.md +22 -0
package/skills/write-paper/references/latex/build_paper.sh +41 -0
package/skills/write-paper/references/latex/manuscript.tex +39 -0
package/skills/write-paper/references/latex/references.bib +10 -0
package/skills/write-paper/references/latex/sections/ablations.tex +3 -0
package/skills/write-paper/references/latex/sections/abstract.tex +3 -0
package/skills/write-paper/references/latex/sections/conclusion.tex +3 -0
package/skills/write-paper/references/latex/sections/discussion_scope.tex +7 -0
package/skills/write-paper/references/latex/sections/experimental_protocol.tex +3 -0
package/skills/write-paper/references/latex/sections/introduction.tex +3 -0
package/skills/write-paper/references/latex/sections/main_results.tex +9 -0
package/skills/write-paper/references/latex/sections/method_system.tex +3 -0
package/skills/write-paper/references/latex/sections/problem_setup.tex +3 -0
package/skills/write-paper/references/latex/sections/related_work.tex +3 -0
package/skills/write-paper/references/paper-template.md +155 -0
package/skills/write-paper/references/paragraph-contract.md +139 -0
package/skills/write-paper/references/paragraph-examples.md +171 -0
package/skills/write-paper/references/style-banlist.md +81 -0
package/skills/write-review-paper/SKILL.md +22 -16
package/skills/write-review-paper/references/note-template.md +1 -1
package/skills/write-review-paper/references/survey-template.md +1 -1
package/dist/src/hooks/research-mode.d.ts +0 -22
package/dist/src/hooks/research-mode.d.ts.map +0 -1
package/dist/src/hooks/research-mode.js +0 -35
package/dist/src/hooks/research-mode.js.map +0 -1
package/dist/src/hooks/scientify-cron-autofill.d.ts +0 -15
package/dist/src/hooks/scientify-cron-autofill.d.ts.map +0 -1
package/dist/src/hooks/scientify-cron-autofill.js +0 -156
package/dist/src/hooks/scientify-cron-autofill.js.map +0 -1
package/dist/src/hooks/scientify-signature.d.ts +0 -21
package/dist/src/hooks/scientify-signature.d.ts.map +0 -1
package/dist/src/hooks/scientify-signature.js +0 -150
package/dist/src/hooks/scientify-signature.js.map +0 -1
package/dist/src/knowledge-state/project.d.ts +0 -13
package/dist/src/knowledge-state/project.d.ts.map +0 -1
package/dist/src/knowledge-state/project.js +0 -88
package/dist/src/knowledge-state/project.js.map +0 -1
package/dist/src/knowledge-state/render.d.ts +0 -63
package/dist/src/knowledge-state/render.d.ts.map +0 -1
package/dist/src/knowledge-state/render.js +0 -368
package/dist/src/knowledge-state/render.js.map +0 -1
package/dist/src/knowledge-state/store.d.ts +0 -19
package/dist/src/knowledge-state/store.d.ts.map +0 -1
package/dist/src/knowledge-state/store.js +0 -978
package/dist/src/knowledge-state/store.js.map +0 -1
package/dist/src/knowledge-state/types.d.ts +0 -182
package/dist/src/knowledge-state/types.d.ts.map +0 -1
package/dist/src/knowledge-state/types.js +0 -2
package/dist/src/knowledge-state/types.js.map +0 -1
package/dist/src/literature/subscription-state.d.ts +0 -112
package/dist/src/literature/subscription-state.d.ts.map +0 -1
package/dist/src/literature/subscription-state.js +0 -696
package/dist/src/literature/subscription-state.js.map +0 -1
package/dist/src/research-subscriptions/constants.d.ts +0 -16
package/dist/src/research-subscriptions/constants.d.ts.map +0 -1
package/dist/src/research-subscriptions/constants.js +0 -59
package/dist/src/research-subscriptions/constants.js.map +0 -1
package/dist/src/research-subscriptions/cron-client.d.ts +0 -8
package/dist/src/research-subscriptions/cron-client.d.ts.map +0 -1
package/dist/src/research-subscriptions/cron-client.js +0 -81
package/dist/src/research-subscriptions/cron-client.js.map +0 -1
package/dist/src/research-subscriptions/delivery.d.ts +0 -10
package/dist/src/research-subscriptions/delivery.d.ts.map +0 -1
package/dist/src/research-subscriptions/delivery.js +0 -82
package/dist/src/research-subscriptions/delivery.js.map +0 -1
package/dist/src/research-subscriptions/handlers.d.ts +0 -6
package/dist/src/research-subscriptions/handlers.d.ts.map +0 -1
package/dist/src/research-subscriptions/handlers.js +0 -204
package/dist/src/research-subscriptions/handlers.js.map +0 -1
package/dist/src/research-subscriptions/parse.d.ts +0 -11
package/dist/src/research-subscriptions/parse.d.ts.map +0 -1
package/dist/src/research-subscriptions/parse.js +0 -492
package/dist/src/research-subscriptions/parse.js.map +0 -1
package/dist/src/research-subscriptions/prompt.d.ts +0 -5
package/dist/src/research-subscriptions/prompt.d.ts.map +0 -1
package/dist/src/research-subscriptions/prompt.js +0 -347
package/dist/src/research-subscriptions/prompt.js.map +0 -1
package/dist/src/research-subscriptions/types.d.ts +0 -66
package/dist/src/research-subscriptions/types.d.ts.map +0 -1
package/dist/src/research-subscriptions/types.js +0 -2
package/dist/src/research-subscriptions/types.js.map +0 -1
package/dist/src/research-subscriptions.d.ts +0 -2
package/dist/src/research-subscriptions.d.ts.map +0 -1
package/dist/src/research-subscriptions.js +0 -2
package/dist/src/research-subscriptions.js.map +0 -1
package/dist/src/services/auto-updater.d.ts +0 -15
package/dist/src/services/auto-updater.d.ts.map +0 -1
package/dist/src/services/auto-updater.js +0 -188
package/dist/src/services/auto-updater.js.map +0 -1
package/dist/src/tools/arxiv-download.d.ts +0 -24
package/dist/src/tools/arxiv-download.d.ts.map +0 -1
package/dist/src/tools/arxiv-download.js +0 -177
package/dist/src/tools/arxiv-download.js.map +0 -1
package/dist/src/tools/github-search-tool.d.ts +0 -25
package/dist/src/tools/github-search-tool.d.ts.map +0 -1
package/dist/src/tools/github-search-tool.js +0 -114
package/dist/src/tools/github-search-tool.js.map +0 -1
package/dist/src/tools/openreview-lookup.d.ts +0 -31
package/dist/src/tools/openreview-lookup.d.ts.map +0 -1
package/dist/src/tools/openreview-lookup.js +0 -414
package/dist/src/tools/openreview-lookup.js.map +0 -1
package/dist/src/tools/paper-browser.d.ts +0 -23
package/dist/src/tools/paper-browser.d.ts.map +0 -1
package/dist/src/tools/paper-browser.js +0 -121
package/dist/src/tools/paper-browser.js.map +0 -1
package/dist/src/tools/scientify-cron.d.ts +0 -63
package/dist/src/tools/scientify-cron.d.ts.map +0 -1
package/dist/src/tools/scientify-cron.js +0 -265
package/dist/src/tools/scientify-cron.js.map +0 -1
package/dist/src/tools/scientify-literature-state.d.ts +0 -303
package/dist/src/tools/scientify-literature-state.d.ts.map +0 -1
package/dist/src/tools/scientify-literature-state.js +0 -957
package/dist/src/tools/scientify-literature-state.js.map +0 -1
package/dist/src/tools/unpaywall-download.d.ts +0 -21
package/dist/src/tools/unpaywall-download.d.ts.map +0 -1
package/dist/src/tools/unpaywall-download.js +0 -169
package/dist/src/tools/unpaywall-download.js.map +0 -1
package/dist/src/tools/workspace.d.ts +0 -32
package/dist/src/tools/workspace.d.ts.map +0 -1
package/dist/src/tools/workspace.js +0 -69
package/dist/src/tools/workspace.js.map +0 -1
package/skills/metabolism-init/SKILL.md +0 -80
package/skills/research-subscription/SKILL.md +0 -119

package/skills/release-layout/SKILL.md ADDED Viewed

@@ -0,0 +1,73 @@
+---
+name: release-layout
+description: "Use this when the user wants to improve README, docs pages, or microsites so a new reader can understand what the project is, how to use it, what artifacts exist, and what the scope boundaries are within one screen."
+metadata:
+  {
+    "openclaw":
+      {
+        "emoji": "🪄",
+      },
+  }
+---
+# Release Layout
+**Don't ask permission. Just do it.**
+Use this skill for outward-facing packaging surfaces such as:
+- `README.md`
+- `docs/index.html`
+- release page generator scripts
+This skill improves structure and legibility. It does **not** upgrade the scientific claim on its own.
+## Core Goal
+A first-time reader should understand, within one screen:
+1. what this is
+2. how to use it
+3. what artifacts it produces
+4. what the scope boundary is
+## Workflow
+### Step 1: Detect the Real Edit Target
+If a page is generated by a script, prefer editing the generator rather than the built HTML.
+If `review/release_gate.json` exists, read it before polishing release-facing copy.
+### Step 2: Audit the First Screen
+Check whether the hero / opening section answers the four core questions above.
+### Step 3: Reshape the Page
+Prefer this order:
+1. hero / product definition
+2. quick-start or usage path
+3. artifact map
+4. evidence / results block
+5. scope note
+6. FAQ or next steps
+Use `references/page-structure.md`.
+### Step 4: Clean the Reading Path
+Reduce:
+- duplicated claims
+- buried usage instructions
+- unexplained metrics
+- isolated figures without framing text
+## Safety Rules
+1. Do not hide limitations for the sake of visual polish.
+2. Do not introduce stronger language than the underlying artifacts support.
+3. If the result is simulator-only, say that near the top instead of burying it below the fold.
+4. If the release gate is `HOLD`, stale, or missing for a share-ready artifact set, do not present the project as fully ready to share.

package/skills/release-layout/references/page-structure.md ADDED Viewed

@@ -0,0 +1,14 @@
+# Page Structure
+Recommended first-screen order:
+1. one-line definition
+2. quick-start
+3. artifact outputs
+4. evidence boundary
+Avoid:
+- leading with large result claims before the project is defined
+- hiding usage instructions below the fold
+- showing figures without telling the reader what they mean

package/skills/research-collect/SKILL.md CHANGED Viewed

@@ -14,24 +14,15 @@ metadata:
 **Don't ask permission. Just do it.**
-**Workspace:** `$W` = working directory provided in task parameter.
 ## Output Structure
 ```
-$W/
-├── survey/
-│   ├── search_terms.json      # 检索词列表
-│   └── report.md              # 最终报告
 ├── papers/
-│   ├── _downloads/            # 原始下载
-│   ├── _meta/                 # 每篇论文的元数据
-│   │   └── {arxiv_id}.json
-│   └── {direction}/           # 整理后的分类
-├── repos/                     # 参考代码仓库（Phase 3）
-│   ├── {repo_name_1}/
-│   └── {repo_name_2}/
-└── prepare_res.md             # 仓库选择报告（Phase 3）
+│   ├── {arxiv_id}/             # arXiv 论文源文件
+│   ├── {doi_slug}.pdf          # DOI 论文 PDF
+│   └── {direction}/            # 整理后的分类目录
+├── repos/                      # 参考代码仓库（Phase 3）
+└── survey_report.md            # 调研报告
 ```
 ---
@@ -40,13 +31,11 @@ $W/
 ### Phase 1: 准备
-确保工作目录结构存在：
 ```bash
-mkdir -p "$W/survey" "$W/papers/_downloads" "$W/papers/_meta"
+mkdir -p "papers"
 ```
-生成 4-8 个检索词，保存到 `$W/survey/search_terms.json`。
+生成 4-8 个检索词。
 ---
@@ -58,40 +47,21 @@ mkdir -p "$W/survey" "$W/papers/_downloads" "$W/papers/_meta"
 ```
 arxiv_search({ query: "<term>", max_results: 30 })
+openalex_search({ query: "<term>", max_results: 20 })
 ```
-#### 2.2 即时筛选
-对返回的论文**立即**评分（1-5），只保留 ≥4 分的。
+合并两个来源的结果，按 arXiv ID / DOI 去重。
-评分标准：
-- 5分：核心论文，直接研究该主题
-- 4分：相关方法或应用
-- 3分及以下：跳过
+#### 2.2 筛选
-#### 2.3 下载有用论文
+只看**相关性**——这篇论文是否和研究主题直接相关？
-```
-arxiv_download({
-  arxiv_ids: ["<有用的论文ID>"],
-  output_dir: "papers/_downloads"
-})
-```
+- **相关**：直接研究该主题，或提出了可借鉴的方法 → 保留
+- **不相关**：主题偏离，仅在关键词上有交集 → 跳过
-#### 2.4 写入元数据
+#### 2.3 下载论文
-为每篇下载的论文创建元数据文件 `$W/papers/_meta/{arxiv_id}.json`：
-```json
-{
-  "arxiv_id": "2401.12345",
-  "title": "...",
-  "abstract": "...",
-  "score": 5,
-  "source_term": "battery RUL prediction",
-  "downloaded_at": "2024-01-15T10:00:00Z"
-}
-```
+按 /paper-download 的方式下载论文到 `papers/`。
 **完成一个检索词后，再进行下一个。** 这样避免上下文被大量搜索结果污染。
@@ -101,9 +71,9 @@ arxiv_download({
 **目标**：为下游 skill（research-survey、research-plan、research-implement）提供可参考的开源实现。
-#### 3.1 选择高分论文
+#### 3.1 选择论文
-读取 `$W/papers/_meta/` 下得分 ≥4 的论文，选出 **Top 5** 最相关论文。
+从 `papers/` 中选出 **Top 5** 最相关论文。
 #### 3.2 搜索参考仓库
@@ -112,87 +82,47 @@ arxiv_download({
 - 核心方法名 + 作者名
 - 论文中提到的数据集名 + 任务名
-使用 `github_search` 工具：
-```javascript
-github_search({
-  query: "{paper_title} implementation",
-  max_results: 10,
-  sort: "stars",
-  language: "python"
-})
+```bash
+gh search repos "{paper_title} implementation" --limit 10 --sort stars --language python
 ```
 #### 3.3 筛选与 clone
-对搜索到的仓库，评估：
-- Star 数（建议 >100）
-- 代码质量（有 README、有 requirements.txt、代码结构清晰）
-- 与论文的匹配度
-选择 **3-5 个**最相关的仓库，clone 到 `$W/repos/`：
+选择 **3-5 个**最相关的仓库：
 ```bash
-mkdir -p "$W/repos"
-cd "$W/repos"
-git clone --depth 1 <repo_url>
+mkdir -p "repos"
+git clone --depth 1 <repo_url> "repos/{name}"
 ```
-#### 3.4 写入选择报告
-创建 `$W/prepare_res.md`：
-```markdown
-# 参考仓库选择
-| 仓库 | 对应论文 | Stars | 选择理由 |
-|------|----------|-------|----------|
-| repos/{repo_name} | {paper_title} (arxiv:{id}) | {N} | {理由} |
-## 各仓库关键文件
-### {repo_name}
-- **模型实现**: `model/` 或 `models/`
-- **训练脚本**: `train.py` 或 `main.py`
-- **数据加载**: `data/` 或 `dataset.py`
-- **核心文件**: `{关键文件路径}` — {描述}
-```
-**如果搜不到相关仓库**，在 `prepare_res.md` 中注明"无可用参考仓库"，后续 skill 将不依赖代码映射。
+**如果搜不到相关仓库**，跳过本阶段。
 ---
 ### Phase 4: 分类整理
-所有检索词和代码搜索完毕后：
-#### 4.1 读取所有元数据
-```bash
-ls $W/papers/_meta/
-```
-读取所有 `.json` 文件，汇总论文列表。
+所有检索词完毕后：
-#### 4.2 聚类分析
+#### 4.1 聚类分析
-根据论文的标题、摘要、来源检索词，识别 3-6 个研究方向。
+根据已下载论文的标题和摘要，识别 3-6 个研究方向。
-#### 4.3 创建文件夹并移动
+#### 4.2 创建分类目录
 ```bash
-mkdir -p "$W/papers/data-driven"
-mv "$W/papers/_downloads/2401.12345" "$W/papers/data-driven/"
+mkdir -p "papers/{direction}"
+mv "papers/2401.12345" "papers/data-driven/"
 ```
 ---
 ### Phase 5: 生成报告
-创建 `$W/survey/report.md`：
+创建 `survey_report.md`：
 - 调研概要（检索词数、论文数、方向数）
 - 各研究方向概述
-- Top 10 论文
-- **参考仓库摘要**（引用 prepare_res.md）
+- Top 10 论文（标题 + ID + 一句话价值）
+- 参考仓库摘要（如有）
 - 建议阅读顺序
 ---
@@ -201,14 +131,14 @@ mv "$W/papers/_downloads/2401.12345" "$W/papers/data-driven/"
 | 原则 | 说明 |
 |------|------|
-| **增量处理** | 每个检索词独立完成搜索→筛选→下载→写元数据，避免上下文膨胀 |
-| **元数据驱动** | 分类基于 `_meta/*.json`，不依赖内存中的大列表 |
-| **文件夹即分类** | 聚类结果通过 `papers/{direction}/` 体现，无需额外 JSON |
+| **增量处理** | 每个检索词独立完成搜索→筛选→下载，避免上下文膨胀 |
+| **文件夹即分类** | 聚类结果通过 `papers/{direction}/` 体现 |
-## Tools
+## Tools / Commands
-| Tool | Purpose |
-|------|---------|
-| `arxiv_search` | 搜索论文（无副作用） |
-| `arxiv_download` | 下载 .tex/.pdf（需绝对路径） |
-| `github_search` | 搜索参考仓库 |
+| Tool / Command | Purpose |
+|----------------|---------|
+| `arxiv_search` | 搜索 arXiv 论文 |
+| `openalex_search` | 搜索跨学科论文（覆盖更广） |
+| /paper-download | 下载论文（arXiv .tex/PDF、DOI via Unpaywall） |
+| `gh search repos "query"` | 搜索 GitHub 仓库 |

package/skills/research-experiment/SKILL.md CHANGED Viewed

@@ -15,15 +15,14 @@ metadata:
 **Don't ask permission. Just do it.**
-**Workspace:** `$W` = working directory provided in task parameter.
 ## Prerequisites
 | File | Source |
 |------|--------|
-| `$W/project/` | /research-implement |
-| `$W/plan_res.md` | /research-plan |
-| `$W/iterations/judge_v*.md` | /research-review（最后一份 verdict 必须是 PASS） |
+| `project/` | /research-implement |
+| `plan_res.md` | /research-plan |
+| `iterations/judge_v*.md` | /research-review（最后一份 verdict 必须是 PASS） |
 **验证 PASS：** 读取最新的 `judge_v*.md`，确认 `verdict: PASS`。如果不是，STOP。
@@ -31,8 +30,8 @@ metadata:
 | File | Content |
 |------|---------|
-| `$W/experiment_res.md` | 完整实验报告（含 full training + 消融 + 补充实验） |
-| `$W/experiment_analysis/analysis_{N}.md` | 每轮实验分析报告（迭代过程中产生） |
+| `experiment_res.md` | Full experiment report (full training, ablations, supplementary experiments) with explicit headline metrics, baselines, guardrails, and figure anchors |
+| `experiment_analysis/analysis_{N}.md` | 每轮实验分析报告（迭代过程中产生） |
 ---
@@ -43,7 +42,7 @@ metadata:
 修改 epoch 数为 plan_res.md 中指定的正式值。**不要改代码逻辑，只改 epoch。**
 ```bash
-cd $W/project && source .venv/bin/activate
+cd project && source .venv/bin/activate
 python3 run.py  # full epochs
 ```
@@ -78,7 +77,7 @@ python3 run.py --epochs 2 --ablation no_attention
 #### 4.1 分析当前结果
-读取当前所有实验结果（full training + 消融），写入分析报告 `$W/experiment_analysis/analysis_{N}.md`：
+读取当前所有实验结果（full training + 消融），写入分析报告 `experiment_analysis/analysis_{N}.md`：
 ```markdown
 # Experiment Analysis Round {N}
@@ -108,7 +107,7 @@ python3 run.py --epochs 2 --ablation no_attention
 根据分析报告中的计划，修改代码并执行补充实验。**只改实验相关参数/配置，不改核心算法逻辑。**
 ```bash
-cd $W/project && source .venv/bin/activate
+cd project && source .venv/bin/activate
 python3 run.py --experiment {exp_name}
 ```
@@ -118,7 +117,7 @@ python3 run.py --experiment {exp_name}
 ### Step 5: 写入最终实验报告
-汇总所有实验结果（full training + 消融 + 2 轮补充实验），写入 `$W/experiment_res.md`：
+汇总所有实验结果（full training + 消融 + 2 轮补充实验），写入 `experiment_res.md`：
 ```markdown
 # Experiment Report
@@ -129,6 +128,9 @@ python3 run.py --experiment {exp_name}
 - [RESULT] val_metric={value}
 - [RESULT] elapsed={value}
 - [RESULT] device={device}
+- [METRIC] name={headline_metric} value={value} unit={unit} baseline={baseline}
+- [GUARD] name={guard_name} value={value} threshold={threshold} pass={true/false}
+- [FIGURE] file={figure path}
 > 以上数值来自真实执行输出。
@@ -157,9 +159,14 @@ python3 run.py --experiment {exp_name}
 | Ours | {value} | — |
 | {Baseline} | {value} | ... |
+## Scope / Evidence Boundary
+- baseline: {which baseline is used}
+- protocol / guardrail: {evaluation rule}
+- evidence_type: {simulator / local_runtime / full_runtime}
 ### Visualizations
-- 训练曲线: `$W/project/figures/training_curve.png`
-- {其他可视化}: `$W/project/figures/{name}.png`
+- 训练曲线: `project/figures/training_curve.png`
+- {其他可视化}: `project/figures/{name}.png`
 ## Conclusions
 - {key findings from all experiments}
@@ -178,3 +185,4 @@ python3 run.py --experiment {exp_name}
 4. 如果 full training 失败（OOM 等），调整 batch_size 后重试，不要跳过
 5. **补充实验迭代必须做 2 轮（Novix Exp Analyzer 机制）** — 第 1 轮针对初始结果，第 2 轮针对补充实验结果
 6. 补充实验不改核心算法，只改实验配置/参数/可视化代码
+7. Every headline metric must include a baseline, and every main conclusion must point back to real outputs or figure files

package/skills/research-implement/SKILL.md CHANGED Viewed

@@ -15,15 +15,14 @@ metadata:
 **Don't ask permission. Just do it.**
-**Workspace:** `$W` = working directory provided in task parameter.
 ## Prerequisites
 | File | Source |
 |------|--------|
-| `$W/plan_res.md` | /research-plan |
-| `$W/survey_res.md` | /research-survey |
-| `$W/repos/` (optional) | reference code |
+| `plan_res.md` | /research-plan |
+| `survey_res.md` | /research-survey |
+| `repos/` (optional) | reference code |
 **If `plan_res.md` is missing, STOP:** "需要先运行 /research-plan 完成实现计划"
@@ -31,8 +30,8 @@ metadata:
 | File | Content |
 |------|---------|
-| `$W/project/` | 完整可运行代码 |
-| `$W/ml_res.md` | 实现报告（含真实执行结果） |
+| `project/` | 完整可运行代码 |
+| `ml_res.md` | 实现报告（含真实执行结果） |
 ---
@@ -40,7 +39,7 @@ metadata:
 ### Step 1: 读取计划
-读取 `$W/plan_res.md`，提取：
+读取 `plan_res.md`，提取：
 - 所有组件列表
 - 数据集信息
 - 训练参数
@@ -48,7 +47,7 @@ metadata:
 ### Step 2: 创建项目结构
 ```
-$W/project/
+project/
   model/          # 模型组件（每个组件一个文件）
   data/           # 数据加载
   training/       # 训练循环 + loss
@@ -66,7 +65,7 @@ $W/project/
 **3b. 数据管道**
 ```bash
-cd $W/project && uv venv .venv && source .venv/bin/activate
+cd project && uv venv .venv && source .venv/bin/activate
 uv pip install -r requirements.txt
 python3 -c "from data.dataset import *; print('data OK')"
 ```
@@ -93,7 +92,7 @@ print(f"[RESULT] device={device}")
 ### Step 4: 环境搭建 + 执行
 ```bash
-cd $W/project
+cd project
 uv venv .venv
 source .venv/bin/activate
@@ -125,7 +124,7 @@ python3 run.py --epochs 2
 ### Step 6: 写入报告
-写入 `$W/ml_res.md`：
+写入 `ml_res.md`：
 ```markdown
 # Implementation Report

package/skills/research-pipeline/SKILL.md CHANGED Viewed

@@ -92,19 +92,11 @@ task 必须以 `/skill-name` 开头（触发 slash command 解析），后续行
 ---
-## Workspace
-`$W` = agent workspace root (see AGENTS.md for layout).
----
 ## Step 0: 初始化
-`$W` 即当前 agent 的工作目录（AGENTS.md 中定义）。
-检查 `$W/SOUL.md` 是否包含研究方向信息。如果没有（BOOTSTRAP 未完成），提示用户先完成 BOOTSTRAP 配置。
+检查 `SOUL.md` 是否包含研究方向信息。如果没有（BOOTSTRAP 未完成），提示用户先完成 BOOTSTRAP 配置。
-确保 `$W` 下存在必要的子目录（如 `survey/`, `papers/` 等）。
+确保 `papers/`、`knowledge/`、`ideas/`、`experiments/` 目录存在。
 ---
@@ -114,65 +106,65 @@ task 必须以 `/skill-name` 开头（触发 slash command 解析），后续行
 ### Phase 1: Literature Survey
-**检查:** `$W/papers/_meta/` 目录存在且有 `.json` 文件？
+**检查:** `papers/` 目录存在且有论文文件？
 **如果缺失，调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-collect\n工作目录: {$W绝对路径}\n研究主题: {从task.json提取}\n请搜索、筛选、下载论文到工作目录的 papers/ 下。"`
+- task: `"/research-collect\n研究主题: {从SOUL.md提取}\n请搜索、筛选、下载论文到工作目录的 papers/ 下。"`
 - label: `"Research Collect"`
 - runTimeoutSeconds: `1800`
-**验证:** `ls $W/papers/_meta/*.json` 至少有 3 个文件
+**验证:** `ls papers/` 至少有 3 篇论文
 ---
 ### Phase 2: Deep Survey
-**检查:** `$W/survey_res.md` 存在？
+**检查:** `survey_res.md` 存在？
 **如果缺失，先读取 Phase 1 摘要（论文数量、方向），然后调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-survey\n工作目录: {$W绝对路径}\n上下文: 已下载 {N} 篇论文，方向包括 {directions}。\n重点论文: {top 3 arxiv_id 和标题}\n请深度分析论文、提取公式，写入 survey_res.md。"`
+- task: `"/research-survey\n上下文: 已下载 {N} 篇论文，方向包括 {directions}。\n重点论文: {top 3 arxiv_id 和标题}\n请深度分析论文、提取公式，写入 survey_res.md。"`
 - label: `"Deep Survey"`
 - runTimeoutSeconds: `1800`
-**验证:** `$W/survey_res.md` 存在且包含"核心方法对比"表格
+**验证:** `survey_res.md` 存在且包含"核心方法对比"表格
 ---
 ### Phase 3: Implementation Plan
-**检查:** `$W/plan_res.md` 存在？
+**检查:** `plan_res.md` 存在？
 **如果缺失，读取 survey_res.md 摘要，然后调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-plan\n工作目录: {$W绝对路径}\n上下文: 调研发现核心方法是 {method}，推荐技术路线 {route}。\n关键公式: {1-2个公式}\n请制定实现计划到 plan_res.md。"`
+- task: `"/research-plan\n上下文: 调研发现核心方法是 {method}，推荐技术路线 {route}。\n关键公式: {1-2个公式}\n请制定实现计划到 plan_res.md。"`
 - label: `"Research Plan"`
 - runTimeoutSeconds: `1800`
-**验证:** `$W/plan_res.md` 存在且包含 4 个 section（Dataset/Model/Training/Testing）
+**验证:** `plan_res.md` 存在且包含 4 个 section（Dataset/Model/Training/Testing）
 ---
 ### Phase 4: Implementation
-**检查:** `$W/ml_res.md` 存在？
+**检查:** `ml_res.md` 存在？
 **如果缺失，读取 plan_res.md 要点，然后调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-implement\n工作目录: {$W绝对路径}\n上下文:\n- 计划包含 {N} 个组件: {list}\n- 数据集: {dataset}\n- 框架: PyTorch\n请实现代码到 project/，运行 2 epoch 验证，写入 ml_res.md。"`
+- task: `"/research-implement\n上下文:\n- 计划包含 {N} 个组件: {list}\n- 数据集: {dataset}\n- 框架: PyTorch\n请实现代码到 project/，运行 2 epoch 验证，写入 ml_res.md。"`
 - label: `"Research Implement"`
 - runTimeoutSeconds: `1800`
 **验证:**
-- `$W/project/run.py` 存在
-- `$W/ml_res.md` 包含 `[RESULT]` 行
+- `project/run.py` 存在
+- `ml_res.md` 包含 `[RESULT]` 行
 - loss 值非 NaN/Inf
 ---
 ### Phase 5: Review
-**检查:** `$W/iterations/` 下最新 `judge_v*.md` 的 verdict 是否为 PASS？
+**检查:** `iterations/` 下最新 `judge_v*.md` 的 verdict 是否为 PASS？
 **如果没有 PASS，调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-review\n工作目录: {$W绝对路径}\n上下文:\n- ml_res.md 显示 train_loss={value}\n- 计划在 plan_res.md\n请审查代码，如需修改则迭代修复（最多 3 轮）。"`
+- task: `"/research-review\n上下文:\n- ml_res.md 显示 train_loss={value}\n- 计划在 plan_res.md\n请审查代码，如需修改则迭代修复（最多 3 轮）。"`
 - label: `"Research Review"`
 - runTimeoutSeconds: `1800`
@@ -184,14 +176,14 @@ task 必须以 `/skill-name` 开头（触发 slash command 解析），后续行
 ### Phase 6: Full Experiment
-**检查:** `$W/experiment_res.md` 存在？
+**检查:** `experiment_res.md` 存在？
 **如果缺失，调用 sessions_spawn 工具（然后停止，等待完成通知）：**
-- task: `"/research-experiment\n工作目录: {$W绝对路径}\n上下文:\n- Review PASS，代码已验证\n- plan_res.md 中指定 full epochs\n请执行完整训练 + 消融实验，写入 experiment_res.md。"`
+- task: `"/research-experiment\n上下文:\n- Review PASS，代码已验证\n- plan_res.md 中指定 full epochs\n请执行完整训练 + 消融实验，写入 experiment_res.md。"`
 - label: `"Research Experiment"`
 - runTimeoutSeconds: `1800`
-**验证:** `$W/experiment_res.md` 包含 `[RESULT]` 行和消融表格
+**验证:** `experiment_res.md` 包含 `[RESULT]` 行和消融表格
 ---
@@ -202,9 +194,9 @@ task 必须以 `/skill-name` 开头（触发 slash command 解析），后续行
 ```
 研究流程完成！
 - 论文: {N} 篇分析
-- 代码: $W/project/
-- 结果: $W/experiment_res.md
-- 审查: $W/iterations/ ({N} 轮)
+- 代码: project/
+- 结果: experiment_res.md
+- 审查: iterations/ ({N} 轮)
 ```
 ---

package/skills/research-plan/SKILL.md CHANGED Viewed

@@ -14,17 +14,14 @@ metadata:
 **Don't ask permission. Just do it.**
-**Workspace:** `$W` = working directory provided in task parameter.
 ## Prerequisites
 | File | Source |
 |------|--------|
-| `$W/task.json` | /research-pipeline or user |
-| `$W/survey_res.md` | /research-survey |
-| `$W/notes/paper_*.md` | /research-survey |
-| `$W/repos/` | /research-collect Phase 3 |
-| `$W/prepare_res.md` | /research-collect Phase 3 |
+| `SOUL.md` | 研究方向和目标 |
+| `survey_res.md` | /research-survey |
+| `knowledge/paper_*.md` | /research-survey |
 **If `survey_res.md` is missing, STOP:** "需要先运行 /research-survey 完成深度分析"
@@ -32,7 +29,7 @@ metadata:
 | File | Content |
 |------|---------|
-| `$W/plan_res.md` | 四部分实现计划 |
+| `plan_res.md` | 四部分实现计划 |
 ---
@@ -41,9 +38,8 @@ metadata:
 ### Step 1: 读取上下文
 读取以下文件，理解研究目标和技术方案：
-- `$W/task.json` — 研究目标
-- `$W/survey_res.md` — 技术路线建议、核心公式、**公式→代码映射表**、参考代码架构摘要
-- `$W/prepare_res.md` — 参考仓库列表及关键文件说明
+- `SOUL.md` — 研究方向和目标
+- `survey_res.md` — 技术路线建议、核心公式、方法对比
 ### Step 2: 参考代码深度分析
@@ -59,7 +55,7 @@ metadata:
 ### Step 3: 制定四部分计划
-写入 `$W/plan_res.md`：
+写入 `plan_res.md`：
 ```markdown
 # Implementation Plan