npm - scientify - Versions diffs - 2.0.0 → 3.0.0 - Mend

scientify 2.0.0 → 3.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (140) hide show

package/README.en.md +21 -0
package/README.md +21 -0
package/dist/index.d.ts.map +1 -1
package/dist/index.js +1 -76
package/dist/index.js.map +1 -1
package/dist/src/cli/research.d.ts.map +1 -1
package/dist/src/cli/research.js +6 -23
package/dist/src/cli/research.js.map +1 -1
package/dist/src/commands/metabolism-status.d.ts.map +1 -1
package/dist/src/commands/metabolism-status.js +5 -25
package/dist/src/commands/metabolism-status.js.map +1 -1
package/dist/src/commands.d.ts +8 -8
package/dist/src/commands.d.ts.map +1 -1
package/dist/src/commands.js +91 -262
package/dist/src/commands.js.map +1 -1
package/dist/src/templates/bootstrap.d.ts.map +1 -1
package/dist/src/templates/bootstrap.js +45 -59
package/dist/src/templates/bootstrap.js.map +1 -1
package/dist/src/types.d.ts +2 -10
package/dist/src/types.d.ts.map +1 -1
package/openclaw.plugin.json +3 -16
package/package.json +2 -3
package/skills/idea-generation/SKILL.md +20 -44
package/skills/idea-generation/references/code-mapping.md +3 -3
package/skills/idea-generation/references/idea-template.md +1 -1
package/skills/idea-generation/references/reading-long-papers.md +3 -3
package/skills/metabolism/SKILL.md +80 -36
package/skills/paper-download/SKILL.md +61 -0
package/skills/research-collect/SKILL.md +41 -111
package/skills/research-experiment/SKILL.md +11 -12
package/skills/research-implement/SKILL.md +10 -11
package/skills/research-pipeline/SKILL.md +23 -31
package/skills/research-plan/SKILL.md +7 -11
package/skills/research-review/SKILL.md +21 -22
package/skills/research-survey/SKILL.md +11 -25
package/skills/write-review-paper/SKILL.md +12 -12
package/skills/write-review-paper/references/note-template.md +1 -1
package/skills/write-review-paper/references/survey-template.md +1 -1
package/dist/src/hooks/research-mode.d.ts +0 -22
package/dist/src/hooks/research-mode.d.ts.map +0 -1
package/dist/src/hooks/research-mode.js +0 -35
package/dist/src/hooks/research-mode.js.map +0 -1
package/dist/src/hooks/scientify-cron-autofill.d.ts +0 -15
package/dist/src/hooks/scientify-cron-autofill.d.ts.map +0 -1
package/dist/src/hooks/scientify-cron-autofill.js +0 -156
package/dist/src/hooks/scientify-cron-autofill.js.map +0 -1
package/dist/src/hooks/scientify-signature.d.ts +0 -21
package/dist/src/hooks/scientify-signature.d.ts.map +0 -1
package/dist/src/hooks/scientify-signature.js +0 -150
package/dist/src/hooks/scientify-signature.js.map +0 -1
package/dist/src/knowledge-state/project.d.ts +0 -13
package/dist/src/knowledge-state/project.d.ts.map +0 -1
package/dist/src/knowledge-state/project.js +0 -88
package/dist/src/knowledge-state/project.js.map +0 -1
package/dist/src/knowledge-state/render.d.ts +0 -63
package/dist/src/knowledge-state/render.d.ts.map +0 -1
package/dist/src/knowledge-state/render.js +0 -368
package/dist/src/knowledge-state/render.js.map +0 -1
package/dist/src/knowledge-state/store.d.ts +0 -19
package/dist/src/knowledge-state/store.d.ts.map +0 -1
package/dist/src/knowledge-state/store.js +0 -978
package/dist/src/knowledge-state/store.js.map +0 -1
package/dist/src/knowledge-state/types.d.ts +0 -182
package/dist/src/knowledge-state/types.d.ts.map +0 -1
package/dist/src/knowledge-state/types.js +0 -2
package/dist/src/knowledge-state/types.js.map +0 -1
package/dist/src/literature/subscription-state.d.ts +0 -112
package/dist/src/literature/subscription-state.d.ts.map +0 -1
package/dist/src/literature/subscription-state.js +0 -696
package/dist/src/literature/subscription-state.js.map +0 -1
package/dist/src/research-subscriptions/constants.d.ts +0 -16
package/dist/src/research-subscriptions/constants.d.ts.map +0 -1
package/dist/src/research-subscriptions/constants.js +0 -59
package/dist/src/research-subscriptions/constants.js.map +0 -1
package/dist/src/research-subscriptions/cron-client.d.ts +0 -8
package/dist/src/research-subscriptions/cron-client.d.ts.map +0 -1
package/dist/src/research-subscriptions/cron-client.js +0 -81
package/dist/src/research-subscriptions/cron-client.js.map +0 -1
package/dist/src/research-subscriptions/delivery.d.ts +0 -10
package/dist/src/research-subscriptions/delivery.d.ts.map +0 -1
package/dist/src/research-subscriptions/delivery.js +0 -82
package/dist/src/research-subscriptions/delivery.js.map +0 -1
package/dist/src/research-subscriptions/handlers.d.ts +0 -6
package/dist/src/research-subscriptions/handlers.d.ts.map +0 -1
package/dist/src/research-subscriptions/handlers.js +0 -204
package/dist/src/research-subscriptions/handlers.js.map +0 -1
package/dist/src/research-subscriptions/parse.d.ts +0 -11
package/dist/src/research-subscriptions/parse.d.ts.map +0 -1
package/dist/src/research-subscriptions/parse.js +0 -492
package/dist/src/research-subscriptions/parse.js.map +0 -1
package/dist/src/research-subscriptions/prompt.d.ts +0 -5
package/dist/src/research-subscriptions/prompt.d.ts.map +0 -1
package/dist/src/research-subscriptions/prompt.js +0 -347
package/dist/src/research-subscriptions/prompt.js.map +0 -1
package/dist/src/research-subscriptions/types.d.ts +0 -66
package/dist/src/research-subscriptions/types.d.ts.map +0 -1
package/dist/src/research-subscriptions/types.js +0 -2
package/dist/src/research-subscriptions/types.js.map +0 -1
package/dist/src/research-subscriptions.d.ts +0 -2
package/dist/src/research-subscriptions.d.ts.map +0 -1
package/dist/src/research-subscriptions.js +0 -2
package/dist/src/research-subscriptions.js.map +0 -1
package/dist/src/services/auto-updater.d.ts +0 -15
package/dist/src/services/auto-updater.d.ts.map +0 -1
package/dist/src/services/auto-updater.js +0 -188
package/dist/src/services/auto-updater.js.map +0 -1
package/dist/src/tools/arxiv-download.d.ts +0 -24
package/dist/src/tools/arxiv-download.d.ts.map +0 -1
package/dist/src/tools/arxiv-download.js +0 -177
package/dist/src/tools/arxiv-download.js.map +0 -1
package/dist/src/tools/github-search-tool.d.ts +0 -25
package/dist/src/tools/github-search-tool.d.ts.map +0 -1
package/dist/src/tools/github-search-tool.js +0 -114
package/dist/src/tools/github-search-tool.js.map +0 -1
package/dist/src/tools/openreview-lookup.d.ts +0 -31
package/dist/src/tools/openreview-lookup.d.ts.map +0 -1
package/dist/src/tools/openreview-lookup.js +0 -414
package/dist/src/tools/openreview-lookup.js.map +0 -1
package/dist/src/tools/paper-browser.d.ts +0 -23
package/dist/src/tools/paper-browser.d.ts.map +0 -1
package/dist/src/tools/paper-browser.js +0 -121
package/dist/src/tools/paper-browser.js.map +0 -1
package/dist/src/tools/scientify-cron.d.ts +0 -63
package/dist/src/tools/scientify-cron.d.ts.map +0 -1
package/dist/src/tools/scientify-cron.js +0 -265
package/dist/src/tools/scientify-cron.js.map +0 -1
package/dist/src/tools/scientify-literature-state.d.ts +0 -303
package/dist/src/tools/scientify-literature-state.d.ts.map +0 -1
package/dist/src/tools/scientify-literature-state.js +0 -957
package/dist/src/tools/scientify-literature-state.js.map +0 -1
package/dist/src/tools/unpaywall-download.d.ts +0 -21
package/dist/src/tools/unpaywall-download.d.ts.map +0 -1
package/dist/src/tools/unpaywall-download.js +0 -169
package/dist/src/tools/unpaywall-download.js.map +0 -1
package/dist/src/tools/workspace.d.ts +0 -32
package/dist/src/tools/workspace.d.ts.map +0 -1
package/dist/src/tools/workspace.js +0 -69
package/dist/src/tools/workspace.js.map +0 -1
package/skills/metabolism-init/SKILL.md +0 -80
package/skills/research-subscription/SKILL.md +0 -119

package/openclaw.plugin.json CHANGED Viewed

@@ -5,19 +5,7 @@
   "configSchema": {
     "type": "object",
     "additionalProperties": false,
-    "properties": {
-      "autoUpdate": {
-        "type": "boolean",
-        "default": true,
-        "description": "Automatically check and install updates (default: true)"
-      }
-    }
-  },
-  "uiHints": {
-    "autoUpdate": {
-      "label": "Auto Update",
-      "description": "Silently check for and install Scientify updates"
-    }
+    "properties": {}
   },
   "skills": [
     "skills/idea-generation",
@@ -28,9 +16,8 @@
     "skills/research-review",
     "skills/research-experiment",
     "skills/research-collect",
+    "skills/paper-download",
     "skills/write-review-paper",
-    "skills/research-subscription",
-    "skills/metabolism",
-    "skills/metabolism-init"
+    "skills/metabolism"
   ]
 }

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "scientify",
-  "version": "2.0.0",
+  "version": "3.0.0",
   "description": "Scientify - AI-powered research workflow automation for OpenClaw. Includes idea generation, literature review, research pipeline skills, and arxiv tool.",
   "type": "module",
   "main": "dist/index.js",
@@ -40,8 +40,7 @@
     "release": "npm version patch && git push && git push --tags"
   },
   "dependencies": {
-    "@sinclair/typebox": "^0.32.0",
-    "tar": "^7.0.0"
+    "@sinclair/typebox": "^0.32.0"
   },
   "devDependencies": {
     "@semantic-release/changelog": "^6.0.3",

package/skills/idea-generation/SKILL.md CHANGED Viewed

@@ -19,27 +19,25 @@ Generate innovative research ideas grounded in literature analysis. This skill r
 **Core principle:** Ideas MUST be grounded in actual papers, not generated from model knowledge.
-**Workspace:** `$W` = working directory provided in task parameter. Outputs go to `$W/ideas/`.
+Outputs go to `ideas/`.
 ---
 ## Step 1: Check Workspace Resources
-First, check what resources already exist in `$W`:
+First, check what resources already exist:
 ```bash
-ls $W/papers/ 2>/dev/null | head -20
-ls $W/papers/_meta/ 2>/dev/null | head -10
-ls $W/survey/ 2>/dev/null
+ls papers/ 2>/dev/null | head -20
+ls knowledge/ 2>/dev/null
 ```
 ### Assess Available Resources
 | Resource | Location | Status |
 |----------|----------|--------|
-| Papers | `$W/papers/` | Count: ? |
-| Survey clusters | `$W/survey/clusters.json` | Exists: Y/N |
-| Repos | `$W/repos/` | Count: ? |
+| Papers | `papers/` | Count: ? |
+| Knowledge | `knowledge/_index.md` | Exists: Y/N |
 ---
@@ -77,7 +75,7 @@ This will:
 - Search 100+ papers systematically
 - Filter by relevance (score ≥4)
 - Cluster into research directions
-- Save to $W/papers/
+- Save to papers/
 After survey completes, run /idea-generation again.
 ```
@@ -86,31 +84,25 @@ After survey completes, run /idea-generation again.
 For fast iteration, do minimal search:
-1. **ArXiv search:**
+1. **Search papers:**
 ```
-Tool: arxiv_search
-Arguments:
-  query: "{user_topic}"
-  max_results: 10
+arxiv_search({ query: "{user_topic}", max_results: 10 })
+openalex_search({ query: "{user_topic}", max_results: 10 })
 ```
-2. **Clone 3-5 reference repos:**
-```bash
-mkdir -p $W/repos
-git clone --depth 1 {repo_url} $W/repos/{name}
-```
+2. **Download papers:** 按 /paper-download 的方式下载到 `papers/`
-3. **Download paper sources:**
+3. **Clone reference repos (optional):**
 ```bash
-mkdir -p $W/papers/{arxiv_id}
-curl -L "https://arxiv.org/src/{arxiv_id}" | tar -xz -C $W/papers/{arxiv_id}
+gh search repos "{paper_title} implementation" --limit 5 --sort stars
+git clone --depth 1 {repo_url} repos/{name}
 ```
 ---
 ## Step 4: Analyze Literature
-**Prerequisites:** At least 5 papers in `$W/papers/`
+**Prerequisites:** At least 5 papers in `papers/`
 ### 4.1 Read Papers
@@ -130,7 +122,7 @@ Look for:
 - Scalability issues
 - Assumptions that could be relaxed
-Document gaps in `$W/ideas/gaps.md`:
+Document gaps in `ideas/gaps.md`:
 ```markdown
 # Research Gaps Identified
@@ -146,7 +138,7 @@ Document gaps in `$W/ideas/gaps.md`:
 ## Step 5: Generate 5 Ideas
-Create `$W/ideas/idea_1.md` through `idea_5.md` using template in `references/idea-template.md`.
+Create `ideas/idea_1.md` through `idea_5.md` using template in `references/idea-template.md`.
 **Requirements:**
 - Each idea cites ≥2 papers by arXiv ID
@@ -175,28 +167,12 @@ Create `$W/ideas/idea_1.md` through `idea_5.md` using template in `references/id
 ### 6.2 Enhance Selected Idea
-Create `$W/ideas/selected_idea.md` with:
+Create `ideas/selected_idea.md` with:
 - Detailed math (loss functions, gradients)
 - Architecture choices
 - Hyperparameters
 - Implementation roadmap
-### 6.3 (Optional but recommended) OpenReview Evidence Check
-For the top 1-2 shortlisted ideas, validate novelty/positioning risk with `openreview_lookup`:
-- Query using core title keywords or representative baseline paper title
-- Extract evidence:
-  - decision (if available)
-  - average rating/confidence
-  - reviewer weakness patterns
-- Add a short "submission risk note" section per idea:
-  - likely reviewer concern
-  - mitigation experiment to add
-  - positioning adjustment
-Do not claim accept/reject predictions as facts. Report evidence-backed risk signals only.
 ---
 ## Step 7: Code Survey
@@ -205,13 +181,13 @@ Map idea concepts to reference implementations.
 See `references/code-mapping.md` for template.
-**Output:** `$W/ideas/implementation_report.md`
+**Output:** `ideas/implementation_report.md`
 ---
 ## Step 8: Summary
-Create `$W/ideas/summary.md`:
+Create `ideas/summary.md`:
 - All 5 ideas with scores
 - Selected idea details
 - Next steps: `/research-pipeline` to implement

package/skills/idea-generation/references/code-mapping.md CHANGED Viewed

@@ -9,13 +9,13 @@ From `selected_idea.md`, list concepts needing implementation.
 ## Step 2: Survey Codebases
 ```bash
-grep -r "class.*Attention" $WORKSPACE/repos/
-grep -r "def forward" $WORKSPACE/repos/
+grep -r "class.*Attention" repos/
+grep -r "def forward" repos/
 ```
 ## Step 3: Implementation Report
-Write to `$WORKSPACE/ideas/implementation_report.md`:
+Write to `ideas/implementation_report.md`:
 ```markdown
 # Implementation Report

package/skills/idea-generation/references/idea-template.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # Idea Template
-Use this template for each generated idea (`$WORKSPACE/ideas/idea_N.md`).
+Use this template for each generated idea (`ideas/idea_N.md`).
 ## Required Sections

package/skills/idea-generation/references/reading-long-papers.md CHANGED Viewed

@@ -5,8 +5,8 @@ For papers >50KB or >15k tokens, use chunked reading.
 ## Step 1: Structure Scan
 ```bash
-ls -la $WORKSPACE/papers/{arxiv_id}/
-wc -l $WORKSPACE/papers/{arxiv_id}/*.tex
+ls -la papers/{arxiv_id}/
+wc -l papers/{arxiv_id}/*.tex
 ```
 ## Step 2: Chunked Reading
@@ -16,7 +16,7 @@ Use Read tool with `offset` and `limit`:
 ```
 Tool: Read
 Arguments:
-  file_path: "$WORKSPACE/papers/2404.04429/main.tex"
+  file_path: "papers/2404.04429/main.tex"
   offset: 1
   limit: 500    # First 500 lines
 ```

package/skills/metabolism/SKILL.md CHANGED Viewed

@@ -1,24 +1,80 @@
 ---
 name: metabolism
-description: "Knowledge metabolism cycle: ingest new papers, update knowledge state, detect cross-topic links, generate hypotheses. Use /metabolism to trigger manually."
-user-invokable: true
+description: "Knowledge metabolism: Day 0 init (discuss + baseline survey) or daily cycle (incremental search + update knowledge + generate hypotheses). Triggered by bootstrap and daily cron."
 ---
-# Continuous Knowledge Metabolism — Incremental Cycle
+# Knowledge Metabolism
-你正在执行知识新陈代谢循环。严格按以下步骤执行。
+读取 `config.json` 的 `currentDay` 字段判断执行哪个分支：
-**前提：** `metabolism/config.json` 必须已存在且 `currentDay >= 1`。如果不存在或 `currentDay` 为 0，提示用户先执行 /metabolism-init 完成初始化。
+- **`currentDay == 0` 或 config.json 不存在** → 执行 Day 0（初始化）
+- **`currentDay >= 1`** → 执行每日增量循环
-## 准备
+---
+## Day 0：初始化
+与用户讨论研究方向后，构建领域基线知识。
-1. 读取 `metabolism/config.json` 获取关键词、arXiv 分类、`processed_ids` 和 `currentDay`
-2. 读取 `metabolism/knowledge/_index.md` 获取当前知识状态
+### 准备
-## Step 1: Search（增量搜索）
+1. 检查 `config.json` 是否存在
+   - 不存在：询问用户研究方向，创建 `config.json`（包含 `keywords`, `arxivCategories`, `sources`, `currentDay: 0`, `processed_ids: []`）
+   - 已存在且 `currentDay > 0`：跳转到每日循环
-用滑动窗口（过去 5 天）搜索，靠 `processed_ids` 去重：
+### Step 1: 宽泛调研
+委托 /research-collect 执行宽泛调研（不限日期），构建初始知识：
+```
+sessions_spawn({
+  task: "/research-collect\n研究主题: {从 config.json 的 keywords 提取}\n这是 Day 0 基线构建，请做宽泛调研（不限日期），覆盖领域经典工作和近期进展。",
+  label: "Day 0 Baseline Survey",
+  runTimeoutSeconds: 1800
+})
+```
+等待完成后，读取 `papers/` 获取论文列表。
+### Step 2: 阅读与知识提取
+对每篇论文：
+- 读 .tex 源码（优先）或 PDF
+- 提取：核心方法、关键结论、领域现状
+将每篇论文的 arXiv ID / DOI 追加到 `config.json` 的 `processed_ids`。
+### Step 3: 构建初始知识状态
+创建 `knowledge/_index.md`：
+- Research Goal（从 config.json 提取）
+- Topics 表格（按论文主题聚类）
+- Cross-topic Links（如有）
+- Timeline（记录 Day 0）
+为每个识别出的主题创建 `knowledge/topic-{name}.md`：
+- 已知方法
+- 关键论文与结论
+- 开放问题
+### Step 4: 记录日志
+写入 `log/{YYYY-MM-DD}-init.md`，更新 `config.json`：`currentDay` 设为 1。
+---
+## Day 1+：每日增量循环
+### 准备
+1. 读取 `config.json` 获取关键词、arXiv 分类、`sources`、`processed_ids` 和 `currentDay`
+2. 读取 `knowledge/_index.md` 获取当前知识状态
+### Step 1: Search（增量搜索）
+根据 `config.json` 的 `sources` 字段选择搜索来源，用滑动窗口（过去 5 天）搜索，靠 `processed_ids` 去重：
+**arXiv**（如果 sources 包含 "arxiv"）：
 ```
 arxiv_search({
   query: "{keywords} AND cat:{category}",
@@ -26,7 +82,10 @@ arxiv_search({
   sort_by: "submittedDate",
   max_results: 30
 })
+```
+**OpenAlex**（如果 sources 包含 "openalex"）：
+```
 openalex_search({
   query: "{keywords}",
   filter: "from_publication_date:{5天前 YYYY-MM-DD}",
@@ -37,14 +96,9 @@ openalex_search({
 合并结果，按 arXiv ID / DOI 去重，**跳过 `processed_ids` 中已有的论文**。
-下载新论文：
+按 /paper-download 的方式下载新论文到 `papers/`（arXiv 优先 .tex 源文件，DOI 通过 Unpaywall 获取 OA PDF）。
-```
-arxiv_download({ arxiv_ids: ["{id1}", "{id2}", ...] })
-unpaywall_download({ dois: ["{doi1}", "{doi2}", ...] })
-```
-## Step 2: Read（阅读）
+### Step 2: Read（阅读）
 对每篇新论文：
 - 读 .tex 源码（优先）或 PDF
@@ -52,9 +106,9 @@ unpaywall_download({ dois: ["{doi1}", "{doi2}", ...] })
 将每篇论文的 arXiv ID / DOI 追加到 `config.json` 的 `processed_ids`。
-## Step 3: Update Knowledge
+### Step 3: Update Knowledge
-读取当前 `metabolism/knowledge/_index.md` 和相关 `topic-*.md`，根据今日阅读的论文更新。
+读取当前 `knowledge/_index.md` 和相关 `topic-*.md`，根据今日阅读的论文更新。
 **更新原则：**
 - 新发现 → 添加到相关章节
@@ -64,15 +118,15 @@ unpaywall_download({ dois: ["{doi1}", "{doi2}", ...] })
 **篇幅管理：** 每个 topic 文件控制在 200 行以内。接近上限时，压缩早期内容（合并相似结论、删除低价值条目），保留信息密度。不要为了压缩而丢失关键结论和来源引用。
-## Step 4: Hypothesize（假设）
+### Step 4: Hypothesize（假设）
-更新完 knowledge.md 后，回顾今日新增内容，自问：
+更新完知识后，回顾今日新增内容，自问：
 - 有没有反复出现但尚未被验证的模式？
 - 有没有两个独立发现组合后暗示的新方向？
 - 有没有现有方法的明显空白？
-**有想法** → 写入 `metabolism/hypotheses/hyp-{NNN}.md`：
+**有想法** → 写入 `ideas/hyp-{NNN}.md`：
 ```markdown
 # Hypothesis {NNN}
@@ -94,27 +148,17 @@ unpaywall_download({ dois: ["{doi1}", "{doi2}", ...] })
 然后用 `sessions_send` 通知 main session。
-**说明：** 发送给用户的内容不要输出“触发条件检查表/列表”，只需解释为什么这个假设合理、哪些已读内容启发了它。
 **没有想法** → 跳过，不要硬凑。
-## Step 5: Log & Finish
+### Step 5: Log & Finish
-写入 `metabolism/log/{YYYY-MM-DD}.md`：
+写入 `log/{YYYY-MM-DD}.md`，更新 `config.json`：`currentDay` +1。
-```markdown
-# Day {currentDay} — {YYYY-MM-DD}
-新论文: {N} 篇
-知识更新: {简述主要变更}
-假设: {有/无}
-```
-更新 `config.json`：`currentDay` +1。
+---
 ## 行为约束
 1. 不捏造论文中未出现的事实性声明，但可以用自身知识做推理和关联判断
 2. 没有想法时不生成假设
-3. 自主运行，不向人类提问
+3. 自主运行，不向人类提问（Day 0 初始配置除外）
 4. 修改知识文件前必须先读取当前内容

package/skills/paper-download/SKILL.md ADDED Viewed

@@ -0,0 +1,61 @@
+---
+name: paper-download
+description: "Download academic papers: arXiv source/PDF by ID, DOI papers via Unpaywall open access. Supports batch download."
+---
+# Paper Download
+将论文下载到当前工作目录的 `papers/` 下。
+## arXiv 论文
+**优先下载 .tex 源文件**（可读性远优于 PDF）：
+```bash
+mkdir -p papers/{arxiv_id}
+curl -L "https://arxiv.org/src/{arxiv_id}" | tar -xz -C papers/{arxiv_id}
+```
+如果 tar 解压失败（部分论文只提供 PDF），回退到 PDF：
+```bash
+curl -L -o papers/{arxiv_id}.pdf "https://arxiv.org/pdf/{arxiv_id}"
+```
+> arXiv 限速：连续下载时每篇间隔 3 秒（`sleep 3`）。
+## DOI 论文（通过 Unpaywall）
+查询开放获取链接，有则下载，无则跳过：
+```bash
+curl -s "https://api.unpaywall.org/v2/{doi}?email=research@openclaw.ai" | \
+  python3 -c "
+import sys, json
+d = json.load(sys.stdin)
+oa = d.get('best_oa_location') or {}
+url = oa.get('url_for_pdf') or oa.get('url')
+if url: print(url)
+else: print('NO_OA', file=sys.stderr)
+" | xargs -I{} curl -L -o papers/{doi_slug}.pdf "{}"
+```
+> `{doi_slug}` = DOI 中的 `/` 替换为 `_`，例如 `10.1000/xyz123` → `10.1000_xyz123`。
+> 非开放获取论文静默跳过，不报错。
+## 批量下载
+```bash
+# 批量 arXiv
+for id in 2401.12345 2403.00001 2405.67890; do
+  mkdir -p papers/$id
+  curl -L "https://arxiv.org/src/$id" | tar -xz -C papers/$id || \
+    curl -L -o papers/$id.pdf "https://arxiv.org/pdf/$id"
+  sleep 3
+done
+```
+## 下载后
+- 下载的论文 ID 应追加到 `config.json` 的 `processed_ids`（如果存在）
+- 优先读 `.tex` 源码而非 PDF（信息更完整，公式可直接提取）