npm - @geekbeer/minion - Versions diffs - 3.52.0 → 3.55.1 - Mend

@geekbeer/minion 3.52.0 → 3.55.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

package/.env.example +7 -0
package/core/db/migrations/20260508000000_page_recipes.js +33 -0
package/core/lib/dag-step-poller.js +245 -1
package/core/lib/web-extract/extractor.js +142 -0
package/core/lib/web-extract/fingerprint.js +63 -0
package/core/lib/web-extract/html-cleaner.js +72 -0
package/core/lib/web-extract/index.js +21 -0
package/core/lib/web-extract/playwright-runner.js +129 -0
package/core/lib/web-extract/recipe-generator.js +247 -0
package/core/lib/web-extract/url-normalize.js +90 -0
package/core/routes/web.js +94 -0
package/core/stores/page-recipe-store.js +143 -0
package/docs/api-reference.md +106 -297
package/docs/task-guides.md +134 -75
package/linux/routes/chat.js +37 -20
package/linux/server.js +2 -0
package/mac/server.js +2 -0
package/package.json +6 -2
package/rules/core.md +26 -9
package/win/routes/chat.js +38 -16
package/win/server.js +2 -0

package/docs/task-guides.md CHANGED Viewed

@@ -4,6 +4,64 @@
 ---
+## Webページの読み取り・要約 🧪 (experimental, v3.53.0〜)
+ユーザーから「このURLを要約して」「このページの情報を抽出して」「このページの一覧を取ってきて」と依頼された場合の手順。
+### まずローカルAPIを試す
+```bash
+curl -X POST http://localhost:8080/api/web/extract \
+  -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \
+  -d '{"url": "対象URL", "hint": "何を抽出したいか短く (任意)"}' | jq
+```
+返ってきた JSON の `title` `content` `structured` を使って要約・回答を作成する。`structured` には初回アクセス時に LLM が選んだフィールドが入る。
+このAPIは内部で Playwright + Readability を回して **メインセッションには結果 JSON だけ返す** ため、Playwright MCP を使うときに起きていたチャットコンテキストのトークン肥大化が回避できる。
+### Playwright MCP を使うべき場面
+`/api/web/extract` で対応できないのは以下のケース。このときだけ `mcp__playwright__*` を使う:
+- ログイン必須ページ (Cookie/2FA 等の認証必要)
+- フォーム入力・複数ページ遷移を伴う操作
+- ボタンクリック→動的に追加されるコンテンツの取得
+- Lancers コンペ応募など、明らかに対話的操作が必要なフロー
+**単純な閲覧・抽出用途では MCP を使わない。**
+### よくあるパターン
+| ユーザー依頼 | 推奨手段 |
+|--------------|----------|
+| 「このQiita記事を要約」 | `/api/web/extract` |
+| 「Lancersコンペの一覧を取得」 | `/api/web/extract` |
+| 「このプロダクトページから価格を抽出」 | `/api/web/extract` |
+| 「ログインしてダッシュボード操作」 | Playwright MCP |
+| 「フォームを送信」 | Playwright MCP |
+| 「複数ページ巡回して全件取得」 | `/api/web/extract` をループ呼び出し (各ページに対して) |
+### キャッシュの確認・破棄 (debug)
+```bash
+# キャッシュ済みレシピ一覧
+curl -H "Authorization: Bearer $API_TOKEN" http://localhost:8080/api/web/recipes | jq
+# 特定のレシピを削除 (壊れたセレクタを強制再生成させたい場合)
+curl -X DELETE -H "Authorization: Bearer $API_TOKEN" \
+  "http://localhost:8080/api/web/recipes?template=lancers.jp/work/proposal/:id&fingerprint=abc123def456"
+```
+### 失敗時の対処
+- `503 PLAYWRIGHT_UNAVAILABLE` → ホスト側で `npx playwright install chromium` を実行 (sudo 不要)
+- `503 LLM_UNAVAILABLE` → primary LLM 未設定。`PUT /api/llm/config -d '{"primary":"claude"}'` で primary を指定するか、fallback として `PUT /api/secrets/ANTHROPIC_API_KEY` で API キーを投入
+- `502 PRIMARY_LLM_BAD_JSON` → primary LLM が JSON 形式で返さなかった。プラグインの認証状態を `GET /api/llm/plugins` で確認し、必要なら別 plugin を primary にする
+- `500 extract timeout` → ページが重すぎる/JSレンダリング待ちが長すぎる。Playwright MCP に切り替えて手動操作
+---
 ## スキルの修正
 ### 1. ローカルのスキルを編集する
@@ -30,7 +88,7 @@ requires:
 ---
 Skill instructions here...
-Use {{PROJECT_VAR}} to reference project/workflow variables.
+Use {{PROJECT_VAR}} to reference project variables.
 ```
 フロントマターのフィールド:
@@ -62,7 +120,7 @@ description: サイトをデプロイする
 - 変数名は英数字とアンダースコアのみ（`\w+`）
 - 未定義の変数は `{{VAR_NAME}}` のまま残る（エラーにはならない）
-- 展開優先順位: ミニオン変数 < プロジェクト変数 < ワークフロー変数（後者が上書き）
+- 展開優先順位: ミニオン変数 < プロジェクト変数（後者が上書き）
 - ルーティン実行時もミニオン変数による `{{VAR}}` 展開が行われる
 ### 変数とシークレットの使い分け
@@ -72,7 +130,7 @@ description: サイトをデプロイする
 | 変数 | `{{VAR_NAME}}` | 設定・パラメータ（非機密） | デプロイ先、サイトURL、プロジェクト名 |
 | シークレット | `$SECRET_NAME`（環境変数） | 機密情報 | APIキー、パスワード、トークン |
-- **変数**はスキル本文のテンプレートとして展開される。全スコープ（ミニオン・プロジェクト・ワークフロー）で同じ `{{VAR}}` 構文を使用する
+- **変数**はスキル本文のテンプレートとして展開される。全スコープ（ミニオン・プロジェクト）で同じ `{{VAR}}` 構文を使用する
 - **シークレット**は環境変数としてプロセスに注入される。テンプレート展開は行われない
 - デイリーログやメモリーから変数・シークレットの値を推測して使用しないこと
@@ -96,63 +154,11 @@ minion-cli skill fetch <name>
 ---
-## ワークフローの修正 (PM のみ)
-### パイプライン構成の変更
-```bash
-# API経由で push (新バージョン自動作成)
-curl -s -X POST "$HQ_URL/api/minion/workflows" \
-  -H "Authorization: Bearer $API_TOKEN" \
-  -H "Content-Type: application/json" \
-  -d '{
-    "name": "my-workflow",
-    "pipeline_skill_names": ["skill-1", "skill-2"],
-    "content": "Workflow description",
-    "project_id": "<project-uuid>",
-    "change_summary": "Updated pipeline"
-  }'
-```
-### ステップごとのロール・レビュー設定
-```bash
-curl -s -X POST "$HQ_URL/api/minion/workflows" \
-  -H "Authorization: Bearer $API_TOKEN" \
-  -H "Content-Type: application/json" \
-  -d '{
-    "name": "my-workflow",
-    "pipeline_skill_names": ["skill-1", "skill-2"],
-    "pipeline_steps": [
-      { "assigned_role": "engineer", "requires_review": false },
-      { "assigned_role": "pm", "requires_review": true }
-    ],
-    "content": "Workflow description",
-    "project_id": "<project-uuid>"
-  }'
-```
-### ローカルワークフローの同期
-```bash
-# HQからワークフローを取得 (不足スキルも自動fetch)
-curl -s -X POST "http://localhost:8080/api/workflows/fetch/<name>" \
-  -H "Authorization: Bearer $API_TOKEN"
-# ローカルワークフローをHQにpush (スキルも自動push)
-curl -s -X POST "http://localhost:8080/api/workflows/push/<name>" \
-  -H "Authorization: Bearer $API_TOKEN"
-```
-> **Note**: `/api/workflows/push|fetch` は線形パイプライン形式（`pipeline_skill_names`）の旧式ワークフロー専用です。DAGワークフロー（ノード/エッジ形式）はHQダッシュボードの DAG エディタで作成・編集します。次節を参照。
----
 ## DAG ワークフロー (ノード/エッジ形式)
-DAG ワークフローは有向非巡回グラフでスキル間の依存関係を表現する新方式のワークフローです。fan-out による並列展開、join による集約、conditional による分岐、transform による LLM データ変換、review によるゲーティングをサポートします。
+DAG ワークフローは有向非巡回グラフでスキル間の依存関係を表現するワークフローです。fan-out による並列展開、join による集約、conditional による分岐、transform による LLM データ変換、script による決定的スクリプト実行 (Python/Node)、review によるゲーティングをサポートします。
-**HQダッシュボードの DAG エディタ（プロジェクト画面 → 「DAG (beta)」タブ）で GUI 編集**できるほか、**ミニオンからは JSON ベースで編集可能**（PMロールのみ）。ミニオンは実行ランタイムも担当し、`dag-step-poller` デーモンが pending ノードを自動で処理します。
+**HQダッシュボードの DAG エディタ（プロジェクト画面の「DAG」タブ）で GUI 編集**できるほか、**ミニオンからは JSON ベースで編集可能**（PMロールのみ）。ミニオンは実行ランタイムも担当し、`dag-step-poller` デーモンが pending ノードを自動で処理します。
 **cronスケジュール (v3.51.0〜):** DAGワークフローは cron 式による定期実行をサポート。設定はHQダッシュボードのDAGビューにある SchedulePanel から行う（最小実行間隔 5分）。発火主体はそのプロジェクトのPMロールのミニオンで、`dag-cron-poller` デーモンが60秒間隔で `/api/dag/minion/dag-cron-tick` を叩いて発火させる。PM不在のプロジェクトでは cron は発火しない。
@@ -347,7 +353,7 @@ hq dag remove-edge <wf-id> edge_3
 **fan_out テンプレート編集:**
-> **⚠️ テンプレート内に `start` / `end` ノードを入れないこと。** テンプレートのエントリ/エグジットはエッジ構造から自動検出される。`start` / `end` はトップレベル DAG 専用であり、テンプレート内に含めるとバリデーションエラーになる。`skill`, `conditional`, `transform`, `review` 等の実行ノードのみ使用すること。
+> **⚠️ テンプレート内に `start` / `end` ノードを入れないこと。** テンプレートのエントリ/エグジットはエッジ構造から自動検出される。`start` / `end` はトップレベル DAG 専用であり、テンプレート内に含めるとバリデーションエラーになる。`skill`, `conditional`, `transform`, `script`, `review` 等の実行ノードのみ使用すること。
 ```bash
 # fan_out ノードの template を PATCH で上書き
@@ -376,7 +382,7 @@ hq dag update-node <wf-id> fan_out_1 /tmp/t.json
 - 書き込み（create / put / publish / dag 操作）は **PMロールのみ**。Engineer / accountant では 403 が返る。読み取り（fetch）は全メンバー可。
 - ノード/エッジ操作は各ステップでドラフトに自動保存され、バリデーション結果がレスポンスに含まれる。
 - `hq dag validate` で公開前にフル検証できる。publish 時の想定外エラーを防止できる。
-- 全文 JSON 操作（`hq put dag-workflow`）も引き続き利用可能だが、**ノード/エッジ操作APIの方が推奨**。
+- 全文 JSON 操作（`hq put dag-workflow`）も引き続き利用可能だが、**ノード/エッジ操作APIの方が推奨**（型の取り違えで 400 になりやすい）。
 ### 実行フロー（ランタイム側、参考）
@@ -490,6 +496,63 @@ input_data: { "items": [{ "title": "Item A" }, { "title": "Item B" }, { "title":
 output_data: { "items": [{ "title": "Item A" }, { "title": "Item C" }] }
 ```
+### Script ノード（決定的処理、LLM不要）v3.54.0〜
+Script ノードは **LLM を使わない決定的なデータ処理** を DAG 内に挟み込むためのノード。トークンコストもかからず、出力形式のブレも発生しない。ミニオン標準搭載の `python3` または `node` でインラインスクリプトを `child_process` 実行する。
+**静的バリデーション要件:**
+- `assigned_role` 必須（pm / engineer / accountant のいずれか）
+- `script_runtime`: `'python'` または `'node'`
+- `script_source`: 非空のスクリプト本文
+- `script_timeout_seconds`: 任意（デフォルト 60、範囲 1–600）
+**I/O プロトコル（skill / transform と完全に揃う）:**
+- 入力: `input_data` (incoming edge から渡る JSON object) → スクリプトの **stdin に JSON 1 個** として書き込まれる
+- 出力: スクリプトが **stdout に JSON object 1 個を書く** → そのままパースされて `output_data` として `node-complete` に送られる
+- outgoing edge に contract が貼ってあれば HQ が `output_data` を validate（skill / transform と同じ runtime validation 経路）
+**failure モード（いずれも `status: failed`、stderr が `output_summary` に格納される）:**
+- 非 0 終了
+- stdout が JSON parse 不能 / object でない（配列・プリミティブは不可）
+- `script_timeout_seconds` 超過（プロセスは SIGKILL）
+- `script_runtime` が unsupported
+**典型用途:**
+```python
+# script_runtime: "python", input edge contract: { items: array<item> }
+# output edge contract: { items: array<item>, total: number }
+import sys, json
+data = json.load(sys.stdin)
+items = [it for it in data["items"] if it.get("score", 0) >= 0.8]
+json.dump({"items": items, "total": len(items)}, sys.stdout)
+```
+```javascript
+// script_runtime: "node", URL 一覧から domain ごとにグルーピング
+let raw = ''
+process.stdin.on('data', c => raw += c)
+process.stdin.on('end', () => {
+  const data = JSON.parse(raw)
+  const groups = {}
+  for (const url of data.urls) {
+    const host = new URL(url).host
+    ;(groups[host] ||= []).push(url)
+  }
+  process.stdout.write(JSON.stringify({ groups }))
+})
+```
+**制約:**
+- 追加ライブラリのインストール（pip / npm install）は未対応。ミニオン標準搭載のもののみ使用可能
+- tmux セッションは作らず、ミニオンのエージェントプロセス内で `child_process.spawn` する
+- 並列実行上限は skill / transform と共通（`concurrency-manager` の `MAX_CONCURRENT=2`）
 ### DAG 構築時のノード選定フロー
 スキルは汎用的で再利用可能な資産であり、ワークフロー固有の contract に合わせて SKILL.md を改修することは原則行わない。代わりに以下のフローで判断する:
@@ -521,7 +584,7 @@ Review ノードはレビューゲート。`review_status=review_pending` で下
 - `approved` にすると `approved` 種別のエッジで下流に進む
 - `revision_requested` にすると `revision` 種別のエッジで差し戻し先に戻る
-レガシー線形パイプラインの差し戻しは `revision-watcher` デーモン + `/api/minion/pending-revisions` + `/api/minion/revision-reset` で処理される。DAGの差し戻しはサーバ側カスケードで自動処理。
+差し戻しはサーバ側のカスケードで自動処理される（`revision` 種別のエッジが指す上流ノード以降が `pending` に戻り再実行される）。
 ### デバッグ
@@ -656,17 +719,14 @@ curl -X PATCH "$HQ_URL/api/minion/projects/<project-id>/tasks/<task-id>" \
   -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \
   -d '{"status":"doing"}'
-# レビュー依頼
+# レビュー依頼（acceptance_criteria を全て満たした後）
 curl -X PATCH "$HQ_URL/api/minion/projects/<project-id>/tasks/<task-id>" \
   -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \
   -d '{"status":"review"}'
-# 完了
-curl -X PATCH "$HQ_URL/api/minion/projects/<project-id>/tasks/<task-id>" \
-  -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \
-  -d '{"status":"done"}'
 ```
+> **重要**: ミニオン自身は `done` へ直接遷移してはいけない。`done` 遷移はレビュアー（人間または別のミニオン）の責務。受け入れ要件達成後は `review` で停止し、承認を待つこと。
 ### 共通の注意
 - **`status_changed_at` を手動で渡してはならない**。サーバ側で自動更新される(stalled 検出に使われる)。
@@ -763,20 +823,19 @@ minion-cli skill list --local
 minion-cli skill fetch <name>
 ```
-### ワークフローが実行されない
+### DAG ワークフローが実行されない
 ```bash
-# ローカルワークフロー一覧 (next_run を確認)
-curl -s "http://localhost:8080/api/workflows" \
-  -H "Authorization: Bearer $API_TOKEN"
+# pending ノードが自分に割り当てられているか確認
+curl -s "$HQ_URL/api/dag/minion/pending-nodes" \
+  -H "Authorization: Bearer $API_TOKEN" | jq
-# 手動トリガー
-curl -s -X POST "http://localhost:8080/api/workflows/trigger" \
-  -H "Authorization: Bearer $API_TOKEN" \
-  -H "Content-Type: application/json" \
-  -d '{ "workflow_id": "<workflow-uuid>" }'
+# dag-step-poller のログを確認
+tail -f ~/.minion/logs/agent.log | grep '\[DAG'
 ```
+PMロールが不在のプロジェクトでは cron 発火が行われない。`hq list dag-workflows <project-id>` の `my_role` を確認すること。
 ### エージェントの状態確認
 ```bash

package/linux/routes/chat.js CHANGED Viewed

@@ -362,6 +362,29 @@ async function buildContextPrefix(message, context, sessionId, workspaceId, refe
     )
   }
+  // Web page extraction guidance (experimental, v3.53.0)
+  if (!sessionId) {
+    const port = require('../../core/config').config.AGENT_PORT
+    parts.push(
+      '[Webページ読み取りについて 🧪 experimental]',
+      'Webページの読み取り・要約・情報抽出が必要なときは、まず以下のローカルAPIを試すこと:',
+      '',
+      '```bash',
+      `curl -X POST http://localhost:${port}/api/web/extract \\`,
+      '  -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \\',
+      '  -d \'{"url": "対象URL", "hint": "抽出したい内容を短く"}\'',
+      '```',
+      '',
+      'このAPIは内部で Playwright + Readability を回し、抽出済みJSONだけを返すため、',
+      'DOM全体がチャットに流れ込んでトークン肥大化することを防げる。',
+      '初回アクセスで学習したセレクタはSQLiteにキャッシュされ、2回目以降はLLM呼び出しなしで抽出される。',
+      '',
+      'Playwright MCP (`mcp__playwright__*`) は **ログイン・フォーム入力・複数画面の対話操作**が必要な場合のみ使用する。',
+      '単純な閲覧・要約・一覧取得用途ではMCPを使わない。',
+      ''
+    )
+  }
   // File output guidance — always inject on new sessions
   if (!sessionId) {
     parts.push(
@@ -441,26 +464,11 @@ async function buildContextPrefix(message, context, sessionId, workspaceId, refe
           )
         }
         break
-      case 'workflow':
-        if (context.projectId) {
-          const label = context.workflowName
-            ? `ワークフロー「${context.workflowName}」`
-            : 'ワークフロー'
-          parts.push(
-            `ユーザーはHQダッシュボードで${label}を閲覧しています。`,
-            `ワークフロー情報を取得するには以下を実行してください:`,
-            `  hq fetch workflow ${context.workflowName || context.workflowId}`,
-            `プロジェクトコンテキスト:`,
-            `  hq fetch project-context ${context.projectId}`,
-            `取得した内容をもとに回答してください。`
-          )
-        }
-        break
       case 'dag-workflow':
         if (context.projectId && context.dagWorkflowId) {
           parts.push(
             `ユーザーはHQダッシュボードで DAG ワークフロー (ID: ${context.dagWorkflowId}) のエディタ/詳細を閲覧しています。`,
-            `DAG ワークフローはノード/エッジ形式でスキル間の依存関係を表現し、fan-out / join / conditional / transform / review をサポートします。`,
+            `DAG ワークフローはノード/エッジ形式でスキル間の依存関係を表現し、fan-out / join / conditional / transform / script / review をサポートします。`,
             `DAG ワークフロー情報を取得するには以下を実行してください:`,
             `  hq fetch dag-workflow ${context.dagWorkflowId}`,
             `プロジェクトコンテキスト:`,
@@ -770,6 +778,11 @@ function streamViaLegacyLlmCommand(res, prompt, sessionId, workspaceId, original
     child.on('close', async (code) => {
       activeChatChild = null
+      console.log(`[Chat] child closed: code=${code}, response=${fullResponse.length}chars, turns=${turnCount}, stderr=${stderrBuffer.length}bytes, session=${resolvedSessionId}`)
+      if (stderrBuffer.trim()) {
+        console.log(`[Chat] final stderr (tail 500): ${stderrBuffer.slice(-500)}`)
+      }
       // Store messages in chat-store
       if (resolvedSessionId) {
         // If this was a new session, also store the user message now
@@ -782,11 +795,15 @@ function streamViaLegacyLlmCommand(res, prompt, sessionId, workspaceId, original
         }
       }
-      // If exit code is non-zero and no response was generated, send error
-      if (code !== 0 && !fullResponse) {
+      if (code !== 0) {
         const errorMsg = stderrBuffer.trim() || `Claude CLI exited with code ${code}`
-        console.error(`[Chat] CLI failed (exit ${code}): ${errorMsg}`)
-        const errorEvent = JSON.stringify({ type: 'error', error: errorMsg })
+        console.error(`[Chat] CLI failed (exit ${code}, partial=${!!fullResponse}): ${errorMsg}`)
+        const errorEvent = JSON.stringify({
+          type: 'error',
+          error: errorMsg,
+          partial: !!fullResponse,
+          exit_code: code,
+        })
         res.write(`data: ${errorEvent}\n\n`)
       }

package/linux/server.js CHANGED Viewed

@@ -85,6 +85,7 @@ const { todoRoutes } = require('../core/routes/todos')
 const { emailRoutes } = require('../core/routes/emails')
 const { daemonRoutes } = require('../core/routes/daemons')
 const { llmRoutes } = require('../core/routes/llm')
+const { webRoutes } = require('../core/routes/web')
 // Linux-specific routes
 const { commandRoutes, getProcessManager, getAllowedCommands } = require('./routes/commands')
@@ -298,6 +299,7 @@ async function registerAllRoutes(app) {
   await app.register(emailRoutes)
   await app.register(daemonRoutes, { heartbeatStatus: () => ({ running: !!heartbeatTimer, last_beat_at: lastBeatAt }) })
   await app.register(llmRoutes)
+  await app.register(webRoutes)
   // Linux-specific routes
   await app.register(commandRoutes)

package/mac/server.js CHANGED Viewed

@@ -72,6 +72,7 @@ const { todoRoutes } = require('../core/routes/todos')
 const { emailRoutes } = require('../core/routes/emails')
 const { daemonRoutes } = require('../core/routes/daemons')
 const { llmRoutes } = require('../core/routes/llm')
+const { webRoutes } = require('../core/routes/web')
 // macOS-specific routes
 const { commandRoutes, getProcessManager, getAllowedCommands } = require('./routes/commands')
@@ -284,6 +285,7 @@ async function registerAllRoutes(app) {
   await app.register(emailRoutes)
   await app.register(daemonRoutes, { heartbeatStatus: () => ({ running: !!heartbeatTimer, last_beat_at: lastBeatAt }) })
   await app.register(llmRoutes)
+  await app.register(webRoutes)
   // macOS-specific routes
   await app.register(commandRoutes)

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@geekbeer/minion",
-  "version": "3.52.0",
+  "version": "3.55.1",
   "description": "AI Agent runtime for Minion - manages status and skill deployment on VPS",
   "main": "linux/server.js",
   "bin": {
@@ -33,13 +33,17 @@
     "db:migration:new": "node scripts/new-migration.js"
   },
   "dependencies": {
+    "@mozilla/readability": "^0.5.0",
     "croner": "^9.0.0",
     "fastify": "^5.2.2",
+    "linkedom": "^0.18.0",
+    "turndown": "^7.2.0",
     "ws": "^8.0.0"
   },
   "optionalDependencies": {
     "better-sqlite3": "^11.0.0",
-    "node-pty": "^1.0.0"
+    "node-pty": "^1.0.0",
+    "playwright": "^1.48.0"
   },
   "engines": {
     "node": ">=22.0.0"

package/rules/core.md CHANGED Viewed

@@ -15,10 +15,7 @@ You are an AI agent running on a Minion VPS, managed by @geekbeer/minion.
 Project (組織・課金単位)
 ├── Context (markdown, PMが更新)
 ├── Members (minion + role: pm | engineer | accountant)
-├── Workflows (スキルの線形パイプライン + オプションcronスケジュール)
-│   ├── Versions (pipeline の不変スナップショット)
-│   └── Executions (実行履歴, ステップごとの進捗)
-└── DAG Workflows (ノード/エッジ形式のワークフロー, beta)
+└── DAG Workflows (ノード/エッジ形式のワークフロー)
     ├── Versions (graph の不変スナップショット)
     └── Executions (node_executions の集合, scope-aware)
@@ -26,14 +23,14 @@ Minion
 └── Routines (ミニオンローカルの定期タスク, cron付き)
 ```
-- **Workflow**: プロジェクトスコープ。線形パイプライン形式のバージョン管理ワークフロー。ミニオンAPIで push/fetch 可能。
-- **DAG Workflow**: プロジェクトスコープ。ノード/エッジで依存関係を表現する新方式。fan-out / join / conditional / transform / review をサポート。作成・編集はHQダッシュボードのみ、ミニオンは `dag-step-poller` で自動実行。詳細は `~/.minion/docs/api-reference.md` の「DAG Workflows」と `~/.minion/docs/task-guides.md` の「DAG ワークフロー」を参照。
+- **DAG Workflow**: プロジェクトスコープ。ノード/エッジで依存関係を表現するワークフロー。fan-out / join / conditional / transform / script / review をサポート。作成・編集はHQダッシュボードまたはミニオンAPI、ランタイムは `dag-step-poller` が自動実行。詳細は `~/.minion/docs/api-reference.md` の「DAG Workflows」と `~/.minion/docs/task-guides.md` の「DAG ワークフロー」を参照。
   - **PMロールで編集する場合の重要な規則**:
     - ノード/エッジ/contract の追加・更新は**個別API** (`/nodes` `/edges` `/contracts`) を使うこと。`PUT /dag-workflows/:id` による graph 全文PUTは型の取り違えが起きやすく、バリデーションエラーで 400 が返る
     - `edge.contract` は**単一のContract名（string）**のみ。配列は不可。複数の型構造を束ねたい場合は、それらを内包する複合Contractを1つ定義する
     - Contract内で `List<別Contract>` を表現するには `type: 'array'` + `items: "別Contract名"` を使う（詳細は `~/.minion/docs/api-reference.md` の「Contracts API」を参照）
     - **Contract はランタイムで強制される型定義**。`node-complete` 報告時に outgoing edge の contract で `output_data` が検証され、違反はノード `failed` 扱い。スキルが contract に沿った `## Output Data` を出せない場合は **transform ノードをスキルと下流の間に挟んで整形**すること。スキル側の SKILL.md を各ワークフロー専用に改修するのは原則 NG（スキルは汎用資産）
     - **transform ノードの I/O 型は edge の contract から自動導出**。incoming edge と outgoing edge にそれぞれ contract を必ず貼ること。`transform_instruction` は contract だけで意図が伝わらない場合の補足ヒント（任意）
+    - **script ノード (v3.54.0〜)** は LLM を使わない決定的処理用。`script_runtime` (`'python'` or `'node'`) と `script_source` を指定。input_data を stdin で JSON 受け取り → output_data を stdout に JSON 出力する規約。outgoing edge に contract を貼れば transform と同じ runtime validation が走る。LLMトークンを節約したい・出力ブレを許容できない定型処理に使う。詳細は `~/.minion/docs/task-guides.md` の「Script ノード」を参照
     - **fan_out の incoming edge に contract を貼る場合**、`fan_out_source` が指すフィールドが contract 内に `type='array'` として宣言されている必要がある（静的検証で弾かれる）
 - **Routine**: ミニオンスコープ。ミニオンローカルの定期タスク。
 - **Project Tasks / Milestones**: プロジェクトスコープ。**人間+ミニオンが共有するタスクボード**(5段階Kanban: `backlog`→`todo`→`doing`→`review`→`done`)とロードマップ(マイルストーン)。ミニオンは `/api/minion/projects/:projectId/{tasks,milestones,health}` で操作可能。
@@ -103,7 +100,27 @@ minion-cli --version                      # バージョン確認
 `http://localhost:8080` — 認証: `Authorization: Bearer $API_TOKEN`
-主なカテゴリ: Health, Skills, Workflows, Executions, Terminal, Files, Commands, Permissions, Admin (HQ-pushed freeze)
+主なカテゴリ: Health, Skills, Executions, Terminal, Files, Commands, Permissions, Admin (HQ-pushed freeze), Web Extraction (experimental)
+#### Web Page Extraction 🧪 (experimental, v3.53.0〜)
+Webページの読み取り・要約・情報抽出には、**Playwright MCP より先に** ローカルAPI `POST /api/web/extract` を試すこと。
+このAPIは内部でヘッドレスブラウザ→本文クリーン (Readability) →セレクタ抽出 (LLMサブプロセスで自動学習) →JSON 返却までを完結させる。**メインセッションに巨大な DOM が流れ込まないため、トークン肥大化やセッション終了を防げる。**
+```bash
+curl -X POST http://localhost:8080/api/web/extract \
+  -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \
+  -d '{"url": "https://example.com/article/123", "hint": "本文と著者を抽出"}'
+```
+レシピは初回アクセス時に LLM (Haiku) で生成・SQLite (`page_recipes` テーブル) に保存され、2回目以降の構造的に同じページでは LLM 呼び出しなしで抽出される。
+Playwright MCP (`mcp__playwright__*`) は **フォーム入力・クリック・複数画面遷移など対話的な操作**が必要な場合のみ使用すること。単に「ページを読む」目的では MCP を使わない。
+**実験的機能**: レスポンス形状は予告なく変わる可能性がある。要件: (1) primary LLM 設定済み (`PUT /api/llm/config` で `claude` 等を選択、`hq llm primary <name>` でも可) または `ANTHROPIC_API_KEY` シークレット設定済み、(2) ホスト上で `npx playwright install chromium` 実行済み。primary LLM が設定されていれば API キー不要 (Claude Code CLI の認証情報を再利用)。
+詳細仕様は `~/.minion/docs/api-reference.md` の「Web Page Extraction」セクション、ユースケースは `~/.minion/docs/task-guides.md` の「Webページの読み取り・要約」を参照。
 #### Billing-Driven Freeze (v3.52.0〜)
@@ -182,7 +199,7 @@ Note: Codex CLI の `.codex/` ディレクトリはLLMからの直接編集が
 `$HQ_URL/api/minion/*` — 認証: `Authorization: Bearer $API_TOKEN`
-主なカテゴリ: Projects, Context, Workflows, DAG Workflows, Skills, Executions, Routines, Reports
+主なカテゴリ: Projects, Context, DAG Workflows, Skills, Executions, Routines, Reports
 DAG ワークフローのランタイム API は `$HQ_URL/api/dag/minion/*`（pending-nodes / claim-node / node-complete / dag-cron-tick）。`dag-step-poller` と `dag-cron-poller` デーモンが自動でポーリングするため、通常ミニオンのAI側から直接叩くことは無い。
@@ -204,7 +221,7 @@ Routine 実行中は以下もtmuxセッション環境で利用可能:
 - `MINION_ROUTINE_ID` — ルーティンUUID
 - `MINION_ROUTINE_NAME` — ルーティン名
-**変数**（ミニオン変数・プロジェクト変数・ワークフロー変数）はスキル本文の `{{VAR_NAME}}` テンプレートとして実行時に展開される。スキル作成時にパラメータ化したい値は `{{変数名}}` で記述すること。展開優先順位: ミニオン変数 < プロジェクト変数 < ワークフロー変数（後者が優先）。
+**変数**（ミニオン変数・プロジェクト変数）はスキル本文の `{{VAR_NAME}}` テンプレートとして実行時に展開される。スキル作成時にパラメータ化したい値は `{{変数名}}` で記述すること。展開優先順位: ミニオン変数 < プロジェクト変数（後者が優先）。
 **シークレット**（ミニオンシークレット）はサーバー起動時に `process.env` にロードされ、全子プロセスで環境変数 `$SECRET_NAME` として利用可能。APIキーやパスワード等の機密情報に使用する。シークレットは `{{VAR}}` テンプレートでは展開されない。

package/win/routes/chat.js CHANGED Viewed

@@ -423,6 +423,29 @@ async function buildContextPrefix(message, context, sessionId, workspaceId, refe
     )
   }
+  // Web page extraction guidance (experimental, v3.53.0)
+  if (!sessionId) {
+    const port = require('../../core/config').config.AGENT_PORT
+    parts.push(
+      '[Webページ読み取りについて 🧪 experimental]',
+      'Webページの読み取り・要約・情報抽出が必要なときは、まず以下のローカルAPIを試すこと:',
+      '',
+      '```bash',
+      `curl -X POST http://localhost:${port}/api/web/extract \\`,
+      '  -H "Authorization: Bearer $API_TOKEN" -H "Content-Type: application/json" \\',
+      '  -d \'{"url": "対象URL", "hint": "抽出したい内容を短く"}\'',
+      '```',
+      '',
+      'このAPIは内部で Playwright + Readability を回し、抽出済みJSONだけを返すため、',
+      'DOM全体がチャットに流れ込んでトークン肥大化することを防げる。',
+      '初回アクセスで学習したセレクタはSQLiteにキャッシュされ、2回目以降はLLM呼び出しなしで抽出される。',
+      '',
+      'Playwright MCP (`mcp__playwright__*`) は **ログイン・フォーム入力・複数画面の対話操作**が必要な場合のみ使用する。',
+      '単純な閲覧・要約・一覧取得用途ではMCPを使わない。',
+      ''
+    )
+  }
   // File output guidance — always inject on new sessions
   if (!sessionId) {
     parts.push(
@@ -502,24 +525,11 @@ async function buildContextPrefix(message, context, sessionId, workspaceId, refe
           )
         }
         break
-      case 'workflow':
-        if (context.projectId) {
-          const label = context.workflowName ? `ワークフロー「${context.workflowName}」` : 'ワークフロー'
-          parts.push(
-            `ユーザーはHQダッシュボードで${label}を閲覧しています。`,
-            `ワークフロー情報を取得するには以下を実行してください:`,
-            `  hq fetch workflow ${context.workflowName || context.workflowId}`,
-            `プロジェクトコンテキスト:`,
-            `  hq fetch project-context ${context.projectId}`,
-            `取得した内容をもとに回答してください。`
-          )
-        }
-        break
       case 'dag-workflow':
         if (context.projectId && context.dagWorkflowId) {
           parts.push(
             `ユーザーはHQダッシュボードで DAG ワークフロー (ID: ${context.dagWorkflowId}) のエディタ/詳細を閲覧しています。`,
-            `DAG ワークフローはノード/エッジ形式でスキル間の依存関係を表現し、fan-out / join / conditional / transform / review をサポートします。`,
+            `DAG ワークフローはノード/エッジ形式でスキル間の依存関係を表現し、fan-out / join / conditional / transform / script / review をサポートします。`,
             `DAG ワークフロー情報を取得するには以下を実行してください:`,
             `  hq fetch dag-workflow ${context.dagWorkflowId}`,
             `プロジェクトコンテキスト:`,
@@ -790,6 +800,12 @@ function streamViaLegacyLlmCommand(res, prompt, sessionId, workspaceId, original
     child.on('close', async (code) => {
       activeChatChild = null
+      console.log(`[Chat] child closed: code=${code}, response=${fullResponse.length}chars, turns=${turnCount}, stderr=${stderrBuffer.length}bytes, session=${resolvedSessionId}`)
+      if (stderrBuffer.trim()) {
+        console.log(`[Chat] final stderr (tail 500): ${stderrBuffer.slice(-500)}`)
+      }
       if (resolvedSessionId) {
         if (!sessionId) {
           await chatStore.addMessage(resolvedSessionId, { role: 'user', content: originalMessage || prompt }, undefined, workspaceId)
@@ -798,9 +814,15 @@ function streamViaLegacyLlmCommand(res, prompt, sessionId, workspaceId, original
           await chatStore.addMessage(resolvedSessionId, { role: 'assistant', content: fullResponse }, turnCount, workspaceId)
         }
       }
-      if (code !== 0 && !fullResponse) {
+      if (code !== 0) {
         const errorMsg = stderrBuffer.trim() || `Claude CLI exited with code ${code}`
-        res.write(`data: ${JSON.stringify({ type: 'error', error: errorMsg })}\n\n`)
+        console.error(`[Chat] CLI failed (exit ${code}, partial=${!!fullResponse}): ${errorMsg}`)
+        res.write(`data: ${JSON.stringify({
+          type: 'error',
+          error: errorMsg,
+          partial: !!fullResponse,
+          exit_code: code,
+        })}\n\n`)
       }
       const session = await chatStore.load(workspaceId)

package/win/server.js CHANGED Viewed

@@ -67,6 +67,7 @@ const { todoRoutes } = require('../core/routes/todos')
 const { emailRoutes } = require('../core/routes/emails')
 const { daemonRoutes } = require('../core/routes/daemons')
 const { llmRoutes } = require('../core/routes/llm')
+const { webRoutes } = require('../core/routes/web')
 // Validate configuration
 validate()
@@ -232,6 +233,7 @@ async function registerRoutes(app) {
   await app.register(emailRoutes)
   await app.register(daemonRoutes, { heartbeatStatus: () => ({ running: !!heartbeatTimer, last_beat_at: lastBeatAt }) })
   await app.register(llmRoutes)
+  await app.register(webRoutes)
   // Shutdown endpoint — allows detached restart/update scripts to trigger
   // graceful shutdown (offline heartbeat) before force-killing the process.