npm - muonroi-cli - Versions diffs - 1.4.1 → 1.5.0 - Mend

muonroi-cli 1.4.1 → 1.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (172) hide show

package/LICENSE +21 -21
package/README.md +122 -122
package/dist/packages/agent-harness-core/src/predicate.d.ts +1 -1
package/dist/src/agent-harness/__tests__/mock-model.spec.js +48 -1
package/dist/src/agent-harness/mock-model.d.ts +11 -0
package/dist/src/agent-harness/mock-model.js +21 -0
package/dist/src/cli/cost-forensics.js +12 -12
package/dist/src/council/__tests__/clarification-prompt.test.js +51 -0
package/dist/src/council/__tests__/clarifier-ready-gate.test.js +32 -0
package/dist/src/council/__tests__/decisions-lock.test.js +17 -1
package/dist/src/council/__tests__/oauth-reachable.test.d.ts +1 -0
package/dist/src/council/__tests__/oauth-reachable.test.js +31 -0
package/dist/src/council/__tests__/parse-outcome-fallback.test.js +11 -0
package/dist/src/council/clarifier.js +9 -1
package/dist/src/council/debate.js +5 -1
package/dist/src/council/decisions-lock.js +3 -3
package/dist/src/council/index.js +12 -5
package/dist/src/council/leader.d.ts +0 -17
package/dist/src/council/leader.js +22 -15
package/dist/src/council/planner.js +1 -1
package/dist/src/council/prompts.js +63 -57
package/dist/src/council/types.d.ts +7 -0
package/dist/src/ee/__tests__/ee-onboarding.test.d.ts +1 -0
package/dist/src/ee/__tests__/ee-onboarding.test.js +32 -0
package/dist/src/ee/auth.d.ts +9 -0
package/dist/src/ee/auth.js +19 -0
package/dist/src/ee/ee-onboarding.d.ts +5 -0
package/dist/src/ee/ee-onboarding.js +76 -0
package/dist/src/generated/version.d.ts +1 -1
package/dist/src/generated/version.js +1 -1
package/dist/src/headless/output.js +6 -4
package/dist/src/headless/output.test.js +4 -3
package/dist/src/index.js +20 -1
package/dist/src/mcp/__tests__/auto-setup.test.js +74 -0
package/dist/src/mcp/__tests__/client-pool.spec.d.ts +1 -0
package/dist/src/mcp/__tests__/client-pool.spec.js +98 -0
package/dist/src/mcp/__tests__/parallel-build.spec.d.ts +1 -0
package/dist/src/mcp/__tests__/parallel-build.spec.js +67 -0
package/dist/src/mcp/__tests__/smart-filter.test.js +56 -0
package/dist/src/mcp/auto-setup.js +56 -2
package/dist/src/mcp/client-pool.d.ts +46 -0
package/dist/src/mcp/client-pool.js +212 -0
package/dist/src/mcp/oauth-callback.js +2 -2
package/dist/src/mcp/parse-headers.test.js +14 -14
package/dist/src/mcp/runtime.d.ts +28 -0
package/dist/src/mcp/runtime.js +117 -51
package/dist/src/mcp/self-verify-runner.d.ts +14 -0
package/dist/src/mcp/self-verify-runner.js +38 -0
package/dist/src/mcp/setup-guide-text.d.ts +9 -0
package/dist/src/mcp/setup-guide-text.js +84 -0
package/dist/src/mcp/smart-filter.js +49 -0
package/dist/src/mcp/smoke.test.js +43 -43
package/dist/src/mcp/tools-server.d.ts +7 -0
package/dist/src/mcp/tools-server.js +19 -22
package/dist/src/models/catalog.json +349 -349
package/dist/src/ops/__tests__/doctor-ee-health.test.js +21 -0
package/dist/src/ops/doctor.d.ts +3 -2
package/dist/src/ops/doctor.js +47 -11
package/dist/src/ops/doctor.test.js +4 -3
package/dist/src/orchestrator/__tests__/mcp-capability-block.test.d.ts +1 -0
package/dist/src/orchestrator/__tests__/mcp-capability-block.test.js +39 -0
package/dist/src/orchestrator/__tests__/project-stack.test.d.ts +1 -0
package/dist/src/orchestrator/__tests__/project-stack.test.js +65 -0
package/dist/src/orchestrator/batch-turn-runner.js +7 -11
package/dist/src/orchestrator/message-processor.js +57 -27
package/dist/src/orchestrator/orchestrator.js +26 -0
package/dist/src/orchestrator/prompts.d.ts +51 -0
package/dist/src/orchestrator/prompts.js +257 -134
package/dist/src/orchestrator/scope-ceiling.js +6 -1
package/dist/src/orchestrator/stream-runner.js +20 -15
package/dist/src/orchestrator/text-tool-call-detector.test.js +13 -13
package/dist/src/pil/__tests__/clarity-gate.test.js +24 -215
package/dist/src/pil/__tests__/config.test.js +1 -17
package/dist/src/pil/__tests__/discovery.test.js +144 -11
package/dist/src/pil/__tests__/layer1-intent-trace.test.js +7 -2
package/dist/src/pil/__tests__/layer1-intent.test.js +3 -0
package/dist/src/pil/__tests__/layer16-clarity.test.js +32 -116
package/dist/src/pil/__tests__/layer4-gsd.test.js +37 -0
package/dist/src/pil/__tests__/layer6-output.test.js +137 -18
package/dist/src/pil/__tests__/llm-classify.test.js +49 -2
package/dist/src/pil/agent-operating-contract.d.ts +1 -1
package/dist/src/pil/agent-operating-contract.js +2 -0
package/dist/src/pil/agent-operating-contract.test.js +7 -2
package/dist/src/pil/cheap-model-playbook.js +35 -35
package/dist/src/pil/cheap-model-workbooks.js +16 -13
package/dist/src/pil/clarity-gate.d.ts +21 -19
package/dist/src/pil/clarity-gate.js +26 -153
package/dist/src/pil/config.d.ts +9 -1
package/dist/src/pil/config.js +15 -4
package/dist/src/pil/discovery.js +211 -136
package/dist/src/pil/layer1-intent.d.ts +12 -0
package/dist/src/pil/layer1-intent.js +283 -38
package/dist/src/pil/layer1-intent.test.js +210 -4
package/dist/src/pil/layer16-clarity.d.ts +25 -11
package/dist/src/pil/layer16-clarity.js +19 -306
package/dist/src/pil/layer4-gsd.js +18 -6
package/dist/src/pil/layer6-output.d.ts +2 -0
package/dist/src/pil/layer6-output.js +137 -22
package/dist/src/pil/llm-classify.d.ts +26 -0
package/dist/src/pil/llm-classify.js +34 -5
package/dist/src/pil/native-capabilities-workbook.d.ts +1 -1
package/dist/src/pil/native-capabilities-workbook.js +82 -76
package/dist/src/pil/schema.d.ts +8 -0
package/dist/src/pil/schema.js +12 -1
package/dist/src/pil/task-tier-map.js +4 -0
package/dist/src/pil/types.d.ts +11 -1
package/dist/src/product-loop/done-gate.js +3 -3
package/dist/src/product-loop/loop-driver.js +18 -18
package/dist/src/product-loop/progress-snapshot.js +4 -4
package/dist/src/providers/auth/gemini-oauth.js +6 -15
package/dist/src/providers/auth/grok-oauth.js +6 -15
package/dist/src/providers/auth/openai-oauth.js +6 -15
package/dist/src/providers/mcp-vision-bridge.js +48 -48
package/dist/src/reporter/index.js +1 -1
package/dist/src/scaffold/bb-ecosystem-apply.js +47 -47
package/dist/src/scaffold/bb-quality-gate.js +5 -5
package/dist/src/scaffold/continuation-prompt.js +60 -60
package/dist/src/scaffold/init-new.js +453 -453
package/dist/src/self-qa/__tests__/scenario-planner.test.js +3 -3
package/dist/src/self-qa/agentic-loop.js +24 -19
package/dist/src/self-qa/spec-emitter.js +26 -23
package/dist/src/storage/__tests__/migrations.test.js +2 -2
package/dist/src/storage/interaction-log.js +5 -5
package/dist/src/storage/migrations.js +122 -122
package/dist/src/storage/sessions.js +42 -42
package/dist/src/storage/transcript.js +91 -84
package/dist/src/storage/usage.js +14 -14
package/dist/src/storage/workspaces.js +12 -12
package/dist/src/tools/__tests__/native-tools.test.d.ts +1 -0
package/dist/src/tools/__tests__/native-tools.test.js +53 -0
package/dist/src/tools/git-safety.d.ts +61 -0
package/dist/src/tools/git-safety.js +141 -0
package/dist/src/tools/git-safety.test.d.ts +1 -0
package/dist/src/tools/git-safety.test.js +111 -0
package/dist/src/tools/native-tools.d.ts +31 -0
package/dist/src/tools/native-tools.js +273 -0
package/dist/src/tools/registry-git-safety.test.d.ts +7 -0
package/dist/src/tools/registry-git-safety.test.js +92 -0
package/dist/src/tools/registry.js +39 -4
package/dist/src/ui/__tests__/markdown-render.test.d.ts +1 -0
package/dist/src/ui/__tests__/markdown-render.test.js +48 -0
package/dist/src/ui/app.js +0 -0
package/dist/src/ui/components/message-view.js +4 -1
package/dist/src/ui/components/structured-response-view.js +7 -3
package/dist/src/ui/components/tool-group.js +7 -1
package/dist/src/ui/markdown-render.d.ts +41 -0
package/dist/src/ui/markdown-render.js +223 -0
package/dist/src/ui/markdown.d.ts +10 -0
package/dist/src/ui/markdown.js +12 -35
package/dist/src/ui/slash/council-inspect.js +4 -4
package/dist/src/ui/slash/export.js +4 -4
package/dist/src/ui/utils/text.d.ts +8 -0
package/dist/src/ui/utils/text.js +16 -0
package/dist/src/ui/utils/text.test.d.ts +1 -0
package/dist/src/ui/utils/text.test.js +23 -0
package/dist/src/usage/ledger.js +48 -15
package/dist/src/utils/__tests__/footprint-gitignore.test.d.ts +1 -0
package/dist/src/utils/__tests__/footprint-gitignore.test.js +50 -0
package/dist/src/utils/clipboard-image.js +23 -23
package/dist/src/utils/open-url.d.ts +56 -0
package/dist/src/utils/open-url.js +58 -0
package/dist/src/utils/open-url.test.d.ts +1 -0
package/dist/src/utils/open-url.test.js +86 -0
package/dist/src/utils/settings.d.ts +12 -0
package/dist/src/utils/settings.js +48 -0
package/dist/src/utils/side-question.js +2 -2
package/dist/src/utils/skills.js +3 -3
package/dist/src/verify/__tests__/coverage-parsers.test.js +30 -30
package/dist/src/verify/environment.js +2 -1
package/package.json +1 -1
package/dist/src/pil/layer16-clarity.test.js +0 -31
/package/dist/src/{pil/layer16-clarity.test.d.ts → council/__tests__/clarification-prompt.test.d.ts} +0 -0

package/dist/src/models/catalog.json CHANGED Viewed

@@ -1,349 +1,349 @@
-{
-  "version": "2.2",
-  "updated_at": "2026-06-04",
-  "description": "Local fallback catalog: deepseek + siliconflow + openai (ChatGPT OAuth) + google (Gemini, via AI Studio key or Google OAuth). SiliconFlow pricing verified 2026-05-21; Gemini 2.5 pricing per ai.google.dev/pricing 2026-06-04 (3.x flash/pro entries APPROXIMATE — see per-model descriptions). Model IDs verified against ai.google.dev/gemini-api/docs/models 2026-06-04. See ./catalog.README.md for curation rationale.",
-  "models": [
-    {
-      "id": "deepseek-v4-flash",
-      "name": "DeepSeek V4 Flash (native)",
-      "provider": "deepseek",
-      "tier": "fast",
-      "context_window": 128000,
-      "max_output_tokens": 8000,
-      "input_price_per_million": 0.27,
-      "output_price_per_million": 1.1,
-      "cached_input_price_per_million": 0.027,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Native DeepSeek V4 Flash. Tool-call capable. More expensive than SiliconFlow's hosted V4-Flash ($0.14/$0.28) — prefer SF unless rate-limited.",
-      "aliases": ["deepseek-flash-native"],
-      "supports_vision": false
-    },
-    {
-      "id": "deepseek-v4-pro",
-      "name": "DeepSeek V4 Pro (native)",
-      "provider": "deepseek",
-      "tier": "premium",
-      "context_window": 128000,
-      "max_output_tokens": 16000,
-      "input_price_per_million": 0.55,
-      "output_price_per_million": 2.19,
-      "cached_input_price_per_million": 0.055,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Native DeepSeek V4 Pro. Tool-call capable. Cheaper than SF-hosted V4-Pro ($1.74/$3.48) — this is the premium-tier default.",
-      "aliases": ["deepseek-pro-native"],
-      "supports_vision": false
-    },
-    {
-      "id": "deepseek-ai/DeepSeek-V4-Flash",
-      "name": "DeepSeek V4 Flash (via SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "fast",
-      "context_window": 1049000,
-      "max_output_tokens": 8000,
-      "input_price_per_million": 0.14,
-      "output_price_per_million": 0.28,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "DeepSeek V4 Flash on SiliconFlow — cheaper than native. 1M context. Reasoning_tokens share output budget.",
-      "aliases": ["deepseek-v4-flash-sf", "deepseek-flash-sf"],
-      "supports_vision": false
-    },
-    {
-      "id": "deepseek-ai/DeepSeek-V4-Pro",
-      "name": "DeepSeek V4 Pro (via SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "premium",
-      "context_window": 1049000,
-      "max_output_tokens": 16000,
-      "input_price_per_million": 1.74,
-      "output_price_per_million": 3.48,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "DeepSeek V4 Pro on SiliconFlow. Prefer native deepseek-v4-pro for cost ($0.55/$2.19) when key available.",
-      "aliases": ["deepseek-v4-pro-sf", "deepseek-pro-sf"],
-      "supports_vision": false
-    },
-    {
-      "id": "Qwen/Qwen3-8B",
-      "name": "Qwen3 8B (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "fast",
-      "context_window": 131072,
-      "max_output_tokens": 8192,
-      "input_price_per_million": 0.06,
-      "output_price_per_million": 0.06,
-      "reasoning": false,
-      "thinking_type": "hybrid",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Cheapest tool-capable SiliconFlow model. Symmetric pricing — ideal for mechanical tool-execution loops. Supports thinking/non-thinking hybrid mode.",
-      "aliases": ["qwen3-8b-sf", "alibaba/Qwen3-8B"],
-      "supports_vision": false
-    },
-    {
-      "id": "Qwen/Qwen3-30B-A3B-Instruct-2507",
-      "name": "Qwen3 30B A3B Instruct (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "balanced",
-      "context_window": 262144,
-      "max_output_tokens": 8192,
-      "input_price_per_million": 0.09,
-      "output_price_per_million": 0.3,
-      "reasoning": false,
-      "thinking_type": null,
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "MoE balanced default. 3B active params keeps cost low while 30B total gives strong instruction following + tool use. Recommended SF balanced pick.",
-      "aliases": ["qwen3-30b-instruct-sf", "alibaba/Qwen3-30B-A3B-Instruct-2507"],
-      "supports_vision": false
-    },
-    {
-      "id": "Qwen/Qwen3-Coder-30B-A3B-Instruct",
-      "name": "Qwen3 Coder 30B A3B (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "balanced",
-      "context_window": 262144,
-      "max_output_tokens": 8192,
-      "input_price_per_million": 0.07,
-      "output_price_per_million": 0.28,
-      "reasoning": false,
-      "thinking_type": null,
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Coding-specialized Qwen3 MoE. Cheaper than the generic Qwen3-30B variant. Use when pil.taskType is coding (router override pending).",
-      "aliases": ["qwen3-coder-sf", "qwen-coder-sf", "alibaba/Qwen3-Coder-30B-A3B-Instruct"],
-      "supports_vision": false
-    },
-    {
-      "id": "deepseek-ai/DeepSeek-V3.2",
-      "name": "DeepSeek V3.2 (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "balanced",
-      "context_window": 163840,
-      "max_output_tokens": 8192,
-      "input_price_per_million": 0.27,
-      "output_price_per_million": 0.42,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Cheap DeepSeek reasoning option for balanced-tier turns that benefit from CoT. Tool-capable. Use when Qwen3-30B is not strong enough on reasoning.",
-      "aliases": ["deepseek-v3.2-sf"],
-      "supports_vision": false
-    },
-    {
-      "id": "deepseek-ai/DeepSeek-R1",
-      "name": "DeepSeek R1 (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "premium",
-      "context_window": 163840,
-      "max_output_tokens": 16384,
-      "input_price_per_million": 0.5,
-      "output_price_per_million": 2.18,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Cheaper premium reasoning alternative to V4-Pro. Tool-capable. Use when V4-Pro is rate-limited or for benchmark parity.",
-      "aliases": ["deepseek-r1-sf"],
-      "supports_vision": false
-    },
-    {
-      "id": "z-ai/GLM-4.6V",
-      "name": "GLM 4.6V Vision (SiliconFlow)",
-      "provider": "siliconflow",
-      "tier": "balanced",
-      "context_window": 131072,
-      "max_output_tokens": 4096,
-      "input_price_per_million": 0.3,
-      "output_price_per_million": 0.9,
-      "reasoning": false,
-      "thinking_type": null,
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Vision-language model with confirmed function-calling support. Use when the turn contains image attachments (router vision-override pending).",
-      "aliases": ["glm-4.6v-sf"],
-      "supports_vision": true
-    },
-    {
-      "id": "gpt-5.4-mini",
-      "name": "GPT-5.4 mini (OpenAI ChatGPT OAuth)",
-      "provider": "openai",
-      "tier": "fast",
-      "context_window": 256000,
-      "max_output_tokens": 32000,
-      "input_price_per_million": 0,
-      "output_price_per_million": 0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": true,
-      "default_reasoning_effort": "low",
-      "description": "OpenAI GPT-5.4 mini via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
-      "aliases": ["gpt-5.4-mini-oauth"],
-      "supports_vision": false
-    },
-    {
-      "id": "gpt-5.4",
-      "name": "GPT-5.4 (OpenAI ChatGPT OAuth)",
-      "provider": "openai",
-      "tier": "premium",
-      "context_window": 256000,
-      "max_output_tokens": 32000,
-      "input_price_per_million": 0,
-      "output_price_per_million": 0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": true,
-      "default_reasoning_effort": "medium",
-      "description": "OpenAI GPT-5.4 via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
-      "aliases": ["gpt-5.4-oauth"],
-      "supports_vision": false
-    },
-    {
-      "id": "gpt-5.3-codex",
-      "name": "GPT-5.3 Codex (OpenAI ChatGPT OAuth)",
-      "provider": "openai",
-      "tier": "balanced",
-      "context_window": 256000,
-      "max_output_tokens": 32000,
-      "input_price_per_million": 0,
-      "output_price_per_million": 0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": true,
-      "default_reasoning_effort": "medium",
-      "description": "OpenAI GPT-5.3 Codex (coding-specialized) via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
-      "aliases": ["gpt-5.3-codex-oauth", "codex"],
-      "supports_vision": false
-    },
-    {
-      "id": "gemini-2.5-flash",
-      "name": "Gemini 2.5 Flash",
-      "provider": "google",
-      "tier": "balanced",
-      "context_window": 1048576,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 0.3,
-      "output_price_per_million": 2.5,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Google Gemini 2.5 Flash via Generative Language API (AI Studio key — console aistudio.google.com/app/apikey, or stored Google OAuth). Multimodal, 1M context, thinking-capable. Pricing per ai.google.dev/pricing (2026-06-04).",
-      "aliases": ["gemini-flash", "gemini-2.5-flash-latest"],
-      "supports_vision": true
-    },
-    {
-      "id": "gemini-2.5-pro",
-      "name": "Gemini 2.5 Pro",
-      "provider": "google",
-      "tier": "premium",
-      "context_window": 1048576,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 1.25,
-      "output_price_per_million": 10.0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Google Gemini 2.5 Pro via Generative Language API (AI Studio key or stored Google OAuth). Most advanced 2.5 reasoning model, multimodal, 1M context. Pricing per ai.google.dev/pricing (2026-06-04).",
-      "aliases": ["gemini-pro", "gemini-2.5-pro-latest"],
-      "supports_vision": true
-    },
-    {
-      "id": "gemini-3.5-flash",
-      "name": "Gemini 3.5 Flash",
-      "provider": "google",
-      "tier": "fast",
-      "context_window": 1048576,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 0.5,
-      "output_price_per_million": 3.0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Google Gemini 3.5 Flash via Generative Language API. Frontier agentic/coding flash model, multimodal, 1M context, thinking-capable. Pricing APPROXIMATE (verify at ai.google.dev/pricing before cost-sensitive use).",
-      "aliases": ["gemini-flash-3.5"],
-      "supports_vision": true
-    },
-    {
-      "id": "gemini-3.1-flash-lite",
-      "name": "Gemini 3.1 Flash-Lite",
-      "provider": "google",
-      "tier": "fast",
-      "context_window": 1048576,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 0.15,
-      "output_price_per_million": 0.6,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Google Gemini 3.1 Flash-Lite via Generative Language API. Cheapest multimodal Gemini, 1M context, limited thinking. Pricing APPROXIMATE (verify at ai.google.dev/pricing before cost-sensitive use).",
-      "aliases": ["gemini-flash-lite"],
-      "supports_vision": true
-    },
-    {
-      "id": "gemini-3.1-pro-preview",
-      "name": "Gemini 3.1 Pro Preview",
-      "provider": "google",
-      "tier": "premium",
-      "context_window": 1048576,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 2.0,
-      "output_price_per_million": 12.0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Google Gemini 3.1 Pro Preview via Generative Language API. Strongest agentic/reasoning Gemini, multimodal, 1M context. Preview model — id/pricing may change; pricing APPROXIMATE (verify at ai.google.dev/pricing).",
-      "aliases": ["gemini-pro-preview"],
-      "supports_vision": true
-    },
-    {
-      "id": "grok-4.3",
-      "name": "Grok 4.3 (xAI)",
-      "provider": "xai",
-      "tier": "premium",
-      "context_window": 1048576,
-      "max_output_tokens": 32768,
-      "input_price_per_million": 1.25,
-      "output_price_per_million": 2.5,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": true,
-      "default_reasoning_effort": "medium",
-      "description": "Flagship model mạnh nhất hiện tại của xAI. Agentic tool-calling xuất sắc, hallucination thấp, hỗ trợ reasoning + non-reasoning mode. Context 1M tokens. Model mặc định khuyến nghị cho Grok CLI.",
-      "aliases": ["grok-4.3", "grok-latest", "grok-4"],
-      "supports_vision": true
-    },
-    {
-      "id": "grok-build-0.1",
-      "name": "Grok Build 0.1 (xAI)",
-      "provider": "xai",
-      "tier": "balanced",
-      "context_window": 262144,
-      "max_output_tokens": 65536,
-      "input_price_per_million": 1.0,
-      "output_price_per_million": 2.0,
-      "reasoning": true,
-      "thinking_type": "enabled",
-      "supports_effort": false,
-      "default_reasoning_effort": null,
-      "description": "Model coding chuyên biệt, nhanh, tối ưu cho agentic coding workflows. Chính là model powering Grok Build CLI. Rất phù hợp cho lập trình, debug, multi-step tasks.",
-      "aliases": ["grok-build", "grok-code-fast", "grok-build-0.1"],
-      "supports_vision": true
-    }
-  ]
-}
+{
+  "version": "2.2",
+  "updated_at": "2026-06-04",
+  "description": "Local fallback catalog: deepseek + siliconflow + openai (ChatGPT OAuth) + google (Gemini, via AI Studio key or Google OAuth). SiliconFlow pricing verified 2026-05-21; Gemini 2.5 pricing per ai.google.dev/pricing 2026-06-04 (3.x flash/pro entries APPROXIMATE — see per-model descriptions). Model IDs verified against ai.google.dev/gemini-api/docs/models 2026-06-04. See ./catalog.README.md for curation rationale.",
+  "models": [
+    {
+      "id": "deepseek-v4-flash",
+      "name": "DeepSeek V4 Flash (native)",
+      "provider": "deepseek",
+      "tier": "fast",
+      "context_window": 128000,
+      "max_output_tokens": 8000,
+      "input_price_per_million": 0.27,
+      "output_price_per_million": 1.1,
+      "cached_input_price_per_million": 0.027,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Native DeepSeek V4 Flash. Tool-call capable. More expensive than SiliconFlow's hosted V4-Flash ($0.14/$0.28) — prefer SF unless rate-limited.",
+      "aliases": ["deepseek-flash-native"],
+      "supports_vision": false
+    },
+    {
+      "id": "deepseek-v4-pro",
+      "name": "DeepSeek V4 Pro (native)",
+      "provider": "deepseek",
+      "tier": "premium",
+      "context_window": 128000,
+      "max_output_tokens": 16000,
+      "input_price_per_million": 0.55,
+      "output_price_per_million": 2.19,
+      "cached_input_price_per_million": 0.055,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Native DeepSeek V4 Pro. Tool-call capable. Cheaper than SF-hosted V4-Pro ($1.74/$3.48) — this is the premium-tier default.",
+      "aliases": ["deepseek-pro-native"],
+      "supports_vision": false
+    },
+    {
+      "id": "deepseek-ai/DeepSeek-V4-Flash",
+      "name": "DeepSeek V4 Flash (via SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "fast",
+      "context_window": 1049000,
+      "max_output_tokens": 8000,
+      "input_price_per_million": 0.14,
+      "output_price_per_million": 0.28,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "DeepSeek V4 Flash on SiliconFlow — cheaper than native. 1M context. Reasoning_tokens share output budget.",
+      "aliases": ["deepseek-v4-flash-sf", "deepseek-flash-sf"],
+      "supports_vision": false
+    },
+    {
+      "id": "deepseek-ai/DeepSeek-V4-Pro",
+      "name": "DeepSeek V4 Pro (via SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "premium",
+      "context_window": 1049000,
+      "max_output_tokens": 16000,
+      "input_price_per_million": 1.74,
+      "output_price_per_million": 3.48,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "DeepSeek V4 Pro on SiliconFlow. Prefer native deepseek-v4-pro for cost ($0.55/$2.19) when key available.",
+      "aliases": ["deepseek-v4-pro-sf", "deepseek-pro-sf"],
+      "supports_vision": false
+    },
+    {
+      "id": "Qwen/Qwen3-8B",
+      "name": "Qwen3 8B (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "fast",
+      "context_window": 131072,
+      "max_output_tokens": 8192,
+      "input_price_per_million": 0.06,
+      "output_price_per_million": 0.06,
+      "reasoning": false,
+      "thinking_type": "hybrid",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Cheapest tool-capable SiliconFlow model. Symmetric pricing — ideal for mechanical tool-execution loops. Supports thinking/non-thinking hybrid mode.",
+      "aliases": ["qwen3-8b-sf", "alibaba/Qwen3-8B"],
+      "supports_vision": false
+    },
+    {
+      "id": "Qwen/Qwen3-30B-A3B-Instruct-2507",
+      "name": "Qwen3 30B A3B Instruct (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "balanced",
+      "context_window": 262144,
+      "max_output_tokens": 8192,
+      "input_price_per_million": 0.09,
+      "output_price_per_million": 0.3,
+      "reasoning": false,
+      "thinking_type": null,
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "MoE balanced default. 3B active params keeps cost low while 30B total gives strong instruction following + tool use. Recommended SF balanced pick.",
+      "aliases": ["qwen3-30b-instruct-sf", "alibaba/Qwen3-30B-A3B-Instruct-2507"],
+      "supports_vision": false
+    },
+    {
+      "id": "Qwen/Qwen3-Coder-30B-A3B-Instruct",
+      "name": "Qwen3 Coder 30B A3B (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "balanced",
+      "context_window": 262144,
+      "max_output_tokens": 8192,
+      "input_price_per_million": 0.07,
+      "output_price_per_million": 0.28,
+      "reasoning": false,
+      "thinking_type": null,
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Coding-specialized Qwen3 MoE. Cheaper than the generic Qwen3-30B variant. Use when pil.taskType is coding (router override pending).",
+      "aliases": ["qwen3-coder-sf", "qwen-coder-sf", "alibaba/Qwen3-Coder-30B-A3B-Instruct"],
+      "supports_vision": false
+    },
+    {
+      "id": "deepseek-ai/DeepSeek-V3.2",
+      "name": "DeepSeek V3.2 (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "balanced",
+      "context_window": 163840,
+      "max_output_tokens": 8192,
+      "input_price_per_million": 0.27,
+      "output_price_per_million": 0.42,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Cheap DeepSeek reasoning option for balanced-tier turns that benefit from CoT. Tool-capable. Use when Qwen3-30B is not strong enough on reasoning.",
+      "aliases": ["deepseek-v3.2-sf"],
+      "supports_vision": false
+    },
+    {
+      "id": "deepseek-ai/DeepSeek-R1",
+      "name": "DeepSeek R1 (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "premium",
+      "context_window": 163840,
+      "max_output_tokens": 16384,
+      "input_price_per_million": 0.5,
+      "output_price_per_million": 2.18,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Cheaper premium reasoning alternative to V4-Pro. Tool-capable. Use when V4-Pro is rate-limited or for benchmark parity.",
+      "aliases": ["deepseek-r1-sf"],
+      "supports_vision": false
+    },
+    {
+      "id": "z-ai/GLM-4.6V",
+      "name": "GLM 4.6V Vision (SiliconFlow)",
+      "provider": "siliconflow",
+      "tier": "balanced",
+      "context_window": 131072,
+      "max_output_tokens": 4096,
+      "input_price_per_million": 0.3,
+      "output_price_per_million": 0.9,
+      "reasoning": false,
+      "thinking_type": null,
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Vision-language model with confirmed function-calling support. Use when the turn contains image attachments (router vision-override pending).",
+      "aliases": ["glm-4.6v-sf"],
+      "supports_vision": true
+    },
+    {
+      "id": "gpt-5.4-mini",
+      "name": "GPT-5.4 mini (OpenAI ChatGPT OAuth)",
+      "provider": "openai",
+      "tier": "fast",
+      "context_window": 256000,
+      "max_output_tokens": 32000,
+      "input_price_per_million": 0,
+      "output_price_per_million": 0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": true,
+      "default_reasoning_effort": "low",
+      "description": "OpenAI GPT-5.4 mini via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
+      "aliases": ["gpt-5.4-mini-oauth"],
+      "supports_vision": false
+    },
+    {
+      "id": "gpt-5.4",
+      "name": "GPT-5.4 (OpenAI ChatGPT OAuth)",
+      "provider": "openai",
+      "tier": "premium",
+      "context_window": 256000,
+      "max_output_tokens": 32000,
+      "input_price_per_million": 0,
+      "output_price_per_million": 0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": true,
+      "default_reasoning_effort": "medium",
+      "description": "OpenAI GPT-5.4 via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
+      "aliases": ["gpt-5.4-oauth"],
+      "supports_vision": false
+    },
+    {
+      "id": "gpt-5.3-codex",
+      "name": "GPT-5.3 Codex (OpenAI ChatGPT OAuth)",
+      "provider": "openai",
+      "tier": "balanced",
+      "context_window": 256000,
+      "max_output_tokens": 32000,
+      "input_price_per_million": 0,
+      "output_price_per_million": 0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": true,
+      "default_reasoning_effort": "medium",
+      "description": "OpenAI GPT-5.3 Codex (coding-specialized) via ChatGPT subscription OAuth (chatgpt.com/backend-api/codex, Responses API). Subscription-billed — per-token price N/A (0 placeholder). Added to local fallback catalog so OAuth-granted OpenAI models resolve when the CP catalog endpoint is unreachable.",
+      "aliases": ["gpt-5.3-codex-oauth", "codex"],
+      "supports_vision": false
+    },
+    {
+      "id": "gemini-2.5-flash",
+      "name": "Gemini 2.5 Flash",
+      "provider": "google",
+      "tier": "balanced",
+      "context_window": 1048576,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 0.3,
+      "output_price_per_million": 2.5,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Google Gemini 2.5 Flash via Generative Language API (AI Studio key — console aistudio.google.com/app/apikey, or stored Google OAuth). Multimodal, 1M context, thinking-capable. Pricing per ai.google.dev/pricing (2026-06-04).",
+      "aliases": ["gemini-flash", "gemini-2.5-flash-latest"],
+      "supports_vision": true
+    },
+    {
+      "id": "gemini-2.5-pro",
+      "name": "Gemini 2.5 Pro",
+      "provider": "google",
+      "tier": "premium",
+      "context_window": 1048576,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 1.25,
+      "output_price_per_million": 10.0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Google Gemini 2.5 Pro via Generative Language API (AI Studio key or stored Google OAuth). Most advanced 2.5 reasoning model, multimodal, 1M context. Pricing per ai.google.dev/pricing (2026-06-04).",
+      "aliases": ["gemini-pro", "gemini-2.5-pro-latest"],
+      "supports_vision": true
+    },
+    {
+      "id": "gemini-3.5-flash",
+      "name": "Gemini 3.5 Flash",
+      "provider": "google",
+      "tier": "fast",
+      "context_window": 1048576,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 0.5,
+      "output_price_per_million": 3.0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Google Gemini 3.5 Flash via Generative Language API. Frontier agentic/coding flash model, multimodal, 1M context, thinking-capable. Pricing APPROXIMATE (verify at ai.google.dev/pricing before cost-sensitive use).",
+      "aliases": ["gemini-flash-3.5"],
+      "supports_vision": true
+    },
+    {
+      "id": "gemini-3.1-flash-lite",
+      "name": "Gemini 3.1 Flash-Lite",
+      "provider": "google",
+      "tier": "fast",
+      "context_window": 1048576,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 0.15,
+      "output_price_per_million": 0.6,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Google Gemini 3.1 Flash-Lite via Generative Language API. Cheapest multimodal Gemini, 1M context, limited thinking. Pricing APPROXIMATE (verify at ai.google.dev/pricing before cost-sensitive use).",
+      "aliases": ["gemini-flash-lite"],
+      "supports_vision": true
+    },
+    {
+      "id": "gemini-3.1-pro-preview",
+      "name": "Gemini 3.1 Pro Preview",
+      "provider": "google",
+      "tier": "premium",
+      "context_window": 1048576,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 2.0,
+      "output_price_per_million": 12.0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Google Gemini 3.1 Pro Preview via Generative Language API. Strongest agentic/reasoning Gemini, multimodal, 1M context. Preview model — id/pricing may change; pricing APPROXIMATE (verify at ai.google.dev/pricing).",
+      "aliases": ["gemini-pro-preview"],
+      "supports_vision": true
+    },
+    {
+      "id": "grok-4.3",
+      "name": "Grok 4.3 (xAI)",
+      "provider": "xai",
+      "tier": "premium",
+      "context_window": 1048576,
+      "max_output_tokens": 32768,
+      "input_price_per_million": 1.25,
+      "output_price_per_million": 2.5,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": true,
+      "default_reasoning_effort": "medium",
+      "description": "xAI's current flagship. Excellent agentic tool-calling, low hallucination, supports reasoning + non-reasoning mode. 1M token context. Recommended default for Grok CLI.",
+      "aliases": ["grok-4.3", "grok-latest", "grok-4"],
+      "supports_vision": true
+    },
+    {
+      "id": "grok-build-0.1",
+      "name": "Grok Build 0.1 (xAI)",
+      "provider": "xai",
+      "tier": "balanced",
+      "context_window": 262144,
+      "max_output_tokens": 65536,
+      "input_price_per_million": 1.0,
+      "output_price_per_million": 2.0,
+      "reasoning": true,
+      "thinking_type": "enabled",
+      "supports_effort": false,
+      "default_reasoning_effort": null,
+      "description": "Specialized fast coding model optimized for agentic coding workflows. The model powering Grok Build CLI. Well-suited for programming, debugging, and multi-step tasks.",
+      "aliases": ["grok-build", "grok-code-fast", "grok-build-0.1"],
+      "supports_vision": true
+    }
+  ]
+}