npm - @wy51ai/clawzenmux - Versions diffs - 0.1.0 - Mend

@wy51ai/clawzenmux 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

package/README.md ADDED Viewed

@@ -0,0 +1,295 @@
+# ClawZenMux
+**[English](README_EN.md)** | 中文
+OpenClaw 智能 LLM 路由插件 —— 通过 [ZenMux](https://zenmux.ai) 统一网关调用 90+ 模型，自动选择最便宜的模型处理请求，节省 78-96% 的 token 费用。
+> **注意**：这是一个社区第三方插件，非 OpenClaw 或 ZenMux 官方出品。欢迎各位大佬提交PR改进。
+>
+> 本插件参考 [ClawRouter](https://github.com/BlockRunAI/ClawRouter) 架构开发，去掉了区块链/x402 支付部分，改用 ZenMux 统一网关 + API Key 认证。感谢 ClawRouter 作者的开源贡献！
+## 工作原理
+```
+OpenClaw Agent
+  │
+  ▼  POST /v1/chat/completions  { model: "clawzenmux/auto", messages: [...] }
+  │
+  ▼  localhost:8403 (ClawZenMux 本地代理)
+  │
+  ├─ 1. 解析请求，提取用户 prompt
+  ├─ 2. 规则引擎评分 (14 维加权，<1ms，零成本)
+  ├─ 3. 根据复杂度选择最便宜的模型
+  ├─ 4. 替换 model 字段，转发到 ZenMux API
+  ├─ 5. 流式返回响应给 Agent
+  └─ 6. 记录使用日志
+```
+**核心思路**：简单问题用便宜模型（DeepSeek $0.28/M），中等问题用均衡模型（Gemini 3 Flash），复杂问题用强力模型（Claude $3/M），推理问题用专业模型（DeepSeek Thinking）。用户只需设置 `clawzenmux/auto`，路由器自动判断。
+## 快速开始
+### 1. 获取 ZenMux API Key
+前往 [zenmux.ai](https://zenmux.ai) 注册，在 Console > API Keys 页面创建密钥。
+### 2. 安装插件
+```bash
+openclaw plugin install @wy51ai/clawzenmux
+```
+### 3. 配置 API Key（三种方式，任选其一）
+```bash
+# 方式一：环境变量（推荐）
+export ZENMUX_API_KEY=your-key-here
+# 方式二：保存到文件
+echo "your-key-here" > ~/.openclaw/zenmux/api.key
+# 方式三：在 openclaw.json 中配置
+# 见下方「配置」章节
+```
+### 4. 使用智能路由
+```bash
+# 自动选择最优模型
+openclaw models set clawzenmux/auto
+# 或者指定特定模型
+openclaw models set anthropic/claude-sonnet-4.5
+```
+### 5. 提示词强制路由（可选）
+当你使用 `clawzenmux/auto` 时，可以在用户消息里加入控制指令强制层级：
+```text
+USE SIMPLE
+USE MEDIUM
+USE COMPLEX
+USE REASONING
+```
+示例：
+```text
+USE COMPLEX 设计一个分布式消息队列的架构
+```
+说明：
+- 该指令只在 `model=clawzenmux/auto`（或 `auto`）时生效
+- 代理会在转发前移除 `USE ...` 指令文本，避免污染真正的提示词
+- 若同一条消息没有指令，继续走默认规则引擎
+## 智能路由详解
+### 四层分级
+| 层级 | 默认模型 | 价格 ($/M tokens) | 适用场景 |
+|------|---------|-------------------|----------|
+| **SIMPLE** | deepseek/deepseek-v3.2 | $0.28 / $0.43 | 简单问答、翻译、定义 |
+| **MEDIUM** | google/gemini-3-flash-preview | $0.15 / $0.60 | 一般编码、摘要、解释 |
+| **COMPLEX** | anthropic/claude-sonnet-4.5 | $3.00 / $15.00 | 复杂代码、架构设计、多步分析 |
+| **REASONING** | deepseek/deepseek-v3.2-thinking | $0.28 / $0.43 | 数学证明、逻辑推导、定理证明 |
+### 规则引擎（<1ms，免费）
+100% 本地规则评分，无外部 API 调用。对 prompt 进行 14 维加权评分，根据总分映射到层级。关键词覆盖英文、中文、日文、俄文：
+| 维度 | 权重 | 检测内容 | 多语言关键词示例 |
+|------|------|----------|-----------------|
+| 推理标记 | 0.18 | 证明、推导类提示 | prove, theorem / 证明, 推导 / 証明, 定理 / доказать |
+| 代码存在 | 0.15 | 代码相关内容 | function, class, \`\`\` / 函数, 类 / 関数 / функция |
+| 简单指标 | 0.12 | 简单问题标记 | what is, hello / 什么是, 你好 / とは / что такое |
+| 多步模式 | 0.12 | 多步骤任务 | first...then, step 1, 1. 2. 3. |
+| 技术术语 | 0.10 | 专业技术词汇 | algorithm / 算法 / アルゴリズム / алгоритм |
+| Token 数量 | 0.08 | 输入长度 | <50 tokens → 简单，>500 → 复杂 |
+| 创意标记 | 0.05 | 创意写作 | story, poem / 故事, 诗 / 物語 / история |
+| 问题复杂度 | 0.05 | 多个问号 | 超过 3 个 ? |
+| 约束条件 | 0.04 | 限制条件 | at most / 不超过 / 以下 / не более |
+| 命令动词 | 0.03 | 构建指令 | build, create / 构建, 创建 / 構築 / создать |
+| 输出格式 | 0.03 | 结构化输出 | json, yaml / 表格 / テーブル / таблица |
+| 引用复杂度 | 0.02 | 上下文引用 | above, the docs / 上面, 文档 / 上記 / выше |
+| 领域特异性 | 0.02 | 专业领域 | quantum, fpga / 量子 / 量子 / квантовый |
+| 否定复杂度 | 0.01 | 否定约束 | don't, avoid / 不要, 避免 / しないで / избегать |
+**评分逻辑**：
+```
+加权总分 = Σ(维度得分 × 权重)
+总分 < 0.0   → SIMPLE
+0.0 ~ 0.15   → MEDIUM
+0.15 ~ 0.25  → COMPLEX
+≥ 0.25       → REASONING
+特殊规则：2+ 个推理关键词命中 → 直接判定 REASONING
+架构设计信号（architecture/架构 + 分布式/消息队列/分片/容灾/QPS/多租户等）→ 直接判定 COMPLEX
+置信度 < 0.6 → 标记为「模糊」，回退到默认层级 (MEDIUM)
+```
+### 覆盖规则
+- **大上下文** (>100k tokens) → 强制 COMPLEX
+- **结构化输出** (system prompt 含 json/structured/schema) → 最低 MEDIUM
+- **模糊判定** → 默认 MEDIUM
+## 配置
+在 `~/.openclaw/openclaw.json` 中配置插件：
+```json
+{
+  "plugins": {
+    "entries": {
+      "clawzenmux": {
+        "config": {
+          "apiKey": "your-zenmux-api-key",
+          "routing": {
+            "tiers": {
+              "SIMPLE": {
+                "primary": "deepseek/deepseek-v3.2",
+                "fallback": ["google/gemini-2.5-flash"]
+              },
+              "MEDIUM": {
+                "primary": "google/gemini-3-flash-preview",
+                "fallback": ["deepseek/deepseek-v3.2"]
+              },
+              "COMPLEX": {
+                "primary": "anthropic/claude-sonnet-4.5",
+                "fallback": ["anthropic/claude-sonnet-4", "openai/gpt-4o"]
+              },
+              "REASONING": {
+                "primary": "deepseek/deepseek-v3.2-thinking",
+                "fallback": ["openai/gpt-5.2"]
+              }
+            }
+          }
+        }
+      }
+    }
+  }
+}
+```
+### 配置项说明
+| 参数 | 类型 | 默认值 | 说明 |
+|------|------|--------|------|
+| `apiKey` | string | — | ZenMux API Key，也可用环境变量 `ZENMUX_API_KEY` |
+| `routing.tiers.{TIER}.primary` | string | 见上表 | 该层级的首选模型 |
+| `routing.tiers.{TIER}.fallback` | string[] | 见上表 | 首选不可用时的备选模型 |
+## 动态模型同步
+插件启动时会调用 ZenMux `GET /v1/models` API 获取最新的模型列表和定价信息：
+- 30 分钟缓存，避免频繁请求
+- API 不可用时自动回退到内置静态模型目录
+- 确保定价信息始终最新
+## 支持的模型
+通过 ZenMux 平台访问 90+ 模型，包括：
+| 提供商 | 模型 |
+|--------|------|
+| **OpenAI** | GPT-5.2 Pro, GPT-5.2, GPT-5.1, GPT-5, GPT-5 Mini/Nano, GPT-4.1, o3, o4-mini, Codex |
+| **Anthropic** | Claude Opus 4.6/4.5, Claude Sonnet 4.5/4, Claude Haiku 4.5 |
+| **Google** | Gemini 3 Pro/Flash Preview, Gemini 2.5 Pro/Flash/Flash-Lite |
+| **DeepSeek** | V3.2, V3.2 Thinking |
+| **xAI** | Grok 4.1 Fast, Grok 4 Fast, Grok 3 |
+| **阿里** | Qwen3-Max, Qwen3-Coder-Plus, Qwen3-VL-Plus |
+| **智谱** | GLM 4.7, GLM 4.6 |
+| **月之暗面** | Kimi K2 Thinking, Kimi K2.5 |
+| **Mistral** | Mistral Large 3 |
+| **百度** | ERNIE-5.0 Thinking Preview |
+| **字节** | Doubao-Seed-Code |
+| **小米** | MiMo-V2-Flash |
+## 项目结构
+```
+src/
+├── index.ts                 # 插件入口，注册 provider，启动代理
+├── provider.ts              # OpenClaw provider 定义
+├── proxy.ts                 # 本地 HTTP 代理服务器 (port 8403)
+├── models.ts                # 内置模型目录（90+ 模型 + 定价）
+├── model-sync.ts            # 动态模型同步（从 ZenMux API 拉取最新）
+├── auth.ts                  # API Key 解析（config / 文件 / 环境变量 / 向导）
+├── types.ts                 # OpenClaw 插件类型定义
+├── dedup.ts                 # 请求去重（防止超时重试导致重复计费）
+├── retry.ts                 # 指数退避重试（429/502/503/504）
+├── logger.ts                # 使用日志（~/.openclaw/zenmux/logs/）
+├── errors.ts                # 错误类型定义
+└── router/
+    ├── index.ts             # 路由入口（纯规则评分，同步）
+    ├── rules.ts             # 规则引擎（14 维加权评分）
+    ├── selector.ts          # 层级 → 模型选择 + 费用估算
+    ├── config.ts            # 默认路由配置
+    └── types.ts             # 路由类型定义
+```
+## 代理服务器特性
+- **SSE 心跳**：流式请求立即返回 200 + 心跳包，防止 OpenClaw 10-15 秒超时
+- **请求去重**：SHA-256 哈希请求体，30 秒 TTL 缓存，防止重试导致重复计费
+- **重试机制**：429/502/503/504 自动指数退避重试，支持 Retry-After header
+- **使用日志**：每次请求记录为 JSONL 行 (`~/.openclaw/zenmux/logs/usage-YYYY-MM-DD.jsonl`)
+## 费用节省示例
+```
+"什么是量子计算？"（简单问题）
+  → 规则引擎: SIMPLE → deepseek/deepseek-v3.2
+  → 费用: $0.0003 vs Opus 4.6 $0.025 = 节省 98.8%
+"帮我写一个 React 组件"（一般编码）
+  → 规则引擎: MEDIUM → google/gemini-3-flash-preview
+  → 费用: $0.0002 vs Opus 4.6 $0.025 = 节省 99.2%
+"设计一个分布式消息队列的架构"（复杂任务）
+  → 规则引擎: COMPLEX → anthropic/claude-sonnet-4.5
+  → 费用: $0.045 vs Opus 4.6 $0.25 = 节省 82%
+"证明 √2 是无理数"（推理）
+  → 规则引擎: REASONING → deepseek/deepseek-v3.2-thinking
+  → 费用: $0.0003 vs Opus 4.6 $0.25 = 节省 99.9%
+```
+## 开发
+```bash
+# 安装依赖
+npm install
+# 开发模式（监听文件变化）
+npm run dev
+# 类型检查
+npm run typecheck
+# 构建
+npm run build
+# 输出: dist/index.js (~50KB, 零运行时依赖)
+```
+## 健康检查
+代理启动后可通过 HTTP 检查状态：
+```bash
+curl http://localhost:8403/health
+# {"status":"ok","provider":"zenmux","models":94}
+```
+## 作者
+**WY** — [X / Twitter](https://x.com/akokoi1)
+## 许可证
+MIT