@wengine-ai/llms 2.3.5 → 2.3.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.md CHANGED
@@ -8,7 +8,7 @@
8
8
 
9
9
  > [从CLI工具风格看工具渐进式披露](/blog/zh/从CLI工具风格看工具渐进式披露.md)
10
10
 
11
- > 一款强大的工具,可将 Claude Code 请求路由到不同的模型,并自定义任何请求。
11
+ > 一款强大的工具,可将 Claude Code 和 Codex 请求路由到不同的模型,并自定义任何请求。
12
12
 
13
13
  ![](blog/images/claude-code.png)
14
14
 
@@ -93,6 +93,8 @@ npm install -g @wengine-ai/claude-code-router-next@latest && ccr restart
93
93
 
94
94
  | 版本 | 发布内容 |
95
95
  | --- | --- |
96
+ | **v2.3.7** | <ul><li>**新增项目默认接管并跟随全局**:在「项目配置」页添加项目时,默认开启「CCR 接管」与「使用全局配置」,自动写入 ccr 代理配置并保持项目路由实时跟随全局,新项目开箱即用。</li><li>**项目级 fallback 复制修复**:自定义项目路由时正确复制全局顶层 `fallback`,避免备用模型链丢失。</li><li>**接管模型配置同步修复**:切换接管开关时按当前全局配置重新生成托管字段,确保全局变更后重新接管能同步最新模型路由,同时保留 `permissions`/`hooks` 等非托管配置。</li></ul> |
97
+ | **v2.3.6** | <ul><li>**项目级 CCR 接管**:Web UI 项目配置页新增「CCR 接管」开关,开启后会将 `ANTHROPIC_BASE_URL`/`ANTHROPIC_AUTH_TOKEN`、模型族路由环境变量、auto-compact 设置及状态栏命令同步写入该项目的 `.claude/settings.local.json`,使该项目的 Claude Code CLI 无需 `ccr code` 即可直接通过 CCR 路由;关闭接管时会备份当前配置,下次重新接管自动还原,避免个性化配置丢失。</li><li>**项目配置页折叠与同步修复**:项目卡片支持折叠/展开;关闭「使用全局配置」后正确同步全局路由的 fallback 与模型族配置。</li></ul> |
96
98
  | **v2.1.36** | <ul><li>**Codex 最新 RT 导出**:Codex 账号管理支持导出当前或指定托管账号的最新 refresh token,CLI 新增 `ccr clients codex export-rt [account-id]`,Web UI 新增复制最新 RT 按钮,并会在当前 auth 文件更新时同步托管快照。</li></ul> |
97
99
  | **v2.1.35** | <ul><li>**定时唤醒稳定性修复**:提供商定时唤醒在 macOS 睡眠/唤醒或系统时间跳变后会重新计算下一次触发时间,避免错过或重复执行唤醒任务。</li></ul> |
98
100
  | **v2.1.34** | <ul><li>**本地客户端配置接管**:新增 Client Configuration 管理能力,可通过 UI/API/CLI 启用、禁用或恢复本地 Claude Code、Codex 等客户端配置,并自动写入 CCR 代理地址与模型别名。</li><li>**Codex 本地账号代管理**:新增 Codex 账号管理页与 `ccr clients codex` 命令,支持导入当前登录账号、通过 refresh token 导入、切换激活账号、删除托管账号,并对官方 auth 文件做备份与替换。</li><li>**Codex 账号列表缓存优化**:Codex 账号页优先读取本地固化账号与限额缓存,页面刷新无需等待官方 usage 接口;当前账号后台 1 分钟刷新一次,非当前账号 30 分钟刷新一次。</li><li>**Codex / OpenAI Responses API 兼容**:新增 `openai-responses` Transformer,支持 Codex 使用 Responses API wire format 接入 CCR,并完成 Chat/Anthropic 与 Responses 的流式、非流式转换。</li><li>**状态栏视觉升级**:状态栏新增彩色渐变 Context 上下文占用进度条,提升长上下文使用情况的可读性。</li></ul> |
@@ -101,11 +103,8 @@ npm install -g @wengine-ai/claude-code-router-next@latest && ccr restart
101
103
  | **v2.1.30** | <ul><li>**Codex 多账号限额展示**:Codex 账号管理页新增官方限额信息展示,通过 `chatgpt.com/backend-api/wham/usage` 获取 5 小时速率限制与 7 天周限制的使用百分比和重置时间。</li><li>**Codex 账号自动切换**:Codex 请求前会检查当前账号官方限额,默认任一窗口达到 95% 自动切换到下一个可用账号;仍保留 429/限流错误后的自动切换兜底。</li></ul> |
102
104
  | **v2.1.27** | <ul><li>**DeepSeek / GLM 工具调用兼容修复**:修复部分 DeepSeek 与 GLM 兼容接口因 `tool_choice` 参数格式不一致导致的请求失败问题。</li></ul> |
103
105
  | **v2.1.26** | <ul><li>**修复 Anthropic Transformer URI 覆盖问题**:当 `Anthropic` 与 DeepSeek/OpenAI 兼容提供商组合使用时,不再把 `chat/completions` 端点错误改写为 `/v1/messages`,避免 DeepSeek 返回 404。</li><li>**协议转换边界收紧**:仅当 provider 的 `api_base_url` 明确指向 `/messages` 端点时,才将请求体转换为 Anthropic messages 结构。</li></ul> |
104
- | **v2.1.25** | <ul><li>**修复新版 Claude Code (v2.1.154+) 422 报错**:完美解决请求 `/v1/messages` 兼容提供商时因 messages 数组中包含 `role: "system"` 造成的 400/422 报错。</li><li>**动态 Passthrough 绕过自愈**:强制拦截带有 system 消息的 Anthropic 兼容提供商透传,自动进行双向协议规范化与 system 字段合并。</li><li>**响应无损透传修复**:支持目标为 Anthropic 协议响应的原样直出,解决了第三方接口转发时“请求成功但无数据返回”的重大漏洞。</li></ul> |
105
- | **v2.1.22** | <ul><li>**提供商定时唤醒功能 (定时唤醒)**:新增通用及提供商级别的清晨定时自动重置/唤醒机制,通过发送 dummy 消息提前激活额度。</li><li>**对称用量展示面板**:将 Web 控制台的用量统计网格从 8 张卡片升级为更美观对称的 10 卡片布局。</li><li>**高级用量指标统计**:新增对缓存命中率 (Cache Hit Rate) 及生成速度 (Average Speed) 的多维度计算与动态展示。</li></ul> |
106
- | **v2.1.7** | <ul><li>**Gemini 思考模式签名支持**:完美支持 Gemini 思考模式 (thinking mode) 及思维链签名 (thought_signature),防止转发时出现 400 校验异常并拦截 API Key 泄露。</li><li>**系统级调试日志面板**:引入运行时一键切换的系统调试日志,与 Web 控制台深度集成,提供实时请求响应细节。</li></ul> |
107
- | **v2.1.2** | <ul><li>**状态栏 Token 缓存计数**:支持 CLI 状态栏 (statusline) 中的 Token 计数正确显示缓存命中详情,并在响应速度及文字格式上完成多项优化。</li></ul> |
108
- | **v2.0.87** | <ul><li>**Web 控制台额度支持**:正式打通并适配智谱 GLM 与百炼 Qwen 等主流渠道的额度使用详情实时分析。</li><li>**健康失败记录优化**:修复 HTTP 429 速率限制请求在健康监测系统中未被记录为失败并导致熔断延迟的 Bug。</li></ul> |
106
+
107
+ > 仅保留最近 10 个版本,更早版本的发布摘要见 [CHANGELOG-archive.md](./CHANGELOG-archive.md),完整详细变更记录见 [CHANGELOG.md](./CHANGELOG.md)
109
108
 
110
109
  ### 2. 配置
111
110
 
@@ -261,12 +260,25 @@ npm install -g @wengine-ai/claude-code-router-next@latest && ccr restart
261
260
  5. 在右侧 **Headers (标头)** 的 **Request Headers (请求头)** 中找到 **`Cookie`** 这一项,将其右侧的完整超长内容复制下来。
262
261
  6. 在您的 `config.json` 中,将这个 cookie 填入阿里云 provider 下的 **`quotaToken`** 属性中即可!
263
262
 
264
- ![阿里云用量 Cookie 获取方式](blog/images/aliyun-quota-auth.png)
265
-
266
263
  配置成功后,Web UI 的 Provider 列表中将会实时展示您的套餐剩余用量额度条与刷新状态:
267
264
 
265
+ ![阿里云用量 Cookie 获取方式](blog/images/aliyun-quota-auth.png)
266
+
268
267
  ![阿里云用量额度条展示](blog/images/aliyun-quota-display.png)
269
268
 
269
+ ### 🔑 讯飞 Coding Plan 用量 Token (Cookie) 获取引导
270
+
271
+ 如果您想让 Claude Code Router 的后台 Web UI 实时拉取并可视化展示您的 **讯飞 Coding Plan** 剩余用量额度条,您需要进入讯飞 Coding Plan 订阅查询页面,打开浏览器开发者工具的 Network 面板,刷新页面后复制请求中的 `Cookie` 作为 `quotaToken` 填入配置:
272
+
273
+ 1. 登录讯飞 Coding Plan 订阅查询页面。
274
+ 2. 按键盘 `F12` 打开浏览器开发者工具,并切换到 **Network (网络)** 标签页。
275
+ 3. 刷新页面。
276
+ 4. 在左侧网络请求列表中,找到订阅查询页面对应的用量查询请求并点击。
277
+ 5. 在右侧 **Headers (标头)** 的 **Request Headers (请求头)** 中找到 **`Cookie`** 这一项,将其右侧的完整内容复制下来。
278
+ 6. 在您的 `config.json` 中,将这个 cookie 填入讯飞 provider 下的 **`quotaToken`** 属性中,或者粘贴到 UI 的 **限额查询 Token** 输入框中即可。
279
+
280
+ > **注意**: 这个 token 不是长期有效的,可能会过期;过期后需要重新手动添加。
281
+
270
282
  ### 3. 使用 Router 运行 Claude Code
271
283
 
272
284
  使用 router 启动 Claude Code: