PyPI - coding-proxy - Versions diffs - 0.4.1a11__tar.gz → 0.5.0__tar.gz - Mend

coding-proxy 0.4.1a11tar.gz → 0.5.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (195) hide show

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/AGENTS.md RENAMED Viewed

@@ -44,14 +44,15 @@
   1. **Python**: 严禁使用 pip/poetry，**必须**统一使用 `uv` 进行包管理与脚本执行（如 `uv run`）；
   2. **JavaScript/TypeScript**: 严禁使用 npm/yarn，**必须**统一使用 `pnpm` 进行包管理与脚本执行；
 - **Database Management**: 谨慎操作，数据迁移、测试等操作严禁将现有数据删除，谨慎操作数据迁移的回滚，防止数据被清理。
+- **In-depth and close to the facts**：系统且全面地进行问题的分析，深入贴近事实，如有疑问，需先发问，不要乱做决定。
 - **Browser Validation Protocol (浏览器验证准则)**：Agent 不得自行完成、绕过或模拟任何 OAuth / SSO 认证流程，所有登录态均来源于用户已认证的 Chrome 主 profile（真实用户登录态）。完整协议（连通性自检、凭证管理、E2E 集成、实机回归等）详见 [浏览器验证协议](./docs/agents/browser-validation.md)；
   1. **安全红线**：禁止在 Sandbox 浏览器中跳转 Google 同意屏；禁止以模拟用户或第三方账号替代真实登录态；禁止要求用户在 chat 中粘贴密码、Cookie 或验证码；
 - **Knowledge Map (知识索引)**：项目所有文档索引统一维护在 [知识索引](./docs/agents/knowledge-map.md)，并在文档目录变更时即时同步跟新；
 - **Documentation Standards (文档规范)**：
-  1. **Visual Documentation (图文并茂)**: 对于复杂逻辑，优先 **Mermaid Visualization Norms (Mermaid 可视化规范)**，构建“图文并茂”的直观文档；
+  1. **Visual Documentation (图文并茂)**: 对于复杂逻辑，优先 **Mermaid Visualization Norms (Mermaid 可视化规范)**，构建”图文并茂”的直观文档；
      - **色彩语义与兼容性**：为图表节点配置具备语义辨识度的色彩，并确保在深色模式（Dark Mode）下具有极高的对比度与清晰度；
      - **逻辑模块化解构**：针对业务跨度较大的架构流程，强制采用 `subgraph` 容器进行层级解构与边界划分，以增强图表的自解说（Self-explaining）能力；
   2. **语言叙事**：用语精准，叙事完备，行文专业，聚焦核心，篇幅精炼，形象具体，体现真实作用与用户吸引性，字数恰当；
-  3. **Direct Hyperlinking (直接跳转)**: 在文档中提及 Repo 内其他资源（文档/代码）时，**必须**构建可跳转的相对路径链接（如 `[Doc Name](./path.md)`），严禁使用“死文本”引用，以降低信息检索熵；
+  3. **Direct Hyperlinking (直接跳转)**: 在文档中提及 Repo 内其他资源（文档/代码）时，**必须**构建可跳转的相对路径链接（如 `[Doc Name](./path.md)`），严禁使用”死文本”引用，以降低信息检索熵；
   4. **实操截图**：文档需要引入必要的浏览器实操截图时，需自行通过默认浏览器打开相关页面，通过实操现场截图并保留到文档路径进行文档引用；
 - **Reference Specifications (IEEE)**：为保障工程决策的可追溯性与学术严谨性，核心引用需遵循 [reference-specifications.md](docs/agents/reference-specifications.md)IEEE 标准引用格式；

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/CHANGELOG.md RENAMED Viewed

@@ -4,7 +4,29 @@
 ## [Unreleased]
-- feat(zhipu): 新增每模型并发限制（默认 3，可通过 `vendors[zhipu].concurrency` 配置），基于 `asyncio.Semaphore` 实现 FIFO 公平排队，流式与非流式共用同一槽位，与 429 重试机制兼容。
+## [v0.5.0](https://github.com/ThreeFish-AI/coding-proxy/releases/tag/v0.5.0) - 2026-05-27
+> [!IMPORTANT]
+>
+> **🚀 Model Calling 实时状态！**
+>
+> 模型并发与排队深度一目了然，运行时动态调整每个模型并行度，预防 vendor 侧的 429 幺蛾子。
+![model-calling](assets/model-calling-v0.5.0.png)
+### ✨ 核心亮点
+- feat(concurrency): 新增 Model Calling 实时状态模块，可视化每模型并发与排队深度，支持运行时动态修改每模型并行度 (#250) (#251)
+- feat(zhipu): 新增每模型并发限制，默认 3 个并行请求 FIFO 排队 (#248)
+- feat(zhipu): 为 429 Rate Limit 添加指数退避重试挽回机制 (#242)
+### 🔧 更多特性
+- fix(antigravity): 修复 v1internal 模式检测逻辑并新增 E2E 测试; (#234)
+- fix(routes): 修复 count_tokens 路由对 target_vendor.name 的错误属性访问; (#235)
+- fix(vendor-channels): 修复 zhipu→anthropic 通道 tool_use/tool_result 配对漏洞; (#236)
+- fix(native-api): 修复 Gemini :verb 路径中 %3A URL 编码导致上游 400 的兼容问题; (#237)
+- fix(zhipu): 诊断首选 tier 语义拒绝降级问题，增强可观测性并提取跨供应商清洗共享函数 (#243)
 ## [v0.4.0](https://github.com/ThreeFish-AI/coding-proxy/releases/tag/v0.4.0) — 2026-05-01

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: coding-proxy
-Version: 0.4.1a11
+Version: 0.5.0
 Summary: A High-Availability, Transparent, and Smart Multi-Vendor Proxy for Claude Code. Support Claude Plans, GitHub Copilot, Google Antigravity, ZAI/GLM, MiniMax, Qwen, Xiaomi, Kimi, Doubao...
 Project-URL: Source Code, https://github.com/ThreeFish-AI/coding-proxy
 Project-URL: User Guide, https://github.com/ThreeFish-AI/coding-proxy/blob/master/docs/user-guide.md

coding_proxy-0.5.0/assets/model-calling-v0.5.0.png ADDED Viewed

Binary file

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/pyproject.toml RENAMED Viewed

@@ -1,6 +1,6 @@
 [project]
 name = "coding-proxy"
-version = "0.4.1a11"
+version = "0.5.0"
 description = "A High-Availability, Transparent, and Smart Multi-Vendor Proxy for Claude Code. Support Claude Plans, GitHub Copilot, Google Antigravity, ZAI/GLM, MiniMax, Qwen, Xiaomi, Kimi, Doubao..."
 readme = "README.md"
 requires-python = ">=3.12"

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/src/coding/proxy/server/dashboard.py RENAMED Viewed

@@ -640,6 +640,43 @@ _DASHBOARD_HTML = """<!DOCTYPE html>
       padding: 1px 6px;
       border-radius: 3px;
     }
+    .mc-limit-editable {
+      cursor: pointer;
+      border-bottom: 1px dashed rgba(74,222,128,.4);
+      transition: border-color .2s, color .2s;
+    }
+    .mc-limit-editable:hover {
+      border-bottom-color: #4ade80;
+      color: #4ade80;
+    }
+    .mc-limit-input {
+      width: 36px;
+      background: var(--bg-primary);
+      border: 1px solid var(--accent-blue);
+      border-radius: 3px;
+      color: var(--text-primary);
+      font-size: 10px;
+      font-family: 'JetBrains Mono', monospace;
+      text-align: center;
+      padding: 0 2px;
+      outline: none;
+      -moz-appearance: textfield;
+    }
+    .mc-limit-input::-webkit-outer-spin-button,
+    .mc-limit-input::-webkit-inner-spin-button {
+      -webkit-appearance: none;
+      margin: 0;
+    }
+    .mc-limit-flash-ok { animation: mc-flash-ok .6s ease; }
+    .mc-limit-flash-err { animation: mc-flash-err .6s ease; }
+    @keyframes mc-flash-ok {
+      0%,100% { color: inherit; }
+      40% { color: #4ade80; }
+    }
+    @keyframes mc-flash-err {
+      0%,100% { color: inherit; }
+      40% { color: #f87171; }
+    }
   </style>
 </head>
 <body>
@@ -1268,7 +1305,8 @@ function updateModelCalling(status) {
       + '<span class="mc-model-name">' + escapeHtml(m.vendor + '/' + m.model) + '</span>'
       + '<div class="mc-bar-wrap"><div class="mc-bar-fill ' + barClass + '" style="width:' + pct + '%"></div></div>'
       + '<div class="mc-stats">'
-      + '<span class="mc-badge mc-badge-active">' + m.in_use + '/' + m.limit + '</span>'
+      + '<span class="mc-badge mc-badge-active">' + m.in_use
+      + '/<span class="mc-limit-editable" data-tier="' + escapeHtml(m.vendor) + '" data-model="' + escapeHtml(m.model) + '" data-limit="' + m.limit + '" title="点击修改并行度">' + m.limit + '</span></span>'
       + (m.pending > 0 ? '<span class="mc-badge mc-badge-pending">⏳ ' + m.pending + '</span>' : '')
       + '</div>'
       + '</div>';
@@ -1293,6 +1331,79 @@ function stopModelCallingPoll() {
   if (_mcTimer) { clearInterval(_mcTimer); _mcTimer = null; }
 }
+// ── 并行度运行时编辑 ──────────────────────────────────────
+var _mcEditing = false;
+document.addEventListener('click', function(e) {
+  if (_mcEditing) return;
+  var el = e.target.closest('.mc-limit-editable');
+  if (!el) return;
+  e.preventDefault();
+  _mcEditing = true;
+  var oldVal = el.getAttribute('data-limit');
+  var tier = el.getAttribute('data-tier');
+  var model = el.getAttribute('data-model');
+  var input = document.createElement('input');
+  input.type = 'number';
+  input.className = 'mc-limit-input';
+  input.min = '1';
+  input.max = '20';
+  input.value = oldVal;
+  el.style.display = 'none';
+  el.parentNode.insertBefore(input, el.nextSibling);
+  input.focus();
+  input.select();
+  var _cancelled = false;
+  function restore() {
+    _mcEditing = false;
+    if (input.parentNode) input.parentNode.removeChild(input);
+    el.style.display = '';
+  }
+  function flash(cls) {
+    el.classList.add(cls);
+    setTimeout(function() { el.classList.remove(cls); }, 600);
+  }
+  input.addEventListener('keydown', function(ev) {
+    if (ev.key === 'Escape') { _cancelled = true; restore(); return; }
+    if (ev.key !== 'Enter') return;
+    ev.preventDefault();
+    submit();
+  });
+  input.addEventListener('blur', function() {
+    setTimeout(function() { if (!_cancelled) submit(); }, 50);
+  });
+  function submit() {
+    if (_cancelled) return;
+    var v = parseInt(input.value, 10);
+    if (isNaN(v) || v < 1 || v > 20) { restore(); flash('mc-limit-flash-err'); return; }
+    if (String(v) === oldVal) { restore(); return; }
+    fetch('/api/concurrency', {
+      method: 'PUT',
+      headers: {'Content-Type': 'application/json'},
+      body: JSON.stringify({tier: tier, model: model, limit: v})
+    }).then(function(res) {
+      if (res.ok) {
+        return res.json().then(function() {
+          el.textContent = v;
+          el.setAttribute('data-limit', v);
+          flash('mc-limit-flash-ok');
+        });
+      } else {
+        flash('mc-limit-flash-err');
+      }
+    }).catch(function() {
+      flash('mc-limit-flash-err');
+    }).finally(function() {
+      restore();
+    });
+  }
+});
 // ── 按 tiers 顺序排序 vendor 列表 ─────────────────────────
 function sortByTierOrder(vendors, tierOrder) {
   if (!tierOrder || !tierOrder.length) return vendors.sort();

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/src/coding/proxy/server/routes.py RENAMED Viewed

@@ -225,6 +225,61 @@ def register_status_route(app: Any, router: Any) -> None:
         return result
+def register_concurrency_route(app: Any, router: Any) -> None:
+    """注册运行时并发限制调整路由."""
+    @app.put("/api/concurrency")
+    async def update_concurrency(request: Request) -> Response:
+        try:
+            body = await request.json()
+        except Exception:
+            return json_error_response(
+                400, error_type="invalid_request_error", message="body must be JSON"
+            )
+        tier_name = body.get("tier")
+        model = body.get("model")
+        limit = body.get("limit")
+        if not tier_name or not model or limit is None:
+            return json_error_response(
+                400,
+                error_type="invalid_request_error",
+                message="requires tier, model, limit",
+            )
+        if not isinstance(limit, int) or limit < 1 or limit > 20:
+            return json_error_response(
+                400,
+                error_type="invalid_request_error",
+                message="limit must be an integer between 1 and 20",
+            )
+        for tier in router.tiers:
+            if tier.name == tier_name:
+                vendor = tier.vendor
+                update_fn = getattr(vendor, "update_concurrency", None)
+                if update_fn is None:
+                    return json_error_response(
+                        400,
+                        error_type="invalid_request_error",
+                        message=f"vendor '{tier_name}' does not support concurrency",
+                    )
+                try:
+                    update_fn(model, limit)
+                except (ValueError, AttributeError) as exc:
+                    return json_error_response(
+                        400, error_type="invalid_request_error", message=str(exc)
+                    )
+                return Response(
+                    content=json.dumps(
+                        {"ok": True, "tier": tier_name, "model": model, "limit": limit},
+                        ensure_ascii=False,
+                    ).encode(),
+                    status_code=200,
+                    media_type="application/json",
+                )
+        return json_error_response(
+            404, error_type="not_found", message=f"tier '{tier_name}' not found"
+        )
 def register_copilot_routes(app: Any, router: Any) -> None:
     """注册 Copilot 诊断与模型探测路由."""
     from .factory import _find_copilot_vendor
@@ -457,6 +512,7 @@ def register_all_routes(
     register_core_routes(app, router)
     register_health_routes(app)
     register_status_route(app, router)
+    register_concurrency_route(app, router)
     register_copilot_routes(app, router)
     register_admin_routes(app, router)
     register_session_vendor_routes(app, router)

coding_proxy-0.5.0/src/coding/proxy/vendors/concurrency.py ADDED Viewed

@@ -0,0 +1,162 @@
+"""每模型并发限制器 — 支持运行时动态调整的公平排队.
+为每个映射后的模型（如 ``glm-5v-turbo``）独立维护一个 ``_ConcurrencySlot`，
+确保同一时间点该模型的并行请求数不超过配置的上限。当所有槽位被占满时，
+新请求按 FIFO 顺序排队等待，直到有槽位释放。
+设计要点：
+  - **惰性创建**：仅在首次请求到达时才为该模型创建 Slot，避免冷启动开销
+  - **FIFO 公平**：``asyncio.Event`` + while 循环天然满足 FIFO 排队语义
+  - **动态调整**：支持运行时修改 per-model limit，无需重启进程
+  - **按映射后模型名键控**：与上游真实承载能力对齐，而非按客户端请求名
+"""
+from __future__ import annotations
+import asyncio
+import logging
+from ..config.vendors import ZhipuConcurrencyConfig
+logger = logging.getLogger(__name__)
+class _ConcurrencySlot:
+    """支持动态 limit 的并发槽位.
+    使用 ``asyncio.Event`` 作为等待/通知原语，在 ``acquire`` 中 await 等待，
+    在 ``release`` / ``set_limit`` 中唤醒。``set_limit`` 修改上限后立即唤醒
+    所有等待者，由它们重新判断是否可获得槽位。
+    """
+    def __init__(self, limit: int) -> None:
+        self._limit = limit
+        self._in_use: int = 0
+        self._pending: int = 0
+        self._wake = asyncio.Event()
+        self._wake.set()
+    async def acquire(self) -> _ConcurrencySlot:
+        """获取一个并发槽位，必要时阻塞排队.
+        返回 ``self``，调用方在请求完成后调用 ``release()``。
+        """
+        # Fast path
+        if self._in_use < self._limit:
+            self._in_use += 1
+            return self
+        # Slow path — 等待槽位释放
+        self._pending += 1
+        try:
+            while True:
+                self._wake.clear()
+                await self._wake.wait()
+                if self._in_use < self._limit:
+                    self._in_use += 1
+                    return self
+        finally:
+            self._pending -= 1
+    def release(self) -> None:
+        """释放一个并发槽位."""
+        self._in_use = max(0, self._in_use - 1)
+        self._wake.set()
+    def set_limit(self, new_limit: int) -> None:
+        """动态调整并发上限.
+        增大 limit 时立即唤醒等待者；缩小时已持有的槽位不受影响，
+        新 limit 在后续 acquire 中自然生效。
+        """
+        self._limit = new_limit
+        self._wake.set()
+    @property
+    def limit(self) -> int:
+        return self._limit
+    @property
+    def in_use(self) -> int:
+        return self._in_use
+    @property
+    def available(self) -> int:
+        return max(0, self._limit - self._in_use)
+    @property
+    def pending(self) -> int:
+        return self._pending
+class ModelConcurrencyLimiter:
+    """按模型名提供独立并发槽位的限制器.
+    用法::
+        limiter = ModelConcurrencyLimiter(config)
+        slot = await limiter.acquire("glm-5v-turbo")
+        try:
+            ...  # 执行请求
+        finally:
+            slot.release()
+    """
+    def __init__(self, config: ZhipuConcurrencyConfig) -> None:
+        self._config = config
+        self._slots: dict[str, _ConcurrencySlot] = {}
+    def _get_or_create_slot(self, model: str) -> _ConcurrencySlot:
+        """获取（或惰性创建）指定模型的并发槽位."""
+        slot = self._slots.get(model)
+        if slot is None:
+            limit = self._config.get_limit(model)
+            slot = _ConcurrencySlot(limit)
+            self._slots[model] = slot
+            logger.debug(
+                "ModelConcurrencyLimiter: created slot model=%s limit=%d",
+                model,
+                limit,
+            )
+        return slot
+    async def acquire(self, model: str) -> _ConcurrencySlot:
+        """获取指定模型的并发槽位，必要时阻塞排队.
+        返回已获取的 Slot 实例，调用方负责在请求完成后调用 ``release()``。
+        """
+        slot = self._get_or_create_slot(model)
+        await slot.acquire()
+        return slot
+    def set_limit(self, model: str, new_limit: int) -> None:
+        """运行时修改指定模型的并发上限.
+        同时更新 config.models 以确保后续惰性创建使用新值。
+        """
+        slot = self._slots.get(model)
+        if slot is None:
+            slot = _ConcurrencySlot(new_limit)
+            self._slots[model] = slot
+        else:
+            slot.set_limit(new_limit)
+        self._config.models[model] = new_limit
+        logger.info(
+            "ModelConcurrencyLimiter: updated limit model=%s new_limit=%d",
+            model,
+            new_limit,
+        )
+    def get_diagnostics(self) -> dict[str, dict[str, int]]:
+        """返回每个模型的并发状态快照（用于可观测性）."""
+        snapshot: dict[str, dict[str, int]] = {}
+        for model, slot in self._slots.items():
+            snapshot[model] = {
+                "limit": slot.limit,
+                "in_use": slot.in_use,
+                "available": slot.available,
+                "pending": slot.pending,
+            }
+        return snapshot
+__all__ = ["ModelConcurrencyLimiter"]

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/src/coding/proxy/vendors/zhipu.py RENAMED Viewed

@@ -261,6 +261,13 @@ class ZhipuVendor(NativeAnthropicVendor):
             diagnostics["concurrency"] = self._concurrency_limiter.get_diagnostics()
         return diagnostics
+    def update_concurrency(self, model: str, limit: int) -> None:
+        """运行时更新指定模型的并发限制."""
+        if self._concurrency_limiter is None:
+            msg = "Concurrency limiter is not enabled for this vendor"
+            raise ValueError(msg)
+        self._concurrency_limiter.set_limit(model, limit)
     # ── 延迟计算 ────────────────────────────────────────────
     def _compute_retry_delay_from_headers(

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/tests/test_zhipu_concurrency.py RENAMED Viewed

@@ -141,12 +141,12 @@ class TestModelConcurrencyLimiter:
     @pytest.mark.asyncio
     async def test_lazy_semaphore_creation(self) -> None:
         limiter = ModelConcurrencyLimiter(ZhipuConcurrencyConfig(default=2))
-        sem_a = limiter._get_semaphore("model-a")
-        sem_b = limiter._get_semaphore("model-b")
-        # 不同模型独立 semaphore
-        assert sem_a is not sem_b
-        # 相同模型复用 semaphore
-        assert limiter._get_semaphore("model-a") is sem_a
+        slot_a = limiter._get_or_create_slot("model-a")
+        slot_b = limiter._get_or_create_slot("model-b")
+        # 不同模型独立 slot
+        assert slot_a is not slot_b
+        # 相同模型复用 slot
+        assert limiter._get_or_create_slot("model-a") is slot_a
     @pytest.mark.asyncio
     async def test_acquire_blocks_when_full(self) -> None:
@@ -184,8 +184,8 @@ class TestModelConcurrencyLimiter:
     def test_diagnostics_snapshot(self) -> None:
         limiter = ModelConcurrencyLimiter(ZhipuConcurrencyConfig(default=3))
-        # 触发 semaphore 创建
-        limiter._get_semaphore("glm-5.1")
+        # 触发 slot 创建
+        limiter._get_or_create_slot("glm-5.1")
         snap = limiter.get_diagnostics()
         assert "glm-5.1" in snap
         assert snap["glm-5.1"]["limit"] == 3
@@ -459,10 +459,10 @@ class TestZhipuVendorStreamConcurrency:
                     chunks.append(chunk)
                 assert len(chunks) == 2
-        # 确认 semaphore 当前完全可用
+        # 确认 slot 当前完全可用
         assert vendor._concurrency_limiter is not None
-        sem = vendor._concurrency_limiter._get_semaphore("glm-5.1")
-        assert sem._value == 1  # noqa: SLF001
+        slot = vendor._concurrency_limiter._get_or_create_slot("glm-5.1")
+        assert slot.available == 1
     @pytest.mark.asyncio
     async def test_stream_releases_slot_on_error(self) -> None:

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/uv.lock RENAMED Viewed

@@ -74,7 +74,7 @@ wheels = [
 [[package]]
 name = "coding-proxy"
-version = "0.4.1a11"
+version = "0.5.0"
 source = { editable = "." }
 dependencies = [
     { name = "aiosqlite" },

coding_proxy-0.4.1a11/src/coding/proxy/vendors/concurrency.py DELETED Viewed

@@ -1,83 +0,0 @@
-"""每模型并发限制器 — 基于 asyncio.Semaphore 的公平排队.
-为每个映射后的模型（如 ``glm-5v-turbo``）独立维护一个 ``asyncio.Semaphore``，
-确保同一时间点该模型的并行请求数不超过配置的上限。当所有槽位被占满时，
-新请求按 FIFO 顺序排队等待，直到有槽位释放。
-设计要点：
-  - **惰性创建**：仅在首次请求到达时才为该模型创建 Semaphore，避免冷启动开销
-  - **FIFO 公平**：``asyncio.Semaphore`` 内部使用 FIFO 队列，天然满足排队语义
-  - **按映射后模型名键控**：与上游真实承载能力对齐，而非按客户端请求名（如 ``claude-sonnet-*``）
-"""
-from __future__ import annotations
-import asyncio
-import logging
-from ..config.vendors import ZhipuConcurrencyConfig
-logger = logging.getLogger(__name__)
-class ModelConcurrencyLimiter:
-    """按模型名提供独立并发槽位的限制器.
-    用法::
-        limiter = ModelConcurrencyLimiter(config)
-        sem = await limiter.acquire("glm-5v-turbo")
-        try:
-            ...  # 执行请求
-        finally:
-            sem.release()
-    """
-    def __init__(self, config: ZhipuConcurrencyConfig) -> None:
-        self._config = config
-        self._semaphores: dict[str, asyncio.Semaphore] = {}
-    def _get_semaphore(self, model: str) -> asyncio.Semaphore:
-        """获取（或惰性创建）指定模型的信号量."""
-        sem = self._semaphores.get(model)
-        if sem is None:
-            limit = self._config.get_limit(model)
-            sem = asyncio.Semaphore(limit)
-            self._semaphores[model] = sem
-            logger.debug(
-                "ModelConcurrencyLimiter: created semaphore model=%s limit=%d",
-                model,
-                limit,
-            )
-        return sem
-    async def acquire(self, model: str) -> asyncio.Semaphore:
-        """获取指定模型的并发槽位，必要时阻塞排队.
-        返回已获取的 Semaphore 实例，调用方负责在请求完成后调用 ``release()``。
-        """
-        sem = self._get_semaphore(model)
-        await sem.acquire()
-        return sem
-    def get_diagnostics(self) -> dict[str, dict[str, int]]:
-        """返回每个模型的并发状态快照（用于可观测性）."""
-        snapshot: dict[str, dict[str, int]] = {}
-        for model, sem in self._semaphores.items():
-            limit = self._config.get_limit(model)
-            # asyncio.Semaphore 内部 _value 表示剩余可用槽位
-            available = sem._value  # noqa: SLF001 — 公开 API 未暴露
-            in_use = max(limit - available, 0)
-            # _waiters 为正在排队等待的协程集合，无等待者时为 None
-            waiters = getattr(sem, "_waiters", None)  # noqa: SLF001
-            pending = len(waiters) if waiters else 0
-            snapshot[model] = {
-                "limit": limit,
-                "in_use": in_use,
-                "available": max(available, 0),
-                "pending": pending,
-            }
-        return snapshot
-__all__ = ["ModelConcurrencyLimiter"]

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/.github/workflows/ci.yml RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/.github/workflows/coverage.yml RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/.github/workflows/release.yml RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/.gitignore RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/.pre-commit-config.yaml RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/CLAUDE.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/LICENSE RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/README.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/assets/dashboard-v0.4.0.png RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/assets/session-v0.4.0.png RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/agents/browser-validation.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/agents/issue.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/agents/knowledge-map.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/agents/reference-specifications.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/config-reference.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/convert.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/design-patterns.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/routing.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/testing.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/arch/vendors.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/framework.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/api-reference.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/cli-reference.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/dashboard.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/monitoring.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/quickstart.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/guide/vendors.md RENAMED Viewed

File without changes

{coding_proxy-0.4.1a11 → coding_proxy-0.5.0}/docs/ops/ci-cd.md RENAMED Viewed

File without changes

coding-proxy 0.4.1a11__tar.gz → 0.5.0__tar.gz

coding-proxy 0.4.1a11tar.gz → 0.5.0tar.gz