PyPI - api-key-manager - Versions diffs - 2.1.0__py3-none-any.whl - Mend

api-key-manager 2.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (73) hide show

api_key_manager-2.1.0.dist-info/METADATA +709 -0
api_key_manager-2.1.0.dist-info/RECORD +73 -0
api_key_manager-2.1.0.dist-info/WHEEL +5 -0
api_key_manager-2.1.0.dist-info/entry_points.txt +2 -0
api_key_manager-2.1.0.dist-info/top_level.txt +1 -0
key_manager/__init__.py +16 -0
key_manager/__main__.py +5 -0
key_manager/api_models.py +358 -0
key_manager/checker.py +51 -0
key_manager/cli.py +270 -0
key_manager/config.py +61 -0
key_manager/core.py +205 -0
key_manager/detector.py +335 -0
key_manager/errors.py +179 -0
key_manager/i18n.py +142 -0
key_manager/logger.py +207 -0
key_manager/model_capabilities.py +412 -0
key_manager/parser.py +153 -0
key_manager/providers/__init__.py +283 -0
key_manager/providers/ai302.py +109 -0
key_manager/providers/anthropic.py +109 -0
key_manager/providers/baichuan.py +97 -0
key_manager/providers/base.py +312 -0
key_manager/providers/cerebras.py +109 -0
key_manager/providers/cohere.py +90 -0
key_manager/providers/cstcloud.py +122 -0
key_manager/providers/dashscope.py +120 -0
key_manager/providers/dashscope_coding.py +122 -0
key_manager/providers/deepseek.py +166 -0
key_manager/providers/dmxapi.py +109 -0
key_manager/providers/doubao.py +109 -0
key_manager/providers/fireworks.py +109 -0
key_manager/providers/google.py +99 -0
key_manager/providers/grok.py +109 -0
key_manager/providers/groq.py +109 -0
key_manager/providers/huggingface.py +54 -0
key_manager/providers/hyperbolic.py +109 -0
key_manager/providers/infini.py +135 -0
key_manager/providers/infini_coding.py +124 -0
key_manager/providers/kimi.py +121 -0
key_manager/providers/kimi_coding.py +124 -0
key_manager/providers/longcat.py +123 -0
key_manager/providers/mimo.py +109 -0
key_manager/providers/mimo_plan.py +140 -0
key_manager/providers/minimax.py +97 -0
key_manager/providers/minimax_plan.py +122 -0
key_manager/providers/mistral.py +109 -0
key_manager/providers/models_registry.py +2901 -0
key_manager/providers/modelscope.py +134 -0
key_manager/providers/nvidia.py +109 -0
key_manager/providers/ocoolai.py +109 -0
key_manager/providers/openai.py +140 -0
key_manager/providers/openrouter.py +119 -0
key_manager/providers/perplexity.py +109 -0
key_manager/providers/poe.py +109 -0
key_manager/providers/ppio.py +109 -0
key_manager/providers/replicate.py +54 -0
key_manager/providers/siliconflow.py +121 -0
key_manager/providers/stepfun.py +132 -0
key_manager/providers/tencent_hunyuan.py +122 -0
key_manager/providers/together.py +134 -0
key_manager/providers/yi.py +97 -0
key_manager/providers/zai.py +109 -0
key_manager/providers/zhipu.py +127 -0
key_manager/providers/zhipu_coding.py +124 -0
key_manager/proxy.py +70 -0
key_manager/ssrf.py +68 -0
key_manager/storage.py +134 -0
key_manager/tester.py +137 -0
key_manager/url_override.py +5 -0
key_manager/validator.py +185 -0
key_manager/web.py +1512 -0
key_manager/webhook.py +257 -0

key_manager/providers/cstcloud.py ADDED Viewed

@@ -0,0 +1,122 @@
+import asyncio
+import time
+from .base import ProviderBase, CheckResult, TestResult
+class CSTCloudProvider(ProviderBase):
+    """中国科技云 AI provider."""
+    name = "cstcloud"
+    base_url = "https://uni-api.cstcloud.cn/v1"
+    check_endpoint = "/models"
+    check_model = "gpt-3.5-turbo"
+    def build_headers(self, key: str) -> dict:
+        return {"Authorization": f"Bearer {key}"}
+    async def get_models(self, client, key: str) -> list[str]:
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            if resp.status_code == 200:
+                data = resp.json()
+                if "data" in data:
+                    return [m["id"] for m in data["data"] if "id" in m]
+            return []
+        except Exception:
+            return []
+    async def check(self, client, key: str) -> CheckResult:
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        start = time.monotonic()
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={"model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "hi"}], "max_tokens": 5}
+            )
+            latency = (time.monotonic() - start) * 1000
+            if resp.status_code == 200:
+                return CheckResult(True, 200, latency, None)
+            elif resp.status_code in (401, 403):
+                return CheckResult(False, resp.status_code, latency, "invalid key or forbidden")
+            elif resp.status_code == 429:
+                return CheckResult(False, 429, latency, "rate limited")
+            else:
+                try:
+                    data = resp.json()
+                    error_msg = data.get("error", {}).get("message", f"status {resp.status_code}")
+                except:
+                    error_msg = f"status {resp.status_code}"
+                return CheckResult(False, resp.status_code, latency, error_msg)
+        except Exception as e:
+            return CheckResult(False, None, (time.monotonic() - start) * 1000, str(e))
+    async def test_token_limit(self, client, key: str, token_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in token_steps:
+            try:
+                resp = await client.post(
+                    f"{self.get_base_url()}/chat/completions",
+                    headers=headers,
+                    json={"model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "hi"}], "max_tokens": step}
+                )
+                if resp.status_code == 200:
+                    last_success = step
+                elif resp.status_code in (400, 413):
+                    break
+                elif resp.status_code == 429:
+                    await asyncio.sleep(1)
+                    continue
+                else:
+                    break
+            except Exception:
+                break
+        return TestResult(max_tokens=last_success)
+    async def check_real(self, client, key: str) -> CheckResult:
+        return await self.check(client, key)
+    async def test_concurrency(self, client, key: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe(client, headers) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe(self, client, headers) -> bool:
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            return resp.status_code == 200
+        except Exception:
+            return False
+    async def test_concurrency_for_model(self, client, key: str, model: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe_model(client, headers, model) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe_model(self, client, headers, model: str) -> bool:
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={"model": model, "messages": [{"role": "user", "content": "hi"}], "max_tokens": 1}
+            )
+            return resp.status_code == 200
+        except Exception:
+            return False

key_manager/providers/dashscope.py ADDED Viewed

@@ -0,0 +1,120 @@
+import asyncio
+import time
+from .base import ProviderBase, CheckResult, TestResult, BalanceResult
+class DashScopeProvider(ProviderBase):
+    name = "dashscope"
+    base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1"
+    check_endpoint = "/models"
+    check_model = "qwen-turbo"
+    def build_headers(self, key: str) -> dict:
+        return {"Authorization": f"Bearer {key}"}
+    async def get_models(self, client, key: str) -> list[str]:
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(f"{self.get_base_url()}/models", headers=headers)
+            if resp.status_code == 200:
+                data = resp.json()
+                if "data" in data:
+                    return [m["id"] for m in data["data"] if "id" in m]
+            return []
+        except Exception:
+            return []
+    async def check(self, client, key: str) -> CheckResult:
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        start = time.monotonic()
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={"model": "qwen-turbo", "messages": [{"role": "user", "content": "hi"}], "max_tokens": 5}
+            )
+            latency = (time.monotonic() - start) * 1000
+            if resp.status_code == 200:
+                return CheckResult(True, 200, latency, None)
+            elif resp.status_code in (401, 403):
+                return CheckResult(False, resp.status_code, latency, "invalid key or forbidden")
+            elif resp.status_code == 429:
+                return CheckResult(False, 429, latency, "rate limited")
+            else:
+                try:
+                    data = resp.json()
+                    error_msg = data.get("error", {}).get("message", f"status {resp.status_code}")
+                except:
+                    error_msg = f"status {resp.status_code}"
+                return CheckResult(False, resp.status_code, latency, error_msg)
+        except Exception as e:
+            return CheckResult(False, None, (time.monotonic() - start) * 1000, str(e))
+    async def test_token_limit(self, client, key: str, token_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in token_steps:
+            try:
+                resp = await client.post(
+                    f"{self.get_base_url()}/chat/completions",
+                    headers=headers,
+                    json={"model": "qwen-turbo", "messages": [{"role": "user", "content": "hi"}], "max_tokens": step}
+                )
+                if resp.status_code == 200:
+                    last_success = step
+                elif resp.status_code in (400, 413):
+                    break
+                elif resp.status_code == 429:
+                    await asyncio.sleep(1)
+                    continue
+                else:
+                    break
+            except Exception:
+                break
+        return TestResult(max_tokens=last_success)
+    async def check_real(self, client, key: str) -> CheckResult:
+        return await self.check(client, key)
+    async def test_concurrency(self, client, key: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe(client, headers) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe(self, client, headers) -> bool:
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            return resp.status_code == 200
+        except Exception:
+            return False
+    async def get_balance(self, client, key: str) -> BalanceResult:
+        """Get account balance via DashScope recharge balance API."""
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(
+                f"https://dashscope.aliyuncs.com/api/v1/recharge/recharge-balance/query",
+                headers=headers
+            )
+            if resp.status_code == 200:
+                data = resp.json()
+                return BalanceResult(
+                    supported=True,
+                    balance=float(data.get("available_balance", 0)),
+                    currency="CNY",
+                    raw=data,
+                )
+            elif resp.status_code in (401, 403):
+                return BalanceResult(supported=True, error="invalid key or forbidden")
+            else:
+                return BalanceResult(supported=True, error=f"status {resp.status_code}")
+        except Exception as e:
+            return BalanceResult(supported=True, error=str(e))

key_manager/providers/dashscope_coding.py ADDED Viewed

@@ -0,0 +1,122 @@
+import asyncio
+import time
+from .base import ProviderBase, CheckResult, TestResult
+class DashScopeCodingProvider(ProviderBase):
+    """阿里百炼 Coding Plan provider."""
+    name = "dashscope-coding"
+    base_url = "https://coding-intl.dashscope.aliyuncs.com/compatible-mode/v1"
+    check_endpoint = "/models"
+    check_model = "qwen-coder-plus"
+    def build_headers(self, key: str) -> dict:
+        return {"Authorization": f"Bearer {key}"}
+    async def get_models(self, client, key: str) -> list[str]:
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            if resp.status_code == 200:
+                data = resp.json()
+                if "data" in data:
+                    return [m["id"] for m in data["data"] if "id" in m]
+            return []
+        except Exception:
+            return []
+    async def check(self, client, key: str) -> CheckResult:
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        start = time.monotonic()
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={"model": "qwen-coder-plus", "messages": [{"role": "user", "content": "hi"}], "max_tokens": 5}
+            )
+            latency = (time.monotonic() - start) * 1000
+            if resp.status_code == 200:
+                return CheckResult(True, 200, latency, None)
+            elif resp.status_code in (401, 403):
+                return CheckResult(False, resp.status_code, latency, "invalid key or forbidden")
+            elif resp.status_code == 429:
+                return CheckResult(False, 429, latency, "rate limited")
+            else:
+                try:
+                    data = resp.json()
+                    error_msg = data.get("error", {}).get("message", f"status {resp.status_code}")
+                except:
+                    error_msg = f"status {resp.status_code}"
+                return CheckResult(False, resp.status_code, latency, error_msg)
+        except Exception as e:
+            return CheckResult(False, None, (time.monotonic() - start) * 1000, str(e))
+    async def test_token_limit(self, client, key: str, token_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in token_steps:
+            try:
+                resp = await client.post(
+                    f"{self.get_base_url()}/chat/completions",
+                    headers=headers,
+                    json={"model": "qwen-coder-plus", "messages": [{"role": "user", "content": "hi"}], "max_tokens": step}
+                )
+                if resp.status_code == 200:
+                    last_success = step
+                elif resp.status_code in (400, 413):
+                    break
+                elif resp.status_code == 429:
+                    await asyncio.sleep(1)
+                    continue
+                else:
+                    break
+            except Exception:
+                break
+        return TestResult(max_tokens=last_success)
+    async def check_real(self, client, key: str) -> CheckResult:
+        return await self.check(client, key)
+    async def test_concurrency(self, client, key: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe(client, headers) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe(self, client, headers) -> bool:
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            return resp.status_code == 200
+        except Exception:
+            return False
+    async def test_concurrency_for_model(self, client, key: str, model: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe_model(client, headers, model) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe_model(self, client, headers, model: str) -> bool:
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={"model": model, "messages": [{"role": "user", "content": "hi"}], "max_tokens": 1}
+            )
+            return resp.status_code == 200
+        except Exception:
+            return False

key_manager/providers/deepseek.py ADDED Viewed

@@ -0,0 +1,166 @@
+import asyncio
+import time
+from .base import ProviderBase, CheckResult, TestResult, BalanceResult
+class DeepSeekProvider(ProviderBase):
+    name = "deepseek"
+    base_url = "https://api.deepseek.com"
+    check_endpoint = "/models"
+    def build_headers(self, key: str) -> dict:
+        return {"Authorization": f"Bearer {key}"}
+    async def get_models(self, client, key: str) -> list[str]:
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(
+                f"{self.get_base_url()}{self.check_endpoint}",
+                headers=headers
+            )
+            if resp.status_code == 200:
+                data = resp.json()
+                if "data" in data:
+                    return [m["id"] for m in data["data"] if "id" in m]
+            return []
+        except Exception:
+            return []
+    async def check(self, client, key: str) -> CheckResult:
+        """Real usage test - try to make a minimal chat completion request."""
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        start = time.monotonic()
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={
+                    "model": "deepseek-chat",
+                    "messages": [{"role": "user", "content": "hi"}],
+                    "max_tokens": 5
+                }
+            )
+            latency = (time.monotonic() - start) * 1000
+            if resp.status_code == 200:
+                return CheckResult(True, 200, latency, None)
+            elif resp.status_code in (401, 403):
+                return CheckResult(False, resp.status_code, latency, "invalid key or forbidden")
+            elif resp.status_code == 429:
+                return CheckResult(False, 429, latency, "rate limited")
+            else:
+                try:
+                    data = resp.json()
+                    error_msg = data.get("error", {}).get("message", f"status {resp.status_code}")
+                except:
+                    error_msg = f"status {resp.status_code}"
+                return CheckResult(False, resp.status_code, latency, error_msg)
+        except Exception as e:
+            return CheckResult(False, None, (time.monotonic() - start) * 1000, str(e))
+    async def test_token_limit(self, client, key: str, token_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in token_steps:
+            try:
+                resp = await client.post(
+                    f"{self.get_base_url()}/chat/completions",
+                    headers=headers,
+                    json={
+                        "model": "deepseek-chat",
+                        "messages": [{"role": "user", "content": "hi"}],
+                        "max_tokens": step
+                    }
+                )
+                if resp.status_code == 200:
+                    last_success = step
+                elif resp.status_code in (400, 413):
+                    break
+                elif resp.status_code == 429:
+                    await asyncio.sleep(1)
+                    continue
+                else:
+                    break
+            except Exception:
+                break
+        return TestResult(max_tokens=last_success)
+    async def check_real(self, client, key: str) -> CheckResult:
+        return await self.check(client, key)
+    async def test_concurrency(self, client, key: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe(client, headers) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe(self, client, headers) -> bool:
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            return resp.status_code == 200
+        except Exception:
+            return False
+    async def test_concurrency_for_model(self, client, key: str, model: str, concurrency_steps: list[int]) -> TestResult:
+        """Test concurrency for a specific model using chat completions."""
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe_model(client, headers, model) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe_model(self, client, headers, model: str) -> bool:
+        """Probe a specific model with a minimal chat completion request."""
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={
+                    "model": model,
+                    "messages": [{"role": "user", "content": "hi"}],
+                    "max_tokens": 1
+                }
+            )
+            return resp.status_code == 200
+        except Exception:
+            return False
+    async def get_balance(self, client, key: str) -> BalanceResult:
+        """Get account balance via DeepSeek balance API."""
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(
+                f"{self.get_base_url()}/user/balance",
+                headers=headers
+            )
+            if resp.status_code == 200:
+                data = resp.json()
+                balance_infos = data.get("balance_infos", [])
+                if balance_infos:
+                    info = balance_infos[0]
+                    return BalanceResult(
+                        supported=True,
+                        balance=float(info.get("total_balance", 0)),
+                        currency=info.get("currency", "USD"),
+                        raw=data,
+                    )
+                return BalanceResult(supported=True, balance=0.0, raw=data)
+            elif resp.status_code in (401, 403):
+                return BalanceResult(supported=True, error="invalid key or forbidden")
+            else:
+                return BalanceResult(supported=True, error=f"status {resp.status_code}")
+        except Exception as e:
+            return BalanceResult(supported=True, error=str(e))

key_manager/providers/dmxapi.py ADDED Viewed

@@ -0,0 +1,109 @@
+import asyncio
+import time
+from .base import ProviderBase, CheckResult, TestResult
+class DMXAPIProvider(ProviderBase):
+    name = "dmxapi"
+    base_url = "https://www.dmxapi.cn/v1"
+    check_endpoint = "/models"
+    def build_headers(self, key: str) -> dict:
+        return {"Authorization": f"Bearer {key}"}
+    async def get_models(self, client, key: str) -> list[str]:
+        headers = self.build_headers(key)
+        try:
+            resp = await client.get(
+                f"{self.get_base_url()}{self.check_endpoint}",
+                headers=headers
+            )
+            if resp.status_code == 200:
+                data = resp.json()
+                if "data" in data:
+                    return [m["id"] for m in data["data"] if "id" in m]
+            return []
+        except Exception:
+            return []
+    async def check(self, client, key: str) -> CheckResult:
+        """Real usage test - try to make a minimal chat completion request."""
+        headers = self.build_headers(key)
+        headers["Content-Type"] = "application/json"
+        start = time.monotonic()
+        try:
+            resp = await client.post(
+                f"{self.get_base_url()}/chat/completions",
+                headers=headers,
+                json={
+                    "model": "gpt-4o-mini",
+                    "messages": [{"role": "user", "content": "hi"}],
+                    "max_tokens": 5
+                }
+            )
+            latency = (time.monotonic() - start) * 1000
+            if resp.status_code == 200:
+                return CheckResult(True, 200, latency, None)
+            elif resp.status_code in (401, 403):
+                return CheckResult(False, resp.status_code, latency, "invalid key or forbidden")
+            elif resp.status_code == 429:
+                return CheckResult(False, 429, latency, "rate limited")
+            else:
+                try:
+                    data = resp.json()
+                    error_msg = data.get("error", {}).get("message", f"status {resp.status_code}")
+                except:
+                    error_msg = f"status {resp.status_code}"
+                return CheckResult(False, resp.status_code, latency, error_msg)
+        except Exception as e:
+            return CheckResult(False, None, (time.monotonic() - start) * 1000, str(e))
+    async def test_token_limit(self, client, key: str, token_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in token_steps:
+            try:
+                resp = await client.post(
+                    f"{self.get_base_url()}/chat/completions",
+                    headers=headers,
+                    json={
+                        "model": "gpt-4o-mini",
+                        "messages": [{"role": "user", "content": "hi"}],
+                        "max_tokens": step
+                    }
+                )
+                if resp.status_code == 200:
+                    last_success = step
+                elif resp.status_code in (400, 413):
+                    break
+                elif resp.status_code == 429:
+                    await asyncio.sleep(1)
+                    continue
+                else:
+                    break
+            except Exception:
+                break
+        return TestResult(max_tokens=last_success)
+    async def check_real(self, client, key: str) -> CheckResult:
+        return await self.check(client, key)
+    async def test_concurrency(self, client, key: str, concurrency_steps: list[int]) -> TestResult:
+        headers = self.build_headers(key)
+        last_success = None
+        for step in concurrency_steps:
+            tasks = [self._probe(client, headers) for _ in range(step)]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+            rate_limited = sum(1 for r in results if not isinstance(r, Exception) and not r)
+            if rate_limited / step >= 0.3:
+                break
+            last_success = step
+        return TestResult(max_concurrency=last_success)
+    async def _probe(self, client, headers) -> bool:
+        try:
+            resp = await client.get(f"{self.get_base_url()}{self.check_endpoint}", headers=headers)
+            return resp.status_code == 200
+        except Exception:
+            return False