npm - @starlink-awaken/agentmesh - Versions diffs - 1.2.6 → 1.3.0 - Mend

@starlink-awaken/agentmesh 1.2.6 → 1.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

package/config/gateway.yaml +212 -250
package/dist/src/cli/connect.js +32 -1
package/dist/src/cli.js +41 -2
package/dist/src/model-gateway/metrics.d.ts +28 -0
package/dist/src/model-gateway/metrics.js +60 -0
package/dist/src/model-gateway/router.d.ts +1 -0
package/dist/src/model-gateway/router.js +13 -0
package/dist/src/model-gateway/routes.js +20 -7
package/package.json +1 -1

package/config/gateway.yaml CHANGED Viewed

@@ -1,268 +1,230 @@
-port: 3000
-wsPort: 3001
-host: "0.0.0.0"
-dataDir: "./data"
-logDir: "./logs"
-routing:
-  defaultAgent: "claude-code"
-  rules:
-    # Claude Code - 通用代码任务
-    - name: code-generation
-      keywords:
-        - write code
-        - generate code
-        - create function
-        - create class
-        - 写代码
-        - 生成代码
-      agent: claude-code
-      priority: 10
-    - name: code-review
-      keywords:
-        - review
-        - code review
-        - pr review
-        - review code
-        - 代码审查
-        - review code
-      agent: claude-code
-      priority: 15
-    - name: debugging
-      keywords:
-        - debug
-        - fix bug
-        - error
-        - bug
-        - 调试
-        - 修复错误
-      agent: claude-code
-      priority: 15
-    - name: refactoring
-      keywords:
-        - refactor
-        - 重构
-        - improve code
-      agent: claude-code
-      priority: 10
-    - name: documentation
-      keywords:
-        - docs
-        - document
-        - 文档
-        - write docs
-      agent: claude-code
-      priority: 10
-    # OpenClaw - 浏览器自动化
-    - name: browser-automation
-      keywords:
-        - browser
-        - scrape
-        - click
-        - screenshot
-        - web automation
-        - 浏览器
-        - 爬虫
-        - 截图
-      agent: openclaw
-      priority: 15
-    - name: web-scraping
-      keywords:
-        - scrap
-        - crawl
-        - extract data
-        - 抓取
-        - 采集
-      agent: openclaw
-      priority: 15
-    # Cursor - AI 编程
-    - name: cursor-task
-      keywords:
-        - cursor
-        - cursor task
-      agent: cursor
-      priority: 12
-    # Windsurf - Flow 状态编程
-    - name: windsurf-task
-      keywords:
-        - windsurf
-        - flow state
-      agent: windsurf
-      priority: 12
-    # Qwen Code - 中文编程
-    - name: qwen-task
-      keywords:
-        - qwen
-        - 通义千问
-      agent: qwen-code
-      priority: 12
-    # Gemini - 多模态
-    - name: gemini-task
-      keywords:
-        - gemini
-        - multimodal
-        - 多模态
-      agent: gemini
-      priority: 12
-    # Droid - Android 开发
-    - name: android-development
-      keywords:
-        - android
-        - apk
-        - mobile
-        - 安卓
-        - 手机应用
-      agent: droid
-      priority: 15
-    # Aider - Git 集成编辑
-    - name: aider-task
-      keywords:
-        - aider
-        - git edit
-        - refactor git
-      agent: aider
-      priority: 12
-    # Cline - 自主编程
-    - name: cline-task
-      keywords:
-        - cline
-        - autonomous
-      agent: cline
-      priority: 12
-    # Roo Code
-    - name: roo-code-task
-      keywords:
-        - roo-code
-        - roo
-      agent: roo-code
-      priority: 12
-    # 多 Agent 协作
-    - name: multi-agent
-      keywords:
-        - collaborate
-        - team
-        - together
-        - multiple agents
-        - 协作
-        - 多个
-      strategy: broadcast
-      agents:
-        - claude-code
-        - openclaw
-      priority: 20
-# =============================================================================
-# 模型网关配置 — 多 Provider 路由 + 配额感知 Fallback
-# =============================================================================
+agents:
+- capabilities:
+  - code-generation
+  - code-review
+  - debugging
+  - refactoring
+  - documentation
+  - file-operations
+  id: claude-code
+  name: Claude Code
+  type: claude-code
+- capabilities:
+  - browser-automation
+  - web-scraping
+  - form-filling
+  - ui-testing
+  id: openclaw
+  name: OpenClaw
+  type: openclaw
+dataDir: ./data
+host: 0.0.0.0
+logDir: ./logs
 models:
   default_model: deepseek-chat
-  # 默认配置（各 Provider 可覆盖）
   defaults:
     circuit_breaker:
       failure_threshold: 3
-      reset_timeout_ms: 30000
       half_open_max_requests: 1
+      reset_timeout_ms: 30000
     retry:
-      max_retries: 3
       base_delay_ms: 500
       max_delay_ms: 10000
-      retryable_statuses: [429, 500, 502, 503, 504]
+      max_retries: 3
+      retryable_statuses:
+      - 429
+      - 500
+      - 502
+      - 503
+      - 504
+  fallback_chain:
+  - deepseek
+  - openrouter
+  - ollama
+  model_routing:
+    claude:
+    - openrouter
+    codestral:
+    - ollama
+    deepseek:
+    - deepseek
+    gemini:
+    - openrouter
+    gpt-:
+    - openai
+    - deepseek
+    gpt-5.3-codex:
+    - deepseek
+    llama:
+    - ollama
+    o1:
+    - openai
+    - deepseek
+    o4:
+    - openai
+    - deepseek
+    qwen:
+    - ollama
   providers:
     deepseek:
-      base_url: https://api.deepseek.com/v1
       api_key_env: DEEPSEEK_API_KEY
+      base_url: https://api.deepseek.com/v1
+      models:
+      - deepseek-chat
+      - deepseek-reasoner
+      - deepseek-v4-pro
+      - deepseek-v4-flash
+    ollama:
+      api_key: ollama
+      base_url: http://127.0.0.1:11434/v1
       models:
-        - deepseek-chat
-        - deepseek-reasoner
-        - deepseek-v4-pro
-        - deepseek-v4-flash
+      - qwen3:14b
+      - codestral:22b
+      - llama3.1:8b
     openai:
-      base_url: https://api.openai.com/v1
       api_key_env: OPENAI_API_KEY
+      base_url: https://api.openai.com/v1
       models:
-        - gpt-5.1
-        - gpt-5.1-codex
-        - o4-mini
+      - gpt-5.1
+      - gpt-5.1-codex
+      - o4-mini
     openrouter:
-      base_url: https://openrouter.ai/api/v1
       api_key_env: OPENROUTER_API_KEY
-    ollama:
-      base_url: http://127.0.0.1:11434/v1
-      api_key: ollama
-      models:
-        - qwen3:14b
-        - codestral:22b
-        - llama3.1:8b
-  # Fallback 链：主 Provider 不可用时依次尝试
-  fallback_chain:
-    - deepseek
-    - openrouter
-    - ollama
-  # 模型名 → 优先 Provider 列表
-  model_routing:
-    "deepseek":
-      - deepseek
-    "gpt-":
-      - openai
-      - deepseek
-    "o1":
-      - openai
-      - deepseek
-    "o4":
-      - openai
-      - deepseek
-    "claude":
-      - openrouter
-    "gemini":
-      - openrouter
-    "qwen":
-      - ollama
-    "codestral":
-      - ollama
-    "llama":
-      - ollama
-# =============================================================================
-# Agent 配置
-# =============================================================================
-agents:
-  # 内置 Agent（在代码中注册）
-  - id: claude-code
-    name: Claude Code
-    type: claude-code
-    capabilities:
-      - code-generation
-      - code-review
-      - debugging
-      - refactoring
-      - documentation
-      - file-operations
-  - id: openclaw
-    name: OpenClaw
-    type: openclaw
-    capabilities:
-      - browser-automation
-      - web-scraping
-      - form-filling
-      - ui-testing
+      base_url: https://openrouter.ai/api/v1
+port: 3000
+routing:
+  defaultAgent: claude-code
+  rules:
+  - agent: claude-code
+    keywords:
+    - write code
+    - generate code
+    - create function
+    - create class
+    - 写代码
+    - 生成代码
+    name: code-generation
+    priority: 10
+  - agent: claude-code
+    keywords:
+    - review
+    - code review
+    - pr review
+    - review code
+    - 代码审查
+    - review code
+    name: code-review
+    priority: 15
+  - agent: claude-code
+    keywords:
+    - debug
+    - fix bug
+    - error
+    - bug
+    - 调试
+    - 修复错误
+    name: debugging
+    priority: 15
+  - agent: claude-code
+    keywords:
+    - refactor
+    - 重构
+    - improve code
+    name: refactoring
+    priority: 10
+  - agent: claude-code
+    keywords:
+    - docs
+    - document
+    - 文档
+    - write docs
+    name: documentation
+    priority: 10
+  - agent: openclaw
+    keywords:
+    - browser
+    - scrape
+    - click
+    - screenshot
+    - web automation
+    - 浏览器
+    - 爬虫
+    - 截图
+    name: browser-automation
+    priority: 15
+  - agent: openclaw
+    keywords:
+    - scrap
+    - crawl
+    - extract data
+    - 抓取
+    - 采集
+    name: web-scraping
+    priority: 15
+  - agent: cursor
+    keywords:
+    - cursor
+    - cursor task
+    name: cursor-task
+    priority: 12
+  - agent: windsurf
+    keywords:
+    - windsurf
+    - flow state
+    name: windsurf-task
+    priority: 12
+  - agent: qwen-code
+    keywords:
+    - qwen
+    - 通义千问
+    name: qwen-task
+    priority: 12
+  - agent: gemini
+    keywords:
+    - gemini
+    - multimodal
+    - 多模态
+    name: gemini-task
+    priority: 12
+  - agent: droid
+    keywords:
+    - android
+    - apk
+    - mobile
+    - 安卓
+    - 手机应用
+    name: android-development
+    priority: 15
+  - agent: aider
+    keywords:
+    - aider
+    - git edit
+    - refactor git
+    name: aider-task
+    priority: 12
+  - agent: cline
+    keywords:
+    - cline
+    - autonomous
+    name: cline-task
+    priority: 12
+  - agent: roo-code
+    keywords:
+    - roo-code
+    - roo
+    name: roo-code-task
+    priority: 12
+  - agents:
+    - claude-code
+    - openclaw
+    keywords:
+    - collaborate
+    - team
+    - together
+    - multiple agents
+    - 协作
+    - 多个
+    name: multi-agent
+    priority: 20
+    strategy: broadcast
+wsPort: 3001

package/dist/src/cli/connect.js CHANGED Viewed

@@ -85,9 +85,11 @@ const codexDesktopAdapter = {
     },
     generateConfig(gwUrl) {
         const path = this.getConfigPath();
+        const catalogPath = join(HOME, '.codex', 'model-catalogs', 'agentmesh-models.json');
         const section = {
             model: 'deepseek-v4-pro',
             model_provider: 'agentmesh',
+            model_catalog_json: catalogPath,
         };
         const providerSection = {
             name: 'Agent Mesh Gateway',
@@ -98,7 +100,12 @@ const codexDesktopAdapter = {
         return {
             path,
             format: 'toml',
-            content: { model: section.model, model_provider: section.model_provider, model_providers: { agentmesh: providerSection } },
+            content: {
+                model: section.model,
+                model_provider: section.model_provider,
+                model_catalog_json: section.model_catalog_json,
+                model_providers: { agentmesh: providerSection },
+            },
         };
     },
     hasGatewayConfig(config) {
@@ -300,6 +307,30 @@ export async function connectTools(targetTools, opts = {}) {
                     break;
                 }
             }
+            // Codex Desktop: 注入模型到 models_cache.json
+            if (adapter.name === 'codex-desktop' && !opts.dryRun) {
+                try {
+                    const cachePath = join(HOME, '.codex', 'models_cache.json');
+                    if (existsSync(cachePath)) {
+                        const cache = JSON.parse(readFileSync(cachePath, 'utf-8'));
+                        const slugs = new Set(cache.models?.map((m) => m.slug) || []);
+                        const newModels = [
+                            { slug: 'deepseek-v4-pro', display_name: 'DeepSeek V4 Pro', description: 'DeepSeek V4 Pro via Agent Mesh — 强推理，代码生成', default_reasoning_level: 'high', supported_reasoning_levels: [{ effort: 'low', description: '快速响应' }, { effort: 'medium', description: '平衡速度与推理' }, { effort: 'high', description: '深度推理' }], visibility: 'list', supported_in_api: true, priority: 10, service_tiers: [], additional_speed_tiers: [] },
+                            { slug: 'deepseek-v4-flash', display_name: 'DeepSeek V4 Flash', description: 'DeepSeek V4 Flash via Agent Mesh — 快速、便宜', default_reasoning_level: 'low', supported_reasoning_levels: [{ effort: 'low', description: '快速响应' }], visibility: 'list', supported_in_api: true, priority: 20, service_tiers: [], additional_speed_tiers: [] },
+                        ];
+                        let added = 0;
+                        for (const m of newModels) {
+                            if (!slugs.has(m.slug)) {
+                                cache.models.push(m);
+                                added++;
+                            }
+                        }
+                        if (added > 0)
+                            writeFileSync(cachePath, JSON.stringify(cache, null, 2) + '\n');
+                    }
+                }
+                catch { }
+            }
             results.push({
                 tool: adapter.name,
                 status: 'ok',

package/dist/src/cli.js CHANGED Viewed

@@ -7,7 +7,7 @@ import { existsSync, readFileSync } from 'node:fs';
 import { resolve, dirname, join } from 'node:path';
 import { initLogger } from './core/logger.js';
 const PROJECT_ROOT = resolve(dirname(import.meta.dir), '..');
-const VERSION = '1.2.6';
+const VERSION = '1.3.0';
 const BANNER = `
    █████╗  ██████╗ ███████╗███╗   ██╗████████╗
   ██╔══██╗██╔════╝ ██╔════╝████╗  ██║╚══██╔══╝
@@ -250,6 +250,42 @@ async function cmdConfig(args) {
         }
     }
 }
+async function cmdStatus() {
+    try {
+        const [health, models, stats] = await Promise.all([
+            apiRequest('/health'),
+            apiRequest('/v1/models').catch(() => ({ data: [] })),
+            apiRequest('/model-gateway/stats').catch(() => null),
+        ]);
+        console.log(`
+╔═══════════════════════════════════════════════════╗
+║     Agent Mesh Gateway Status                    ║
+╠═══════════════════════════════════════════════════╣
+║  Status:    ${health.status}                                      ║
+║  Agents:    ${String(health.agents?.length || 0).padStart(2)} online                               ║
+║  Models:    ${String(models.data?.length || 0).padStart(2)} available                            ║
+║  Uptime:    ${stats?.uptime_seconds ? Math.floor(stats.uptime_seconds) + 's' : 'N/A'}                                   ║
+╠═══════════════════════════════════════════════════╣`);
+        if (stats?.providers) {
+            console.log('║  Provider Metrics:                              ║');
+            for (const [name, m] of Object.entries(stats.providers)) {
+                console.log(`║  ${name.padEnd(12)} reqs:${String(m.requests).padStart(5)}  ok:${(m.success_rate || 'N/A').padStart(6)}  avg:${String(m.avg_latency_ms || 0).padStart(4)}ms     ║`);
+            }
+        }
+        if (stats?.recent?.length) {
+            console.log('╠═══════════════════════════════════════════════════╣');
+            console.log('║  Recent:                                        ║');
+            for (const r of stats.recent.slice(0, 5)) {
+                const time = new Date(r.time).toLocaleTimeString();
+                console.log(`║  ${r.status >= 400 ? '❌' : '✅'} ${time} ${r.model} → ${r.actual}  ${r.latency_ms}ms              ║`);
+            }
+        }
+        console.log('╚═══════════════════════════════════════════════════╝\n');
+    }
+    catch {
+        console.error('\n  ❌ Gateway not reachable. Start: agentmesh start\n');
+    }
+}
 async function cmdDoctor() {
     console.log('\n  🔍 Agent Mesh Gateway Diagnostics\n');
     const checks = [];
@@ -326,9 +362,12 @@ async function main() {
                 await runSetup();
                 break;
             case 'health':
-            case 'status':
                 await cmdHealth();
                 break;
+            case 'status':
+            case 'info':
+                await cmdStatus();
+                break;
             case 'models':
             case 'model':
                 await cmdModels();

package/dist/src/model-gateway/metrics.d.ts ADDED Viewed

@@ -0,0 +1,28 @@
+interface RequestLog {
+    timestamp: number;
+    model: string;
+    provider: string;
+    actualModel: string;
+    latencyMs: number;
+    status: number;
+    error?: string;
+    streaming: boolean;
+}
+export declare function recordRequest(log: RequestLog): void;
+export declare function getMetrics(): {
+    uptime_seconds: number;
+    total_requests: number;
+    total_failures: number;
+    providers: Record<string, any>;
+    recent: {
+        time: string;
+        model: string;
+        provider: string;
+        actual: string;
+        latency_ms: number;
+        status: number;
+        streaming: boolean;
+        error: string | undefined;
+    }[];
+};
+export {};

package/dist/src/model-gateway/metrics.js ADDED Viewed

@@ -0,0 +1,60 @@
+// 网关运行时指标收集
+const providerMetrics = new Map();
+const recentRequests = [];
+const MAX_RECENT = 200;
+function getOrInitProvider(name) {
+    if (!providerMetrics.has(name)) {
+        providerMetrics.set(name, { requests: 0, success: 0, failures: 0, totalLatencyMs: 0 });
+    }
+    return providerMetrics.get(name);
+}
+export function recordRequest(log) {
+    const m = getOrInitProvider(log.provider);
+    m.requests++;
+    m.totalLatencyMs += log.latencyMs;
+    if (log.status >= 200 && log.status < 400) {
+        m.success++;
+        m.lastSuccessTime = log.timestamp;
+    }
+    else {
+        m.failures++;
+        m.lastError = log.error;
+        m.lastErrorTime = log.timestamp;
+    }
+    recentRequests.unshift(log);
+    if (recentRequests.length > MAX_RECENT)
+        recentRequests.pop();
+}
+export function getMetrics() {
+    const providers = {};
+    let totalRequests = 0;
+    let totalFailures = 0;
+    for (const [name, m] of providerMetrics) {
+        totalRequests += m.requests;
+        totalFailures += m.failures;
+        providers[name] = {
+            requests: m.requests,
+            success_rate: m.requests > 0 ? ((m.success / m.requests) * 100).toFixed(1) + '%' : 'N/A',
+            avg_latency_ms: m.requests > 0 ? Math.round(m.totalLatencyMs / m.requests) : 0,
+            last_success: m.lastSuccessTime ? new Date(m.lastSuccessTime).toISOString() : null,
+            last_error: m.lastError || null,
+            last_error_time: m.lastErrorTime ? new Date(m.lastErrorTime).toISOString() : null,
+        };
+    }
+    return {
+        uptime_seconds: Math.round(process.uptime()),
+        total_requests: totalRequests,
+        total_failures: totalFailures,
+        providers,
+        recent: recentRequests.slice(0, 20).map(r => ({
+            time: new Date(r.timestamp).toISOString(),
+            model: r.model,
+            provider: r.provider,
+            actual: r.actualModel,
+            latency_ms: r.latencyMs,
+            status: r.status,
+            streaming: r.streaming,
+            error: r.error,
+        })),
+    };
+}

package/dist/src/model-gateway/router.d.ts CHANGED Viewed

@@ -2,3 +2,4 @@ import type { ModelGatewayConfig, ResolvedProvider } from './types.js';
 export declare function initModelRouter(cfg: ModelGatewayConfig): void;
 export declare function getConfig(): ModelGatewayConfig;
 export declare function resolveProvider(model: string): ResolvedProvider | null;
+export declare function remapModel(model: string, providerName: string): string;

package/dist/src/model-gateway/router.js CHANGED Viewed

@@ -1,5 +1,15 @@
 import { isProviderAvailable } from './quota.js';
 import { circuitBreakerRegistry } from './circuit-breaker.js';
+// 模型名重映射：对外模型名 → 实际 Provider 的模型名
+const MODEL_ALIASES = {
+    deepseek: {
+        'gpt-5.3-codex': 'deepseek-v4-pro',
+        'gpt-5.4': 'deepseek-v4-pro',
+        'gpt-5.5': 'deepseek-v4-pro',
+        'o4-mini': 'deepseek-v4-flash',
+        'claude-sonnet-4-6': 'deepseek-v4-pro',
+    },
+};
 let config;
 export function initModelRouter(cfg) {
     config = cfg;
@@ -68,6 +78,9 @@ export function resolveProvider(model) {
     }
     return null;
 }
+export function remapModel(model, providerName) {
+    return MODEL_ALIASES[providerName]?.[model] || model;
+}
 function resolveApiKey(_name, providerCfg) {
     if (providerCfg.api_key && providerCfg.api_key !== '') {
         return providerCfg.api_key;

package/dist/src/model-gateway/routes.js CHANGED Viewed

@@ -1,8 +1,9 @@
-import { resolveProvider, getConfig } from './router.js';
+import { resolveProvider, getConfig, remapModel } from './router.js';
 import { callChatCompletions, callResponsesApi } from './providers.js';
 import { getQuotaSummary, probeQuota } from './quota.js';
 import { circuitBreakerRegistry } from './circuit-breaker.js';
 import { checkAllProviders } from './health.js';
+import { getMetrics, recordRequest } from './metrics.js';
 export async function modelGatewayRoutes(fastify) {
     // 健康检查 + 配额总览
     fastify.get('/model-gateway/health', async (_req, _reply) => {
@@ -44,14 +45,16 @@ export async function modelGatewayRoutes(fastify) {
         if (!body || !body.messages) {
             return reply.code(400).send({ error: { message: 'messages is required' } });
         }
-        const model = body.model || 'deepseek-chat';
-        const provider = resolveProvider(model);
+        const originalModel = body.model || 'deepseek-chat';
+        const provider = resolveProvider(originalModel);
         if (!provider) {
             return reply.code(503).send({
                 error: { message: 'No available provider. Check API keys and quota.' },
             });
         }
-        console.log(`[ModelGW] ${model} → ${provider.name} (${body.stream ? 'stream' : 'sync'})`);
+        const model = remapModel(originalModel, provider.name);
+        const reqStart = Date.now();
+        console.log(`[ModelGW] ${originalModel} → ${provider.name}/${model} (${body.stream ? 'stream' : 'sync'})`);
         try {
             const upstreamResp = await callChatCompletions(provider, {
                 model,
@@ -64,12 +67,14 @@ export async function modelGatewayRoutes(fastify) {
             });
             if (!upstreamResp.ok && upstreamResp.status !== 200) {
                 const errText = await upstreamResp.text();
+                recordRequest({ timestamp: Date.now(), model: originalModel, provider: provider.name, actualModel: model, latencyMs: Date.now() - reqStart, status: upstreamResp.status, error: errText.slice(0, 200), streaming: !!body.stream });
                 console.error(`[ModelGW] ${provider.name} error ${upstreamResp.status}: ${errText.slice(0, 200)}`);
                 return reply.code(upstreamResp.status).send({
                     error: { message: `${provider.name}: ${errText.slice(0, 500)}` },
                 });
             }
             if (body.stream) {
+                recordRequest({ timestamp: Date.now(), model: originalModel, provider: provider.name, actualModel: model, latencyMs: Date.now() - reqStart, status: 200, streaming: true });
                 return reply.headers({
                     'Content-Type': 'text/event-stream',
                     'Cache-Control': 'no-cache',
@@ -77,9 +82,11 @@ export async function modelGatewayRoutes(fastify) {
                 }).send(upstreamResp.body);
             }
             const data = await upstreamResp.json();
+            recordRequest({ timestamp: Date.now(), model: originalModel, provider: provider.name, actualModel: model, latencyMs: Date.now() - reqStart, status: 200, streaming: false });
             reply.send(data);
         }
         catch (err) {
+            recordRequest({ timestamp: Date.now(), model: originalModel, provider: provider.name, actualModel: model, latencyMs: Date.now() - reqStart, status: 502, error: err.message, streaming: !!body.stream });
             console.error(`[ModelGW] Error calling ${provider.name}:`, err.message);
             reply.code(502).send({
                 error: { message: `Provider error: ${err.message}` },
@@ -92,14 +99,16 @@ export async function modelGatewayRoutes(fastify) {
         if (!body || !body.input) {
             return reply.code(400).send({ error: { message: 'input is required' } });
         }
-        const model = body.model || 'deepseek-chat';
-        const provider = resolveProvider(model);
+        const originalModel = body.model || 'deepseek-chat';
+        const provider = resolveProvider(originalModel);
         if (!provider) {
             return reply.code(503).send({
                 error: { message: 'No available provider. Check API keys and quota.' },
             });
         }
-        console.log(`[ModelGW:Responses] ${model} → ${provider.name}`);
+        const model = remapModel(originalModel, provider.name);
+        body.model = model;
+        console.log(`[ModelGW:Responses] ${originalModel} → ${provider.name}/${model}`);
         try {
             const upstreamResp = await callResponsesApi(provider, body);
             if (!upstreamResp.ok) {
@@ -144,6 +153,10 @@ export async function modelGatewayRoutes(fastify) {
             });
         }
     });
+    // 运行时统计
+    fastify.get('/model-gateway/stats', async (_request, reply) => {
+        reply.send(getMetrics());
+    });
     // Provider 健康检查 + 熔断器状态
     fastify.get('/model-gateway/health/:provider', async (request, reply) => {
         const { provider } = request.params;

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@starlink-awaken/agentmesh",
-  "version": "1.2.6",
+  "version": "1.3.0",
   "description": "Unified Agent Gateway - Multi-Agent Scheduler and Router",
   "main": "dist/index.js",
   "types": "dist/index.d.ts",