npm - @elvatis_com/openclaw-cli-bridge-elvatis - Versions diffs - 2.6.3 → 2.7.0 - Mend

@elvatis_com/openclaw-cli-bridge-elvatis 2.6.3 → 2.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

package/README.md CHANGED Viewed

@@ -2,7 +2,7 @@
 > OpenClaw plugin that bridges locally installed AI CLIs (Codex, Gemini, Claude Code, OpenCode, Pi) as model providers — with slash commands for instant model switching, restore, health testing, and model listing.
-**Current version:** `2.6.3`
+**Current version:** `2.7.0`
 ---
@@ -398,7 +398,7 @@ Model fallback (v1.9.0):
 ```bash
 npm run lint        # eslint (TypeScript-aware)
 npm run typecheck   # tsc --noEmit
-npm test            # vitest run (252 tests)
+npm test            # vitest run (261 tests)
 npm run ci          # lint + typecheck + test
 ```
@@ -406,6 +406,12 @@ npm run ci          # lint + typecheck + test
 ## Changelog
+### v2.7.0
+- **feat:** Persistent per-model metrics — request counts, error rates, latency, and token usage now survive gateway restarts. Stored in `~/.openclaw/cli-bridge/metrics.json`, debounced writes (5s).
+- **feat:** Token usage estimation for all models — CLI runners (claude, gemini, codex), web-session models (gemini, claude, chatgpt) now report estimated `prompt_tokens` and `completion_tokens` in the OpenAI-compatible `usage` response field (~4 chars/token heuristic). Grok models continue to use real token counts from the API.
+- **feat:** Dashboard and `/healthz` now show actual token stats per model instead of zeros
+- **test:** 9 new metrics tests — estimateTokens, MetricsCollector recording, sorting, reset (261 total)
 ### v2.6.3
 - **security:** Bump `vite` 8.0.2 → 8.0.5 — fixes 3 CVEs: `server.fs.deny` bypass via query strings, arbitrary file read via WebSocket, path traversal in optimized deps `.map` handling (merged Dependabot PR #18)

package/SKILL.md CHANGED Viewed

@@ -68,4 +68,4 @@ On gateway restart, if any session has expired, a **WhatsApp alert** is sent aut
 See `README.md` for full configuration reference and architecture diagram.
-**Version:** 2.6.3
+**Version:** 2.7.0

package/openclaw.plugin.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "id": "openclaw-cli-bridge-elvatis",
   "slug": "openclaw-cli-bridge-elvatis",
   "name": "OpenClaw CLI Bridge",
-  "version": "2.6.3",
+  "version": "2.7.0",
   "license": "MIT",
   "description": "Phase 1: openai-codex auth bridge. Phase 2: local HTTP proxy routing model calls through gemini/claude CLIs (vllm provider).",
   "providers": [

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@elvatis_com/openclaw-cli-bridge-elvatis",
-  "version": "2.6.3",
+  "version": "2.7.0",
   "description": "Bridges gemini, claude, and codex CLI tools as OpenClaw model providers. Reads existing CLI auth without re-login.",
   "type": "module",
   "openclaw": {

package/src/config.ts CHANGED Viewed

@@ -134,6 +134,9 @@ export const PENDING_FILE = join(OPENCLAW_DIR, "cli-bridge-pending.json");
 /** Provider session registry file. */
 export const PROVIDER_SESSIONS_FILE = join(OPENCLAW_DIR, "cli-bridge", "sessions.json");
+/** Persistent metrics file — survives gateway restarts. */
+export const METRICS_FILE = join(OPENCLAW_DIR, "cli-bridge", "metrics.json");
 /** Temporary directory for multimodal media files. */
 export const MEDIA_TMP_DIR = join(tmpdir(), "cli-bridge-media");

package/src/metrics.ts CHANGED Viewed

@@ -1,11 +1,18 @@
 /**
  * metrics.ts
  *
- * In-memory metrics collector for the CLI bridge proxy.
+ * Persistent metrics collector for the CLI bridge proxy.
  * Tracks request counts, errors, latency, and token usage per model.
  * All operations are O(1) — cannot block the event loop.
+ *
+ * Metrics are persisted to disk on every recordRequest() call (debounced)
+ * and restored on startup so stats survive gateway restarts.
  */
+import { readFileSync, writeFileSync, mkdirSync } from "node:fs";
+import { dirname } from "node:path";
+import { METRICS_FILE } from "./config.js";
 export interface ModelMetrics {
   model: string;
   requests: number;
@@ -23,9 +30,37 @@ export interface MetricsSnapshot {
   models: ModelMetrics[]; // sorted by requests desc
 }
+// ── Token estimation ────────────────────────────────────────────────────────
+/**
+ * Rough token count estimate: ~4 characters per token.
+ * This matches the commonly used GPT tokenizer heuristic and is
+ * accurate within ~15% for English text / code.
+ */
+export function estimateTokens(text: string): number {
+  if (!text) return 0;
+  return Math.ceil(text.length / 4);
+}
+// ── Persistence format ──────────────────────────────────────────────────────
+interface PersistedMetrics {
+  version: 1;
+  startedAt: number;
+  models: ModelMetrics[];
+}
+// ── Collector ───────────────────────────────────────────────────────────────
 class MetricsCollector {
   private startedAt = Date.now();
   private data = new Map<string, ModelMetrics>();
+  private flushTimer: ReturnType<typeof setTimeout> | null = null;
+  private dirty = false;
+  constructor() {
+    this.load();
+  }
   recordRequest(
     model: string,
@@ -53,6 +88,7 @@ class MetricsCollector {
     if (promptTokens) entry.promptTokens += promptTokens;
     if (completionTokens) entry.completionTokens += completionTokens;
     entry.lastRequestAt = Date.now();
+    this.scheduleSave();
   }
   getMetrics(): MetricsSnapshot {
@@ -79,6 +115,49 @@ class MetricsCollector {
   reset(): void {
     this.startedAt = Date.now();
     this.data.clear();
+    this.saveNow();
+  }
+  // ── Persistence ─────────────────────────────────────────────────────────
+  private load(): void {
+    try {
+      const raw = readFileSync(METRICS_FILE, "utf-8");
+      const persisted = JSON.parse(raw) as PersistedMetrics;
+      if (persisted.version === 1 && Array.isArray(persisted.models)) {
+        this.startedAt = persisted.startedAt;
+        for (const m of persisted.models) {
+          this.data.set(m.model, { ...m });
+        }
+      }
+    } catch {
+      // File doesn't exist or is corrupt — start fresh
+    }
+  }
+  private scheduleSave(): void {
+    this.dirty = true;
+    if (this.flushTimer) return;
+    // Debounce: save at most once per 5 seconds
+    this.flushTimer = setTimeout(() => {
+      this.flushTimer = null;
+      if (this.dirty) this.saveNow();
+    }, 5_000);
+  }
+  saveNow(): void {
+    this.dirty = false;
+    const persisted: PersistedMetrics = {
+      version: 1,
+      startedAt: this.startedAt,
+      models: Array.from(this.data.values()),
+    };
+    try {
+      mkdirSync(dirname(METRICS_FILE), { recursive: true });
+      writeFileSync(METRICS_FILE, JSON.stringify(persisted, null, 2) + "\n", "utf-8");
+    } catch {
+      // Best effort — don't crash the proxy for metrics I/O
+    }
   }
 }

package/src/proxy-server.ts CHANGED Viewed

@@ -19,7 +19,7 @@ import { chatgptComplete, chatgptCompleteStream, type ChatMessage as ChatGPTBrow
 import type { BrowserContext } from "playwright";
 import { renderStatusPage, type StatusProvider } from "./status-template.js";
 import { sessionManager } from "./session-manager.js";
-import { metrics } from "./metrics.js";
+import { metrics, estimateTokens } from "./metrics.js";
 import { providerSessions } from "./provider-sessions.js";
 import {
   DEFAULT_PROXY_TIMEOUT_MS,
@@ -337,6 +337,10 @@ async function handleRequest(
     // Extract multimodal content (images, audio) from messages → temp files
     const { cleanMessages, mediaFiles } = extractMultimodalParts(messages);
+    // Estimate prompt tokens from message content (used when CLIs don't report usage)
+    const promptText = cleanMessages.map(m => typeof m.content === "string" ? m.content : "").join(" ");
+    const estPromptTokens = estimateTokens(promptText);
     opts.log(`[cli-bridge] ${model} · ${cleanMessages.length} msg(s) · stream=${stream}${hasTools ? ` · tools=${tools!.length}` : ""}${mediaFiles.length ? ` · media=${mediaFiles.length}` : ""}`);
     const id = `chatcmpl-cli-${randomBytes(6).toString("hex")}`;
@@ -385,7 +389,7 @@ async function handleRequest(
           }));
         }
       } catch (err) {
-        metrics.recordRequest(model, Date.now() - grokStart, false);
+        metrics.recordRequest(model, Date.now() - grokStart, false, estPromptTokens);
         const msg = (err as Error).message;
         opts.warn(`[cli-bridge] Grok error for ${model}: ${msg}`);
         if (!res.headersSent) {
@@ -423,22 +427,23 @@ async function handleRequest(
             (token) => sendSseChunk(res, { id, created, model, delta: { content: token }, finish_reason: null }),
             opts.log
           );
-          metrics.recordRequest(model, Date.now() - geminiStart, true);
+          metrics.recordRequest(model, Date.now() - geminiStart, true, estPromptTokens, estimateTokens(result.content));
           sendSseChunk(res, { id, created, model, delta: {}, finish_reason: result.finishReason });
           res.write("data: [DONE]\n\n");
           res.end();
         } else {
           const result = await doGeminiComplete(geminiCtx, { messages: geminiMessages, model, timeoutMs }, opts.log);
-          metrics.recordRequest(model, Date.now() - geminiStart, true);
+          const estComp = estimateTokens(result.content);
+          metrics.recordRequest(model, Date.now() - geminiStart, true, estPromptTokens, estComp);
           res.writeHead(200, { "Content-Type": "application/json", ...corsHeaders() });
           res.end(JSON.stringify({
             id, object: "chat.completion", created, model,
             choices: [{ index: 0, message: { role: "assistant", content: result.content }, finish_reason: result.finishReason }],
-            usage: { prompt_tokens: 0, completion_tokens: 0, total_tokens: 0 },
+            usage: { prompt_tokens: estPromptTokens, completion_tokens: estComp, total_tokens: estPromptTokens + estComp },
           }));
         }
       } catch (err) {
-        metrics.recordRequest(model, Date.now() - geminiStart, false);
+        metrics.recordRequest(model, Date.now() - geminiStart, false, estPromptTokens);
         const msg = (err as Error).message;
         opts.warn(`[cli-bridge] Gemini browser error for ${model}: ${msg}`);
         if (!res.headersSent) {
@@ -476,22 +481,23 @@ async function handleRequest(
             (token) => sendSseChunk(res, { id, created, model, delta: { content: token }, finish_reason: null }),
             opts.log
           );
-          metrics.recordRequest(model, Date.now() - claudeStart, true);
+          metrics.recordRequest(model, Date.now() - claudeStart, true, estPromptTokens, estimateTokens(result.content));
           sendSseChunk(res, { id, created, model, delta: {}, finish_reason: result.finishReason });
           res.write("data: [DONE]\n\n");
           res.end();
         } else {
           const result = await doClaudeComplete(claudeCtx, { messages: claudeMessages, model, timeoutMs }, opts.log);
-          metrics.recordRequest(model, Date.now() - claudeStart, true);
+          const estComp = estimateTokens(result.content);
+          metrics.recordRequest(model, Date.now() - claudeStart, true, estPromptTokens, estComp);
           res.writeHead(200, { "Content-Type": "application/json", ...corsHeaders() });
           res.end(JSON.stringify({
             id, object: "chat.completion", created, model,
             choices: [{ index: 0, message: { role: "assistant", content: result.content }, finish_reason: result.finishReason }],
-            usage: { prompt_tokens: 0, completion_tokens: 0, total_tokens: 0 },
+            usage: { prompt_tokens: estPromptTokens, completion_tokens: estComp, total_tokens: estPromptTokens + estComp },
           }));
         }
       } catch (err) {
-        metrics.recordRequest(model, Date.now() - claudeStart, false);
+        metrics.recordRequest(model, Date.now() - claudeStart, false, estPromptTokens);
         const msg = (err as Error).message;
         opts.warn(`[cli-bridge] Claude browser error for ${model}: ${msg}`);
         if (!res.headersSent) {
@@ -530,22 +536,23 @@ async function handleRequest(
             (token) => sendSseChunk(res, { id, created, model, delta: { content: token }, finish_reason: null }),
             opts.log
           );
-          metrics.recordRequest(model, Date.now() - chatgptStart, true);
+          metrics.recordRequest(model, Date.now() - chatgptStart, true, estPromptTokens, estimateTokens(result.content));
           sendSseChunk(res, { id, created, model, delta: {}, finish_reason: result.finishReason });
           res.write("data: [DONE]\n\n");
           res.end();
         } else {
           const result = await doChatGPTComplete(chatgptCtx, { messages: chatgptMessages, model: chatgptModel, timeoutMs }, opts.log);
-          metrics.recordRequest(model, Date.now() - chatgptStart, true);
+          const estComp = estimateTokens(result.content);
+          metrics.recordRequest(model, Date.now() - chatgptStart, true, estPromptTokens, estComp);
           res.writeHead(200, { "Content-Type": "application/json", ...corsHeaders() });
           res.end(JSON.stringify({
             id, object: "chat.completion", created, model,
             choices: [{ index: 0, message: { role: "assistant", content: result.content }, finish_reason: result.finishReason }],
-            usage: { prompt_tokens: 0, completion_tokens: 0, total_tokens: 0 },
+            usage: { prompt_tokens: estPromptTokens, completion_tokens: estComp, total_tokens: estPromptTokens + estComp },
           }));
         }
       } catch (err) {
-        metrics.recordRequest(model, Date.now() - chatgptStart, false);
+        metrics.recordRequest(model, Date.now() - chatgptStart, false, estPromptTokens);
         const msg = (err as Error).message;
         opts.warn(`[cli-bridge] ChatGPT browser error for ${model}: ${msg}`);
         if (!res.headersSent) {
@@ -683,7 +690,8 @@ async function handleRequest(
     const cliStart = Date.now();
     try {
       result = await routeToCliRunner(model, cleanMessages, effectiveTimeout, routeOpts);
-      metrics.recordRequest(model, Date.now() - cliStart, true);
+      const estCompletionTokens = estimateTokens(result.content ?? "");
+      metrics.recordRequest(model, Date.now() - cliStart, true, estPromptTokens, estCompletionTokens);
       providerSessions.recordRun(session.id, false);
     } catch (err) {
       const primaryDuration = Date.now() - cliStart;
@@ -694,17 +702,18 @@ async function handleRequest(
       providerSessions.recordRun(session.id, isTimeout);
       const fallbackModel = opts.modelFallbacks?.[model];
       if (fallbackModel) {
-        metrics.recordRequest(model, primaryDuration, false);
+        metrics.recordRequest(model, primaryDuration, false, estPromptTokens);
         const reason = isTimeout ? `timeout by supervisor, session=${session.id} preserved` : msg;
         opts.warn(`[cli-bridge] ${model} failed (${reason}), falling back to ${fallbackModel}`);
         const fallbackStart = Date.now();
         try {
           result = await routeToCliRunner(fallbackModel, cleanMessages, effectiveTimeout, routeOpts);
-          metrics.recordRequest(fallbackModel, Date.now() - fallbackStart, true);
+          const fbCompTokens = estimateTokens(result.content ?? "");
+          metrics.recordRequest(fallbackModel, Date.now() - fallbackStart, true, estPromptTokens, fbCompTokens);
           usedModel = fallbackModel;
           opts.log(`[cli-bridge] fallback to ${fallbackModel} succeeded`);
         } catch (fallbackErr) {
-          metrics.recordRequest(fallbackModel, Date.now() - fallbackStart, false);
+          metrics.recordRequest(fallbackModel, Date.now() - fallbackStart, false, estPromptTokens);
           const fallbackMsg = (fallbackErr as Error).message;
           opts.warn(`[cli-bridge] fallback ${fallbackModel} also failed: ${fallbackMsg}`);
           if (sseHeadersSent) {
@@ -718,7 +727,7 @@ async function handleRequest(
           return;
         }
       } else {
-        metrics.recordRequest(model, primaryDuration, false);
+        metrics.recordRequest(model, primaryDuration, false, estPromptTokens);
         opts.warn(`[cli-bridge] CLI error for ${model}: ${msg}`);
         if (sseHeadersSent) {
           res.write(`data: ${JSON.stringify({ error: { message: msg, type: "cli_error" } })}\n\n`);
@@ -806,7 +815,11 @@ async function handleRequest(
             finish_reason: finishReason,
           },
         ],
-        usage: { prompt_tokens: 0, completion_tokens: 0, total_tokens: 0 },
+        usage: {
+          prompt_tokens: estPromptTokens,
+          completion_tokens: estimateTokens(typeof message.content === "string" ? message.content : ""),
+          total_tokens: estPromptTokens + estimateTokens(typeof message.content === "string" ? message.content : ""),
+        },
         // Propagate session ID so callers can resume in the same session
         provider_session_id: session.id,
       };

package/test/metrics.test.ts ADDED Viewed

@@ -0,0 +1,110 @@
+import { describe, it, expect, beforeEach, afterEach } from "vitest";
+import { readFileSync, unlinkSync, existsSync } from "node:fs";
+import { join } from "node:path";
+import { tmpdir } from "node:os";
+// We test estimateTokens directly and the MetricsCollector via the singleton
+// after resetting. For persistence tests we mock METRICS_FILE.
+describe("estimateTokens", () => {
+  it("returns 0 for empty string", async () => {
+    const { estimateTokens } = await import("../src/metrics.js");
+    expect(estimateTokens("")).toBe(0);
+  });
+  it("returns 0 for undefined/null-ish input", async () => {
+    const { estimateTokens } = await import("../src/metrics.js");
+    expect(estimateTokens(undefined as unknown as string)).toBe(0);
+    expect(estimateTokens(null as unknown as string)).toBe(0);
+  });
+  it("estimates ~1 token per 4 characters", async () => {
+    const { estimateTokens } = await import("../src/metrics.js");
+    // 100 chars → ceil(100/4) = 25 tokens
+    const text = "a".repeat(100);
+    expect(estimateTokens(text)).toBe(25);
+  });
+  it("rounds up partial tokens", async () => {
+    const { estimateTokens } = await import("../src/metrics.js");
+    // 5 chars → ceil(5/4) = 2
+    expect(estimateTokens("hello")).toBe(2);
+  });
+  it("handles realistic prompt sizes", async () => {
+    const { estimateTokens } = await import("../src/metrics.js");
+    // ~400 chars of English text → ~100 tokens
+    const text = "The quick brown fox jumps over the lazy dog. ".repeat(9); // 405 chars
+    const tokens = estimateTokens(text);
+    expect(tokens).toBeGreaterThan(90);
+    expect(tokens).toBeLessThan(110);
+  });
+});
+describe("MetricsCollector", () => {
+  it("records requests and tracks per-model stats", async () => {
+    const { metrics } = await import("../src/metrics.js");
+    metrics.reset();
+    metrics.recordRequest("test/model-a", 100, true, 50, 25);
+    metrics.recordRequest("test/model-a", 200, true, 60, 30);
+    metrics.recordRequest("test/model-b", 150, false, 40, 0);
+    const snap = metrics.getMetrics();
+    expect(snap.totalRequests).toBe(3);
+    expect(snap.totalErrors).toBe(1);
+    const modelA = snap.models.find(m => m.model === "test/model-a");
+    expect(modelA).toBeDefined();
+    expect(modelA!.requests).toBe(2);
+    expect(modelA!.errors).toBe(0);
+    expect(modelA!.promptTokens).toBe(110);
+    expect(modelA!.completionTokens).toBe(55);
+    expect(modelA!.totalLatencyMs).toBe(300);
+    const modelB = snap.models.find(m => m.model === "test/model-b");
+    expect(modelB).toBeDefined();
+    expect(modelB!.requests).toBe(1);
+    expect(modelB!.errors).toBe(1);
+    expect(modelB!.promptTokens).toBe(40);
+  });
+  it("sorts models by request count descending", async () => {
+    const { metrics } = await import("../src/metrics.js");
+    metrics.reset();
+    metrics.recordRequest("low", 10, true);
+    metrics.recordRequest("high", 10, true);
+    metrics.recordRequest("high", 10, true);
+    metrics.recordRequest("high", 10, true);
+    metrics.recordRequest("mid", 10, true);
+    metrics.recordRequest("mid", 10, true);
+    const snap = metrics.getMetrics();
+    expect(snap.models[0].model).toBe("high");
+    expect(snap.models[1].model).toBe("mid");
+    expect(snap.models[2].model).toBe("low");
+  });
+  it("reset clears all data", async () => {
+    const { metrics } = await import("../src/metrics.js");
+    metrics.recordRequest("test/x", 10, true, 5, 5);
+    metrics.reset();
+    const snap = metrics.getMetrics();
+    expect(snap.totalRequests).toBe(0);
+    expect(snap.models).toHaveLength(0);
+  });
+  it("handles missing token counts gracefully", async () => {
+    const { metrics } = await import("../src/metrics.js");
+    metrics.reset();
+    // No token args — should not crash, tokens stay 0
+    metrics.recordRequest("test/no-tokens", 50, true);
+    const snap = metrics.getMetrics();
+    const m = snap.models[0];
+    expect(m.promptTokens).toBe(0);
+    expect(m.completionTokens).toBe(0);
+  });
+});