npm - @tokenbuddy/tokenbuddy - Versions diffs - 1.0.28 → 1.0.30 - Mend

@tokenbuddy/tokenbuddy 1.0.28 → 1.0.30

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

package/dist/src/daemon.d.ts +11 -4
package/dist/src/daemon.d.ts.map +1 -1
package/dist/src/daemon.js +130 -42
package/dist/src/daemon.js.map +1 -1
package/dist/src/doctor-diagnostics.d.ts.map +1 -1
package/dist/src/doctor-diagnostics.js +7 -1
package/dist/src/doctor-diagnostics.js.map +1 -1
package/dist/src/prewarm-cache.d.ts +4 -0
package/dist/src/prewarm-cache.d.ts.map +1 -1
package/dist/src/prewarm-cache.js +1 -0
package/dist/src/prewarm-cache.js.map +1 -1
package/dist/src/prewarm-scheduler.d.ts +2 -0
package/dist/src/prewarm-scheduler.d.ts.map +1 -1
package/dist/src/prewarm-scheduler.js +4 -1
package/dist/src/prewarm-scheduler.js.map +1 -1
package/dist/src/provider-install.d.ts.map +1 -1
package/dist/src/provider-install.js +196 -18
package/dist/src/provider-install.js.map +1 -1
package/dist/src/seller-catalog.d.ts +4 -0
package/dist/src/seller-catalog.d.ts.map +1 -1
package/dist/src/seller-catalog.js.map +1 -1
package/dist/src/seller-pool.d.ts +13 -0
package/dist/src/seller-pool.d.ts.map +1 -1
package/dist/src/seller-pool.js +43 -2
package/dist/src/seller-pool.js.map +1 -1
package/dist/src/seller-route-planner.d.ts +9 -0
package/dist/src/seller-route-planner.d.ts.map +1 -1
package/dist/src/seller-route-planner.js +39 -15
package/dist/src/seller-route-planner.js.map +1 -1
package/dist/src/seller-routing-strategy.d.ts +6 -4
package/dist/src/seller-routing-strategy.d.ts.map +1 -1
package/dist/src/seller-routing-strategy.js +15 -12
package/dist/src/seller-routing-strategy.js.map +1 -1
package/dist/src/terminal-detect.d.ts +5 -5
package/dist/src/terminal-detect.d.ts.map +1 -1
package/dist/src/terminal-detect.js +79 -26
package/dist/src/terminal-detect.js.map +1 -1
package/package.json +1 -1
package/src/daemon.ts +168 -46
package/src/doctor-diagnostics.ts +5 -1
package/src/prewarm-cache.ts +5 -0
package/src/prewarm-scheduler.ts +6 -1
package/src/provider-install.ts +203 -18
package/src/seller-catalog.ts +4 -0
package/src/seller-pool.ts +68 -2
package/src/seller-route-planner.ts +61 -15
package/src/seller-routing-strategy.ts +21 -16
package/src/terminal-detect.ts +81 -24
package/static/ui/assets/index-DEDEl8o2.js +236 -0
package/static/ui/assets/{index-UAfOhbwC.js.map → index-DEDEl8o2.js.map} +1 -1
package/static/ui/index.html +1 -1
package/tests/control-plane-ui-endpoints.test.ts +73 -0
package/tests/seller-pool.test.ts +55 -0
package/tests/seller-route-planner.test.ts +45 -1
package/tests/seller-routing-strategy.test.ts +6 -5
package/tests/tokenbuddy.test.ts +346 -38
package/static/ui/assets/index-UAfOhbwC.js +0 -236

package/static/ui/index.html CHANGED Viewed

@@ -12,7 +12,7 @@
     <link rel="icon" type="image/png" sizes="192x192" href="/icons/tokenbuddy-192.png" />
     <link rel="apple-touch-icon" href="/icons/apple-touch-icon.png" />
     <title>TokenBuddy · Local Control</title>
-    <script type="module" crossorigin src="/assets/index-UAfOhbwC.js"></script>
+    <script type="module" crossorigin src="/assets/index-DEDEl8o2.js"></script>
     <link rel="stylesheet" crossorigin href="/assets/index-Bzbrp7Qe.css">
   </head>
   <body>

package/tests/control-plane-ui-endpoints.test.ts CHANGED Viewed

@@ -552,6 +552,79 @@ describe("TokenbuddyDaemon control-plane UI endpoints (PR-0)", () => {
       expect(body.summary.configuredCount).toBeGreaterThanOrEqual(1);
       expect(body.summary.installCommand).toBe("tb init");
     });
+    it("applies tb-ui provider install requests to active OpenClaw and Hermes config files", async () => {
+      daemon.stop();
+      await startDaemon({ providerHomeDir: TEMP_HOME });
+      const res = await fetch(controlUrl("/providers/install/apply"), {
+        method: "POST",
+        headers: { "content-type": "application/json" },
+        body: JSON.stringify({
+          home: TEMP_HOME,
+          providers: ["openclaw", "hermes"],
+          proxyUrl: `http://127.0.0.1:${proxyPort}`,
+          providerSelections: {
+            openclaw: {
+              selectionKind: "single-model",
+              protocolPreference: "chat_completions",
+              defaultModel: "gpt-5.4"
+            },
+            hermes: {
+              selectionKind: "single-model",
+              protocolPreference: "chat_completions",
+              defaultModel: "gpt-5.4"
+            }
+          }
+        })
+      });
+      expect(res.status).toBe(200);
+      const body = await res.json() as { applied: Array<{ providerId: string; path: string; action: string }> };
+      expect(body.applied).toEqual(expect.arrayContaining([
+        expect.objectContaining({
+          providerId: "openclaw",
+          path: path.join(TEMP_HOME, ".openclaw", "openclaw.json")
+        }),
+        expect.objectContaining({
+          providerId: "hermes",
+          path: path.join(TEMP_HOME, ".hermes", "config.yaml")
+        })
+      ]));
+      const openclaw = JSON.parse(fs.readFileSync(path.join(TEMP_HOME, ".openclaw", "openclaw.json"), "utf8"));
+      expect(openclaw.models.providers.tokenbuddy.baseUrl).toBe(`http://127.0.0.1:${proxyPort}/v1`);
+      expect(openclaw.models.providers.tokenbuddy.apiKey).toBe("TOKENBUDDY_PROXY");
+      expect(openclaw.models.providers.tokenbuddy.auth).toBe("api-key");
+      expect(openclaw.models.providers.tokenbuddy.api).toBe("openai-completions");
+      expect(openclaw.models.providers.tokenbuddy.models).toEqual(expect.arrayContaining([
+        expect.objectContaining({ id: "gpt-5.4", api: "openai-completions" })
+      ]));
+      expect(openclaw.agents.defaults.model).toBe("tokenbuddy/gpt-5.4");
+      const hermes = fs.readFileSync(path.join(TEMP_HOME, ".hermes", "config.yaml"), "utf8");
+      expect(hermes).toContain("default: gpt-5.4");
+      expect(hermes).toContain("provider: custom");
+      expect(hermes).toContain(`base_url: "http://127.0.0.1:${proxyPort}/v1"`);
+      expect(hermes).toContain("api_key: TOKENBUDDY_PROXY");
+      expect(hermes).toContain("api_mode: chat_completions");
+      const statusRes = await fetch(controlUrl("/providers/status"));
+      expect(statusRes.status).toBe(200);
+      const statusBody = await statusRes.json() as { clients: Array<{ id: string; configured: boolean; configPath?: string }> };
+      expect(statusBody.clients).toEqual(expect.arrayContaining([
+        expect.objectContaining({
+          id: "openclaw",
+          configured: true,
+          configPath: path.join(TEMP_HOME, ".openclaw", "openclaw.json")
+        }),
+        expect.objectContaining({
+          id: "hermes",
+          configured: true,
+          configPath: path.join(TEMP_HOME, ".hermes", "config.yaml")
+        })
+      ]));
+    });
   });
   // ─── GET /routing/strategy ────────────────────────────────────

package/tests/seller-pool.test.ts CHANGED Viewed

@@ -235,6 +235,61 @@ describe("SellerPool", () => {
     expect(ctx.credit.getEntry("s1")?.currentBalanceMicros).toBe(250_000);
   });
+  test("recordRuntimeMetrics updates speed telemetry without changing credit", () => {
+    const ctx = build([{ id: "s1" }]);
+    const pool = new SellerPool({ modelIndex: ctx.index, cache: ctx.cache, creditTracker: ctx.credit });
+    pool.sync();
+    ctx.credit.recordPurchase("s1", 1_000_000, 250_000);
+    const entry = pool.recordRuntimeMetrics("s1", {
+      ttftMs: 123,
+      avgInferenceMs: 456,
+      avgTokensPerSecond: 78.9
+    });
+    expect(entry).toMatchObject({
+      sellerId: "s1",
+      ttftMs: 123,
+      avgInferenceMs: 456,
+      avgLatencyMs: 456,
+      avgTokensPerSecond: 78.9
+    });
+    expect(ctx.credit.getEntry("s1")?.currentBalanceMicros).toBe(250_000);
+  });
+  test("sync preserves live runtime speed metrics when prewarm has no newer values", () => {
+    const ctx = build([{ id: "s1" }]);
+    const pool = new SellerPool({ modelIndex: ctx.index, cache: ctx.cache, creditTracker: ctx.credit });
+    pool.sync();
+    pool.recordRuntimeMetrics("s1", {
+      ttftMs: 123,
+      avgInferenceMs: 456,
+      avgTokensPerSecond: 78.9
+    }, 2_000_000);
+    ctx.cache.commitWarm({
+      modelId: "gpt-4o",
+      protocol: "chat_completions",
+      paymentMethod: "clawtip",
+      candidates: [{
+        sellerId: "s1",
+        url: "https://s1.example.com",
+        healthScore: 80,
+        lastSuccessAt: 1_000_000,
+        ttftMs: 1,
+        avgInferenceMs: 2,
+        avgTokensPerSecond: 0
+      }]
+    });
+    pool.sync();
+    expect(pool.snapshot()[0]).toMatchObject({
+      ttftMs: 123,
+      avgInferenceMs: 456,
+      avgTokensPerSecond: 78.9
+    });
+  });
   test("hard failure kinds (hard_4xx, auth_invalid) immediately open the circuit and transfer leftover", () => {
     const ctx = build([{ id: "s1" }]);
     const pool = new SellerPool({ modelIndex: ctx.index, cache: ctx.cache, creditTracker: ctx.credit });

package/tests/seller-route-planner.test.ts CHANGED Viewed

@@ -32,7 +32,7 @@ describe("seller route planner", () => {
   test("uses compatible prewarm candidates before registry fallback", () => {
     const result = plan({
       prewarmCandidates: [
-        { sellerId: "s2", url: "https://s2.example.com", healthScore: 95, avgLatencyMs: 120 },
+        { sellerId: "s2", url: "https://s2.example.com", healthScore: 95, avgLatencyMs: 120, avgTokensPerSecond: 42.5 },
         { sellerId: "s1", url: "https://s1.example.com", healthScore: 50, avgLatencyMs: 80 },
         { sellerId: "missing", url: "https://missing.example.com", healthScore: 100, avgLatencyMs: 1 }
       ],
@@ -48,11 +48,55 @@ describe("seller route planner", () => {
     expect(result.routes[0].metrics).toEqual({
       healthScore: 95,
       avgLatencyMs: 120,
+      avgTokensPerSecond: 42.5,
       discountRatio: 0.01,
       registryOrder: 1
     });
   });
+  test("prefers live runtime speed metrics over stale prewarm metrics", () => {
+    const result = plan({
+      routing: { mode: "fullAuto", scorer: "speed" },
+      prewarmCandidates: [
+        { sellerId: "s1", url: "https://s1.example.com", healthScore: 90, avgLatencyMs: 100, avgTokensPerSecond: 1 },
+        { sellerId: "s2", url: "https://s2.example.com", healthScore: 90, avgLatencyMs: 100, avgTokensPerSecond: 80 }
+      ],
+      sellerMetrics: [
+        { sellerId: "s1", ttftMs: 20, avgInferenceMs: 100, avgTokensPerSecond: 120 },
+        { sellerId: "s2", ttftMs: 20, avgInferenceMs: 100, avgTokensPerSecond: 2 }
+      ]
+    });
+    expect(result.routes.map((route) => route.seller.id)).toEqual(["s1", "s2"]);
+    expect(result.routes[0].metrics).toMatchObject({
+      ttftMs: 20,
+      avgInferenceMs: 100,
+      avgTokensPerSecond: 120
+    });
+  });
+  test("does not hide compatible registry sellers when prewarm cache is incomplete", () => {
+    const result = plan({
+      routing: { mode: "fullAuto", scorer: "discount" },
+      prewarmCandidates: [
+        { sellerId: "s1", url: "https://s1.example.com", healthScore: 95, avgLatencyMs: 30 }
+      ],
+      sellerMetrics: [
+        { sellerId: "s1", discountRatio: 1 },
+        { sellerId: "s2", discountRatio: 0.01 }
+      ]
+    });
+    expect(result.source).toBe("prewarm_cache");
+    expect(result.sourceReason).toBe("prewarm_metrics_merged_with_registry");
+    expect(result.routes.map((route) => route.seller.id)).toEqual(["s2", "s1"]);
+    expect(result.diagnostics).toMatchObject({
+      prewarmCandidateCount: 1,
+      prewarmUsableCount: 1,
+      sourceCandidateCount: 2
+    });
+  });
   test("falls back to registry candidates when prewarm has no usable sellers", () => {
     const result = plan({
       prewarmCandidates: [

package/tests/seller-routing-strategy.test.ts CHANGED Viewed

@@ -12,6 +12,7 @@ function candidate(overrides: Partial<RoutingCandidate> & { sellerId: string; re
     healthProbeLatencyMs: overrides.healthProbeLatencyMs,
     ttftMs: overrides.ttftMs,
     avgInferenceMs: overrides.avgInferenceMs,
+    avgTokensPerSecond: overrides.avgTokensPerSecond,
     discountRatio: overrides.discountRatio,
     registryOrder: overrides.registryOrder
   };
@@ -112,17 +113,17 @@ describe("seller routing strategy", () => {
     expect(ids).toEqual(["s1", "s3"]);
   });
-  test("speed scorer prefers lower TTFT and average inference time, then health", () => {
+  test("speed scorer uses TTFT and ten-minute Tok/s, then health", () => {
     const ids = planIds(
       [
-        candidate({ sellerId: "high-slow", registryOrder: 0, healthScore: 90, ttftMs: 800, avgInferenceMs: 800 }),
-        candidate({ sellerId: "high-fast", registryOrder: 1, healthScore: 90, ttftMs: 100, avgInferenceMs: 100 }),
-        candidate({ sellerId: "low-fast", registryOrder: 2, healthScore: 40, ttftMs: 10, avgInferenceMs: 10 })
+        candidate({ sellerId: "high-slow", registryOrder: 0, healthScore: 90, ttftMs: 800, avgInferenceMs: 10, avgTokensPerSecond: 1 }),
+        candidate({ sellerId: "high-fast", registryOrder: 1, healthScore: 90, ttftMs: 100, avgInferenceMs: 1000, avgTokensPerSecond: 80 }),
+        candidate({ sellerId: "low-fast", registryOrder: 2, healthScore: 40, ttftMs: 10, avgInferenceMs: 1000, avgTokensPerSecond: 20 })
       ],
       { mode: "fullAuto", scorer: "speed" }
     );
-    expect(ids).toEqual(["low-fast", "high-fast", "high-slow"]);
+    expect(ids).toEqual(["high-fast", "low-fast", "high-slow"]);
   });
   test("discount scorer prefers lower discount ratio, then health", () => {