npm - lynkr - Versions diffs - 7.2.5 → 8.0.0 - Mend

lynkr 7.2.5 → 8.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (64) hide show

package/README.md +2 -2
package/config/model-tiers.json +89 -0
package/docs/docs.html +1 -0
package/docs/index.md +7 -0
package/docs/toon-integration-spec.md +130 -0
package/documentation/README.md +3 -2
package/documentation/claude-code-cli.md +23 -16
package/documentation/cursor-integration.md +17 -14
package/documentation/docker.md +11 -4
package/documentation/embeddings.md +7 -5
package/documentation/faq.md +66 -12
package/documentation/features.md +22 -15
package/documentation/installation.md +66 -14
package/documentation/production.md +43 -8
package/documentation/providers.md +145 -42
package/documentation/routing.md +476 -0
package/documentation/token-optimization.md +7 -5
package/documentation/troubleshooting.md +81 -5
package/install.sh +6 -1
package/package.json +4 -2
package/scripts/setup.js +0 -1
package/src/agents/executor.js +14 -6
package/src/api/middleware/session.js +15 -2
package/src/api/openai-router.js +130 -37
package/src/api/providers-handler.js +15 -1
package/src/api/router.js +107 -2
package/src/budget/index.js +4 -3
package/src/clients/databricks.js +431 -234
package/src/clients/gpt-utils.js +181 -0
package/src/clients/ollama-utils.js +66 -140
package/src/clients/routing.js +0 -1
package/src/clients/standard-tools.js +76 -3
package/src/config/index.js +113 -35
package/src/context/toon.js +173 -0
package/src/logger/index.js +23 -0
package/src/orchestrator/index.js +686 -211
package/src/routing/agentic-detector.js +320 -0
package/src/routing/complexity-analyzer.js +202 -2
package/src/routing/cost-optimizer.js +305 -0
package/src/routing/index.js +168 -159
package/src/routing/model-tiers.js +365 -0
package/src/server.js +2 -2
package/src/sessions/cleanup.js +3 -3
package/src/sessions/record.js +10 -1
package/src/sessions/store.js +7 -2
package/src/tools/agent-task.js +48 -1
package/src/tools/index.js +15 -2
package/te +11622 -0
package/test/README.md +1 -1
package/test/azure-openai-config.test.js +17 -8
package/test/azure-openai-integration.test.js +7 -1
package/test/azure-openai-routing.test.js +41 -43
package/test/bedrock-integration.test.js +18 -32
package/test/hybrid-routing-integration.test.js +35 -20
package/test/hybrid-routing-performance.test.js +74 -64
package/test/llamacpp-integration.test.js +28 -9
package/test/lmstudio-integration.test.js +20 -8
package/test/openai-integration.test.js +17 -20
package/test/performance-tests.js +1 -1
package/test/routing.test.js +65 -59
package/test/toon-compression.test.js +131 -0
package/CLAWROUTER_ROUTING_PLAN.md +0 -910
package/ROUTER_COMPARISON.md +0 -173
package/TIER_ROUTING_PLAN.md +0 -771

package/test/routing.test.js CHANGED Viewed

@@ -11,13 +11,22 @@ describe("Routing Logic", () => {
     delete require.cache[require.resolve("../src/config/index.js")];
     delete require.cache[require.resolve("../src/clients/routing")];
     delete require.cache[require.resolve("../src/routing/index.js")];
-    delete require.cache[require.resolve("../src/clients/ollama-utils")];
+    delete require.cache[require.resolve("../src/routing/model-tiers")];
+    delete require.cache[require.resolve("../src/routing/complexity-analyzer")];
+    delete require.cache[require.resolve("../src/routing/cost-optimizer")];
+    delete require.cache[require.resolve("../src/routing/agentic-detector")];
     // Store original config
     originalConfig = { ...process.env };
     // Explicitly set valid fallback to override any local .env pollution (e.g. lmstudio)
     process.env.FALLBACK_PROVIDER = "databricks";
+    // Ensure no TIER_* vars leak between tests
+    process.env.TIER_SIMPLE = "";
+    process.env.TIER_MEDIUM = "";
+    process.env.TIER_COMPLEX = "";
+    process.env.TIER_REASONING = "";
   });
   afterEach(() => {
@@ -25,23 +34,24 @@ describe("Routing Logic", () => {
     process.env = originalConfig;
   });
-  describe("determineProvider()", () => {
-    it("should return configured provider when PREFER_OLLAMA is false", () => {
+  describe("static routing (tier routing disabled)", () => {
+    it("should return configured provider when tier routing is disabled", async () => {
       process.env.MODEL_PROVIDER = "databricks";
-      process.env.PREFER_OLLAMA = "false";
+      process.env.DATABRICKS_API_KEY = "test-key";
+      process.env.DATABRICKS_API_BASE = "http://test.com";
       config = require("../src/config");
       routing = require("../src/clients/routing");
       const payload = { messages: [{ role: "user", content: "test" }] };
-      const provider = routing.determineProvider(payload);
+      const result = await routing.determineProviderSmart(payload);
-      assert.strictEqual(provider, "databricks");
+      assert.strictEqual(result.provider, "databricks");
+      assert.strictEqual(result.method, "static");
     });
-    it("should route to ollama when no tools and PREFER_OLLAMA is true", () => {
+    it("should return ollama when MODEL_PROVIDER is ollama", async () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
       config = require("../src/config");
@@ -52,15 +62,14 @@ describe("Routing Logic", () => {
         tools: [],
       };
-      const provider = routing.determineProvider(payload);
-      assert.strictEqual(provider, "ollama");
+      const result = await routing.determineProviderSmart(payload);
+      assert.strictEqual(result.provider, "ollama");
+      assert.strictEqual(result.method, "static");
     });
-    it("should route to ollama when tool count < threshold", () => {
+    it("should return primary provider regardless of tool count", async () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
-      process.env.OLLAMA_MAX_TOOLS_FOR_ROUTING = "3";
       config = require("../src/config");
       routing = require("../src/clients/routing");
@@ -73,25 +82,15 @@ describe("Routing Logic", () => {
         ],
       };
-      const provider = routing.determineProvider(payload);
-      assert.strictEqual(provider, "ollama");
+      const result = await routing.determineProviderSmart(payload);
+      assert.strictEqual(result.provider, "ollama");
+      assert.strictEqual(result.method, "static");
     });
-    it("should route to cloud when tool count >= threshold", () => {
-      process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
-      process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
-      process.env.OLLAMA_MAX_TOOLS_FOR_ROUTING = "3";
-      process.env.OPENROUTER_MAX_TOOLS_FOR_ROUTING = "3"; // Set same as ollama to skip openrouter tier
-      process.env.FALLBACK_PROVIDER = "databricks";
-      process.env.FALLBACK_ENABLED = "true"; // Ensure fallback is enabled
+    it("should return primary provider even with many tools", async () => {
+      process.env.MODEL_PROVIDER = "databricks";
       process.env.DATABRICKS_API_KEY = "test-key";
       process.env.DATABRICKS_API_BASE = "http://test.com";
-      // Set Azure OpenAI to empty to prevent dotenv from loading .env values
-      // dotenv won't override existing vars, even if empty
-      process.env.AZURE_OPENAI_ENDPOINT = "";
-      process.env.AZURE_OPENAI_API_KEY = "";
-      process.env.OPENROUTER_API_KEY = "";
       config = require("../src/config");
       routing = require("../src/clients/routing");
@@ -107,16 +106,13 @@ describe("Routing Logic", () => {
         ],
       };
-      const provider = routing.determineProvider(payload);
-      assert.strictEqual(provider, "databricks");
+      const result = await routing.determineProviderSmart(payload);
+      assert.strictEqual(result.provider, "databricks");
+      assert.strictEqual(result.method, "static");
     });
-    it("should route to cloud when model doesn't support tools", () => {
-      process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
-      process.env.OLLAMA_MODEL = "llama3:latest"; // Non-tool-capable model
-      process.env.OLLAMA_FALLBACK_PROVIDER = "databricks";
-      process.env.FALLBACK_ENABLED = "true"; // Ensure fallback is enabled
+    it("should return configured MODEL_PROVIDER", async () => {
+      process.env.MODEL_PROVIDER = "databricks";
       process.env.DATABRICKS_API_KEY = "test-key";
       process.env.DATABRICKS_API_BASE = "http://test.com";
@@ -128,42 +124,55 @@ describe("Routing Logic", () => {
         tools: [{ name: "tool1", description: "test" }],
       };
-      const provider = routing.determineProvider(payload);
-      assert.strictEqual(provider, "databricks");
+      const result = await routing.determineProviderSmart(payload);
+      assert.strictEqual(result.provider, "databricks");
+      assert.strictEqual(result.method, "static");
     });
+  });
+  describe("determineProviderSmart()", () => {
+    it("should return static routing when tier routing is disabled (no TIER_* vars)", async () => {
+      process.env.MODEL_PROVIDER = "databricks";
+      process.env.DATABRICKS_API_KEY = "test-key";
+      process.env.DATABRICKS_API_BASE = "http://test.com";
-    it("should use custom max tools threshold", () => {
+      config = require("../src/config");
+      routing = require("../src/clients/routing");
+      const payload = { messages: [{ role: "user", content: "test" }] };
+      const result = await routing.determineProviderSmart(payload);
+      assert.strictEqual(result.provider, "databricks");
+      assert.strictEqual(result.method, "static");
+      assert.strictEqual(result.reason, "tier_routing_disabled");
+      assert.strictEqual(result.model, null);
+    });
+    it("should use tier routing when TIER_* vars are set", async () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
-      process.env.OLLAMA_MAX_TOOLS_FOR_ROUTING = "5";
-      process.env.OLLAMA_FALLBACK_PROVIDER = "databricks";
+      process.env.TIER_SIMPLE = "ollama:llama3.2";
+      process.env.TIER_MEDIUM = "ollama:llama3.2";
+      process.env.TIER_COMPLEX = "databricks:claude-sonnet";
+      process.env.TIER_REASONING = "databricks:claude-sonnet";
       process.env.DATABRICKS_API_KEY = "test-key";
       process.env.DATABRICKS_API_BASE = "http://test.com";
       config = require("../src/config");
       routing = require("../src/clients/routing");
-      const payload = {
-        messages: [{ role: "user", content: "test" }],
-        tools: [
-          { name: "tool1", description: "test" },
-          { name: "tool2", description: "test" },
-          { name: "tool3", description: "test" },
-          { name: "tool4", description: "test" },
-        ],
-      };
+      const payload = { messages: [{ role: "user", content: "test" }] };
+      const result = await routing.determineProviderSmart(payload);
-      // 4 tools < 5, should route to ollama
-      const provider = routing.determineProvider(payload);
-      assert.strictEqual(provider, "ollama");
+      // When tier routing is enabled, method should not be 'static'
+      assert.notStrictEqual(result.method, "static");
+      assert.ok(result.provider, "provider should be set");
     });
   });
   describe("isFallbackEnabled()", () => {
     it("should return true by default", () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
       // Override .env file which sets FALLBACK_ENABLED=false
       // Test default behavior when not set to "false"
@@ -177,7 +186,6 @@ describe("Routing Logic", () => {
     it("should return false when explicitly disabled", () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
       process.env.FALLBACK_ENABLED = "false";
@@ -191,7 +199,6 @@ describe("Routing Logic", () => {
   describe("getFallbackProvider()", () => {
     it("should return databricks by default", () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
       process.env.DATABRICKS_API_KEY = "test-key";
       process.env.DATABRICKS_API_BASE = "http://test.com";
@@ -204,7 +211,6 @@ describe("Routing Logic", () => {
     it("should return configured fallback provider", () => {
       process.env.MODEL_PROVIDER = "ollama";
-      process.env.PREFER_OLLAMA = "true";
       process.env.OLLAMA_MODEL = "qwen2.5-coder:latest";
       process.env.FALLBACK_PROVIDER = "azure-anthropic";
       process.env.AZURE_ANTHROPIC_ENDPOINT = "http://test.com";

package/test/toon-compression.test.js ADDED Viewed

@@ -0,0 +1,131 @@
+const assert = require("assert");
+const { describe, it } = require("node:test");
+const { applyToonCompression } = require("../src/context/toon");
+function createLargeJsonString() {
+  return JSON.stringify({
+    rows: Array.from({ length: 8 }, (_, idx) => ({
+      id: idx + 1,
+      label: `item-${idx + 1}`,
+      value: `value-${idx + 1}`.repeat(20),
+    })),
+  });
+}
+describe("TOON compression", () => {
+  it("is a no-op when TOON is disabled", () => {
+    const payload = {
+      stream: false,
+      tool_choice: { type: "auto" },
+      tools: [{ name: "Read", input_schema: { type: "object", properties: {} } }],
+      messages: [{ role: "user", content: createLargeJsonString() }],
+    };
+    const before = JSON.parse(JSON.stringify(payload));
+    const { payload: after, stats } = applyToonCompression(
+      payload,
+      { enabled: false, minBytes: 1, failOpen: true },
+      { encode: () => "should-not-run" },
+    );
+    assert.deepStrictEqual(after, before);
+    assert.strictEqual(stats.enabled, false);
+    assert.strictEqual(stats.convertedCount, 0);
+  });
+  it("falls back safely when encoder throws (fail-open)", () => {
+    const payload = {
+      messages: [{ role: "user", content: createLargeJsonString() }],
+    };
+    const original = payload.messages[0].content;
+    const { payload: after, stats } = applyToonCompression(
+      payload,
+      { enabled: true, minBytes: 1, failOpen: true, logStats: false },
+      {
+        encode: () => {
+          throw new Error("simulated toon encode failure");
+        },
+      },
+    );
+    assert.strictEqual(after.messages[0].content, original);
+    assert.strictEqual(stats.failureCount, 1);
+    assert.strictEqual(stats.convertedCount, 0);
+  });
+  it("does not mutate protocol fields while compressing eligible message content", () => {
+    const payload = {
+      model: "kimi-k2.5",
+      stream: true,
+      tool_choice: { type: "tool", name: "Read" },
+      tools: [
+        {
+          name: "Read",
+          description: "Read files",
+          input_schema: {
+            type: "object",
+            properties: { file_path: { type: "string" } },
+            required: ["file_path"],
+          },
+        },
+      ],
+      messages: [
+        { role: "user", content: createLargeJsonString() },
+        { role: "tool", content: createLargeJsonString() }, // tool role should never be touched
+      ],
+    };
+    const beforeTools = JSON.parse(JSON.stringify(payload.tools));
+    const beforeToolChoice = JSON.parse(JSON.stringify(payload.tool_choice));
+    const beforeToolRoleContent = payload.messages[1].content;
+    const { payload: after, stats } = applyToonCompression(
+      payload,
+      { enabled: true, minBytes: 1, failOpen: false, logStats: false },
+      { encode: () => "rows[1]{id,label,value}:\n  1,item-1,value-1" },
+    );
+    assert.strictEqual(after.messages[0].content, "rows[1]{id,label,value}:\n  1,item-1,value-1");
+    assert.strictEqual(after.messages[1].content, beforeToolRoleContent);
+    assert.deepStrictEqual(after.tools, beforeTools);
+    assert.deepStrictEqual(after.tool_choice, beforeToolChoice);
+    assert.strictEqual(after.stream, true);
+    assert.strictEqual(after.model, "kimi-k2.5");
+    assert.strictEqual(stats.convertedCount, 1);
+  });
+  it("compresses Anthropic text blocks while preserving tool protocol blocks", () => {
+    const largeJson = createLargeJsonString();
+    const payload = {
+      messages: [
+        {
+          role: "user",
+          content: [
+            { type: "text", text: largeJson },
+            { type: "input_text", input_text: largeJson },
+            {
+              type: "tool_result",
+              tool_use_id: "toolu_123",
+              content: largeJson,
+              is_error: false,
+            },
+          ],
+        },
+      ],
+    };
+    const originalToolResultContent = payload.messages[0].content[2].content;
+    const { payload: after, stats } = applyToonCompression(
+      payload,
+      { enabled: true, minBytes: 1, failOpen: false, logStats: false },
+      { encode: () => "rows[1]{id,label,value}:\n  1,item-1,value-1" },
+    );
+    assert.strictEqual(after.messages[0].content[0].text, "rows[1]{id,label,value}:\n  1,item-1,value-1");
+    assert.strictEqual(after.messages[0].content[1].input_text, "rows[1]{id,label,value}:\n  1,item-1,value-1");
+    assert.strictEqual(after.messages[0].content[2].content, originalToolResultContent);
+    assert.strictEqual(stats.convertedCount, 2);
+  });
+});