npm - lynkr - Versions diffs - 7.2.4 → 8.0.0 - Mend

lynkr 7.2.4 → 8.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (68) hide show

package/README.md +2 -2
package/config/model-tiers.json +89 -0
package/docs/docs.html +1 -0
package/docs/index.md +7 -0
package/docs/toon-integration-spec.md +130 -0
package/documentation/README.md +3 -2
package/documentation/claude-code-cli.md +23 -16
package/documentation/cursor-integration.md +17 -14
package/documentation/docker.md +11 -4
package/documentation/embeddings.md +7 -5
package/documentation/faq.md +66 -12
package/documentation/features.md +22 -15
package/documentation/installation.md +66 -14
package/documentation/production.md +43 -8
package/documentation/providers.md +145 -42
package/documentation/routing.md +476 -0
package/documentation/token-optimization.md +7 -5
package/documentation/troubleshooting.md +81 -5
package/install.sh +6 -1
package/package.json +5 -3
package/scripts/setup.js +0 -1
package/src/agents/executor.js +14 -6
package/src/api/middleware/session.js +15 -2
package/src/api/openai-router.js +130 -37
package/src/api/providers-handler.js +15 -1
package/src/api/router.js +107 -2
package/src/budget/index.js +4 -3
package/src/clients/databricks.js +431 -234
package/src/clients/gpt-utils.js +181 -0
package/src/clients/ollama-utils.js +66 -140
package/src/clients/routing.js +0 -1
package/src/clients/standard-tools.js +82 -5
package/src/config/index.js +119 -35
package/src/context/toon.js +173 -0
package/src/headroom/launcher.js +8 -3
package/src/logger/index.js +23 -0
package/src/orchestrator/index.js +765 -212
package/src/routing/agentic-detector.js +320 -0
package/src/routing/complexity-analyzer.js +202 -2
package/src/routing/cost-optimizer.js +305 -0
package/src/routing/index.js +168 -159
package/src/routing/model-registry.js +437 -0
package/src/routing/model-tiers.js +365 -0
package/src/server.js +2 -2
package/src/sessions/cleanup.js +3 -3
package/src/sessions/record.js +10 -1
package/src/sessions/store.js +7 -2
package/src/tools/agent-task.js +48 -1
package/src/tools/index.js +15 -2
package/src/tools/workspace.js +35 -4
package/src/workspace/index.js +30 -0
package/te +11622 -0
package/test/README.md +1 -1
package/test/azure-openai-config.test.js +17 -8
package/test/azure-openai-integration.test.js +7 -1
package/test/azure-openai-routing.test.js +41 -43
package/test/bedrock-integration.test.js +18 -32
package/test/hybrid-routing-integration.test.js +35 -20
package/test/hybrid-routing-performance.test.js +74 -64
package/test/llamacpp-integration.test.js +28 -9
package/test/lmstudio-integration.test.js +20 -8
package/test/openai-integration.test.js +17 -20
package/test/performance-tests.js +1 -1
package/test/routing.test.js +65 -59
package/test/toon-compression.test.js +131 -0
package/CLAWROUTER_ROUTING_PLAN.md +0 -910
package/ROUTER_COMPARISON.md +0 -173
package/TIER_ROUTING_PLAN.md +0 -771

package/src/agents/executor.js CHANGED Viewed

@@ -162,14 +162,22 @@ class SubagentExecutor {
       payload.tools = filteredTools;
     }
-    // Determine provider based on model - subagents should use the specified model
+    // Determine provider based on model family.
+    // Subagents should use the currently configured MODEL_PROVIDER and avoid
+    // hard-fallbacks to Azure when Azure is not selected/configured.
     let forceProvider = null;
-    if (payload.model?.includes('claude') || payload.model?.includes('sonnet') || payload.model?.includes('haiku') || payload.model?.includes('opus')) {
-      // Route Claude models to the configured Claude provider (azure-openai, databricks, etc.)
+    const modelLower = String(payload.model || "").toLowerCase();
+    const isClaudeFamilyModel =
+      modelLower.includes("claude") ||
+      modelLower.includes("sonnet") ||
+      modelLower.includes("haiku") ||
+      modelLower.includes("opus");
+    const isGptFamilyModel = modelLower.includes("gpt");
+    if (isClaudeFamilyModel || isGptFamilyModel) {
       const config = require('../config');
-      forceProvider = config.modelProvider?.provider || 'azure-openai';
-    } else if (payload.model?.includes('gpt')) {
-      forceProvider = 'azure-openai';
+      // `type` is the canonical key; `provider` kept as legacy fallback.
+      forceProvider = config.modelProvider?.type || config.modelProvider?.provider || null;
     }
     logger.debug({

package/src/api/middleware/session.js CHANGED Viewed

@@ -45,8 +45,21 @@ function sessionMiddleware(req, res, next) {
     // Add sessionId to logger context for this request
     req.log = logger.child({ sessionId });
-    const session = getOrCreateSession(sessionId);
-    req.session = session;
+    // Skip DB persistence for auto-generated (ephemeral) session IDs.
+    // These are created when the client doesn't send a session header,
+    // so storing them just bloats the DB with throwaway records.
+    if (req.generatedSessionId) {
+      req.session = {
+        id: sessionId,
+        createdAt: Date.now(),
+        updatedAt: Date.now(),
+        metadata: {},
+        history: [],
+        _ephemeral: true,
+      };
+    } else {
+      req.session = getOrCreateSession(sessionId);
+    }
     return next();
   } catch (err) {
     return next(err);

package/src/api/openai-router.js CHANGED Viewed

@@ -21,9 +21,9 @@ const orchestrator = require("../orchestrator");
 const { getSession } = require("../sessions");
 const {
   convertOpenAIToAnthropic,
-  convertAnthropicToOpenAI,
-  convertAnthropicStreamChunkToOpenAI
+  convertAnthropicToOpenAI
 } = require("../clients/openai-format");
+const { IDE_SAFE_TOOLS } = require("../clients/standard-tools");
 const router = express.Router();
@@ -60,13 +60,14 @@ function detectClient(headers) {
  */
 const CLIENT_TOOL_MAPPINGS = {
   // ============== CODEX CLI ==============
-  // Tools: shell_command, read_file, write_file, apply_patch, glob_file_search, rg, list_dir
+  // Confirmed tools: shell, apply_patch, read_file, write_file, list_dir, glob_file_search,
+  //   rg, web_search, update_plan, view_image, memory
+  // NOT supported: spawn_agent/spawn_thread (Task has no Codex equivalent)
   codex: {
     "Bash": {
-      name: "shell_command",
+      name: "shell",
       mapArgs: (a) => ({
-        command: a.command || "",
-        workdir: a.cwd || a.working_directory
+        command: ["bash", "-c", a.command || ""]
       })
     },
     "Read": {
@@ -113,6 +114,18 @@ const CLIENT_TOOL_MAPPINGS = {
       mapArgs: (a) => ({
         path: a.path || a.directory
       })
+    },
+    "TodoWrite": {
+      name: "update_plan",
+      mapArgs: (a) => ({
+        todos: a.todos || []
+      })
+    },
+    "WebSearch": {
+      name: "web_search",
+      mapArgs: (a) => ({
+        query: a.query || ""
+      })
     }
   },
@@ -321,14 +334,7 @@ function mapToolForClient(toolName, argsJson, clientType) {
   };
 }
-/**
- * Check if client is a known AI coding tool that needs tool mapping
- * @param {Object} headers - Request headers
- * @returns {boolean}
- */
-function isKnownClient(headers) {
-  return detectClient(headers) !== "unknown";
-}
 /**
  * POST /v1/chat/completions
@@ -374,7 +380,7 @@ router.post("/chat/completions", async (req, res) => {
         : JSON.stringify(m.content).substring(0, 200)
     }));
-    logger.info({
+    logger.debug({
       endpoint: "/v1/chat/completions",
       model: req.body.model,
       messageCount: req.body.messages?.length,
@@ -393,6 +399,30 @@ router.post("/chat/completions", async (req, res) => {
     // Convert OpenAI request to Anthropic format
     const anthropicRequest = convertOpenAIToAnthropic(req.body);
+    // Inject tools if client didn't send any.
+    // Two-layer filtering:
+    //   1. IDE_SAFE_TOOLS = STANDARD_TOOLS minus AskUserQuestion (can't work through proxy)
+    //   2. For known clients (codex, cline, etc.), further filter to only tools
+    //      that have a mapping in CLIENT_TOOL_MAPPINGS — this ensures clients like
+    //      Codex don't see tools they can't handle (Task, WebFetch, NotebookEdit)
+    //      while Claude Code (unknown client) gets the full IDE_SAFE_TOOLS set.
+    const clientType = detectClient(req.headers);
+    if (!anthropicRequest.tools || anthropicRequest.tools.length === 0) {
+      const clientMappings = CLIENT_TOOL_MAPPINGS[clientType];
+      const clientTools = clientMappings
+        ? IDE_SAFE_TOOLS.filter(t => clientMappings[t.name])
+        : IDE_SAFE_TOOLS;
+      anthropicRequest.tools = clientTools;
+      logger.debug({
+        clientType,
+        injectedToolCount: clientTools.length,
+        injectedToolNames: clientTools.map(t => t.name),
+        reason: clientMappings
+          ? `Known client '${clientType}' — filtered to mapped tools only`
+          : "Unknown client — injecting full IDE_SAFE_TOOLS"
+      }, "=== INJECTING TOOLS ===");
+    }
     // Get or create session
     const session = getSession(sessionId);
@@ -420,7 +450,7 @@ router.post("/chat/completions", async (req, res) => {
         });
         // Check if we have a valid response body
-        logger.info({
+        logger.debug({
           hasResult: !!result,
           resultKeys: result ? Object.keys(result) : null,
           hasBody: result && !!result.body,
@@ -442,7 +472,7 @@ router.post("/chat/completions", async (req, res) => {
         const openaiResponse = convertAnthropicToOpenAI(result.body, req.body.model);
         // Debug: Log what we're about to stream
-        logger.info({
+        logger.debug({
           openaiResponseId: openaiResponse.id,
           messageContent: openaiResponse.choices[0]?.message?.content?.substring(0, 100),
           contentLength: openaiResponse.choices[0]?.message?.content?.length || 0,
@@ -454,7 +484,25 @@ router.post("/chat/completions", async (req, res) => {
         // Simulate streaming by sending the complete response as chunks
         const content = openaiResponse.choices[0].message.content || "";
-        const toolCalls = openaiResponse.choices[0].message.tool_calls;
+        let toolCalls = openaiResponse.choices[0].message.tool_calls;
+        // Map tool names for known IDE clients
+        if (clientType !== "unknown" && toolCalls && toolCalls.length > 0) {
+          toolCalls = toolCalls.map(tc => {
+            const mapped = mapToolForClient(tc.function?.name || "", tc.function?.arguments || "{}", clientType);
+            return {
+              ...tc,
+              function: {
+                name: mapped.name,
+                arguments: mapped.arguments
+              }
+            };
+          });
+          logger.debug({
+            mappedTools: toolCalls.map(t => t.function?.name),
+            clientType
+          }, "Tool names mapped for streaming chat/completions");
+        }
         // Send start chunk with role
         const startChunk = {
@@ -493,7 +541,7 @@ router.post("/chat/completions", async (req, res) => {
             }]
           };
           const contentWriteOk = res.write(`data: ${JSON.stringify(contentChunk)}\n\n`);
-          logger.info({ contentPreview: content.substring(0, 50), writeOk: contentWriteOk }, "Sent content chunk");
+          logger.debug({ contentPreview: content.substring(0, 50), writeOk: contentWriteOk }, "Sent content chunk");
         }
         // Send tool calls if present
@@ -545,7 +593,7 @@ router.post("/chat/completions", async (req, res) => {
         res.write("data: [DONE]\n\n");
         // Ensure data is flushed before ending
-        logger.info({ contentLength: content.length, contentPreview: content.substring(0, 50) }, "=== SSE STREAM COMPLETE ===");
+        logger.debug({ contentLength: content.length, contentPreview: content.substring(0, 50) }, "=== SSE STREAM COMPLETE ===");
         res.end();
         logger.info({
@@ -558,10 +606,7 @@ router.post("/chat/completions", async (req, res) => {
       } catch (streamError) {
         logger.error({
           error: streamError.message,
-          stack: streamError.stack,
-          resultWasNull: !result,
-          resultBodyWasNull: result && !result.body,
-          resultKeys: result ? Object.keys(result) : null
+          stack: streamError.stack
         }, "=== STREAMING ERROR ===");
         // Send error in OpenAI streaming format
@@ -606,6 +651,24 @@ router.post("/chat/completions", async (req, res) => {
       // Convert Anthropic response to OpenAI format
       const openaiResponse = convertAnthropicToOpenAI(result.body, req.body.model);
+      // Map tool names for known IDE clients
+      if (clientType !== "unknown" && openaiResponse.choices?.[0]?.message?.tool_calls?.length > 0) {
+        openaiResponse.choices[0].message.tool_calls = openaiResponse.choices[0].message.tool_calls.map(tc => {
+          const mapped = mapToolForClient(tc.function?.name || "", tc.function?.arguments || "{}", clientType);
+          return {
+            ...tc,
+            function: {
+              name: mapped.name,
+              arguments: mapped.arguments
+            }
+          };
+        });
+        logger.debug({
+          mappedTools: openaiResponse.choices[0].message.tool_calls.map(t => t.function?.name),
+          clientType
+        }, "Tool names mapped for non-streaming chat/completions");
+      }
       logger.info({
         duration: Date.now() - startTime,
         mode: "non-streaming",
@@ -767,6 +830,18 @@ function getConfiguredProviders() {
     });
   }
+  // Check Moonshot AI (Kimi)
+  if (config.moonshot?.apiKey) {
+    providers.push({
+      name: "moonshot",
+      type: "moonshot-ai",
+      models: [
+        config.moonshot.model || "kimi-k2-turbo-preview",
+        "kimi-k2-turbo-preview"
+      ]
+    });
+  }
   // Check Vertex AI (Google Cloud)
   if (config.vertex?.projectId) {
     providers.push({
@@ -1013,7 +1088,7 @@ function determineEmbeddingProvider(requestedModel = null) {
 async function generateOllamaEmbeddings(inputs, embeddingConfig) {
   const { model, endpoint } = embeddingConfig;
-  logger.info({
+  logger.debug({
     model,
     endpoint,
     inputCount: inputs.length
@@ -1079,7 +1154,7 @@ async function generateOllamaEmbeddings(inputs, embeddingConfig) {
 async function generateLlamaCppEmbeddings(inputs, embeddingConfig) {
   const { model, endpoint } = embeddingConfig;
-  logger.info({
+  logger.debug({
     model,
     endpoint,
     inputCount: inputs.length
@@ -1147,7 +1222,7 @@ async function generateLlamaCppEmbeddings(inputs, embeddingConfig) {
 async function generateOpenRouterEmbeddings(inputs, embeddingConfig) {
   const { model, apiKey, endpoint } = embeddingConfig;
-  logger.info({
+  logger.debug({
     model,
     inputCount: inputs.length
   }, "Generating embeddings with OpenRouter");
@@ -1181,7 +1256,7 @@ async function generateOpenRouterEmbeddings(inputs, embeddingConfig) {
 async function generateOpenAIEmbeddings(inputs, embeddingConfig) {
   const { model, apiKey, endpoint } = embeddingConfig;
-  logger.info({
+  logger.debug({
     model,
     inputCount: inputs.length
   }, "Generating embeddings with OpenAI");
@@ -1233,7 +1308,7 @@ router.post("/embeddings", async (req, res) => {
     // Convert input to array if string
     const inputs = Array.isArray(input) ? input : [input];
-    logger.info({
+    logger.debug({
       endpoint: "/v1/embeddings",
       model: model || "auto-detect",
       inputCount: inputs.length,
@@ -1335,7 +1410,7 @@ router.post("/responses", async (req, res) => {
     const { convertResponsesToChat, convertChatToResponses } = require("../clients/responses-format");
     // Comprehensive debug logging
-    logger.info({
+    logger.debug({
       endpoint: "/v1/responses",
       inputType: typeof req.body.input,
       inputIsArray: Array.isArray(req.body.input),
@@ -1354,7 +1429,7 @@ router.post("/responses", async (req, res) => {
     // Convert Responses API to Chat Completions format
     const chatRequest = convertResponsesToChat(req.body);
-    logger.info({
+    logger.debug({
       chatRequestMessageCount: chatRequest.messages?.length,
       chatRequestMessages: chatRequest.messages?.map(m => ({
         role: m.role,
@@ -1366,7 +1441,7 @@ router.post("/responses", async (req, res) => {
     // Convert to Anthropic format
     const anthropicRequest = convertOpenAIToAnthropic(chatRequest);
-    logger.info({
+    logger.debug({
       anthropicMessageCount: anthropicRequest.messages?.length,
       anthropicMessages: anthropicRequest.messages?.map(m => ({
         role: m.role,
@@ -1374,6 +1449,24 @@ router.post("/responses", async (req, res) => {
       }))
     }, "After Chat→Anthropic conversion");
+    // Inject tools if client didn't send any (same two-layer filtering as chat/completions).
+    const clientType = detectClient(req.headers);
+    if (!anthropicRequest.tools || anthropicRequest.tools.length === 0) {
+      const clientMappings = CLIENT_TOOL_MAPPINGS[clientType];
+      const clientTools = clientMappings
+        ? IDE_SAFE_TOOLS.filter(t => clientMappings[t.name])
+        : IDE_SAFE_TOOLS;
+      anthropicRequest.tools = clientTools;
+      logger.debug({
+        clientType,
+        injectedToolCount: clientTools.length,
+        injectedToolNames: clientTools.map(t => t.name),
+        reason: clientMappings
+          ? `Known client '${clientType}' — filtered to mapped tools only`
+          : "Unknown client — injecting full IDE_SAFE_TOOLS"
+      }, "=== INJECTING TOOLS (responses) ===");
+    }
     // Get session
     const session = getSession(sessionId);
@@ -1400,7 +1493,7 @@ router.post("/responses", async (req, res) => {
         });
         // Debug: Log what orchestrator returned
-        logger.info({
+        logger.debug({
           hasResult: !!result,
           hasBody: !!result?.body,
           bodyKeys: result?.body ? Object.keys(result.body) : null,
@@ -1412,7 +1505,7 @@ router.post("/responses", async (req, res) => {
         // Convert back: Anthropic → OpenAI → Responses
         const chatResponse = convertAnthropicToOpenAI(result.body, req.body.model);
-        logger.info({
+        logger.debug({
           chatContent: chatResponse.choices?.[0]?.message?.content?.substring(0, 200),
           chatContentLength: chatResponse.choices?.[0]?.message?.content?.length || 0,
           hasToolCalls: !!chatResponse.choices?.[0]?.message?.tool_calls,
@@ -1433,7 +1526,7 @@ router.post("/responses", async (req, res) => {
         // Check if client is a known AI coding tool and map tool names accordingly
         const clientType = detectClient(req.headers);
         if (clientType !== "unknown" && toolCalls.length > 0) {
-          logger.info({
+          logger.debug({
             originalTools: toolCalls.map(t => t.function?.name),
             clientType,
             userAgent: req.headers["user-agent"]
@@ -1451,12 +1544,12 @@ router.post("/responses", async (req, res) => {
             };
           });
-          logger.info({
+          logger.debug({
             mappedTools: toolCalls.map(t => t.function?.name)
           }, `Tool names mapped for ${clientType}`);
         }
-        logger.info({
+        logger.debug({
           content: content.substring(0, 100),
           contentLength: content.length,
           toolCallCount: toolCalls.length,

package/src/api/providers-handler.js CHANGED Viewed

@@ -179,6 +179,20 @@ function getConfiguredProviders() {
     });
   }
+  // Check Moonshot AI (Kimi)
+  if (config.moonshot?.apiKey) {
+    providers.push({
+      name: "moonshot",
+      type: "moonshot-ai",
+      baseUrl: config.moonshot.endpoint || "https://api.moonshot.ai/v1",
+      enabled: true,
+      models: [
+        { id: config.moonshot.model || "kimi-k2-turbo-preview", name: "Configured Model" },
+        { id: "kimi-k2-turbo-preview", name: "Kimi K2 Turbo Preview" },
+      ]
+    });
+  }
   // Check Vertex AI (Google Cloud)
   if (config.vertex?.projectId) {
     const region = config.vertex.region || "us-east5";
@@ -369,7 +383,7 @@ router.get("/config", (req, res) => {
       model_provider: config.modelProvider?.type || "databricks",
       fallback_provider: config.modelProvider?.fallbackProvider || null,
       fallback_enabled: config.modelProvider?.fallbackEnabled || false,
-      prefer_ollama: config.modelProvider?.preferOllama || false,
+      tier_routing_enabled: config.modelTiers?.enabled || false,
       tool_execution_mode: config.toolExecutionMode || "server",
       configured_providers: providers.map(p => p.name),
       memory_enabled: config.memory?.enabled || false,

package/src/api/router.js CHANGED Viewed

@@ -2,10 +2,11 @@ const express = require("express");
 const { processMessage } = require("../orchestrator");
 const { getSession } = require("../sessions");
 const metrics = require("../metrics");
+const logger = require("../logger");
 const { createRateLimiter } = require("./middleware/rate-limiter");
 const openaiRouter = require("./openai-router");
 const providersRouter = require("./providers-handler");
-const { getRoutingHeaders, getRoutingStats, analyzeComplexity } = require("../routing");
+const { getRoutingHeaders, getRoutingStats, analyzeComplexity, getModelTierSelector } = require("../routing");
 const { validateCwd } = require("../workspace");
 const router = express.Router();
@@ -71,6 +72,99 @@ router.get("/routing/stats", (req, res) => {
   });
 });
+// Model registry info (from LiteLLM + models.dev APIs)
+router.get("/routing/models", async (req, res) => {
+  try {
+    const { getModelRegistry } = require("../routing/model-registry");
+    const registry = await getModelRegistry();
+    res.json({
+      status: "ok",
+      ...registry.getStats(),
+    });
+  } catch (err) {
+    res.status(500).json({ error: err.message });
+  }
+});
+// Get specific model info
+router.get("/routing/models/:model", async (req, res) => {
+  try {
+    const { getModelRegistry } = require("../routing/model-registry");
+    const registry = await getModelRegistry();
+    const model = registry.getModel(req.params.model);
+    if (!model || model.source === "default") {
+      return res.status(404).json({ error: "Model not found", model: req.params.model });
+    }
+    res.json({ status: "ok", model: req.params.model, ...model });
+  } catch (err) {
+    res.status(500).json({ error: err.message });
+  }
+});
+// Routing tier information
+router.get("/routing/tiers", (req, res) => {
+  try {
+    const { getModelTierSelector } = require("../routing/model-tiers");
+    const selector = getModelTierSelector();
+    res.json({
+      status: "ok",
+      ...selector.getTierStats(),
+    });
+  } catch (err) {
+    res.status(500).json({ error: err.message });
+  }
+});
+// Cost optimization stats
+router.get("/metrics/cost-optimization", (req, res) => {
+  try {
+    const { getCostOptimizer } = require("../routing/cost-optimizer");
+    const optimizer = getCostOptimizer();
+    res.json({
+      status: "ok",
+      ...optimizer.getStats(),
+    });
+  } catch (err) {
+    res.status(500).json({ error: err.message });
+  }
+});
+// Request analysis test endpoint
+router.post("/routing/analyze", async (req, res) => {
+  try {
+    const { getAgenticDetector } = require("../routing/agentic-detector");
+    const { getModelTierSelector } = require("../routing/model-tiers");
+    const { getModelRegistry } = require("../routing/model-registry");
+    const analysis = analyzeComplexity(req.body, { weighted: req.query.weighted === "true" });
+    const agentic = getAgenticDetector().detect(req.body);
+    const selector = getModelTierSelector();
+    const tier = selector.getTier(analysis.score);
+    // Get recommended model for tier
+    const provider = req.query.provider || "openai";
+    const modelSelection = selector.selectModel(tier, provider);
+    // Get model cost info
+    let modelInfo = null;
+    if (modelSelection.model) {
+      const registry = await getModelRegistry();
+      modelInfo = registry.getCost(modelSelection.model);
+    }
+    res.json({
+      status: "ok",
+      analysis,
+      agentic,
+      tier,
+      modelSelection,
+      modelInfo,
+    });
+  } catch (err) {
+    res.status(500).json({ error: err.message });
+  }
+});
 router.get("/debug/session", (req, res) => {
   if (!req.sessionId) {
     return res.status(400).json({ error: "missing_session_id", message: "Provide x-session-id header" });
@@ -123,8 +217,19 @@ router.post("/v1/messages", rateLimiter, async (req, res, next) => {
     // Analyze complexity for routing headers (Phase 3)
     const complexity = analyzeComplexity(req.body);
+    let preRouteProvider = 'cloud';
+    if (complexity.recommendation === 'local') {
+      // Use tier config to determine actual provider instead of hardcoding 'ollama'
+      try {
+        const selector = getModelTierSelector();
+        const tierResult = selector.selectModel('SIMPLE', null);
+        preRouteProvider = tierResult.provider;
+      } catch (_) {
+        preRouteProvider = 'ollama';
+      }
+    }
     const routingHeaders = getRoutingHeaders({
-      provider: complexity.recommendation === 'local' ? 'ollama' : 'cloud',
+      provider: preRouteProvider,
       score: complexity.score,
       threshold: complexity.threshold,
       method: 'complexity',

package/src/budget/index.js CHANGED Viewed

@@ -11,13 +11,14 @@ const logger = require('../logger');
 class BudgetManager {
   constructor(options = {}) {
     this.enabled = options.enabled !== false;
+    let dbPath = null;
     if (!this.enabled || !Database) {
       this.enabled = false;
       return;
     }
     try {
-      const dbPath = path.join(process.cwd(), 'data', 'budgets.db');
+      dbPath = path.join(process.cwd(), 'data', 'budgets.db');
       const dbDir = path.dirname(dbPath);
       if (!fs.existsSync(dbDir)) {
@@ -25,14 +26,14 @@ class BudgetManager {
       }
       this.db = new Database(dbPath);
+      this.dbPath = dbPath;
       this.initDatabase();
+      logger.info({ dbPath }, 'Budget manager initialized');
     } catch (err) {
       logger.warn({ err: err.message }, "BudgetManager: better-sqlite3 not available");
       this.enabled = false;
       return;
     }
-    logger.info({ dbPath }, 'Budget manager initialized');
   }
   initDatabase() {