npm - lynkr - Versions diffs - 9.0.2 → 9.1.3 - Mend

lynkr 9.0.2 → 9.1.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (65) hide show

package/README.md +21 -10
package/bin/cli.js +18 -1
package/bin/lynkr-trajectory.js +136 -0
package/bin/lynkr-usage.js +219 -0
package/funding.json +110 -0
package/package.json +4 -2
package/public/dashboard.html +665 -0
package/scripts/build-knn-index.js +130 -0
package/scripts/calibrate-thresholds.js +197 -0
package/scripts/compare-policies.js +67 -0
package/scripts/learn-output-ratios.js +162 -0
package/scripts/refresh-pricing.js +122 -0
package/scripts/run-routerarena.js +26 -0
package/scripts/sample-regret.js +84 -0
package/scripts/train-risk-classifier.js +191 -0
package/src/api/files-router.js +6 -6
package/src/api/middleware/budget-enforcer.js +60 -0
package/src/api/middleware/budget.js +19 -1
package/src/api/middleware/load-shedding.js +17 -0
package/src/api/middleware/tenant.js +21 -0
package/src/api/openai-router.js +1 -1
package/src/api/router.js +204 -87
package/src/budget/hierarchical-budget.js +159 -0
package/src/cache/semantic.js +28 -2
package/src/clients/databricks.js +68 -10
package/src/clients/openai-format.js +31 -5
package/src/config/index.js +246 -43
package/src/context/toon.js +5 -4
package/src/dashboard/api.js +170 -0
package/src/dashboard/router.js +13 -0
package/src/headroom/client.js +3 -109
package/src/headroom/index.js +0 -14
package/src/memory/search.js +0 -50
package/src/orchestrator/index.js +106 -11
package/src/orchestrator/preflight.js +188 -0
package/src/prompts/system.js +34 -6
package/src/routing/bandit.js +246 -0
package/src/routing/cascade.js +106 -0
package/src/routing/complexity-analyzer.js +7 -15
package/src/routing/confidence-scorer.js +121 -0
package/src/routing/context-validator.js +71 -0
package/src/routing/cost-optimizer.js +5 -2
package/src/routing/deadline.js +52 -0
package/src/routing/drift-monitor.js +113 -0
package/src/routing/embedding-cache.js +77 -0
package/src/routing/index.js +374 -4
package/src/routing/interaction.js +183 -0
package/src/routing/knn-router.js +206 -0
package/src/routing/latency-tracker.js +113 -71
package/src/routing/model-tiers.js +156 -6
package/src/routing/output-ratios.js +57 -0
package/src/routing/regret-estimator.js +91 -0
package/src/routing/reward-pipeline.js +62 -0
package/src/routing/risk-analyzer.js +194 -0
package/src/routing/risk-classifier.js +130 -0
package/src/routing/shadow-mode.js +77 -0
package/src/routing/telemetry.js +7 -0
package/src/routing/tenant-policy.js +96 -0
package/src/routing/tokenizer.js +162 -0
package/src/server.js +12 -0
package/src/stores/file-store.js +42 -7
package/src/tools/smart-selection.js +11 -2
package/src/training/trajectory-compressor.js +266 -0
package/src/usage/aggregator.js +206 -0
package/src/utils/markdown-ansi.js +146 -0

package/src/clients/databricks.js CHANGED Viewed

@@ -107,8 +107,17 @@ async function performJsonRequest(url, { headers = {}, body }, providerLabel) {
     let json;
     try {
       json = JSON.parse(text);
-    } catch {
+    } catch (parseError) {
       json = null;
+      // Log non-JSON responses for debugging
+      if (response.ok) {
+        logger.warn({
+          provider: providerLabel,
+          status: response.status,
+          contentType: response.headers.get("content-type"),
+          textPreview: text.substring(0, 200),
+        }, `${providerLabel} returned non-JSON response (status ${response.status})`);
+      }
     }
     const result = {
@@ -221,7 +230,7 @@ async function invokeOllama(body) {
   const useAnthropicApi = await hasAnthropicEndpoint(config.ollama.endpoint);
   // Check if model supports tools FIRST (before wasteful injection)
-  const supportsTools = await checkOllamaToolSupport(config.ollama.model);
+  const supportsTools = await checkOllamaToolSupport(modelName);
   const injectToolsOllama = process.env.INJECT_TOOLS_OLLAMA !== "false";
   // Determine tools to send
@@ -256,7 +265,7 @@ async function invokeOllama(body) {
     toolCount,
     toolsInjected,
     supportsTools,
-    toolNames: (Array.isArray(toolsToSend) && toolsToSend.length > 0) ? toolsToSend.map(t => t.name) : []
+    toolNames: (Array.isArray(toolsToSend) && toolsToSend.length > 0) ? toolsToSend.map(t => t.name || t.function?.name || 'unnamed') : []
   }, `=== Ollama STANDARD TOOLS INJECTION for ${config.ollama.model} === ${logMessage}`);
   // ---- Anthropic-native path (Ollama v0.14.0+) ----
@@ -476,13 +485,17 @@ async function invokeAzureOpenAI(body) {
   // System prompt injection disabled - breaks model response
   // Tool guidance now provided via tool descriptions instead
+  const azureDeployment = body._suggestionModeModel || body._tierModel || config.azureOpenAI.deployment || "";
+  const isGpt5 = /gpt-5/i.test(azureDeployment);
+  const maxTokensKey = isGpt5 ? "max_completion_tokens" : "max_tokens";
   const azureBody = {
     messages,
-    temperature: body.temperature ?? 0.3,  // Lower temperature for more deterministic, action-oriented behavior
-    max_tokens: Math.min(body.max_tokens ?? 16384, 16384),  // Cap at Azure OpenAI's limit
+    temperature: body.temperature ?? 0.3,
+    [maxTokensKey]: Math.min(body.max_tokens ?? 16384, 16384),
     top_p: body.top_p ?? 1.0,
-    stream: false,  // Force non-streaming for Azure OpenAI - streaming format conversion not yet implemented
-    model: body._suggestionModeModel || body._tierModel || config.azureOpenAI.deployment
+    stream: false,
+    model: azureDeployment
   };
   // Add tools - inject standard tools if client didn't send any (passthrough mode)
@@ -2032,9 +2045,10 @@ async function invokeModel(body, options = {}) {
   // Determine provider via async tier routing
   // Thread workspace for code-graph integration (from X-Lynkr-Workspace header or body._workspace)
   const workspace = body._workspace || options.workspace || null;
+  const tenantPolicy = body._tenantPolicy || options.tenantPolicy || null;
   const routingResult = options.forceProvider
     ? { provider: options.forceProvider, model: null, method: 'forced' }
-    : await determineProviderSmart(body, { workspace });
+    : await determineProviderSmart(body, { workspace, tenantPolicy });
   const initialProvider = routingResult.provider;
   const tierSelectedModel = routingResult.model;
@@ -2071,6 +2085,50 @@ async function invokeModel(body, options = {}) {
     method: routingResult.method,
   }, "Provider routing decision");
+  // Phase 3.3 — small-first cascade (LYNKR_CASCADE_ENABLED=true to opt in).
+  // _cascadeInner prevents recursive cascade when invokeModel is called from inside.
+  if (!options._cascadeInner) {
+    const cascadeModule = require('../routing/cascade');
+    const hasTools = Array.isArray(body.tools) && body.tools.length > 0;
+    if (cascadeModule.shouldCascade({
+      tier: routingDecision.tier,
+      streaming: !!body.stream,
+      hasTools,
+    })) {
+      try {
+        const { getModelTierSelector } = require('../routing/model-tiers');
+        const simpleSelection = getModelTierSelector().selectModel('SIMPLE', null);
+        const cascadeResult = await cascadeModule.run({
+          payload: body,
+          smallModel: simpleSelection,
+          bigModel: { provider: initialProvider, model: tierSelectedModel },
+          invoke: async (provider, model, payload) => {
+            const cloned = { ...payload };
+            if (model) cloned._tierModel = model;
+            const resp = await invokeModel(cloned, { forceProvider: provider, _cascadeInner: true });
+            return resp.json; // confidence-scorer needs response body (.content)
+          },
+          taskType: body._taskType || routingResult.reason || 'reasoning',
+          threshold: 0.85,
+        });
+        logger.debug({
+          accepted: cascadeResult.cascadeStats.accepted,
+          usedModel: cascadeResult.usedModel,
+          totalMs: cascadeResult.cascadeStats.totalLatency,
+        }, '[Cascade] Result');
+        return {
+          ok: true,
+          status: 200,
+          json: cascadeResult.response,
+          stream: null,
+          routingDecision: { ...routingDecision, cascadeStats: cascadeResult.cascadeStats, usedModel: cascadeResult.usedModel },
+        };
+      } catch (err) {
+        logger.debug({ err: err.message }, '[Cascade] Failed, falling through to normal routing');
+      }
+    }
+  }
   metricsCollector.recordProviderRouting(initialProvider);
   // Get circuit breaker for initial provider
@@ -2198,7 +2256,7 @@ async function invokeModel(body, options = {}) {
     const failLatency = Date.now() - startTime;
     metricsCollector.recordProviderFailure(initialProvider);
     healthTracker.recordFailure(initialProvider, err, err.status);
-    getLatencyTracker().record(initialProvider, failLatency);
+    getLatencyTracker().record(initialProvider, routingDecision?.model, failLatency);
     // Check if we should fallback (any provider can fall back, not just ollama)
     const shouldFallback =
@@ -2309,7 +2367,7 @@ async function invokeModel(body, options = {}) {
       }, "Fallback to cloud provider succeeded");
       // Record latency for fallback provider
-      getLatencyTracker().record(fallbackProvider, fallbackLatency);
+      getLatencyTracker().record(fallbackProvider, routingDecision?.model, fallbackLatency);
       // Capture fallback telemetry
       const fbOutputTokens = fallbackResult.json?.usage?.output_tokens || fallbackResult.json?.usage?.completion_tokens || 0;

package/src/clients/openai-format.js CHANGED Viewed

@@ -203,24 +203,37 @@ function convertAnthropicToOpenAI(anthropicResponse, model = "claude-3-5-sonnet-
   const { id, content, stop_reason, usage } = anthropicResponse;
-  // Validate required fields
-  if (!content || !Array.isArray(content)) {
-    throw new Error(`convertAnthropicToOpenAI: invalid content field (got ${typeof content})`);
+  // Tolerant fallback: providers sometimes return reasoning-only responses
+  // (Minimax/DeepSeek), error envelopes, or empty bodies. Treat missing/invalid
+  // content as an empty turn so jcode/Pi/Codex don't crash on the response.
+  const safeContent = Array.isArray(content) ? content : [];
+  if (safeContent.length === 0) {
+    logger.warn({
+      hasContent: content !== undefined,
+      contentType: typeof content,
+      stop_reason,
+      responseKeys: Object.keys(anthropicResponse),
+      hasError: !!anthropicResponse.error,
+      errorMessage: anthropicResponse.error?.message,
+    }, "convertAnthropicToOpenAI: empty/missing content, returning empty assistant message");
   }
   // Convert content blocks to OpenAI format
   let messageContent = "";
+  let reasoningContent = "";
   const toolCalls = [];
   let citations = [];
-  for (const block of content) {
+  for (const block of safeContent) {
     if (block.type === "text") {
       messageContent += block.text;
       if (Array.isArray(block.citations)) {
         citations.push(...block.citations);
       }
     } else if (block.type === "thinking") {
-      // Skip thinking blocks in OpenAI format (they don't have an equivalent)
+      // Preserve reasoning text so reasoning-only models (Minimax, DeepSeek-R1)
+      // surface visible output to OpenAI clients that don't render thinking blocks
+      reasoningContent += (block.thinking || "");
     } else if (block.type === "tool_use") {
       toolCalls.push({
         id: block.id,
@@ -233,6 +246,12 @@ function convertAnthropicToOpenAI(anthropicResponse, model = "claude-3-5-sonnet-
     }
   }
+  // Fallback: if the model returned only reasoning (no visible text and no tools),
+  // promote reasoning into the visible content so jcode/Pi/Codex see something
+  if (!messageContent && !toolCalls.length && reasoningContent) {
+    messageContent = reasoningContent;
+  }
   // Build OpenAI response
   // Ensure ID has the chatcmpl- prefix that OpenAI clients expect
   const responseId = id && id.startsWith("chatcmpl-") ? id : `chatcmpl-${Date.now()}`;
@@ -263,6 +282,13 @@ function convertAnthropicToOpenAI(anthropicResponse, model = "claude-3-5-sonnet-
     openaiResponse.citations = citations;
   }
+  // Add reasoning_content as a side-channel field so clients that render
+  // thinking (e.g. some jcode / OpenRouter setups) can show it without losing
+  // it from the visible content fallback above
+  if (reasoningContent && reasoningContent !== messageContent) {
+    openaiResponse.choices[0].message.reasoning_content = reasoningContent;
+  }
   // Add tool_calls if present
   if (toolCalls.length > 0) {
     openaiResponse.choices[0].message.tool_calls = toolCalls;

package/src/config/index.js CHANGED Viewed

@@ -76,8 +76,8 @@ if (!SUPPORTED_MODEL_PROVIDERS.has(rawModelProvider)) {
 const modelProvider = rawModelProvider;
-const rawBaseUrl = trimTrailingSlash(process.env.DATABRICKS_API_BASE);
-const apiKey = process.env.DATABRICKS_API_KEY;
+let rawBaseUrl = trimTrailingSlash(process.env.DATABRICKS_API_BASE);
+let apiKey = process.env.DATABRICKS_API_KEY;
 const azureAnthropicEndpoint = process.env.AZURE_ANTHROPIC_ENDPOINT ?? null;
 const azureAnthropicApiKey = process.env.AZURE_ANTHROPIC_API_KEY ?? null;
@@ -255,33 +255,8 @@ const headroomLlmlinguaDevice = process.env.HEADROOM_LLMLINGUA_DEVICE ?? "auto";
 const headroomProvider = process.env.HEADROOM_PROVIDER ?? "anthropic";
 const headroomLogLevel = process.env.HEADROOM_LOG_LEVEL ?? "info";
-// Only require Databricks credentials if it's the primary provider or used as fallback
-if (modelProvider === "databricks" && (!rawBaseUrl || !apiKey)) {
-  throw new Error("Set DATABRICKS_API_BASE and DATABRICKS_API_KEY before starting the proxy.");
-} else if (modelProvider === "ollama" && !fallbackEnabled && (!rawBaseUrl || !apiKey)) {
-  // Relaxed: Allow mock credentials for true Ollama-only mode (fallback disabled)
-  if (!rawBaseUrl) process.env.DATABRICKS_API_BASE = "http://localhost:8080";
-  if (!apiKey) process.env.DATABRICKS_API_KEY = "mock-key-for-ollama-only";
-  console.log("[CONFIG] Using mock Databricks credentials (Ollama-only mode with fallback disabled)");
-}
-if (modelProvider === "azure-anthropic" && (!azureAnthropicEndpoint || !azureAnthropicApiKey)) {
-  throw new Error(
-    "Set AZURE_ANTHROPIC_ENDPOINT and AZURE_ANTHROPIC_API_KEY before starting the proxy.",
-  );
-}
-if (modelProvider === "azure-openai" && (!azureOpenAIEndpoint || !azureOpenAIApiKey)) {
-  throw new Error(
-    "Set AZURE_OPENAI_ENDPOINT and AZURE_OPENAI_API_KEY before starting the proxy.",
-  );
-}
-if (modelProvider === "openai" && !openAIApiKey) {
-  throw new Error(
-    "Set OPENAI_API_KEY before starting the proxy.",
-  );
-}
+// Credential validation is deferred until after tier routing mode detection
+// (see line ~430 for the actual validation logic)
 if (modelProvider === "ollama") {
   try {
@@ -320,34 +295,254 @@ if (process.env.PREFER_OLLAMA) {
   console.warn('[DEPRECATION] PREFER_OLLAMA is removed. Use TIER_* env vars for routing. See documentation/routing.md');
 }
-// Warn about misconfigured fallback provider (only when tier routing is active,
-// since that's the only path that triggers provider fallback)
+// ═══════════════════════════════════════════════════════════════════════════
+// TIER ROUTING MODE DETECTION
+// ═══════════════════════════════════════════════════════════════════════════
+// When all 4 TIER_* variables are set, Lynkr operates in "Tier Routing Mode"
+// In this mode:
+//   - MODEL_PROVIDER is auto-detected from TIER_SIMPLE
+//   - FALLBACK_PROVIDER is auto-detected from TIER_REASONING
+//   - FALLBACK_ENABLED is always true
+//   - Only credentials for providers used in tiers are validated
+// ═══════════════════════════════════════════════════════════════════════════
 const tiersConfigured = !!(
   process.env.TIER_SIMPLE?.trim() &&
   process.env.TIER_MEDIUM?.trim() &&
   process.env.TIER_COMPLEX?.trim() &&
   process.env.TIER_REASONING?.trim()
 );
-if (fallbackEnabled && tiersConfigured) {
+let tierRoutingMode = tiersConfigured;
+let autoDetectedProvider = null;
+let autoDetectedFallback = null;
+if (tierRoutingMode) {
+  console.log('[Config] ✓ Tier routing mode active (all 4 TIER_* variables set)');
+  // Phase 3: Error if legacy variables are set
+  if (process.env.MODEL_PROVIDER) {
+    throw new Error(
+      'MODEL_PROVIDER not allowed in tier routing mode.\n' +
+      'Remove MODEL_PROVIDER from your .env file.\n' +
+      'Provider is auto-detected from TIER_SIMPLE.\n' +
+      'See: documentation/routing.md'
+    );
+  }
+  if (process.env.FALLBACK_PROVIDER) {
+    throw new Error(
+      'FALLBACK_PROVIDER not allowed in tier routing mode.\n' +
+      'Remove FALLBACK_PROVIDER from your .env file.\n' +
+      'Fallback is auto-detected from TIER_REASONING.\n' +
+      'See: documentation/routing.md'
+    );
+  }
+  if (process.env.FALLBACK_ENABLED !== undefined) {
+    throw new Error(
+      'FALLBACK_ENABLED not allowed in tier routing mode.\n' +
+      'Remove FALLBACK_ENABLED from your .env file.\n' +
+      'Fallback is automatic when TIER_REASONING uses a cloud provider.\n' +
+      'See: documentation/routing.md'
+    );
+  }
+  // Auto-detect primary provider from TIER_SIMPLE
+  const tierSimple = process.env.TIER_SIMPLE.trim();
+  const tierReasoning = process.env.TIER_REASONING.trim();
+  const simpleMatch = tierSimple.match(/^([a-z-]+):(.+)$/);
+  const reasoningMatch = tierReasoning.match(/^([a-z-]+):(.+)$/);
+  if (!simpleMatch) {
+    throw new Error(`TIER_SIMPLE must be in format "provider:model" (got: "${tierSimple}")`);
+  }
+  if (!reasoningMatch) {
+    throw new Error(`TIER_REASONING must be in format "provider:model" (got: "${tierReasoning}")`);
+  }
+  autoDetectedProvider = simpleMatch[1];
+  autoDetectedFallback = reasoningMatch[1];
+  console.log(`[Config] Auto-detected MODEL_PROVIDER="${autoDetectedProvider}" from TIER_SIMPLE`);
+  console.log(`[Config] Auto-detected FALLBACK_PROVIDER="${autoDetectedFallback}" from TIER_REASONING`);
+  // Validate auto-detected providers
+  if (!SUPPORTED_MODEL_PROVIDERS.has(autoDetectedProvider)) {
+    throw new Error(
+      `Invalid provider in TIER_SIMPLE: "${autoDetectedProvider}"\n` +
+      `Valid providers: ${Array.from(SUPPORTED_MODEL_PROVIDERS).sort().join(', ')}`
+    );
+  }
+  if (!SUPPORTED_MODEL_PROVIDERS.has(autoDetectedFallback)) {
+    throw new Error(
+      `Invalid provider in TIER_REASONING: "${autoDetectedFallback}"\n` +
+      `Valid providers: ${Array.from(SUPPORTED_MODEL_PROVIDERS).sort().join(', ')}`
+    );
+  }
+  // Override MODEL_PROVIDER and FALLBACK_PROVIDER internally
+  process.env.MODEL_PROVIDER = autoDetectedProvider;
+  process.env.FALLBACK_PROVIDER = autoDetectedFallback;
+  process.env.FALLBACK_ENABLED = 'true';
+}
+// Re-read modelProvider and fallbackProvider after tier routing auto-detection
+// This ensures the config object uses the auto-detected values
+const finalModelProvider = (process.env.MODEL_PROVIDER ?? "databricks").toLowerCase();
+const finalFallbackProvider = (process.env.FALLBACK_PROVIDER ?? "databricks").toLowerCase();
+const finalFallbackEnabled = process.env.FALLBACK_ENABLED === "true";
+// Warn about misconfigured fallback provider (only when tier routing is active,
+// since that's the only path that triggers provider fallback)
+if (finalFallbackEnabled && tiersConfigured) {
   const localProviders = ["ollama", "llamacpp", "lmstudio"];
-  if (localProviders.includes(fallbackProvider)) {
-    throw new Error(`FALLBACK_PROVIDER cannot be '${fallbackProvider}' (local providers should not be fallbacks). Use cloud providers: databricks, azure-anthropic, azure-openai, openrouter, openai, bedrock`);
+  // Only warn (not error) if fallback is local - it just means fallback won't work
+  if (localProviders.includes(finalFallbackProvider) && finalFallbackProvider !== finalModelProvider) {
+    console.warn(`[WARN] FALLBACK_PROVIDER='${finalFallbackProvider}' is a local provider. Fallback should use a cloud provider for redundancy.`);
   }
   let fallbackMisconfigured = false;
-  if (fallbackProvider === "databricks" && (!rawBaseUrl || !apiKey)) {
+  if (finalFallbackProvider === "databricks" && (!rawBaseUrl || !apiKey)) {
     fallbackMisconfigured = true;
   }
-  if (fallbackProvider === "azure-anthropic" && (!azureAnthropicEndpoint || !azureAnthropicApiKey)) {
+  if (finalFallbackProvider === "azure-anthropic" && (!azureAnthropicEndpoint || !azureAnthropicApiKey)) {
     fallbackMisconfigured = true;
   }
-  if (fallbackProvider === "azure-openai" && (!azureOpenAIEndpoint || !azureOpenAIApiKey)) {
+  if (finalFallbackProvider === "azure-openai" && (!azureOpenAIEndpoint || !azureOpenAIApiKey)) {
     fallbackMisconfigured = true;
   }
-  if (fallbackProvider === "bedrock" && !bedrockApiKey) {
+  if (finalFallbackProvider === "bedrock" && !bedrockApiKey) {
     fallbackMisconfigured = true;
   }
   if (fallbackMisconfigured) {
-    console.warn(`[WARN] FALLBACK_PROVIDER='${fallbackProvider}' is enabled but missing credentials. Fallback will not work until configured.`);
+    console.warn(`[WARN] FALLBACK_PROVIDER='${finalFallbackProvider}' is enabled but missing credentials. Fallback will not work until configured.`);
+  }
+}
+// ═══════════════════════════════════════════════════════════════════════════
+// SMART CREDENTIAL VALIDATION (TIER ROUTING MODE)
+// ═══════════════════════════════════════════════════════════════════════════
+// Only validate credentials for providers actually used in tier config
+// ═══════════════════════════════════════════════════════════════════════════
+if (tierRoutingMode) {
+  // Extract all unique providers from tier config
+  const usedProviders = new Set();
+  [
+    process.env.TIER_SIMPLE,
+    process.env.TIER_MEDIUM,
+    process.env.TIER_COMPLEX,
+    process.env.TIER_REASONING
+  ].forEach(tierValue => {
+    const match = tierValue?.match(/^([a-z-]+):/);
+    if (match) usedProviders.add(match[1]);
+  });
+  console.log(`[Config] Tier routing uses providers: ${Array.from(usedProviders).join(', ')}`);
+  // Validate only providers used in tiers
+  if (usedProviders.has('databricks')) {
+    if (!rawBaseUrl || !apiKey) {
+      throw new Error(
+        'DATABRICKS_API_BASE and DATABRICKS_API_KEY required.\n' +
+        'Databricks is used in your tier routing config.'
+      );
+    }
+  } else {
+    // Mock credentials if Databricks not used
+    if (!rawBaseUrl) {
+      process.env.DATABRICKS_API_BASE = "http://localhost:8080";
+      rawBaseUrl = "http://localhost:8080";
+    }
+    if (!apiKey) {
+      process.env.DATABRICKS_API_KEY = "mock-key-unused";
+      apiKey = "mock-key-unused";
+    }
+  }
+  if (usedProviders.has('azure-anthropic') && (!azureAnthropicEndpoint || !azureAnthropicApiKey)) {
+    throw new Error(
+      'AZURE_ANTHROPIC_ENDPOINT and AZURE_ANTHROPIC_API_KEY required.\n' +
+      'Azure Anthropic is used in your tier routing config.'
+    );
+  }
+  if (usedProviders.has('azure-openai') && (!azureOpenAIEndpoint || !azureOpenAIApiKey)) {
+    throw new Error(
+      'AZURE_OPENAI_ENDPOINT and AZURE_OPENAI_API_KEY required.\n' +
+      'Azure OpenAI is used in your tier routing config.'
+    );
+  }
+  if (usedProviders.has('openai') && !openAIApiKey) {
+    throw new Error(
+      'OPENAI_API_KEY required.\n' +
+      'OpenAI is used in your tier routing config.'
+    );
+  }
+  if (usedProviders.has('openrouter') && !openRouterApiKey) {
+    throw new Error(
+      'OPENROUTER_API_KEY required.\n' +
+      'OpenRouter is used in your tier routing config.'
+    );
+  }
+  if (usedProviders.has('bedrock') && !bedrockApiKey) {
+    throw new Error(
+      'AWS_BEDROCK_API_KEY required.\n' +
+      'Bedrock is used in your tier routing config.'
+    );
+  }
+  // Ollama endpoint validation
+  if (usedProviders.has('ollama')) {
+    try {
+      new URL(ollamaEndpoint);
+    } catch (err) {
+      throw new Error(`Invalid OLLAMA_ENDPOINT: "${ollamaEndpoint}". Must be a valid URL.`);
+    }
+  }
+} else {
+  // ═══════════════════════════════════════════════════════════════════════════
+  // STATIC PROVIDER MODE - Original validation logic
+  // ═══════════════════════════════════════════════════════════════════════════
+  if (modelProvider === "databricks" && (!rawBaseUrl || !apiKey)) {
+    throw new Error("Set DATABRICKS_API_BASE and DATABRICKS_API_KEY before starting the proxy.");
+  } else if (modelProvider === "ollama" && !fallbackEnabled && (!rawBaseUrl || !apiKey)) {
+    // Relaxed: Allow mock credentials for true Ollama-only mode (fallback disabled)
+    if (!rawBaseUrl) {
+      process.env.DATABRICKS_API_BASE = "http://localhost:8080";
+      rawBaseUrl = "http://localhost:8080";
+    }
+    if (!apiKey) {
+      process.env.DATABRICKS_API_KEY = "mock-key-for-ollama-only";
+      apiKey = "mock-key-for-ollama-only";
+    }
+    console.log("[CONFIG] Using mock Databricks credentials (Ollama-only mode with fallback disabled)");
+  }
+  if (modelProvider === "azure-anthropic" && (!azureAnthropicEndpoint || !azureAnthropicApiKey)) {
+    throw new Error("SET AZURE_ANTHROPIC_ENDPOINT and AZURE_ANTHROPIC_API_KEY before starting the proxy.");
+  }
+  if (modelProvider === "azure-openai" && (!azureOpenAIEndpoint || !azureOpenAIApiKey)) {
+    throw new Error("Set AZURE_OPENAI_ENDPOINT and AZURE_OPENAI_API_KEY before starting the proxy.");
+  }
+  if (modelProvider === "openai" && !openAIApiKey) {
+    throw new Error("Set OPENAI_API_KEY before starting the proxy.");
+  }
+  if (modelProvider === "ollama") {
+    try {
+      new URL(ollamaEndpoint);
+    } catch (err) {
+      throw new Error(`Invalid OLLAMA_ENDPOINT: "${ollamaEndpoint}". Must be a valid URL.`);
+    }
   }
 }
@@ -547,7 +742,7 @@ const workerTaskTimeoutMs = Number.parseInt(process.env.WORKER_TASK_TIMEOUT_MS ?
 const workerOffloadThresholdBytes = Number.parseInt(process.env.WORKER_OFFLOAD_THRESHOLD_BYTES ?? "10000", 10);
 var config = {
-  env: process.env.NODE_ENV ?? "development",
+  env: process.env.NODE_ENV ?? "production",
   port: Number.isNaN(port) ? 8080 : port,
   databricks: {
     baseUrl: rawBaseUrl,
@@ -629,13 +824,13 @@ var config = {
     debounceMs: Number.isNaN(hotReloadDebounceMs) ? 1000 : hotReloadDebounceMs,
   },
   modelProvider: {
-    type: modelProvider,
+    type: finalModelProvider,
     defaultModel,
     suggestionModeModel,
-    fallbackEnabled,
+    fallbackEnabled: finalFallbackEnabled,
     ollamaMaxToolsForRouting,
     openRouterMaxToolsForRouting,
-    fallbackProvider,
+    fallbackProvider: finalFallbackProvider,
   },
   toolExecutionMode,
   toolResultCompression: {
@@ -918,8 +1113,16 @@ var config = {
   // Intelligent Routing
   routing: {
     weightedScoring: true,
+    // Cost optimization now respects tier routing mode (only uses TIER_* configured models)
     costOptimization: true,
     agenticDetection: true,
+    // Embed an interaction block in the response body so the user can
+    // see *why* a particular tier/provider was chosen.
+    visibleInteraction: process.env.LYNKR_VISIBLE_ROUTING === 'true',
+    // Run user-supplied preflight commands before invoking the model.
+    // If all exit 0, short-circuit the request with zero LLM cost.
+    preflightEnabled: process.env.LYNKR_PREFLIGHT_ENABLED === 'true',
+    preflightTimeoutMs: Number(process.env.LYNKR_PREFLIGHT_TIMEOUT_MS) || 120000,
   },
   // Model Tier Configuration (REQUIRED)

package/src/context/toon.js CHANGED Viewed

@@ -15,11 +15,12 @@ function normaliseSettings(settings = {}) {
   };
 }
-function resolveEncodeFn(overrideEncode) {
+async function resolveEncodeFn(overrideEncode) {
   if (typeof overrideEncode === "function") return overrideEncode;
   if (cachedEncode !== undefined) return cachedEncode;
   try {
-    const toon = require("@toon-format/toon");
+    // Use dynamic import for ES module compatibility
+    const toon = await import("@toon-format/toon");
     cachedEncode = typeof toon?.encode === "function" ? toon.encode : null;
     cachedLoadError = cachedEncode ? null : new Error("Missing encode() export from @toon-format/toon");
   } catch (err) {
@@ -89,7 +90,7 @@ function compressStringContent(content, cfg, encodeFn, stats) {
   return toonText;
 }
-function applyToonCompression(payload, settings = {}, options = {}) {
+async function applyToonCompression(payload, settings = {}, options = {}) {
   const cfg = normaliseSettings(settings);
   const stats = {
     enabled: cfg.enabled,
@@ -109,7 +110,7 @@ function applyToonCompression(payload, settings = {}, options = {}) {
     return { payload, stats };
   }
-  const encodeFn = resolveEncodeFn(options.encode);
+  const encodeFn = await resolveEncodeFn(options.encode);
   if (typeof encodeFn !== "function") {
     stats.available = false;
     const err = cachedLoadError ?? new Error("TOON encoder unavailable");