npm - @juspay/neurolink - Versions diffs - 9.41.0 → 9.42.0 - Mend

@juspay/neurolink 9.41.0 → 9.42.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

package/CHANGELOG.md +6 -0
package/README.md +7 -1
package/dist/auth/anthropicOAuth.d.ts +18 -3
package/dist/auth/anthropicOAuth.js +137 -4
package/dist/auth/providers/firebase.js +5 -1
package/dist/auth/providers/jwt.js +5 -1
package/dist/auth/providers/workos.js +5 -1
package/dist/auth/sessionManager.d.ts +1 -1
package/dist/auth/sessionManager.js +58 -27
package/dist/browser/neurolink.min.js +337 -318
package/dist/cli/commands/mcp.js +3 -0
package/dist/cli/commands/proxy.d.ts +2 -1
package/dist/cli/commands/proxy.js +279 -16
package/dist/cli/commands/task.js +3 -0
package/dist/cli/factories/commandFactory.d.ts +2 -0
package/dist/cli/factories/commandFactory.js +38 -0
package/dist/cli/parser.js +4 -3
package/dist/client/aiSdkAdapter.js +3 -0
package/dist/client/streamingClient.js +30 -10
package/dist/core/modules/GenerationHandler.js +3 -2
package/dist/core/redisConversationMemoryManager.js +7 -3
package/dist/evaluation/BatchEvaluator.js +4 -1
package/dist/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/evaluation/pipeline/evaluationPipeline.js +20 -8
package/dist/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/lib/auth/anthropicOAuth.d.ts +18 -3
package/dist/lib/auth/anthropicOAuth.js +137 -4
package/dist/lib/auth/providers/firebase.js +5 -1
package/dist/lib/auth/providers/jwt.js +5 -1
package/dist/lib/auth/providers/workos.js +5 -1
package/dist/lib/auth/sessionManager.d.ts +1 -1
package/dist/lib/auth/sessionManager.js +58 -27
package/dist/lib/client/aiSdkAdapter.js +3 -0
package/dist/lib/client/streamingClient.js +30 -10
package/dist/lib/core/modules/GenerationHandler.js +3 -2
package/dist/lib/core/redisConversationMemoryManager.js +7 -3
package/dist/lib/evaluation/BatchEvaluator.js +4 -1
package/dist/lib/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/lib/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/lib/evaluation/pipeline/evaluationPipeline.js +20 -8
package/dist/lib/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/lib/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/lib/neurolink.d.ts +3 -2
package/dist/lib/neurolink.js +260 -494
package/dist/lib/observability/otelBridge.d.ts +2 -2
package/dist/lib/observability/otelBridge.js +12 -3
package/dist/lib/providers/amazonBedrock.js +2 -4
package/dist/lib/providers/anthropic.d.ts +9 -5
package/dist/lib/providers/anthropic.js +19 -14
package/dist/lib/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/lib/providers/anthropicBaseProvider.js +5 -4
package/dist/lib/providers/azureOpenai.d.ts +1 -1
package/dist/lib/providers/azureOpenai.js +5 -4
package/dist/lib/providers/googleAiStudio.js +30 -1
package/dist/lib/providers/googleVertex.js +28 -6
package/dist/lib/providers/huggingFace.d.ts +3 -3
package/dist/lib/providers/huggingFace.js +6 -8
package/dist/lib/providers/litellm.js +41 -29
package/dist/lib/providers/mistral.js +2 -1
package/dist/lib/providers/ollama.js +80 -23
package/dist/lib/providers/openAI.js +3 -2
package/dist/lib/providers/openRouter.js +2 -1
package/dist/lib/providers/openaiCompatible.d.ts +4 -4
package/dist/lib/providers/openaiCompatible.js +4 -4
package/dist/lib/proxy/claudeFormat.d.ts +3 -2
package/dist/lib/proxy/claudeFormat.js +25 -20
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/lib/proxy/modelRouter.js +3 -0
package/dist/lib/proxy/oauthFetch.d.ts +1 -1
package/dist/lib/proxy/oauthFetch.js +65 -72
package/dist/lib/proxy/proxyConfig.js +44 -24
package/dist/lib/proxy/proxyEnv.d.ts +19 -0
package/dist/lib/proxy/proxyEnv.js +73 -0
package/dist/lib/proxy/proxyFetch.js +50 -4
package/dist/lib/proxy/proxyTracer.d.ts +133 -0
package/dist/lib/proxy/proxyTracer.js +645 -0
package/dist/lib/proxy/rawStreamCapture.d.ts +10 -0
package/dist/lib/proxy/rawStreamCapture.js +83 -0
package/dist/lib/proxy/requestLogger.d.ts +32 -5
package/dist/lib/proxy/requestLogger.js +406 -37
package/dist/lib/proxy/sseInterceptor.d.ts +97 -0
package/dist/lib/proxy/sseInterceptor.js +402 -0
package/dist/lib/proxy/usageStats.d.ts +4 -3
package/dist/lib/proxy/usageStats.js +25 -12
package/dist/lib/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/lib/rag/chunking/markdownChunker.js +15 -6
package/dist/lib/server/routes/claudeProxyRoutes.d.ts +7 -2
package/dist/lib/server/routes/claudeProxyRoutes.js +1737 -508
package/dist/lib/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/lib/services/server/ai/observability/instrumentation.js +240 -40
package/dist/lib/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/lib/tasks/backends/bullmqBackend.js +14 -7
package/dist/lib/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/lib/tasks/store/redisTaskStore.js +34 -26
package/dist/lib/tasks/taskManager.d.ts +3 -0
package/dist/lib/tasks/taskManager.js +63 -30
package/dist/lib/telemetry/index.d.ts +2 -1
package/dist/lib/telemetry/index.js +2 -1
package/dist/lib/telemetry/telemetryService.d.ts +3 -0
package/dist/lib/telemetry/telemetryService.js +65 -5
package/dist/lib/types/cli.d.ts +10 -0
package/dist/lib/types/proxyTypes.d.ts +37 -5
package/dist/lib/types/streamTypes.d.ts +25 -3
package/dist/lib/utils/messageBuilder.js +3 -2
package/dist/lib/utils/providerHealth.d.ts +18 -0
package/dist/lib/utils/providerHealth.js +240 -9
package/dist/lib/utils/providerUtils.js +14 -8
package/dist/lib/utils/toolChoice.d.ts +4 -0
package/dist/lib/utils/toolChoice.js +7 -0
package/dist/neurolink.d.ts +3 -2
package/dist/neurolink.js +260 -494
package/dist/observability/otelBridge.d.ts +2 -2
package/dist/observability/otelBridge.js +12 -3
package/dist/providers/amazonBedrock.js +2 -4
package/dist/providers/anthropic.d.ts +9 -5
package/dist/providers/anthropic.js +19 -14
package/dist/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/providers/anthropicBaseProvider.js +5 -4
package/dist/providers/azureOpenai.d.ts +1 -1
package/dist/providers/azureOpenai.js +5 -4
package/dist/providers/googleAiStudio.js +30 -1
package/dist/providers/googleVertex.js +28 -6
package/dist/providers/huggingFace.d.ts +3 -3
package/dist/providers/huggingFace.js +6 -7
package/dist/providers/litellm.js +41 -29
package/dist/providers/mistral.js +2 -1
package/dist/providers/ollama.js +80 -23
package/dist/providers/openAI.js +3 -2
package/dist/providers/openRouter.js +2 -1
package/dist/providers/openaiCompatible.d.ts +4 -4
package/dist/providers/openaiCompatible.js +4 -3
package/dist/proxy/claudeFormat.d.ts +3 -2
package/dist/proxy/claudeFormat.js +25 -20
package/dist/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/proxy/modelRouter.js +3 -0
package/dist/proxy/oauthFetch.d.ts +1 -1
package/dist/proxy/oauthFetch.js +65 -72
package/dist/proxy/proxyConfig.js +44 -24
package/dist/proxy/proxyEnv.d.ts +19 -0
package/dist/proxy/proxyEnv.js +72 -0
package/dist/proxy/proxyFetch.js +50 -4
package/dist/proxy/proxyTracer.d.ts +133 -0
package/dist/proxy/proxyTracer.js +644 -0
package/dist/proxy/rawStreamCapture.d.ts +10 -0
package/dist/proxy/rawStreamCapture.js +82 -0
package/dist/proxy/requestLogger.d.ts +32 -5
package/dist/proxy/requestLogger.js +406 -37
package/dist/proxy/sseInterceptor.d.ts +97 -0
package/dist/proxy/sseInterceptor.js +401 -0
package/dist/proxy/usageStats.d.ts +4 -3
package/dist/proxy/usageStats.js +25 -12
package/dist/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/rag/chunking/markdownChunker.js +15 -6
package/dist/server/routes/claudeProxyRoutes.d.ts +7 -2
package/dist/server/routes/claudeProxyRoutes.js +1737 -508
package/dist/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/services/server/ai/observability/instrumentation.js +240 -40
package/dist/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/tasks/backends/bullmqBackend.js +14 -7
package/dist/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/tasks/store/redisTaskStore.js +34 -26
package/dist/tasks/taskManager.d.ts +3 -0
package/dist/tasks/taskManager.js +63 -30
package/dist/telemetry/index.d.ts +2 -1
package/dist/telemetry/index.js +2 -1
package/dist/telemetry/telemetryService.d.ts +3 -0
package/dist/telemetry/telemetryService.js +65 -5
package/dist/types/cli.d.ts +10 -0
package/dist/types/proxyTypes.d.ts +37 -5
package/dist/types/streamTypes.d.ts +25 -3
package/dist/utils/messageBuilder.js +3 -2
package/dist/utils/providerHealth.d.ts +18 -0
package/dist/utils/providerHealth.js +240 -9
package/dist/utils/providerUtils.js +14 -8
package/dist/utils/toolChoice.d.ts +4 -0
package/dist/utils/toolChoice.js +6 -0
package/docs/assets/dashboards/neurolink-proxy-observability-dashboard.json +6609 -0
package/docs/changelog.md +252 -0
package/package.json +17 -1
package/scripts/observability/check-proxy-telemetry.mjs +235 -0
package/scripts/observability/docker-compose.proxy-observability.yaml +55 -0
package/scripts/observability/import-openobserve-dashboard.mjs +240 -0
package/scripts/observability/manage-local-openobserve.sh +184 -0
package/scripts/observability/otel-collector.proxy-observability.yaml +78 -0
package/scripts/observability/proxy-observability.env.example +23 -0

package/dist/utils/providerHealth.js CHANGED Viewed

@@ -228,7 +228,8 @@ export class ProviderHealthChecker {
         }
         // Providers that don't use API keys directly
         if (providerName === AIProviderName.OLLAMA ||
-            providerName === AIProviderName.BEDROCK) {
+            providerName === AIProviderName.BEDROCK ||
+            providerName === AIProviderName.LITELLM) {
             healthStatus.hasApiKey = true;
             return;
         }
@@ -368,6 +369,8 @@ export class ProviderHealthChecker {
                 return [];
             case AIProviderName.AZURE:
                 return ["AZURE_OPENAI_API_KEY", "AZURE_OPENAI_ENDPOINT"];
+            case AIProviderName.LITELLM:
+                return [];
             case AIProviderName.OLLAMA:
                 return []; // Ollama typically doesn't require API keys
             default:
@@ -391,8 +394,10 @@ export class ProviderHealthChecker {
                 return "AWS_ACCESS_KEY_ID";
             case AIProviderName.AZURE:
                 return "AZURE_OPENAI_API_KEY";
+            case AIProviderName.LITELLM:
+                return "LITELLM_API_KEY";
             case AIProviderName.OLLAMA:
-                return "OLLAMA_API_BASE";
+                return "OLLAMA_BASE_URL";
             default:
                 return "";
         }
@@ -416,6 +421,8 @@ export class ProviderHealthChecker {
                 return apiKey.length >= API_KEY_LENGTHS.AWS_ACCESS_KEY; // AWS access key length
             case AIProviderName.AZURE:
                 return apiKey.length >= API_KEY_LENGTHS.AZURE_MIN; // Azure OpenAI API key length
+            case AIProviderName.LITELLM:
+                return apiKey.length > 0;
             case AIProviderName.OLLAMA:
                 return true; // Ollama usually doesn't require specific format
             default:
@@ -437,8 +444,10 @@ export class ProviderHealthChecker {
                 return null; // Complex authentication required
             case AIProviderName.BEDROCK:
                 return null; // AWS endpoints vary by region
+            case AIProviderName.LITELLM:
+                return this.getLiteLLMModelsUrl();
             case AIProviderName.OLLAMA:
-                return "http://localhost:11434/api/version";
+                return this.getOllamaTagsUrl();
             default:
                 return null;
         }
@@ -457,6 +466,9 @@ export class ProviderHealthChecker {
             case AIProviderName.AZURE:
                 await this.checkAzureConfig(healthStatus);
                 break;
+            case AIProviderName.LITELLM:
+                await this.checkLiteLLMConfig(healthStatus);
+                break;
             case AIProviderName.OLLAMA:
                 await this.checkOllamaConfig(healthStatus);
                 break;
@@ -648,15 +660,177 @@ export class ProviderHealthChecker {
             healthStatus.recommendations.push("Set one of: AZURE_OPENAI_MODEL, AZURE_OPENAI_DEPLOYMENT, or AZURE_OPENAI_DEPLOYMENT_ID");
         }
     }
+    static getLiteLLMBaseUrl() {
+        return process.env.LITELLM_BASE_URL || "http://localhost:4000";
+    }
+    static getLiteLLMModelsUrl() {
+        return new URL("/v1/models", this.getLiteLLMBaseUrl()).toString();
+    }
+    static getConfiguredLiteLLMModel() {
+        return process.env.LITELLM_MODEL || "openai/gpt-4o-mini";
+    }
+    static getOllamaBaseUrl() {
+        return (process.env.OLLAMA_BASE_URL ||
+            process.env.OLLAMA_API_BASE ||
+            "http://localhost:11434");
+    }
+    static getOllamaTagsUrl() {
+        return new URL("/api/tags", this.getOllamaBaseUrl()).toString();
+    }
+    static getConfiguredOllamaModel() {
+        return process.env.OLLAMA_MODEL || "llama3.1:8b";
+    }
+    static async fetchJsonWithTimeout(url, options = {}) {
+        const controller = new AbortController();
+        const timeoutId = setTimeout(() => controller.abort(), options.timeout ?? this.DEFAULT_TIMEOUT);
+        try {
+            const proxyFetch = createProxyFetch();
+            const response = await proxyFetch(url, {
+                method: "GET",
+                headers: options.headers,
+                signal: controller.signal,
+            });
+            if (!response.ok) {
+                throw new Error(`HTTP ${response.status}: ${response.statusText}`);
+            }
+            return await response.json();
+        }
+        finally {
+            clearTimeout(timeoutId);
+        }
+    }
+    static normalizeModelList(models) {
+        return models
+            .map((entry) => {
+            if (typeof entry === "string") {
+                return entry;
+            }
+            if (entry &&
+                typeof entry === "object" &&
+                "id" in entry &&
+                typeof entry.id === "string") {
+                return entry.id;
+            }
+            if (entry &&
+                typeof entry === "object" &&
+                "name" in entry &&
+                typeof entry.name === "string") {
+                return entry.name;
+            }
+            return null;
+        })
+            .filter((model) => typeof model === "string");
+    }
+    static hasRequestedModel(availableModels, requestedModel) {
+        return availableModels.some((model) => model === requestedModel ||
+            model.startsWith(`${requestedModel}:`) ||
+            requestedModel.startsWith(`${model}:`));
+    }
+    static async getOllamaAvailableModels(timeout = 2000) {
+        const payload = (await this.fetchJsonWithTimeout(this.getOllamaTagsUrl(), {
+            timeout,
+        }));
+        return this.normalizeModelList(payload.models ?? []);
+    }
+    static async getLiteLLMAvailableModels(timeout = 2000) {
+        const payload = (await this.fetchJsonWithTimeout(this.getLiteLLMModelsUrl(), {
+            timeout,
+            headers: {
+                Authorization: `Bearer ${process.env.LITELLM_API_KEY || "sk-anything"}`,
+                "Content-Type": "application/json",
+            },
+        }));
+        return this.normalizeModelList(payload.data ?? []);
+    }
+    static async checkOllamaAvailability(options) {
+        try {
+            const models = await this.getOllamaAvailableModels(options.timeout);
+            if (!this.hasRequestedModel(models, options.model)) {
+                return {
+                    available: false,
+                    reason: `Configured Ollama model '${options.model}' is not installed`,
+                    models,
+                };
+            }
+            return { available: true, models };
+        }
+        catch (error) {
+            return {
+                available: false,
+                reason: error instanceof Error ? error.message : String(error),
+                models: [],
+            };
+        }
+    }
+    static async checkLiteLLMAvailability(options) {
+        try {
+            const models = await this.getLiteLLMAvailableModels(options.timeout);
+            if (models.length === 0) {
+                return {
+                    available: false,
+                    reason: "LiteLLM returned an empty model list",
+                    models,
+                };
+            }
+            if (!this.hasRequestedModel(models, options.model)) {
+                return {
+                    available: false,
+                    reason: `Configured LiteLLM model '${options.model}' is not exposed by the proxy`,
+                    models,
+                };
+            }
+            return { available: true, models };
+        }
+        catch (error) {
+            return {
+                available: false,
+                reason: error instanceof Error ? error.message : String(error),
+                models: [],
+            };
+        }
+    }
+    static async checkLiteLLMConfig(healthStatus) {
+        const liteLLMBase = this.getLiteLLMBaseUrl();
+        if (!liteLLMBase.startsWith("http")) {
+            healthStatus.isConfigured = false;
+            healthStatus.configurationIssues.push("Invalid LITELLM_BASE_URL format");
+            healthStatus.recommendations.push("Set LITELLM_BASE_URL to a valid URL (e.g., http://localhost:4000)");
+            return;
+        }
+        const availability = await this.checkLiteLLMAvailability({
+            model: this.getConfiguredLiteLLMModel(),
+            timeout: 2000,
+        });
+        if (!availability.available) {
+            healthStatus.isConfigured = false;
+            healthStatus.configurationIssues.push(`LiteLLM runtime check failed: ${availability.reason ?? "unknown error"}`);
+            healthStatus.recommendations.push("Start the LiteLLM proxy and ensure the configured model is available from /v1/models");
+            return;
+        }
+        healthStatus.isConfigured = true;
+    }
     /**
      * Check Ollama configuration
      */
     static async checkOllamaConfig(healthStatus) {
-        const ollamaBase = process.env.OLLAMA_API_BASE || "http://localhost:11434";
+        const ollamaBase = this.getOllamaBaseUrl();
         if (!ollamaBase.startsWith("http")) {
-            healthStatus.configurationIssues.push("Invalid OLLAMA_API_BASE format");
-            healthStatus.recommendations.push("Set OLLAMA_API_BASE to a valid URL (e.g., http://localhost:11434)");
+            healthStatus.isConfigured = false;
+            healthStatus.configurationIssues.push("Invalid OLLAMA_BASE_URL format (OLLAMA_API_BASE is still accepted as a legacy alias)");
+            healthStatus.recommendations.push("Set OLLAMA_BASE_URL to a valid URL (e.g., http://localhost:11434). OLLAMA_API_BASE remains supported as a legacy alias.");
+            return;
         }
+        const availability = await this.checkOllamaAvailability({
+            model: this.getConfiguredOllamaModel(),
+            timeout: 2000,
+        });
+        if (!availability.available) {
+            healthStatus.isConfigured = false;
+            healthStatus.configurationIssues.push(`Ollama runtime check failed: ${availability.reason ?? "unknown error"}`);
+            healthStatus.recommendations.push("Start Ollama and install the configured model before using Ollama as a fallback provider");
+            return;
+        }
+        healthStatus.isConfigured = true;
     }
     /**
      * Get common models for a provider
@@ -703,8 +877,21 @@ export class ProviderHealthChecker {
                 return [BedrockModels.CLAUDE_3_SONNET, BedrockModels.CLAUDE_3_HAIKU];
             case AIProviderName.AZURE:
                 return [OpenAIModels.GPT_4O, OpenAIModels.GPT_4O_MINI, "gpt-35-turbo"];
-            case AIProviderName.OLLAMA:
-                return ["llama3.2:latest", "llama3.1:latest", "mistral:latest"];
+            case AIProviderName.LITELLM:
+                return [
+                    "openai/gpt-4o-mini",
+                    "anthropic/claude-3-haiku",
+                    "google/gemini-2.5-flash",
+                ];
+            case AIProviderName.OLLAMA: {
+                const envModel = process.env.OLLAMA_MODEL;
+                const defaults = [
+                    "llama3.2:latest",
+                    "llama3.1:latest",
+                    "mistral:latest",
+                ];
+                return envModel ? [envModel, ...defaults] : defaults;
+            }
             default:
                 return [];
         }
@@ -1139,18 +1326,61 @@ export class ProviderHealthChecker {
             this.consecutiveFailures.clear();
         }
     }
+    static async checkFallbackProviderAvailability(providerName, model) {
+        const provider = providerName;
+        if (provider === AIProviderName.OLLAMA) {
+            const availability = await this.checkOllamaAvailability({
+                model,
+                timeout: 2000,
+            });
+            return {
+                available: availability.available,
+                reason: availability.reason,
+            };
+        }
+        if (provider === AIProviderName.LITELLM) {
+            const availability = await this.checkLiteLLMAvailability({
+                model,
+                timeout: 2000,
+            });
+            return {
+                available: availability.available,
+                reason: availability.reason,
+            };
+        }
+        try {
+            const health = await this.checkProviderHealth(provider, {
+                includeConnectivityTest: false,
+                cacheResults: true,
+                maxCacheAge: 15_000,
+                timeout: 2000,
+            });
+            return {
+                available: health.isHealthy,
+                reason: health.error || health.configurationIssues[0] || health.warning,
+            };
+        }
+        catch (error) {
+            return {
+                available: false,
+                reason: error instanceof Error ? error.message : String(error),
+            };
+        }
+    }
     /**
      * Get the best healthy provider from a list of options (NON-BLOCKING)
      * Prioritizes healthy providers over configured but unhealthy ones
      * Uses fast, cached health checks to avoid blocking initialization
      */
     static async getBestHealthyProvider(preferredProviders = [
+        "litellm",
+        "ollama",
         "openai",
         "anthropic",
         "vertex",
+        "google-ai",
         "bedrock",
         "azure",
-        "google-ai",
     ]) {
         const healthStatuses = await this.checkAllProvidersHealth({
             includeConnectivityTest: false, // Quick config check only
@@ -1191,6 +1421,7 @@ export class ProviderHealthChecker {
             AIProviderName.OPENAI,
             AIProviderName.BEDROCK,
             AIProviderName.AZURE,
+            AIProviderName.LITELLM,
             AIProviderName.OLLAMA,
         ];
         const healthChecks = providers.map((provider) => this.checkProviderHealth(provider, options));

package/dist/utils/providerUtils.js CHANGED Viewed

@@ -62,15 +62,18 @@ export async function getBestProvider(requestedProvider) {
     }
     /**
      * Provider priority order rationale:
-     * - Vertex (Google Cloud AI) is prioritized first for its enterprise-grade reliability and advanced model capabilities.
-     * - Google AI follows as second priority for comprehensive Google AI ecosystem support.
+     * - LiteLLM and Ollama are prioritized first for local/self-hosted deployments,
+     *   avoiding cloud quota/rate-limit issues during fallback scenarios.
+     * - Vertex (Google Cloud AI) follows for enterprise-grade reliability.
+     * - Google AI follows as second cloud priority for comprehensive Google AI ecosystem support.
      * - OpenAI maintains high priority due to its consistent reliability and broad model support.
-     * - Other providers are ordered based on a combination of reliability, feature set, and historical performance in our use cases.
-     * - Ollama is kept as a fallback for local deployments when available.
+     * - Other providers are ordered based on a combination of reliability, feature set, and historical performance.
      * Please update this comment if the order is changed in the future, and document the rationale for maintainability.
      */
     const providers = [
-        "vertex", // Prioritize Google Cloud AI (Vertex) first
+        "litellm", // Prioritize self-hosted/proxy (no rate limits)
+        "ollama", // Local models (no rate limits)
+        "vertex", // Google Cloud AI (enterprise)
         "google-ai", // Google AI ecosystem support
         "openai", // Reliable with broad model support
         "anthropic",
@@ -78,7 +81,6 @@ export async function getBestProvider(requestedProvider) {
         "azure",
         "mistral",
         "huggingface",
-        "ollama", // Keep as fallback
     ];
     for (const provider of providers) {
         if (await isProviderAvailable(provider)) {
@@ -106,8 +108,11 @@ async function isProviderAvailable(providerName) {
             });
             if (response.ok) {
                 const { models } = await response.json();
-                const defaultOllamaModel = "llama3.2:latest";
-                return models.some((m) => m.name === defaultOllamaModel);
+                const defaultOllamaModel = process.env.OLLAMA_MODEL || "llama3.1:8b";
+                // Check for exact match first, then prefix match (e.g. "gemma3:27b" matches "gemma3:27b-fp16")
+                return models.some((m) => m.name === defaultOllamaModel ||
+                    (typeof m.name === "string" &&
+                        m.name.startsWith(defaultOllamaModel.split(":")[0] + ":")));
             }
             return false;
         }
@@ -413,6 +418,7 @@ export function getAvailableProviders() {
         "anthropic",
         "azure",
         "google-ai",
+        "litellm",
         "huggingface",
         "ollama",
         "mistral",

package/dist/utils/toolChoice.d.ts ADDED Viewed

@@ -0,0 +1,4 @@
+import type { Tool, ToolChoice } from "ai";
+export declare function resolveToolChoice(options: {
+    toolChoice?: ToolChoice<Record<string, Tool>>;
+}, tools: Record<string, Tool> | undefined, shouldUseTools: boolean): ToolChoice<Record<string, Tool>> | "none";

package/dist/utils/toolChoice.js ADDED Viewed

@@ -0,0 +1,6 @@
+export function resolveToolChoice(options, tools, shouldUseTools) {
+    if (!shouldUseTools || !tools || Object.keys(tools).length === 0) {
+        return "none";
+    }
+    return options.toolChoice ?? "auto";
+}