npm - @juspay/neurolink - Versions diffs - 9.41.0 → 9.42.1 - Mend

@juspay/neurolink 9.41.0 → 9.42.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (212) hide show

package/CHANGELOG.md +8 -0
package/README.md +7 -1
package/dist/auth/anthropicOAuth.d.ts +18 -3
package/dist/auth/anthropicOAuth.js +149 -4
package/dist/auth/providers/firebase.js +5 -1
package/dist/auth/providers/jwt.js +5 -1
package/dist/auth/providers/workos.js +5 -1
package/dist/auth/sessionManager.d.ts +1 -1
package/dist/auth/sessionManager.js +58 -27
package/dist/browser/neurolink.min.js +354 -334
package/dist/cli/commands/mcp.d.ts +6 -0
package/dist/cli/commands/mcp.js +188 -181
package/dist/cli/commands/proxy.d.ts +2 -1
package/dist/cli/commands/proxy.js +713 -431
package/dist/cli/commands/task.js +3 -0
package/dist/cli/factories/commandFactory.d.ts +2 -0
package/dist/cli/factories/commandFactory.js +38 -0
package/dist/cli/parser.js +4 -3
package/dist/client/aiSdkAdapter.js +3 -0
package/dist/client/streamingClient.js +30 -10
package/dist/core/baseProvider.d.ts +6 -1
package/dist/core/baseProvider.js +208 -230
package/dist/core/factory.d.ts +3 -0
package/dist/core/factory.js +138 -188
package/dist/core/modules/GenerationHandler.js +3 -2
package/dist/core/redisConversationMemoryManager.js +7 -3
package/dist/evaluation/BatchEvaluator.js +4 -1
package/dist/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/evaluation/pipeline/evaluationPipeline.js +24 -9
package/dist/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/evaluation/scorers/scorerRegistry.d.ts +3 -0
package/dist/evaluation/scorers/scorerRegistry.js +353 -282
package/dist/lib/auth/anthropicOAuth.d.ts +18 -3
package/dist/lib/auth/anthropicOAuth.js +149 -4
package/dist/lib/auth/providers/firebase.js +5 -1
package/dist/lib/auth/providers/jwt.js +5 -1
package/dist/lib/auth/providers/workos.js +5 -1
package/dist/lib/auth/sessionManager.d.ts +1 -1
package/dist/lib/auth/sessionManager.js +58 -27
package/dist/lib/client/aiSdkAdapter.js +3 -0
package/dist/lib/client/streamingClient.js +30 -10
package/dist/lib/core/baseProvider.d.ts +6 -1
package/dist/lib/core/baseProvider.js +208 -230
package/dist/lib/core/factory.d.ts +3 -0
package/dist/lib/core/factory.js +138 -188
package/dist/lib/core/modules/GenerationHandler.js +3 -2
package/dist/lib/core/redisConversationMemoryManager.js +7 -3
package/dist/lib/evaluation/BatchEvaluator.js +4 -1
package/dist/lib/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/lib/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/lib/evaluation/pipeline/evaluationPipeline.js +24 -9
package/dist/lib/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/lib/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/lib/evaluation/scorers/scorerRegistry.d.ts +3 -0
package/dist/lib/evaluation/scorers/scorerRegistry.js +353 -282
package/dist/lib/mcp/toolRegistry.d.ts +2 -0
package/dist/lib/mcp/toolRegistry.js +32 -31
package/dist/lib/neurolink.d.ts +41 -2
package/dist/lib/neurolink.js +1616 -1681
package/dist/lib/observability/otelBridge.d.ts +2 -2
package/dist/lib/observability/otelBridge.js +12 -3
package/dist/lib/providers/amazonBedrock.js +2 -4
package/dist/lib/providers/anthropic.d.ts +9 -5
package/dist/lib/providers/anthropic.js +19 -14
package/dist/lib/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/lib/providers/anthropicBaseProvider.js +5 -4
package/dist/lib/providers/azureOpenai.d.ts +1 -1
package/dist/lib/providers/azureOpenai.js +5 -4
package/dist/lib/providers/googleAiStudio.js +30 -6
package/dist/lib/providers/googleVertex.d.ts +10 -0
package/dist/lib/providers/googleVertex.js +437 -423
package/dist/lib/providers/huggingFace.d.ts +3 -3
package/dist/lib/providers/huggingFace.js +6 -8
package/dist/lib/providers/litellm.d.ts +1 -0
package/dist/lib/providers/litellm.js +76 -55
package/dist/lib/providers/mistral.js +2 -1
package/dist/lib/providers/ollama.js +93 -23
package/dist/lib/providers/openAI.d.ts +2 -0
package/dist/lib/providers/openAI.js +141 -141
package/dist/lib/providers/openRouter.js +2 -1
package/dist/lib/providers/openaiCompatible.d.ts +4 -4
package/dist/lib/providers/openaiCompatible.js +4 -4
package/dist/lib/proxy/claudeFormat.d.ts +3 -2
package/dist/lib/proxy/claudeFormat.js +27 -14
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/lib/proxy/modelRouter.js +3 -0
package/dist/lib/proxy/oauthFetch.d.ts +1 -1
package/dist/lib/proxy/oauthFetch.js +289 -316
package/dist/lib/proxy/proxyConfig.js +46 -24
package/dist/lib/proxy/proxyEnv.d.ts +19 -0
package/dist/lib/proxy/proxyEnv.js +73 -0
package/dist/lib/proxy/proxyFetch.js +291 -217
package/dist/lib/proxy/proxyTracer.d.ts +133 -0
package/dist/lib/proxy/proxyTracer.js +645 -0
package/dist/lib/proxy/rawStreamCapture.d.ts +10 -0
package/dist/lib/proxy/rawStreamCapture.js +83 -0
package/dist/lib/proxy/requestLogger.d.ts +32 -5
package/dist/lib/proxy/requestLogger.js +503 -47
package/dist/lib/proxy/sseInterceptor.d.ts +97 -0
package/dist/lib/proxy/sseInterceptor.js +427 -0
package/dist/lib/proxy/usageStats.d.ts +4 -3
package/dist/lib/proxy/usageStats.js +25 -12
package/dist/lib/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/lib/rag/chunking/markdownChunker.js +15 -6
package/dist/lib/server/routes/claudeProxyRoutes.d.ts +17 -3
package/dist/lib/server/routes/claudeProxyRoutes.js +3032 -1349
package/dist/lib/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/lib/services/server/ai/observability/instrumentation.js +337 -161
package/dist/lib/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/lib/tasks/backends/bullmqBackend.js +35 -22
package/dist/lib/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/lib/tasks/store/redisTaskStore.js +54 -39
package/dist/lib/tasks/taskManager.d.ts +5 -0
package/dist/lib/tasks/taskManager.js +158 -30
package/dist/lib/telemetry/index.d.ts +2 -1
package/dist/lib/telemetry/index.js +2 -1
package/dist/lib/telemetry/telemetryService.d.ts +3 -0
package/dist/lib/telemetry/telemetryService.js +69 -5
package/dist/lib/types/cli.d.ts +10 -0
package/dist/lib/types/proxyTypes.d.ts +160 -5
package/dist/lib/types/streamTypes.d.ts +25 -3
package/dist/lib/utils/messageBuilder.js +3 -2
package/dist/lib/utils/providerHealth.d.ts +19 -0
package/dist/lib/utils/providerHealth.js +279 -33
package/dist/lib/utils/providerUtils.js +17 -22
package/dist/lib/utils/toolChoice.d.ts +4 -0
package/dist/lib/utils/toolChoice.js +7 -0
package/dist/mcp/toolRegistry.d.ts +2 -0
package/dist/mcp/toolRegistry.js +32 -31
package/dist/neurolink.d.ts +41 -2
package/dist/neurolink.js +1616 -1681
package/dist/observability/otelBridge.d.ts +2 -2
package/dist/observability/otelBridge.js +12 -3
package/dist/providers/amazonBedrock.js +2 -4
package/dist/providers/anthropic.d.ts +9 -5
package/dist/providers/anthropic.js +19 -14
package/dist/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/providers/anthropicBaseProvider.js +5 -4
package/dist/providers/azureOpenai.d.ts +1 -1
package/dist/providers/azureOpenai.js +5 -4
package/dist/providers/googleAiStudio.js +30 -6
package/dist/providers/googleVertex.d.ts +10 -0
package/dist/providers/googleVertex.js +437 -423
package/dist/providers/huggingFace.d.ts +3 -3
package/dist/providers/huggingFace.js +6 -7
package/dist/providers/litellm.d.ts +1 -0
package/dist/providers/litellm.js +76 -55
package/dist/providers/mistral.js +2 -1
package/dist/providers/ollama.js +93 -23
package/dist/providers/openAI.d.ts +2 -0
package/dist/providers/openAI.js +141 -141
package/dist/providers/openRouter.js +2 -1
package/dist/providers/openaiCompatible.d.ts +4 -4
package/dist/providers/openaiCompatible.js +4 -3
package/dist/proxy/claudeFormat.d.ts +3 -2
package/dist/proxy/claudeFormat.js +27 -14
package/dist/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/proxy/modelRouter.js +3 -0
package/dist/proxy/oauthFetch.d.ts +1 -1
package/dist/proxy/oauthFetch.js +289 -316
package/dist/proxy/proxyConfig.js +46 -24
package/dist/proxy/proxyEnv.d.ts +19 -0
package/dist/proxy/proxyEnv.js +72 -0
package/dist/proxy/proxyFetch.js +291 -217
package/dist/proxy/proxyTracer.d.ts +133 -0
package/dist/proxy/proxyTracer.js +644 -0
package/dist/proxy/rawStreamCapture.d.ts +10 -0
package/dist/proxy/rawStreamCapture.js +82 -0
package/dist/proxy/requestLogger.d.ts +32 -5
package/dist/proxy/requestLogger.js +503 -47
package/dist/proxy/sseInterceptor.d.ts +97 -0
package/dist/proxy/sseInterceptor.js +426 -0
package/dist/proxy/usageStats.d.ts +4 -3
package/dist/proxy/usageStats.js +25 -12
package/dist/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/rag/chunking/markdownChunker.js +15 -6
package/dist/server/routes/claudeProxyRoutes.d.ts +17 -3
package/dist/server/routes/claudeProxyRoutes.js +3032 -1349
package/dist/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/services/server/ai/observability/instrumentation.js +337 -161
package/dist/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/tasks/backends/bullmqBackend.js +35 -22
package/dist/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/tasks/store/redisTaskStore.js +54 -39
package/dist/tasks/taskManager.d.ts +5 -0
package/dist/tasks/taskManager.js +158 -30
package/dist/telemetry/index.d.ts +2 -1
package/dist/telemetry/index.js +2 -1
package/dist/telemetry/telemetryService.d.ts +3 -0
package/dist/telemetry/telemetryService.js +69 -5
package/dist/types/cli.d.ts +10 -0
package/dist/types/proxyTypes.d.ts +160 -5
package/dist/types/streamTypes.d.ts +25 -3
package/dist/utils/messageBuilder.js +3 -2
package/dist/utils/providerHealth.d.ts +19 -0
package/dist/utils/providerHealth.js +279 -33
package/dist/utils/providerUtils.js +18 -22
package/dist/utils/toolChoice.d.ts +4 -0
package/dist/utils/toolChoice.js +6 -0
package/docs/assets/dashboards/neurolink-proxy-observability-dashboard.json +6609 -0
package/docs/changelog.md +252 -0
package/package.json +19 -2
package/scripts/observability/check-proxy-telemetry.mjs +235 -0
package/scripts/observability/docker-compose.proxy-observability.yaml +55 -0
package/scripts/observability/import-openobserve-dashboard.mjs +240 -0
package/scripts/observability/manage-local-openobserve.sh +215 -0
package/scripts/observability/otel-collector.proxy-observability.yaml +78 -0
package/scripts/observability/proxy-observability.env.example +23 -0

package/dist/lib/providers/huggingFace.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
+import { type LanguageModel, type Schema } from "ai";
 import type { ZodType } from "zod";
-import { type Schema, type LanguageModel } from "ai";
-import { AIProviderName } from "../constants/enums.js";
-import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
+import type { AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
+import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
 /**
  * HuggingFace Provider - BaseProvider Implementation
  * Using AI SDK with HuggingFace's OpenAI-compatible endpoint

package/dist/lib/providers/huggingFace.js CHANGED Viewed

@@ -1,12 +1,12 @@
 import { createOpenAI } from "@ai-sdk/openai";
 import { NoOutputGeneratedError, stepCountIs, streamText, } from "ai";
-import { AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import { logger } from "../utils/logger.js";
-import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { DEFAULT_MAX_STEPS } from "../core/constants.js";
-import { validateApiKey, createHuggingFaceConfig, getProviderModel, } from "../utils/providerConfig.js";
 import { createProxyFetch } from "../proxy/proxyFetch.js";
+import { logger } from "../utils/logger.js";
+import { createHuggingFaceConfig, getProviderModel, validateApiKey, } from "../utils/providerConfig.js";
+import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 // Configuration helpers - now using consolidated utility
 const getHuggingFaceApiKey = () => {
     return validateApiKey(createHuggingFaceConfig());
@@ -136,9 +136,7 @@ export class HuggingFaceProvider extends BaseProvider {
                 tools: (shouldUseTools
                     ? streamOptions.tools || allTools
                     : {}),
-                toolChoice: (shouldUseTools
-                    ? streamOptions.toolChoice || "auto"
-                    : "none"),
+                toolChoice: resolveToolChoice(options, (shouldUseTools ? streamOptions.tools || allTools : {}), shouldUseTools),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                 onStepFinish: ({ toolCalls, toolResults }) => {
@@ -203,7 +201,7 @@ export class HuggingFaceProvider extends BaseProvider {
             prompt: options.input.text,
             system: enhancedSystemPrompt,
             tools: formattedTools,
-            toolChoice: formattedTools ? "auto" : undefined,
+            toolChoice: formattedTools ? (options.toolChoice ?? "auto") : undefined,
         };
     }
     /**

package/dist/lib/providers/litellm.d.ts CHANGED Viewed

@@ -29,6 +29,7 @@ export declare class LiteLLMProvider extends BaseProvider {
      * Note: This is only used when tools are disabled
      */
     protected executeStream(options: StreamOptions, analysisSchema?: ZodType | Schema<unknown>): Promise<StreamResult>;
+    private createLiteLLMTransformedStream;
     /**
      * Generate an embedding for a single text input
      * Uses the LiteLLM proxy with OpenAI-compatible embedding API

package/dist/lib/providers/litellm.js CHANGED Viewed

@@ -11,6 +11,7 @@ import { logger } from "../utils/logger.js";
 import { calculateCost } from "../utils/pricing.js";
 import { getProviderModel } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { getModelId } from "./providerTypeUtils.js";
 const streamTracer = trace.getTracer("neurolink.provider.litellm");
 // Configuration helpers
@@ -59,7 +60,7 @@ export class LiteLLMProvider extends BaseProvider {
             apiKey: config.apiKey,
             fetch: createProxyFetch(),
         });
-        this.model = customOpenAI(this.modelName || getDefaultLiteLLMModel());
+        this.model = customOpenAI.chat(this.modelName || getDefaultLiteLLMModel());
         logger.debug("LiteLLM Provider initialized", {
             modelName: this.modelName,
             provider: this.providerName,
@@ -160,7 +161,7 @@ export class LiteLLMProvider extends BaseProvider {
                 ...(shouldUseTools &&
                     Object.keys(tools).length > 0 && {
                     tools,
-                    toolChoice: "auto",
+                    toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                     maxSteps: options.maxSteps || DEFAULT_MAX_STEPS,
                 }),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
@@ -186,6 +187,28 @@ export class LiteLLMProvider extends BaseProvider {
                 },
                 onStepFinish: ({ toolCalls, toolResults }) => {
                     logger.info("Tool execution completed", { toolResults, toolCalls });
+                    for (const toolCall of toolCalls) {
+                        collectedToolCalls.push({
+                            toolCallId: toolCall.toolCallId,
+                            toolName: toolCall.toolName,
+                            args: toolCall.args ??
+                                toolCall.input ??
+                                toolCall
+                                    .parameters ??
+                                {},
+                        });
+                    }
+                    for (const toolResult of toolResults) {
+                        const rawToolResult = toolResult;
+                        collectedToolResults.push({
+                            toolName: toolResult.toolName,
+                            status: rawToolResult.error ? "failure" : "success",
+                            output: (rawToolResult.output ??
+                                rawToolResult.result) ?? undefined,
+                            error: rawToolResult.error,
+                            id: rawToolResult.toolCallId ?? toolResult.toolName,
+                        });
+                    }
                     this.handleToolExecutionStorage(toolCalls, toolResults, options, new Date()).catch((error) => {
                         logger.warn("[LiteLLMProvider] Failed to store tool executions", {
                             provider: this.providerName,
@@ -219,6 +242,8 @@ export class LiteLLMProvider extends BaseProvider {
                 },
             });
             let result;
+            const collectedToolCalls = [];
+            const collectedToolResults = [];
             try {
                 result = streamText(streamOptions);
             }
@@ -269,58 +294,7 @@ export class LiteLLMProvider extends BaseProvider {
                 streamSpan.end();
             });
             timeoutController?.cleanup();
-            // Transform stream to content object stream using fullStream (handles both text and tool calls)
-            // Note: fullStream includes tool results, textStream only has text
-            const transformedStream = (async function* () {
-                try {
-                    // Try fullStream first (handles both text and tool calls), fallback to textStream
-                    const streamToUse = result.fullStream || result.textStream;
-                    for await (const chunk of streamToUse) {
-                        // Handle different chunk types from fullStream
-                        if (chunk && typeof chunk === "object") {
-                            // Check for error chunks first (critical error handling)
-                            if ("type" in chunk && chunk.type === "error") {
-                                const errorChunk = chunk;
-                                logger.error(`LiteLLM: Error chunk received:`, {
-                                    errorType: errorChunk.type,
-                                    errorDetails: errorChunk.error,
-                                });
-                                throw new Error(`LiteLLM streaming error: ${errorChunk.error?.message || "Unknown error"}`);
-                            }
-                            if ("textDelta" in chunk) {
-                                // Text delta from fullStream
-                                const textDelta = chunk.textDelta;
-                                if (textDelta) {
-                                    yield { content: textDelta };
-                                }
-                            }
-                            else if ("type" in chunk &&
-                                chunk.type === "tool-call" &&
-                                "toolCallId" in chunk) {
-                                // Tool call event - log for debugging
-                                const toolCallId = String(chunk.toolCallId);
-                                const toolName = "toolName" in chunk ? String(chunk.toolName) : "unknown";
-                                logger.debug("LiteLLM: Tool call", {
-                                    toolCallId,
-                                    toolName,
-                                });
-                            }
-                        }
-                        else if (typeof chunk === "string") {
-                            // Direct string chunk from textStream fallback
-                            yield { content: chunk };
-                        }
-                    }
-                }
-                catch (streamError) {
-                    // AI SDK v6 throws NoOutputGeneratedError when the stream produced no output.
-                    if (NoOutputGeneratedError.isInstance(streamError)) {
-                        logger.warn("LiteLLM: Stream produced no output (NoOutputGeneratedError)");
-                        return;
-                    }
-                    throw streamError;
-                }
-            })();
+            const transformedStream = this.createLiteLLMTransformedStream(result);
             // Create analytics promise that resolves after stream completion
             const analyticsPromise = streamAnalyticsCollector.createAnalytics(this.providerName, this.modelName, result, Date.now() - startTime, {
                 requestId: options.requestId ??
@@ -331,6 +305,10 @@ export class LiteLLMProvider extends BaseProvider {
                 stream: transformedStream,
                 provider: this.providerName,
                 model: this.modelName,
+                ...(shouldUseTools && {
+                    toolCalls: collectedToolCalls,
+                    toolResults: collectedToolResults,
+                }),
                 analytics: analyticsPromise,
                 metadata: {
                     startTime,
@@ -343,6 +321,47 @@ export class LiteLLMProvider extends BaseProvider {
             throw this.handleProviderError(error);
         }
     }
+    async *createLiteLLMTransformedStream(result) {
+        try {
+            const streamToUse = result.fullStream || result.textStream;
+            for await (const chunk of streamToUse) {
+                if (chunk && typeof chunk === "object") {
+                    if ("type" in chunk && chunk.type === "error") {
+                        const errorChunk = chunk;
+                        logger.error(`LiteLLM: Error chunk received:`, {
+                            errorType: errorChunk.type,
+                            errorDetails: errorChunk.error,
+                        });
+                        throw this.formatProviderError(new Error(`LiteLLM streaming error: ${errorChunk.error?.message || "Unknown error"}`));
+                    }
+                    if ("textDelta" in chunk) {
+                        const textDelta = chunk.textDelta;
+                        if (textDelta) {
+                            yield { content: textDelta };
+                        }
+                    }
+                    else if ("type" in chunk &&
+                        chunk.type === "tool-call" &&
+                        "toolCallId" in chunk) {
+                        logger.debug("LiteLLM: Tool call", {
+                            toolCallId: String(chunk.toolCallId),
+                            toolName: "toolName" in chunk ? String(chunk.toolName) : "unknown",
+                        });
+                    }
+                }
+                else if (typeof chunk === "string") {
+                    yield { content: chunk };
+                }
+            }
+        }
+        catch (streamError) {
+            if (NoOutputGeneratedError.isInstance(streamError)) {
+                logger.warn("LiteLLM: Stream produced no output (NoOutputGeneratedError)");
+                return;
+            }
+            throw streamError;
+        }
+    }
     /**
      * Generate an embedding for a single text input
      * Uses the LiteLLM proxy with OpenAI-compatible embedding API
@@ -419,7 +438,9 @@ export class LiteLLMProvider extends BaseProvider {
             });
         }
         // Fallback to hardcoded list if API fetch fails
-        const fallbackModels = process.env.LITELLM_FALLBACK_MODELS?.split(",").map((m) => m.trim()) || [
+        const fallbackModels = process.env.LITELLM_FALLBACK_MODELS?.split(",")
+            .map((m) => m.trim())
+            .filter((m) => m.length > 0) || [
             "openai/gpt-4o", // minimal safe baseline
             "anthropic/claude-3-haiku",
             "meta-llama/llama-3.1-8b-instruct",

package/dist/lib/providers/mistral.js CHANGED Viewed

@@ -7,6 +7,7 @@ import { createProxyFetch } from "../proxy/proxyFetch.js";
 import { logger } from "../utils/logger.js";
 import { createMistralConfig, getProviderModel, validateApiKey, } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { toAnalyticsStreamResult } from "./providerTypeUtils.js";
 // Configuration helpers - now using consolidated utility
 const getMistralApiKey = () => {
@@ -63,7 +64,7 @@ export class MistralProvider extends BaseProvider {
                 maxOutputTokens: options.maxTokens, // No default limit - unlimited unless specified
                 tools,
                 stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
-                toolChoice: shouldUseTools ? "auto" : "none",
+                toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                 onStepFinish: ({ toolCalls, toolResults }) => {

package/dist/lib/providers/ollama.js CHANGED Viewed

@@ -11,7 +11,7 @@ import { InvalidModelError, NetworkError, ProviderError, } from "../types/errors
 import { tracers, ATTR, withClientSpan } from "../telemetry/index.js";
 import { TimeoutError } from "../utils/timeout.js";
 // Model version constants (configurable via environment)
-const DEFAULT_OLLAMA_MODEL = "llama3.1:8b";
+const DEFAULT_OLLAMA_MODEL = process.env.OLLAMA_MODEL || "llama3.1:8b";
 const FALLBACK_OLLAMA_MODEL = "llama3.2:latest"; // Used when primary model fails
 // Configuration helpers
 const getOllamaBaseUrl = () => {
@@ -40,6 +40,26 @@ const getOllamaTimeout = () => {
     // especially for larger models like aliafshar/gemma3-it-qat-tools:latest (12.2B parameters)
     return parseInt(process.env.OLLAMA_TIMEOUT || "240000", 10);
 };
+function isOllamaHttpError(error) {
+    return (error instanceof ProviderError &&
+        typeof error.statusCode === "number" &&
+        typeof error.responseBody === "string");
+}
+async function createOllamaHttpError(response) {
+    let responseBody = "";
+    try {
+        responseBody = (await response.text()).trim();
+    }
+    catch {
+        // Ignore unreadable bodies
+    }
+    const suffix = responseBody ? ` - ${responseBody.slice(0, 500)}` : "";
+    const error = new ProviderError(`Ollama API error: ${response.status} ${response.statusText}${suffix}`, "ollama");
+    error.statusCode = response.status;
+    error.statusText = response.statusText;
+    error.responseBody = responseBody;
+    return error;
+}
 // Create proxy-aware fetch instance
 const proxyFetch = createProxyFetch();
 // Custom LanguageModel implementation for Ollama
@@ -110,21 +130,37 @@ class OllamaLanguageModel {
                 signal: createAbortSignalWithTimeout(this.timeout),
             });
             if (!response.ok) {
-                throw new Error(`Ollama API error: ${response.status} ${response.statusText}`);
+                throw await createOllamaHttpError(response);
             }
             const data = await response.json();
             logger.debug("[OllamaLanguageModel] OpenAI API Response:", JSON.stringify(data, null, 2));
             const text = data.choices?.[0]?.message?.content || "";
             const usage = data.usage || {};
+            const promptTokens = usage.prompt_tokens ??
+                this.estimateTokenCount(JSON.stringify(messages));
+            const completionTokens = usage.completion_tokens ?? this.estimateTokenCount(text);
             return {
+                content: text ? [{ type: "text", text }] : [],
                 text,
                 usage: {
-                    promptTokens: usage.prompt_tokens ??
-                        this.estimateTokenCount(JSON.stringify(messages)),
-                    completionTokens: usage.completion_tokens ?? this.estimateTokenCount(text),
-                    totalTokens: usage.total_tokens,
+                    inputTokens: promptTokens,
+                    outputTokens: completionTokens,
+                    promptTokens,
+                    completionTokens,
+                    totalTokens: usage.total_tokens ?? promptTokens + completionTokens,
+                },
+                finishReason: data.choices?.[0]?.finish_reason ?? "stop",
+                warnings: [],
+                request: {
+                    body: JSON.stringify(requestBody),
+                },
+                response: {
+                    id: data.id,
+                    modelId: data.model,
+                    timestamp: new Date(),
+                    headers: {},
+                    body: data,
                 },
-                finishReason: "stop",
                 rawCall: {
                     rawPrompt: messages,
                     rawSettings: {
@@ -158,21 +194,45 @@ class OllamaLanguageModel {
                 signal: createAbortSignalWithTimeout(this.timeout),
             });
             if (!response.ok) {
-                throw new Error(`Ollama API error: ${response.status} ${response.statusText}`);
+                throw await createOllamaHttpError(response);
             }
             const data = await response.json();
             logger.debug("[OllamaLanguageModel] Native API Response:", JSON.stringify(data, null, 2));
+            const text = String(data.response ?? "");
+            const promptTokens = data.prompt_eval_count ?? this.estimateTokenCount(prompt);
+            const completionTokens = data.eval_count ?? this.estimateTokenCount(text);
+            const requestBody = {
+                model: this.modelId,
+                prompt,
+                stream: false,
+                system: messages.find((m) => m.role === "system")?.content,
+                options: {
+                    temperature: options.temperature,
+                    num_predict: options.maxTokens,
+                },
+            };
             return {
-                text: data.response,
+                content: text ? [{ type: "text", text }] : [],
+                text,
                 usage: {
-                    promptTokens: data.prompt_eval_count ?? this.estimateTokenCount(prompt),
-                    completionTokens: data.eval_count ??
-                        this.estimateTokenCount(String(data.response ?? "")),
-                    totalTokens: (data.prompt_eval_count ?? this.estimateTokenCount(prompt)) +
-                        (data.eval_count ??
-                            this.estimateTokenCount(String(data.response ?? ""))),
+                    inputTokens: promptTokens,
+                    outputTokens: completionTokens,
+                    promptTokens,
+                    completionTokens,
+                    totalTokens: promptTokens + completionTokens,
+                },
+                finishReason: data.done_reason ?? "stop",
+                warnings: [],
+                request: {
+                    body: JSON.stringify(requestBody),
+                },
+                response: {
+                    id: data.created_at,
+                    modelId: this.modelId,
+                    timestamp: data.created_at ? new Date(data.created_at) : new Date(),
+                    headers: {},
+                    body: data,
                 },
-                finishReason: "stop",
                 rawCall: {
                     rawPrompt: prompt,
                     rawSettings: {
@@ -220,7 +280,7 @@ class OllamaLanguageModel {
                 ok: response.ok,
             });
             if (!response.ok) {
-                throw new Error(`Ollama API error: ${response.status} ${response.statusText}`);
+                throw await createOllamaHttpError(response);
             }
             const self = this;
             return {
@@ -282,7 +342,7 @@ class OllamaLanguageModel {
                 ok: response.ok,
             });
             if (!response.ok) {
-                throw new Error(`Ollama API error: ${response.status} ${response.statusText}`);
+                throw await createOllamaHttpError(response);
             }
             const self = this;
             return {
@@ -705,7 +765,7 @@ export class OllamaProvider extends BaseProvider {
                                 signal: createAbortSignalWithTimeout(this.timeout),
                             });
                             if (!response.ok) {
-                                throw this.handleProviderError(new Error(`Ollama API error: ${response.status} ${response.statusText}`));
+                                throw this.handleProviderError(await createOllamaHttpError(response));
                             }
                             // Process response stream
                             const { content, toolCalls, finishReason } = await this.processOllamaResponse(response, controller);
@@ -870,7 +930,7 @@ export class OllamaProvider extends BaseProvider {
                     ok: response.ok,
                 });
                 if (!response.ok) {
-                    throw this.handleProviderError(new Error(`Ollama API error: ${response.status} ${response.statusText}`));
+                    throw this.handleProviderError(await createOllamaHttpError(response));
                 }
                 // Transform to async generator for OpenAI-compatible format
                 const self = this;
@@ -936,7 +996,7 @@ export class OllamaProvider extends BaseProvider {
                     ok: response.ok,
                 });
                 if (!response.ok) {
-                    throw this.handleProviderError(new Error(`Ollama API error: ${response.status} ${response.statusText}`));
+                    throw this.handleProviderError(await createOllamaHttpError(response));
                 }
                 // Transform to async generator to match other providers
                 const self = this;
@@ -1486,8 +1546,18 @@ export class OllamaProvider extends BaseProvider {
             error.message?.includes("not found")) {
             return new InvalidModelError(`❌ Ollama Model Not Found\n\nModel '${this.modelName}' is not available locally.\n\n🔧 Install Model:\n1. Run: ollama pull ${this.modelName}\n2. Or try a different model:\n   - ollama pull ${FALLBACK_OLLAMA_MODEL}\n   - ollama pull mistral:latest\n   - ollama pull codellama:latest\n\n🔧 List Available Models:\nollama list`, this.providerName);
         }
-        if (error.message?.includes("404")) {
-            return new NetworkError(`❌ Ollama API Endpoint Not Found\n\nThe API endpoint might have changed or Ollama version is incompatible.\n\n🔧 Check:\n1. Ollama version: 'ollama --version'\n2. Update Ollama to latest version\n3. Verify API is available: 'curl ${this.baseUrl}/api/version'`, this.providerName);
+        const errMsg = error.message ?? "";
+        const httpStatus = isOllamaHttpError(error) ? error.statusCode : undefined;
+        const responseBody = isOllamaHttpError(error) ? error.responseBody : "";
+        if (httpStatus === 404 &&
+            (responseBody.toLowerCase().includes("model") ||
+                responseBody.toLowerCase().includes("not found") ||
+                errMsg.toLowerCase().includes("model") ||
+                errMsg.toLowerCase().includes("not found"))) {
+            return new InvalidModelError(`❌ Ollama Returned HTTP 404\n\nThis usually means the configured model '${this.modelName}' is not installed locally, although a bad base URL or incompatible API mode can also cause it.\n\n🔧 Check:\n1. Verify the model exists: 'ollama list'\n2. Pull it if missing: 'ollama pull ${this.modelName}'\n3. Verify the service is healthy: 'curl ${this.baseUrl}/api/version'\n4. If you use OpenAI-compatible mode, confirm the base URL serves /v1/chat/completions`, this.providerName);
+        }
+        if (httpStatus === 404) {
+            return new ProviderError(`❌ Ollama Endpoint Returned HTTP 404\n\nThe configured base URL (${this.baseUrl}) did not serve the expected Ollama endpoint for model '${this.modelName}'. This is usually a configuration or API-mode mismatch rather than a missing model.\n\n🔧 Check:\n1. Verify the base URL: ${this.baseUrl}\n2. For native Ollama mode, confirm /api/generate exists\n3. For OpenAI-compatible mode, confirm /v1/chat/completions exists\n4. If the model is missing, the response body should explicitly say so`, this.providerName);
         }
         return new ProviderError(`❌ Ollama Provider Error\n\n${error.message || "Unknown error occurred"}\n\n🔧 Troubleshooting:\n1. Check if Ollama service is running\n2. Verify model is installed: 'ollama list'\n3. Check network connectivity to ${this.baseUrl}\n4. Review Ollama logs for details`, this.providerName);
     }

package/dist/lib/providers/openAI.d.ts CHANGED Viewed

@@ -52,6 +52,8 @@ export declare class OpenAIProvider extends BaseProvider {
      * and the migration guide in the project repository.
      */
     protected executeStream(options: StreamOptions, _analysisSchema?: ValidationSchema): Promise<StreamResult>;
+    private createOpenAITransformedStream;
+    private extractOpenAIChunkContent;
     /**
      * Generate embeddings for text using OpenAI text-embedding models
      * @param text - The text to embed