npm - @juspay/neurolink - Versions diffs - 9.41.0 → 9.42.0 - Mend

@juspay/neurolink 9.41.0 → 9.42.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

package/CHANGELOG.md +6 -0
package/README.md +7 -1
package/dist/auth/anthropicOAuth.d.ts +18 -3
package/dist/auth/anthropicOAuth.js +137 -4
package/dist/auth/providers/firebase.js +5 -1
package/dist/auth/providers/jwt.js +5 -1
package/dist/auth/providers/workos.js +5 -1
package/dist/auth/sessionManager.d.ts +1 -1
package/dist/auth/sessionManager.js +58 -27
package/dist/browser/neurolink.min.js +337 -318
package/dist/cli/commands/mcp.js +3 -0
package/dist/cli/commands/proxy.d.ts +2 -1
package/dist/cli/commands/proxy.js +279 -16
package/dist/cli/commands/task.js +3 -0
package/dist/cli/factories/commandFactory.d.ts +2 -0
package/dist/cli/factories/commandFactory.js +38 -0
package/dist/cli/parser.js +4 -3
package/dist/client/aiSdkAdapter.js +3 -0
package/dist/client/streamingClient.js +30 -10
package/dist/core/modules/GenerationHandler.js +3 -2
package/dist/core/redisConversationMemoryManager.js +7 -3
package/dist/evaluation/BatchEvaluator.js +4 -1
package/dist/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/evaluation/pipeline/evaluationPipeline.js +20 -8
package/dist/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/lib/auth/anthropicOAuth.d.ts +18 -3
package/dist/lib/auth/anthropicOAuth.js +137 -4
package/dist/lib/auth/providers/firebase.js +5 -1
package/dist/lib/auth/providers/jwt.js +5 -1
package/dist/lib/auth/providers/workos.js +5 -1
package/dist/lib/auth/sessionManager.d.ts +1 -1
package/dist/lib/auth/sessionManager.js +58 -27
package/dist/lib/client/aiSdkAdapter.js +3 -0
package/dist/lib/client/streamingClient.js +30 -10
package/dist/lib/core/modules/GenerationHandler.js +3 -2
package/dist/lib/core/redisConversationMemoryManager.js +7 -3
package/dist/lib/evaluation/BatchEvaluator.js +4 -1
package/dist/lib/evaluation/hooks/observabilityHooks.js +5 -3
package/dist/lib/evaluation/pipeline/evaluationPipeline.d.ts +3 -2
package/dist/lib/evaluation/pipeline/evaluationPipeline.js +20 -8
package/dist/lib/evaluation/pipeline/strategies/batchStrategy.js +6 -3
package/dist/lib/evaluation/pipeline/strategies/samplingStrategy.js +18 -10
package/dist/lib/neurolink.d.ts +3 -2
package/dist/lib/neurolink.js +260 -494
package/dist/lib/observability/otelBridge.d.ts +2 -2
package/dist/lib/observability/otelBridge.js +12 -3
package/dist/lib/providers/amazonBedrock.js +2 -4
package/dist/lib/providers/anthropic.d.ts +9 -5
package/dist/lib/providers/anthropic.js +19 -14
package/dist/lib/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/lib/providers/anthropicBaseProvider.js +5 -4
package/dist/lib/providers/azureOpenai.d.ts +1 -1
package/dist/lib/providers/azureOpenai.js +5 -4
package/dist/lib/providers/googleAiStudio.js +30 -1
package/dist/lib/providers/googleVertex.js +28 -6
package/dist/lib/providers/huggingFace.d.ts +3 -3
package/dist/lib/providers/huggingFace.js +6 -8
package/dist/lib/providers/litellm.js +41 -29
package/dist/lib/providers/mistral.js +2 -1
package/dist/lib/providers/ollama.js +80 -23
package/dist/lib/providers/openAI.js +3 -2
package/dist/lib/providers/openRouter.js +2 -1
package/dist/lib/providers/openaiCompatible.d.ts +4 -4
package/dist/lib/providers/openaiCompatible.js +4 -4
package/dist/lib/proxy/claudeFormat.d.ts +3 -2
package/dist/lib/proxy/claudeFormat.js +25 -20
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/lib/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/lib/proxy/modelRouter.js +3 -0
package/dist/lib/proxy/oauthFetch.d.ts +1 -1
package/dist/lib/proxy/oauthFetch.js +65 -72
package/dist/lib/proxy/proxyConfig.js +44 -24
package/dist/lib/proxy/proxyEnv.d.ts +19 -0
package/dist/lib/proxy/proxyEnv.js +73 -0
package/dist/lib/proxy/proxyFetch.js +50 -4
package/dist/lib/proxy/proxyTracer.d.ts +133 -0
package/dist/lib/proxy/proxyTracer.js +645 -0
package/dist/lib/proxy/rawStreamCapture.d.ts +10 -0
package/dist/lib/proxy/rawStreamCapture.js +83 -0
package/dist/lib/proxy/requestLogger.d.ts +32 -5
package/dist/lib/proxy/requestLogger.js +406 -37
package/dist/lib/proxy/sseInterceptor.d.ts +97 -0
package/dist/lib/proxy/sseInterceptor.js +402 -0
package/dist/lib/proxy/usageStats.d.ts +4 -3
package/dist/lib/proxy/usageStats.js +25 -12
package/dist/lib/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/lib/rag/chunking/markdownChunker.js +15 -6
package/dist/lib/server/routes/claudeProxyRoutes.d.ts +7 -2
package/dist/lib/server/routes/claudeProxyRoutes.js +1737 -508
package/dist/lib/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/lib/services/server/ai/observability/instrumentation.js +240 -40
package/dist/lib/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/lib/tasks/backends/bullmqBackend.js +14 -7
package/dist/lib/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/lib/tasks/store/redisTaskStore.js +34 -26
package/dist/lib/tasks/taskManager.d.ts +3 -0
package/dist/lib/tasks/taskManager.js +63 -30
package/dist/lib/telemetry/index.d.ts +2 -1
package/dist/lib/telemetry/index.js +2 -1
package/dist/lib/telemetry/telemetryService.d.ts +3 -0
package/dist/lib/telemetry/telemetryService.js +65 -5
package/dist/lib/types/cli.d.ts +10 -0
package/dist/lib/types/proxyTypes.d.ts +37 -5
package/dist/lib/types/streamTypes.d.ts +25 -3
package/dist/lib/utils/messageBuilder.js +3 -2
package/dist/lib/utils/providerHealth.d.ts +18 -0
package/dist/lib/utils/providerHealth.js +240 -9
package/dist/lib/utils/providerUtils.js +14 -8
package/dist/lib/utils/toolChoice.d.ts +4 -0
package/dist/lib/utils/toolChoice.js +7 -0
package/dist/neurolink.d.ts +3 -2
package/dist/neurolink.js +260 -494
package/dist/observability/otelBridge.d.ts +2 -2
package/dist/observability/otelBridge.js +12 -3
package/dist/providers/amazonBedrock.js +2 -4
package/dist/providers/anthropic.d.ts +9 -5
package/dist/providers/anthropic.js +19 -14
package/dist/providers/anthropicBaseProvider.d.ts +3 -3
package/dist/providers/anthropicBaseProvider.js +5 -4
package/dist/providers/azureOpenai.d.ts +1 -1
package/dist/providers/azureOpenai.js +5 -4
package/dist/providers/googleAiStudio.js +30 -1
package/dist/providers/googleVertex.js +28 -6
package/dist/providers/huggingFace.d.ts +3 -3
package/dist/providers/huggingFace.js +6 -7
package/dist/providers/litellm.js +41 -29
package/dist/providers/mistral.js +2 -1
package/dist/providers/ollama.js +80 -23
package/dist/providers/openAI.js +3 -2
package/dist/providers/openRouter.js +2 -1
package/dist/providers/openaiCompatible.d.ts +4 -4
package/dist/providers/openaiCompatible.js +4 -3
package/dist/proxy/claudeFormat.d.ts +3 -2
package/dist/proxy/claudeFormat.js +25 -20
package/dist/proxy/cloaking/plugins/sessionIdentity.d.ts +2 -6
package/dist/proxy/cloaking/plugins/sessionIdentity.js +9 -33
package/dist/proxy/modelRouter.js +3 -0
package/dist/proxy/oauthFetch.d.ts +1 -1
package/dist/proxy/oauthFetch.js +65 -72
package/dist/proxy/proxyConfig.js +44 -24
package/dist/proxy/proxyEnv.d.ts +19 -0
package/dist/proxy/proxyEnv.js +72 -0
package/dist/proxy/proxyFetch.js +50 -4
package/dist/proxy/proxyTracer.d.ts +133 -0
package/dist/proxy/proxyTracer.js +644 -0
package/dist/proxy/rawStreamCapture.d.ts +10 -0
package/dist/proxy/rawStreamCapture.js +82 -0
package/dist/proxy/requestLogger.d.ts +32 -5
package/dist/proxy/requestLogger.js +406 -37
package/dist/proxy/sseInterceptor.d.ts +97 -0
package/dist/proxy/sseInterceptor.js +401 -0
package/dist/proxy/usageStats.d.ts +4 -3
package/dist/proxy/usageStats.js +25 -12
package/dist/rag/chunkers/MarkdownChunker.js +13 -5
package/dist/rag/chunking/markdownChunker.js +15 -6
package/dist/server/routes/claudeProxyRoutes.d.ts +7 -2
package/dist/server/routes/claudeProxyRoutes.js +1737 -508
package/dist/services/server/ai/observability/instrumentation.d.ts +7 -1
package/dist/services/server/ai/observability/instrumentation.js +240 -40
package/dist/tasks/backends/bullmqBackend.d.ts +1 -0
package/dist/tasks/backends/bullmqBackend.js +14 -7
package/dist/tasks/store/redisTaskStore.d.ts +1 -0
package/dist/tasks/store/redisTaskStore.js +34 -26
package/dist/tasks/taskManager.d.ts +3 -0
package/dist/tasks/taskManager.js +63 -30
package/dist/telemetry/index.d.ts +2 -1
package/dist/telemetry/index.js +2 -1
package/dist/telemetry/telemetryService.d.ts +3 -0
package/dist/telemetry/telemetryService.js +65 -5
package/dist/types/cli.d.ts +10 -0
package/dist/types/proxyTypes.d.ts +37 -5
package/dist/types/streamTypes.d.ts +25 -3
package/dist/utils/messageBuilder.js +3 -2
package/dist/utils/providerHealth.d.ts +18 -0
package/dist/utils/providerHealth.js +240 -9
package/dist/utils/providerUtils.js +14 -8
package/dist/utils/toolChoice.d.ts +4 -0
package/dist/utils/toolChoice.js +6 -0
package/docs/assets/dashboards/neurolink-proxy-observability-dashboard.json +6609 -0
package/docs/changelog.md +252 -0
package/package.json +17 -1
package/scripts/observability/check-proxy-telemetry.mjs +235 -0
package/scripts/observability/docker-compose.proxy-observability.yaml +55 -0
package/scripts/observability/import-openobserve-dashboard.mjs +240 -0
package/scripts/observability/manage-local-openobserve.sh +184 -0
package/scripts/observability/otel-collector.proxy-observability.yaml +78 -0
package/scripts/observability/proxy-observability.env.example +23 -0

package/dist/lib/observability/otelBridge.d.ts CHANGED Viewed

@@ -2,7 +2,7 @@
  * OpenTelemetry Bridge
  * Bidirectional context propagation between NeuroLink and OpenTelemetry
  */
-import { type SpanContext } from "@opentelemetry/api";
+import { type Context, type SpanContext } from "@opentelemetry/api";
 import type { SpanData } from "./types/spanTypes.js";
 import { type SpanType } from "./types/spanTypes.js";
 /**
@@ -18,7 +18,7 @@ export declare class OtelBridge {
     /**
      * Inject trace context into outgoing request headers
      */
-    injectContext(headers: Record<string, string>): Record<string, string>;
+    injectContext(headers: Record<string, string>, otelContext?: Context): Record<string, string>;
     /**
      * Create a NeuroLink span from OpenTelemetry context
      */

package/dist/lib/observability/otelBridge.js CHANGED Viewed

@@ -15,15 +15,24 @@ export class OtelBridge {
      * Extract trace context from incoming request headers
      */
     extractContext(headers) {
-        const extractedContext = propagation.extract(context.active(), headers);
+        // Normalize traceparent: OTel HTTP auto-instrumentation may inject a second traceparent
+        // on top of the SDK's manually injected one, producing "val1, val2". The W3C spec rejects
+        // multiple values, causing extraction to silently return null. Take the first value only.
+        const normalizedHeaders = { ...headers };
+        if (typeof normalizedHeaders["traceparent"] === "string" &&
+            normalizedHeaders["traceparent"].includes(", ")) {
+            normalizedHeaders["traceparent"] =
+                normalizedHeaders["traceparent"].split(", ")[0];
+        }
+        const extractedContext = propagation.extract(context.active(), normalizedHeaders);
         const spanContext = trace.getSpanContext(extractedContext);
         return spanContext ?? null;
     }
     /**
      * Inject trace context into outgoing request headers
      */
-    injectContext(headers) {
-        propagation.inject(context.active(), headers);
+    injectContext(headers, otelContext = context.active()) {
+        propagation.inject(otelContext, headers);
         return headers;
     }
     /**

package/dist/lib/providers/amazonBedrock.js CHANGED Viewed

@@ -1002,8 +1002,7 @@ export class AmazonBedrockProvider extends BaseProvider {
                             });
                             if (firstStopReason === "tool_use") {
                                 const toolNames = firstMessageContent
-                                    .filter((b) => b.toolUse?.name)
-                                    .map((b) => b.toolUse.name)
+                                    .flatMap((b) => (b.toolUse?.name ? [b.toolUse.name] : []))
                                     .join(", ");
                                 streamSpan.addEvent("stream.tool_use", {
                                     iteration: 0,
@@ -1029,8 +1028,7 @@ export class AmazonBedrockProvider extends BaseProvider {
                             });
                             if (stopReason === "tool_use") {
                                 const toolNames = assistantMessage.content
-                                    .filter((b) => b.toolUse?.name)
-                                    .map((b) => b.toolUse.name)
+                                    .flatMap((b) => (b.toolUse?.name ? [b.toolUse.name] : []))
                                     .join(", ");
                                 streamSpan.addEvent("stream.tool_use", {
                                     iteration,

package/dist/lib/providers/anthropic.d.ts CHANGED Viewed

@@ -1,17 +1,21 @@
 import { type LanguageModel } from "ai";
 import { type AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import type { TextGenerationOptions, EnhancedGenerateResult } from "../types/generateTypes.js";
+import type { EnhancedGenerateResult, TextGenerationOptions } from "../types/generateTypes.js";
+import type { AnthropicProviderConfig } from "../types/providers.js";
 import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
+import type { AnthropicAuthMethod, AnthropicResponseMetadata, ClaudeSubscriptionTier, ClaudeUsageInfo } from "../types/subscriptionTypes.js";
 import type { ValidationSchema } from "../types/typeAliases.js";
-import type { ClaudeSubscriptionTier, AnthropicAuthMethod, AnthropicResponseMetadata, ClaudeUsageInfo } from "../types/subscriptionTypes.js";
-import type { AnthropicProviderConfig } from "../types/providers.js";
 /**
  * Beta headers for Claude Code integration.
  * These enable experimental features:
  * - claude-code-20250219: Claude Code specific features
- * - interleaved-thinking-2025-05-14: Interleaved thinking mode
  * - fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming
+ *
+ * Note: interleaved-thinking-2025-05-14 was removed — it was claude-3-7-sonnet
+ * specific and causes invalid_request_error (HTTP 400) on claude-4 models
+ * (claude-opus-4-6, claude-sonnet-4-6) which handle thinking via the
+ * `thinking` request body parameter instead.
  */
 declare const ANTHROPIC_BETA_HEADERS: {
     "anthropic-beta": string;
@@ -140,6 +144,6 @@ export declare class AnthropicProvider extends BaseProvider {
     isAvailable(): Promise<boolean>;
     getModel(): LanguageModel;
 }
-export { ModelAccessError, isModelAvailableForTier, getRecommendedModelForTier, getModelCapabilities, } from "../models/anthropicModels.js";
+export { getModelCapabilities, getRecommendedModelForTier, isModelAvailableForTier, ModelAccessError, } from "../models/anthropicModels.js";
 export { ANTHROPIC_BETA_HEADERS };
 export default AnthropicProvider;

package/dist/lib/providers/anthropic.js CHANGED Viewed

@@ -1,34 +1,37 @@
 import { createAnthropic } from "@ai-sdk/anthropic";
+import { SpanKind, SpanStatusCode, trace } from "@opentelemetry/api";
 import { stepCountIs, streamText } from "ai";
-import { trace, SpanKind, SpanStatusCode } from "@opentelemetry/api";
-import { AnthropicModels } from "../constants/enums.js";
+import { existsSync, mkdirSync, readFileSync, renameSync, writeFileSync, } from "fs";
+import { homedir } from "os";
+import { join } from "path";
+import { ANTHROPIC_TOKEN_URL, CLAUDE_CLI_USER_AGENT, CLAUDE_CODE_CLIENT_ID, } from "../auth/anthropicOAuth.js";
+import { AnthropicModels, TOKEN_EXPIRY_BUFFER_MS, } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
 import { DEFAULT_MAX_STEPS } from "../core/constants.js";
+import { getModelCapabilities, getRecommendedModelForTier, isModelAvailableForTier, } from "../models/anthropicModels.js";
+import { createOAuthFetch } from "../proxy/oauthFetch.js";
 import { createProxyFetch } from "../proxy/proxyFetch.js";
 import { AuthenticationError, NetworkError, ProviderError, RateLimitError, } from "../types/errors.js";
 import { logger } from "../utils/logger.js";
 import { calculateCost } from "../utils/pricing.js";
 import { createAnthropicConfig, getProviderModel, validateApiKey, } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
-import { isModelAvailableForTier, getRecommendedModelForTier, getModelCapabilities, } from "../models/anthropicModels.js";
-import { CLAUDE_CLI_USER_AGENT, CLAUDE_CODE_CLIENT_ID, ANTHROPIC_TOKEN_URL, } from "../auth/anthropicOAuth.js";
-import { createOAuthFetch } from "../proxy/oauthFetch.js";
-import { homedir } from "os";
-import { readFileSync, existsSync, writeFileSync, mkdirSync, renameSync, } from "fs";
-import { join } from "path";
-import { TOKEN_EXPIRY_BUFFER_MS } from "../constants/enums.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { getModelId } from "./providerTypeUtils.js";
 /**
  * Beta headers for Claude Code integration.
  * These enable experimental features:
  * - claude-code-20250219: Claude Code specific features
- * - interleaved-thinking-2025-05-14: Interleaved thinking mode
  * - fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming
+ *
+ * Note: interleaved-thinking-2025-05-14 was removed — it was claude-3-7-sonnet
+ * specific and causes invalid_request_error (HTTP 400) on claude-4 models
+ * (claude-opus-4-6, claude-sonnet-4-6) which handle thinking via the
+ * `thinking` request body parameter instead.
  */
 const ANTHROPIC_BETA_HEADERS = {
     "anthropic-beta": [
         "claude-code-20250219",
-        "interleaved-thinking-2025-05-14",
         "fine-grained-tool-streaming-2025-05-14",
     ].join(","),
 };
@@ -155,7 +158,9 @@ const detectAuthMethod = (oauthToken) => {
         logger.warn("[detectAuthMethod] ANTHROPIC_AUTH_METHOD=oauth but no OAuth token found; falling through to auto-detection");
     }
     else if (explicit) {
-        logger.warn("[detectAuthMethod] Unrecognized ANTHROPIC_AUTH_METHOD value; falling through to auto-detection", { value: explicit });
+        logger.warn("[detectAuthMethod] Unrecognized ANTHROPIC_AUTH_METHOD value; falling through to auto-detection", {
+            value: explicit,
+        });
     }
     // Auto-detect: OAuth takes precedence if available
     const method = oauthToken ? "oauth" : "api_key";
@@ -762,7 +767,7 @@ export class AnthropicProvider extends BaseProvider {
                     maxRetries: 0, // NL11: Disable AI SDK's invisible internal retries; we handle retries with OTel instrumentation
                     tools,
                     stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
-                    toolChoice: shouldUseTools ? "auto" : "none",
+                    toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                     abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                     experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                     onStepFinish: ({ toolCalls, toolResults }) => {
@@ -857,7 +862,7 @@ export class AnthropicProvider extends BaseProvider {
     }
 }
 // Re-export types and utilities for convenience
-export { ModelAccessError, isModelAvailableForTier, getRecommendedModelForTier, getModelCapabilities, } from "../models/anthropicModels.js";
+export { getModelCapabilities, getRecommendedModelForTier, isModelAvailableForTier, ModelAccessError, } from "../models/anthropicModels.js";
 // Export beta headers constant for external use
 export { ANTHROPIC_BETA_HEADERS };
 export default AnthropicProvider;

package/dist/lib/providers/anthropicBaseProvider.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import type { ZodType } from "zod";
 import { type LanguageModel, type Schema } from "ai";
-import { AIProviderName } from "../constants/enums.js";
-import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
+import type { ZodType } from "zod";
+import { type AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
+import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
 /**
  * Anthropic provider implementation using BaseProvider pattern
  * Migrated from direct API calls to Vercel AI SDK (@ai-sdk/anthropic)

package/dist/lib/providers/anthropicBaseProvider.js CHANGED Viewed

@@ -1,13 +1,14 @@
 import { createAnthropic } from "@ai-sdk/anthropic";
+import { SpanKind, SpanStatusCode, trace } from "@opentelemetry/api";
 import { NoOutputGeneratedError, streamText, } from "ai";
-import { trace, SpanKind, SpanStatusCode } from "@opentelemetry/api";
-import { AIProviderName, AnthropicModels } from "../constants/enums.js";
+import { AnthropicModels } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
 import { AuthenticationError, NetworkError, ProviderError, RateLimitError, } from "../types/errors.js";
 import { logger } from "../utils/logger.js";
 import { calculateCost } from "../utils/pricing.js";
+import { createAnthropicBaseConfig, validateApiKey, } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
-import { validateApiKey, createAnthropicBaseConfig, } from "../utils/providerConfig.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { getModelId } from "./providerTypeUtils.js";
 const streamTracer = trace.getTracer("neurolink.provider.anthropic");
 /**
@@ -90,7 +91,7 @@ export class AnthropicProviderV2 extends BaseProvider {
                     maxOutputTokens: options.maxTokens, // No default limit - unlimited unless specified
                     maxRetries: 0, // NL11: Disable AI SDK's invisible internal retries; we handle retries with OTel instrumentation
                     tools,
-                    toolChoice: shouldUseTools ? "auto" : "none",
+                    toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                     abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                     experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                     onStepFinish: ({ toolCalls, toolResults }) => {

package/dist/lib/providers/azureOpenai.d.ts CHANGED Viewed

@@ -1,6 +1,6 @@
 import { type LanguageModel } from "ai";
+import { type AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import { AIProviderName } from "../constants/enums.js";
 import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
 export declare class AzureOpenAIProvider extends BaseProvider {
     private apiKey;

package/dist/lib/providers/azureOpenai.js CHANGED Viewed

@@ -1,12 +1,13 @@
 import { createAzure } from "@ai-sdk/azure";
 import { stepCountIs, streamText } from "ai";
+import { APIVersions } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import { AIProviderName, APIVersions } from "../constants/enums.js";
-import { validateApiKey, createAzureAPIKeyConfig, createAzureEndpointConfig, } from "../utils/providerConfig.js";
 import { DEFAULT_MAX_STEPS } from "../core/constants.js";
-import { logger } from "../utils/logger.js";
 import { createProxyFetch } from "../proxy/proxyFetch.js";
+import { logger } from "../utils/logger.js";
+import { createAzureAPIKeyConfig, createAzureEndpointConfig, validateApiKey, } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 export class AzureOpenAIProvider extends BaseProvider {
     apiKey;
     resourceName;
@@ -108,7 +109,7 @@ export class AzureOpenAIProvider extends BaseProvider {
                     ? { temperature: options.temperature }
                     : {}),
                 tools,
-                toolChoice: shouldUseTools ? "auto" : "none",
+                toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                 stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),

package/dist/lib/providers/googleAiStudio.js CHANGED Viewed

@@ -11,6 +11,7 @@ import { logger } from "../utils/logger.js";
 import { isGemini3Model } from "../utils/modelDetection.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { estimateTokens } from "../utils/tokenEstimation.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { buildNativeConfig, buildNativeToolDeclarations, collectStreamChunks, collectStreamChunksIncremental, computeMaxSteps, createTextChannel, executeNativeToolCalls, extractTextFromParts, handleMaxStepsTermination, pushModelResponseToHistory, sanitizeToolsForGemini, } from "./googleNativeGemini3.js";
 import { toAnalyticsStreamResult } from "./providerTypeUtils.js";
 // Google AI Live API types now imported from ../types/providerSpecific.js
@@ -473,6 +474,8 @@ export class GoogleAIStudioProvider extends BaseProvider {
             // Build message array from options with multimodal support
             // Using protected helper from BaseProvider to eliminate code duplication
             const messages = await this.buildMessagesForStream(options);
+            const collectedToolCalls = [];
+            const collectedToolResults = [];
             const result = await streamText({
                 model,
                 messages: messages,
@@ -480,7 +483,7 @@ export class GoogleAIStudioProvider extends BaseProvider {
                 maxOutputTokens: options.maxTokens, // No default limit - unlimited unless specified
                 tools,
                 stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
-                toolChoice: shouldUseTools ? "auto" : "none",
+                toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                 // Gemini 3: use thinkingLevel via providerOptions
@@ -502,6 +505,28 @@ export class GoogleAIStudioProvider extends BaseProvider {
                     },
                 }),
                 onStepFinish: ({ toolCalls, toolResults }) => {
+                    for (const toolCall of toolCalls) {
+                        collectedToolCalls.push({
+                            toolCallId: toolCall.toolCallId,
+                            toolName: toolCall.toolName,
+                            args: toolCall.args ??
+                                toolCall.input ??
+                                toolCall
+                                    .parameters ??
+                                {},
+                        });
+                    }
+                    for (const toolResult of toolResults) {
+                        const rawToolResult = toolResult;
+                        collectedToolResults.push({
+                            toolName: toolResult.toolName,
+                            status: rawToolResult.error ? "failure" : "success",
+                            output: (rawToolResult.output ??
+                                rawToolResult.result) ?? undefined,
+                            error: rawToolResult.error,
+                            id: rawToolResult.toolCallId ?? toolResult.toolName,
+                        });
+                    }
                     this.handleToolExecutionStorage(toolCalls, toolResults, options, new Date()).catch((error) => {
                         logger.warn("[GoogleAiStudioProvider] Failed to store tool executions", {
                             provider: this.providerName,
@@ -530,6 +555,10 @@ export class GoogleAIStudioProvider extends BaseProvider {
                 stream: transformedStream,
                 provider: this.providerName,
                 model: this.modelName,
+                ...(shouldUseTools && {
+                    toolCalls: collectedToolCalls,
+                    toolResults: collectedToolResults,
+                }),
                 analytics: analyticsPromise,
                 metadata: {
                     startTime,

package/dist/lib/providers/googleVertex.js CHANGED Viewed

@@ -22,6 +22,7 @@ import { createGoogleAuthConfig, createVertexProjectConfig, validateApiKey, } fr
 import { convertZodToJsonSchema, inlineJsonSchema, } from "../utils/schemaConversion.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { estimateTokens } from "../utils/tokenEstimation.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { buildNativeConfig, buildNativeToolDeclarations, collectStreamChunks, collectStreamChunksIncremental, computeMaxSteps as computeMaxStepsShared, createTextChannel, executeNativeToolCalls, extractTextFromParts, handleMaxStepsTermination, pushModelResponseToHistory, sanitizeToolsForGemini, } from "./googleNativeGemini3.js";
 import { getModelId } from "./providerTypeUtils.js";
 // Import proper types for multimodal message handling
@@ -856,6 +857,8 @@ export class GoogleVertexProvider extends BaseProvider {
             const maxTokens = shouldSetMaxTokens
                 ? options.maxTokens // No default limit
                 : undefined;
+            const collectedToolCalls = [];
+            const collectedToolResults = [];
             // Build complete stream options with proper typing
             let streamOptions = {
                 model: model,
@@ -867,7 +870,7 @@ export class GoogleVertexProvider extends BaseProvider {
                     tools &&
                     Object.keys(tools).length > 0 && {
                     tools,
-                    toolChoice: "auto",
+                    toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                     stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
                 }),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
@@ -911,6 +914,28 @@ export class GoogleVertexProvider extends BaseProvider {
                 },
                 onStepFinish: ({ toolCalls, toolResults }) => {
                     logger.info("Tool execution completed", { toolResults, toolCalls });
+                    for (const toolCall of toolCalls) {
+                        collectedToolCalls.push({
+                            toolCallId: toolCall.toolCallId,
+                            toolName: toolCall.toolName,
+                            args: toolCall.args ??
+                                toolCall.input ??
+                                toolCall
+                                    .parameters ??
+                                {},
+                        });
+                    }
+                    for (const toolResult of toolResults) {
+                        const rawToolResult = toolResult;
+                        collectedToolResults.push({
+                            toolName: toolResult.toolName,
+                            status: rawToolResult.error ? "failure" : "success",
+                            output: (rawToolResult.output ??
+                                rawToolResult.result) ?? undefined,
+                            error: rawToolResult.error,
+                            id: rawToolResult.toolCallId ?? toolResult.toolName,
+                        });
+                    }
                     // Handle tool execution storage
                     this.handleToolExecutionStorage(toolCalls, toolResults, options, new Date()).catch((error) => {
                         logger.warn("[GoogleVertexProvider] Failed to store tool executions", {
@@ -1011,16 +1036,13 @@ export class GoogleVertexProvider extends BaseProvider {
                 .finally(() => timeoutController?.cleanup());
             // Transform string stream to content object stream using BaseProvider method
             const transformedStream = this.createTextStream(result);
-            // Track tool calls and results for streaming
-            const toolCalls = [];
-            const toolResults = [];
             return {
                 stream: transformedStream,
                 provider: this.providerName,
                 model: this.modelName,
                 ...(shouldUseTools && {
-                    toolCalls,
-                    toolResults,
+                    toolCalls: collectedToolCalls,
+                    toolResults: collectedToolResults,
                 }),
             };
         }

package/dist/lib/providers/huggingFace.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
+import { type LanguageModel, type Schema } from "ai";
 import type { ZodType } from "zod";
-import { type Schema, type LanguageModel } from "ai";
-import { AIProviderName } from "../constants/enums.js";
-import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
+import type { AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
+import type { StreamOptions, StreamResult } from "../types/streamTypes.js";
 /**
  * HuggingFace Provider - BaseProvider Implementation
  * Using AI SDK with HuggingFace's OpenAI-compatible endpoint

package/dist/lib/providers/huggingFace.js CHANGED Viewed

@@ -1,12 +1,12 @@
 import { createOpenAI } from "@ai-sdk/openai";
 import { NoOutputGeneratedError, stepCountIs, streamText, } from "ai";
-import { AIProviderName } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import { logger } from "../utils/logger.js";
-import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { DEFAULT_MAX_STEPS } from "../core/constants.js";
-import { validateApiKey, createHuggingFaceConfig, getProviderModel, } from "../utils/providerConfig.js";
 import { createProxyFetch } from "../proxy/proxyFetch.js";
+import { logger } from "../utils/logger.js";
+import { createHuggingFaceConfig, getProviderModel, validateApiKey, } from "../utils/providerConfig.js";
+import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 // Configuration helpers - now using consolidated utility
 const getHuggingFaceApiKey = () => {
     return validateApiKey(createHuggingFaceConfig());
@@ -136,9 +136,7 @@ export class HuggingFaceProvider extends BaseProvider {
                 tools: (shouldUseTools
                     ? streamOptions.tools || allTools
                     : {}),
-                toolChoice: (shouldUseTools
-                    ? streamOptions.toolChoice || "auto"
-                    : "none"),
+                toolChoice: resolveToolChoice(options, (shouldUseTools ? streamOptions.tools || allTools : {}), shouldUseTools),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                 onStepFinish: ({ toolCalls, toolResults }) => {
@@ -203,7 +201,7 @@ export class HuggingFaceProvider extends BaseProvider {
             prompt: options.input.text,
             system: enhancedSystemPrompt,
             tools: formattedTools,
-            toolChoice: formattedTools ? "auto" : undefined,
+            toolChoice: formattedTools ? (options.toolChoice ?? "auto") : undefined,
         };
     }
     /**

package/dist/lib/providers/litellm.js CHANGED Viewed

@@ -1,6 +1,6 @@
 import { createOpenAI } from "@ai-sdk/openai";
 import { SpanKind, SpanStatusCode, trace } from "@opentelemetry/api";
-import { NoOutputGeneratedError, Output, streamText, } from "ai";
+import { NoOutputGeneratedError, Output, streamText } from "ai";
 import { BaseProvider } from "../core/baseProvider.js";
 import { DEFAULT_MAX_STEPS } from "../core/constants.js";
 import { streamAnalyticsCollector } from "../core/streamAnalytics.js";
@@ -10,7 +10,8 @@ import { isAbortError } from "../utils/errorHandling.js";
 import { logger } from "../utils/logger.js";
 import { calculateCost } from "../utils/pricing.js";
 import { getProviderModel } from "../utils/providerConfig.js";
-import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { composeAbortSignals, createTimeoutController, TimeoutError } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { getModelId } from "./providerTypeUtils.js";
 const streamTracer = trace.getTracer("neurolink.provider.litellm");
 // Configuration helpers
@@ -59,7 +60,7 @@ export class LiteLLMProvider extends BaseProvider {
             apiKey: config.apiKey,
             fetch: createProxyFetch(),
         });
-        this.model = customOpenAI(this.modelName || getDefaultLiteLLMModel());
+        this.model = customOpenAI.chat(this.modelName || getDefaultLiteLLMModel());
         logger.debug("LiteLLM Provider initialized", {
             modelName: this.modelName,
             provider: this.providerName,
@@ -85,18 +86,15 @@ export class LiteLLMProvider extends BaseProvider {
         // Check for timeout by error name and message as fallback
         const errorRecord = error;
         if (errorRecord?.name === "TimeoutError" ||
-            (typeof errorRecord?.message === "string" &&
-                errorRecord.message.toLowerCase().includes("timeout"))) {
+            (typeof errorRecord?.message === "string" && errorRecord.message.toLowerCase().includes("timeout"))) {
             return new NetworkError(`Request timed out: ${errorRecord?.message || "Unknown timeout"}`, this.providerName);
         }
         if (typeof errorRecord?.message === "string") {
-            if (errorRecord.message.includes("ECONNREFUSED") ||
-                errorRecord.message.includes("Failed to fetch")) {
+            if (errorRecord.message.includes("ECONNREFUSED") || errorRecord.message.includes("Failed to fetch")) {
                 return new NetworkError("LiteLLM proxy server not available. Please start the LiteLLM proxy server at " +
                     `${process.env.LITELLM_BASE_URL || "http://localhost:4000"}`, this.providerName);
             }
-            if (errorRecord.message.includes("API_KEY_INVALID") ||
-                errorRecord.message.includes("Invalid API key")) {
+            if (errorRecord.message.includes("API_KEY_INVALID") || errorRecord.message.includes("Invalid API key")) {
                 return new AuthenticationError("Invalid LiteLLM configuration. Please check your LITELLM_API_KEY environment variable.", this.providerName);
             }
             if (errorRecord.message.toLowerCase().includes("rate limit")) {
@@ -133,9 +131,7 @@ export class LiteLLMProvider extends BaseProvider {
             const model = await this.getAISDKModelWithMiddleware(options); // This is where network connection happens!
             // Get tools - options.tools is pre-merged by BaseProvider.stream()
             const shouldUseTools = !options.disableTools && this.supportsTools();
-            const tools = shouldUseTools
-                ? options.tools || (await this.getAllTools())
-                : {};
+            const tools = shouldUseTools ? options.tools || (await this.getAllTools()) : {};
             logger.debug(`LiteLLM: Tools for streaming`, {
                 shouldUseTools,
                 toolCount: Object.keys(tools).length,
@@ -160,7 +156,7 @@ export class LiteLLMProvider extends BaseProvider {
                 ...(shouldUseTools &&
                     Object.keys(tools).length > 0 && {
                     tools,
-                    toolChoice: "auto",
+                    toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                     maxSteps: options.maxSteps || DEFAULT_MAX_STEPS,
                 }),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
@@ -186,6 +182,26 @@ export class LiteLLMProvider extends BaseProvider {
                 },
                 onStepFinish: ({ toolCalls, toolResults }) => {
                     logger.info("Tool execution completed", { toolResults, toolCalls });
+                    for (const toolCall of toolCalls) {
+                        collectedToolCalls.push({
+                            toolCallId: toolCall.toolCallId,
+                            toolName: toolCall.toolName,
+                            args: toolCall.args ??
+                                toolCall.input ??
+                                toolCall.parameters ??
+                                {},
+                        });
+                    }
+                    for (const toolResult of toolResults) {
+                        const rawToolResult = toolResult;
+                        collectedToolResults.push({
+                            toolName: toolResult.toolName,
+                            status: rawToolResult.error ? "failure" : "success",
+                            output: (rawToolResult.output ?? rawToolResult.result) ?? undefined,
+                            error: rawToolResult.error,
+                            id: rawToolResult.toolCallId ?? toolResult.toolName,
+                        });
+                    }
                     this.handleToolExecutionStorage(toolCalls, toolResults, options, new Date()).catch((error) => {
                         logger.warn("[LiteLLMProvider] Failed to store tool executions", {
                             provider: this.providerName,
@@ -219,15 +235,15 @@ export class LiteLLMProvider extends BaseProvider {
                 },
             });
             let result;
+            const collectedToolCalls = [];
+            const collectedToolResults = [];
             try {
                 result = streamText(streamOptions);
             }
             catch (streamError) {
                 streamSpan.setStatus({
                     code: SpanStatusCode.ERROR,
-                    message: streamError instanceof Error
-                        ? streamError.message
-                        : String(streamError),
+                    message: streamError instanceof Error ? streamError.message : String(streamError),
                 });
                 streamSpan.end();
                 throw streamError;
@@ -294,9 +310,7 @@ export class LiteLLMProvider extends BaseProvider {
                                     yield { content: textDelta };
                                 }
                             }
-                            else if ("type" in chunk &&
-                                chunk.type === "tool-call" &&
-                                "toolCallId" in chunk) {
+                            else if ("type" in chunk && chunk.type === "tool-call" && "toolCallId" in chunk) {
                                 // Tool call event - log for debugging
                                 const toolCallId = String(chunk.toolCallId);
                                 const toolName = "toolName" in chunk ? String(chunk.toolName) : "unknown";
@@ -323,14 +337,17 @@ export class LiteLLMProvider extends BaseProvider {
             })();
             // Create analytics promise that resolves after stream completion
             const analyticsPromise = streamAnalyticsCollector.createAnalytics(this.providerName, this.modelName, result, Date.now() - startTime, {
-                requestId: options.requestId ??
-                    `litellm-stream-${Date.now()}`,
+                requestId: options.requestId ?? `litellm-stream-${Date.now()}`,
                 streamingMode: true,
             });
             return {
                 stream: transformedStream,
                 provider: this.providerName,
                 model: this.modelName,
+                ...(shouldUseTools && {
+                    toolCalls: collectedToolCalls,
+                    toolResults: collectedToolResults,
+                }),
                 analytics: analyticsPromise,
                 metadata: {
                     startTime,
@@ -351,9 +368,7 @@ export class LiteLLMProvider extends BaseProvider {
         const { embed: aiEmbed } = await import("ai");
         const { createOpenAI } = await import("@ai-sdk/openai");
         const config = getLiteLLMConfig();
-        const embeddingModelName = modelName ||
-            process.env.LITELLM_EMBEDDING_MODEL ||
-            "gemini-embedding-001";
+        const embeddingModelName = modelName || process.env.LITELLM_EMBEDDING_MODEL || "gemini-embedding-001";
         const customOpenAI = createOpenAI({
             baseURL: config.baseURL,
             apiKey: config.apiKey,
@@ -371,9 +386,7 @@ export class LiteLLMProvider extends BaseProvider {
         const { embedMany: aiEmbedMany } = await import("ai");
         const { createOpenAI } = await import("@ai-sdk/openai");
         const config = getLiteLLMConfig();
-        const embeddingModelName = modelName ||
-            process.env.LITELLM_EMBEDDING_MODEL ||
-            "gemini-embedding-001";
+        const embeddingModelName = modelName || process.env.LITELLM_EMBEDDING_MODEL || "gemini-embedding-001";
         const customOpenAI = createOpenAI({
             baseURL: config.baseURL,
             apiKey: config.apiKey,
@@ -392,8 +405,7 @@ export class LiteLLMProvider extends BaseProvider {
         const now = Date.now();
         // Check if cached models are still valid
         if (LiteLLMProvider.modelsCache.length > 0 &&
-            now - LiteLLMProvider.modelsCacheTime <
-                LiteLLMProvider.MODELS_CACHE_DURATION) {
+            now - LiteLLMProvider.modelsCacheTime < LiteLLMProvider.MODELS_CACHE_DURATION) {
             logger.debug(`[${functionTag}] Using cached models`, {
                 cacheAge: Math.round((now - LiteLLMProvider.modelsCacheTime) / 1000),
                 modelCount: LiteLLMProvider.modelsCache.length,

package/dist/lib/providers/mistral.js CHANGED Viewed

@@ -7,6 +7,7 @@ import { createProxyFetch } from "../proxy/proxyFetch.js";
 import { logger } from "../utils/logger.js";
 import { createMistralConfig, getProviderModel, validateApiKey, } from "../utils/providerConfig.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
+import { resolveToolChoice } from "../utils/toolChoice.js";
 import { toAnalyticsStreamResult } from "./providerTypeUtils.js";
 // Configuration helpers - now using consolidated utility
 const getMistralApiKey = () => {
@@ -63,7 +64,7 @@ export class MistralProvider extends BaseProvider {
                 maxOutputTokens: options.maxTokens, // No default limit - unlimited unless specified
                 tools,
                 stopWhen: stepCountIs(options.maxSteps || DEFAULT_MAX_STEPS),
-                toolChoice: shouldUseTools ? "auto" : "none",
+                toolChoice: resolveToolChoice(options, tools, shouldUseTools),
                 abortSignal: composeAbortSignals(options.abortSignal, timeoutController?.controller.signal),
                 experimental_telemetry: this.telemetryHandler.getTelemetryConfig(options),
                 onStepFinish: ({ toolCalls, toolResults }) => {