npm - @juspay/neurolink - Versions diffs - 9.15.0 → 9.17.0 - Mend

@juspay/neurolink 9.15.0 → 9.17.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (196) hide show

package/CHANGELOG.md +12 -0
package/README.md +22 -20
package/dist/adapters/video/videoAnalyzer.d.ts +1 -1
package/dist/adapters/video/videoAnalyzer.js +10 -8
package/dist/cli/commands/setup-anthropic.js +1 -14
package/dist/cli/commands/setup-azure.js +1 -12
package/dist/cli/commands/setup-bedrock.js +1 -9
package/dist/cli/commands/setup-google-ai.js +1 -12
package/dist/cli/commands/setup-openai.js +1 -14
package/dist/cli/commands/workflow.d.ts +27 -0
package/dist/cli/commands/workflow.js +216 -0
package/dist/cli/factories/commandFactory.js +79 -20
package/dist/cli/index.js +0 -1
package/dist/cli/parser.js +4 -1
package/dist/cli/utils/maskCredential.d.ts +11 -0
package/dist/cli/utils/maskCredential.js +23 -0
package/dist/constants/contextWindows.js +107 -16
package/dist/constants/enums.d.ts +99 -15
package/dist/constants/enums.js +152 -22
package/dist/context/budgetChecker.js +1 -1
package/dist/context/contextCompactor.js +31 -4
package/dist/context/emergencyTruncation.d.ts +21 -0
package/dist/context/emergencyTruncation.js +88 -0
package/dist/context/errorDetection.d.ts +16 -0
package/dist/context/errorDetection.js +48 -1
package/dist/context/errors.d.ts +19 -0
package/dist/context/errors.js +21 -0
package/dist/context/stages/slidingWindowTruncator.d.ts +6 -0
package/dist/context/stages/slidingWindowTruncator.js +159 -24
package/dist/context/stages/structuredSummarizer.js +2 -2
package/dist/core/baseProvider.js +306 -200
package/dist/core/conversationMemoryManager.js +104 -61
package/dist/core/evaluationProviders.js +16 -33
package/dist/core/factory.js +237 -164
package/dist/core/modules/GenerationHandler.js +175 -116
package/dist/core/modules/MessageBuilder.js +222 -170
package/dist/core/modules/StreamHandler.d.ts +1 -0
package/dist/core/modules/StreamHandler.js +95 -27
package/dist/core/modules/TelemetryHandler.d.ts +10 -1
package/dist/core/modules/TelemetryHandler.js +25 -7
package/dist/core/modules/ToolsManager.js +115 -191
package/dist/core/redisConversationMemoryManager.js +418 -282
package/dist/factories/providerRegistry.d.ts +5 -0
package/dist/factories/providerRegistry.js +20 -2
package/dist/index.d.ts +2 -2
package/dist/index.js +4 -2
package/dist/lib/adapters/video/videoAnalyzer.d.ts +1 -1
package/dist/lib/adapters/video/videoAnalyzer.js +10 -8
package/dist/lib/constants/contextWindows.js +107 -16
package/dist/lib/constants/enums.d.ts +99 -15
package/dist/lib/constants/enums.js +152 -22
package/dist/lib/context/budgetChecker.js +1 -1
package/dist/lib/context/contextCompactor.js +31 -4
package/dist/lib/context/emergencyTruncation.d.ts +21 -0
package/dist/lib/context/emergencyTruncation.js +89 -0
package/dist/lib/context/errorDetection.d.ts +16 -0
package/dist/lib/context/errorDetection.js +48 -1
package/dist/lib/context/errors.d.ts +19 -0
package/dist/lib/context/errors.js +22 -0
package/dist/lib/context/stages/slidingWindowTruncator.d.ts +6 -0
package/dist/lib/context/stages/slidingWindowTruncator.js +159 -24
package/dist/lib/context/stages/structuredSummarizer.js +2 -2
package/dist/lib/core/baseProvider.js +306 -200
package/dist/lib/core/conversationMemoryManager.js +104 -61
package/dist/lib/core/evaluationProviders.js +16 -33
package/dist/lib/core/factory.js +237 -164
package/dist/lib/core/modules/GenerationHandler.js +175 -116
package/dist/lib/core/modules/MessageBuilder.js +222 -170
package/dist/lib/core/modules/StreamHandler.d.ts +1 -0
package/dist/lib/core/modules/StreamHandler.js +95 -27
package/dist/lib/core/modules/TelemetryHandler.d.ts +10 -1
package/dist/lib/core/modules/TelemetryHandler.js +25 -7
package/dist/lib/core/modules/ToolsManager.js +115 -191
package/dist/lib/core/redisConversationMemoryManager.js +418 -282
package/dist/lib/factories/providerRegistry.d.ts +5 -0
package/dist/lib/factories/providerRegistry.js +20 -2
package/dist/lib/index.d.ts +2 -2
package/dist/lib/index.js +4 -2
package/dist/lib/mcp/externalServerManager.js +66 -0
package/dist/lib/mcp/mcpCircuitBreaker.js +24 -0
package/dist/lib/mcp/mcpClientFactory.js +16 -0
package/dist/lib/mcp/toolDiscoveryService.js +32 -6
package/dist/lib/mcp/toolRegistry.js +193 -123
package/dist/lib/neurolink.d.ts +6 -0
package/dist/lib/neurolink.js +1162 -646
package/dist/lib/providers/amazonBedrock.d.ts +1 -1
package/dist/lib/providers/amazonBedrock.js +521 -319
package/dist/lib/providers/anthropic.js +73 -17
package/dist/lib/providers/anthropicBaseProvider.js +77 -17
package/dist/lib/providers/googleAiStudio.d.ts +1 -1
package/dist/lib/providers/googleAiStudio.js +292 -227
package/dist/lib/providers/googleVertex.d.ts +36 -1
package/dist/lib/providers/googleVertex.js +553 -260
package/dist/lib/providers/ollama.js +329 -278
package/dist/lib/providers/openAI.js +77 -19
package/dist/lib/providers/sagemaker/parsers.js +3 -3
package/dist/lib/providers/sagemaker/streaming.js +3 -3
package/dist/lib/proxy/proxyFetch.js +81 -48
package/dist/lib/rag/ChunkerFactory.js +1 -1
package/dist/lib/rag/chunkers/MarkdownChunker.d.ts +22 -0
package/dist/lib/rag/chunkers/MarkdownChunker.js +213 -9
package/dist/lib/rag/chunking/markdownChunker.d.ts +16 -0
package/dist/lib/rag/chunking/markdownChunker.js +174 -2
package/dist/lib/rag/pipeline/contextAssembly.js +2 -1
package/dist/lib/rag/ragIntegration.d.ts +18 -1
package/dist/lib/rag/ragIntegration.js +94 -14
package/dist/lib/rag/retrieval/vectorQueryTool.js +21 -4
package/dist/lib/server/abstract/baseServerAdapter.js +4 -1
package/dist/lib/server/adapters/fastifyAdapter.js +35 -30
package/dist/lib/services/server/ai/observability/instrumentation.d.ts +32 -0
package/dist/lib/services/server/ai/observability/instrumentation.js +39 -0
package/dist/lib/telemetry/attributes.d.ts +52 -0
package/dist/lib/telemetry/attributes.js +61 -0
package/dist/lib/telemetry/index.d.ts +3 -0
package/dist/lib/telemetry/index.js +3 -0
package/dist/lib/telemetry/telemetryService.d.ts +6 -0
package/dist/lib/telemetry/telemetryService.js +6 -0
package/dist/lib/telemetry/tracers.d.ts +15 -0
package/dist/lib/telemetry/tracers.js +17 -0
package/dist/lib/telemetry/withSpan.d.ts +9 -0
package/dist/lib/telemetry/withSpan.js +35 -0
package/dist/lib/types/contextTypes.d.ts +10 -0
package/dist/lib/types/streamTypes.d.ts +14 -0
package/dist/lib/utils/conversationMemory.js +123 -84
package/dist/lib/utils/logger.d.ts +5 -0
package/dist/lib/utils/logger.js +50 -2
package/dist/lib/utils/messageBuilder.js +22 -42
package/dist/lib/utils/modelDetection.js +3 -3
package/dist/lib/utils/providerRetry.d.ts +41 -0
package/dist/lib/utils/providerRetry.js +114 -0
package/dist/lib/utils/retryability.d.ts +14 -0
package/dist/lib/utils/retryability.js +23 -0
package/dist/lib/utils/sanitizers/svg.js +4 -5
package/dist/lib/utils/tokenEstimation.d.ts +11 -1
package/dist/lib/utils/tokenEstimation.js +19 -4
package/dist/lib/utils/videoAnalysisProcessor.js +7 -3
package/dist/mcp/externalServerManager.js +66 -0
package/dist/mcp/mcpCircuitBreaker.js +24 -0
package/dist/mcp/mcpClientFactory.js +16 -0
package/dist/mcp/toolDiscoveryService.js +32 -6
package/dist/mcp/toolRegistry.js +193 -123
package/dist/neurolink.d.ts +6 -0
package/dist/neurolink.js +1162 -646
package/dist/providers/amazonBedrock.d.ts +1 -1
package/dist/providers/amazonBedrock.js +521 -319
package/dist/providers/anthropic.js +73 -17
package/dist/providers/anthropicBaseProvider.js +77 -17
package/dist/providers/googleAiStudio.d.ts +1 -1
package/dist/providers/googleAiStudio.js +292 -227
package/dist/providers/googleVertex.d.ts +36 -1
package/dist/providers/googleVertex.js +553 -260
package/dist/providers/ollama.js +329 -278
package/dist/providers/openAI.js +77 -19
package/dist/providers/sagemaker/parsers.js +3 -3
package/dist/providers/sagemaker/streaming.js +3 -3
package/dist/proxy/proxyFetch.js +81 -48
package/dist/rag/ChunkerFactory.js +1 -1
package/dist/rag/chunkers/MarkdownChunker.d.ts +22 -0
package/dist/rag/chunkers/MarkdownChunker.js +213 -9
package/dist/rag/chunking/markdownChunker.d.ts +16 -0
package/dist/rag/chunking/markdownChunker.js +174 -2
package/dist/rag/pipeline/contextAssembly.js +2 -1
package/dist/rag/ragIntegration.d.ts +18 -1
package/dist/rag/ragIntegration.js +94 -14
package/dist/rag/retrieval/vectorQueryTool.js +21 -4
package/dist/server/abstract/baseServerAdapter.js +4 -1
package/dist/server/adapters/fastifyAdapter.js +35 -30
package/dist/services/server/ai/observability/instrumentation.d.ts +32 -0
package/dist/services/server/ai/observability/instrumentation.js +39 -0
package/dist/telemetry/attributes.d.ts +52 -0
package/dist/telemetry/attributes.js +60 -0
package/dist/telemetry/index.d.ts +3 -0
package/dist/telemetry/index.js +3 -0
package/dist/telemetry/telemetryService.d.ts +6 -0
package/dist/telemetry/telemetryService.js +6 -0
package/dist/telemetry/tracers.d.ts +15 -0
package/dist/telemetry/tracers.js +16 -0
package/dist/telemetry/withSpan.d.ts +9 -0
package/dist/telemetry/withSpan.js +34 -0
package/dist/types/contextTypes.d.ts +10 -0
package/dist/types/streamTypes.d.ts +14 -0
package/dist/utils/conversationMemory.js +123 -84
package/dist/utils/logger.d.ts +5 -0
package/dist/utils/logger.js +50 -2
package/dist/utils/messageBuilder.js +22 -42
package/dist/utils/modelDetection.js +3 -3
package/dist/utils/providerRetry.d.ts +41 -0
package/dist/utils/providerRetry.js +113 -0
package/dist/utils/retryability.d.ts +14 -0
package/dist/utils/retryability.js +22 -0
package/dist/utils/sanitizers/svg.js +4 -5
package/dist/utils/tokenEstimation.d.ts +11 -1
package/dist/utils/tokenEstimation.js +19 -4
package/dist/utils/videoAnalysisProcessor.js +7 -3
package/dist/workflow/config.d.ts +26 -26
package/package.json +1 -1

package/dist/core/baseProvider.js CHANGED Viewed

@@ -1,8 +1,12 @@
+import { generateText } from "ai";
+import { SpanKind, SpanStatusCode } from "@opentelemetry/api";
+import { tracers } from "../telemetry/tracers.js";
 import { directAgentTools } from "../agent/directTools.js";
 import { IMAGE_GENERATION_MODELS } from "../core/constants.js";
 import { MiddlewareFactory } from "../middleware/factory.js";
 import { isAbortError } from "../utils/errorHandling.js";
 import { logger } from "../utils/logger.js";
+import { calculateCost } from "../utils/pricing.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { shouldDisableBuiltinTools } from "../utils/toolUtils.js";
 import { getKeyCount, getKeysAsString } from "../utils/transformationUtils.js";
@@ -15,6 +19,7 @@ import { StreamHandler } from "./modules/StreamHandler.js";
 import { TelemetryHandler } from "./modules/TelemetryHandler.js";
 import { ToolsManager } from "./modules/ToolsManager.js";
 import { Utilities } from "./modules/Utilities.js";
+const providerTracer = tracers.provider;
 /**
  * Abstract base class for all AI providers
  * Tools are integrated as first-class citizens - always available by default
@@ -49,8 +54,8 @@ export class BaseProvider {
         // Initialize composition modules
         this.messageBuilder = new MessageBuilder(this.providerName, this.modelName);
         this.streamHandler = new StreamHandler(this.providerName, this.modelName);
-        this.generationHandler = new GenerationHandler(this.providerName, this.modelName, () => this.supportsTools(), (options, type) => this.telemetryHandler.getTelemetryConfig(options, type), (toolCalls, toolResults, options, timestamp) => this.handleToolExecutionStorage(toolCalls, toolResults, options, timestamp));
         this.telemetryHandler = new TelemetryHandler(this.providerName, this.modelName, this.neurolink);
+        this.generationHandler = new GenerationHandler(this.providerName, this.modelName, () => this.supportsTools(), (options, type) => this.telemetryHandler.getTelemetryConfig(options, type), (toolCalls, toolResults, options, timestamp) => this.handleToolExecutionStorage(toolCalls, toolResults, options, timestamp));
         this.utilities = new Utilities(this.providerName, this.modelName, this.defaultTimeout, this.middlewareOptions);
         this.toolsManager = new ToolsManager(this.providerName, this.directTools, this.neurolink, {
             isZodSchema: (schema) => this.isZodSchema(schema),
@@ -75,86 +80,107 @@ export class BaseProvider {
      * When tools are involved, falls back to generate() with synthetic streaming
      */
     async stream(optionsOrPrompt, analysisSchema) {
-        let options = this.normalizeStreamOptions(optionsOrPrompt);
-        logger.info(`Starting stream`, {
-            provider: this.providerName,
-            hasTools: !options.disableTools && this.supportsTools(),
-            disableTools: !!options.disableTools,
-            supportsTools: this.supportsTools(),
-            inputLength: options.input?.text?.length || 0,
-            maxTokens: options.maxTokens,
-            temperature: options.temperature,
-            timestamp: Date.now(),
-        });
-        // ===== EARLY MULTIMODAL DETECTION =====
-        const hasFileInput = !!options.input?.files?.length || !!options.input?.videoFiles?.length;
-        if (hasFileInput) {
-            // ===== VIDEO ANALYSIS DETECTION =====
-            // Check if video frames are present and handle with fake streaming
-            const messages = await this.buildMessagesForStream(options);
-            if (hasVideoFrames(messages)) {
-                logger.info(`Video frames detected in stream, using fake streaming for video analysis`, {
-                    provider: this.providerName,
-                    model: this.modelName,
-                });
-                return await this.executeFakeStreaming(options, analysisSchema);
-            }
-        }
-        // 🔧 CRITICAL: Image generation models don't support real streaming
-        // Force fake streaming for image models to ensure image output is yielded
-        const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
-        if (isImageModel) {
-            logger.info(`Image model detected, forcing fake streaming`, {
+        return providerTracer.startActiveSpan("neurolink.provider.stream", { kind: SpanKind.INTERNAL }, async (span) => {
+            let options = this.normalizeStreamOptions(optionsOrPrompt);
+            span.setAttribute("gen_ai.system", this.providerName || "unknown");
+            span.setAttribute("gen_ai.request.model", this.modelName || options.model || "unknown");
+            logger.info(`Starting stream`, {
                 provider: this.providerName,
-                model: this.modelName,
-                reason: "Image generation requires fake streaming to yield image output",
-            });
-            // Skip real streaming, go directly to fake streaming
-            return await this.executeFakeStreaming(options, analysisSchema);
-        }
-        // Central tool merge: Pre-merge base tools (MCP/built-in) with user-provided
-        // tools (e.g. RAG tools) into options.tools. This way, every provider's
-        // executeStream() can simply use options.tools (or getAllTools() + options.tools)
-        // and get the complete tool set without needing per-provider merge logic.
-        if (!options.disableTools && this.supportsTools()) {
-            const mergedTools = await this.getToolsForStream(options);
-            options = { ...options, tools: mergedTools };
-        }
-        else {
-            options = { ...options, tools: {} };
-        }
-        // CRITICAL FIX: Always prefer real streaming over fake streaming
-        // Try real streaming first, use fake streaming only as fallback
-        try {
-            logger.debug(`Attempting real streaming`, {
-                provider: this.providerName,
-                timestamp: Date.now(),
-            });
-            const realStreamResult = await this.executeStream(options, analysisSchema);
-            logger.info(`Real streaming succeeded`, {
-                provider: this.providerName,
-                timestamp: Date.now(),
-            });
-            // If real streaming succeeds, return it (with tools support via Vercel AI SDK)
-            return realStreamResult;
-        }
-        catch (realStreamError) {
-            logger.warn(`Real streaming failed for ${this.providerName}, falling back to fake streaming:`, {
-                error: realStreamError instanceof Error
-                    ? realStreamError.message
-                    : String(realStreamError),
+                hasTools: !options.disableTools && this.supportsTools(),
+                disableTools: !!options.disableTools,
+                supportsTools: this.supportsTools(),
+                inputLength: options.input?.text?.length || 0,
+                maxTokens: options.maxTokens,
+                temperature: options.temperature,
                 timestamp: Date.now(),
             });
-            // Fallback to fake streaming only if real streaming fails AND tools are enabled
-            if (!options.disableTools && this.supportsTools()) {
-                return await this.executeFakeStreaming(options, analysisSchema);
+            try {
+                // ===== EARLY MULTIMODAL DETECTION =====
+                const hasFileInput = !!options.input?.files?.length ||
+                    !!options.input?.videoFiles?.length;
+                if (hasFileInput) {
+                    // ===== VIDEO ANALYSIS DETECTION =====
+                    // Check if video frames are present and handle with fake streaming
+                    const messages = await this.buildMessagesForStream(options);
+                    if (hasVideoFrames(messages)) {
+                        logger.info(`Video frames detected in stream, using fake streaming for video analysis`, {
+                            provider: this.providerName,
+                            model: this.modelName,
+                        });
+                        span.setAttribute("neurolink.stream_mode", "fake");
+                        return await this.executeFakeStreaming(options, analysisSchema);
+                    }
+                }
+                // Image generation models don't support real streaming
+                // Force fake streaming for image models to ensure image output is yielded
+                const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
+                if (isImageModel) {
+                    logger.info(`Image model detected, forcing fake streaming`, {
+                        provider: this.providerName,
+                        model: this.modelName,
+                        reason: "Image generation requires fake streaming to yield image output",
+                    });
+                    // Skip real streaming, go directly to fake streaming
+                    span.setAttribute("neurolink.stream_mode", "fake");
+                    return await this.executeFakeStreaming(options, analysisSchema);
+                }
+                // Central tool merge: Pre-merge base tools (MCP/built-in) with user-provided
+                // tools (e.g. RAG tools) into options.tools. This way, every provider's
+                // executeStream() can simply use options.tools (or getAllTools() + options.tools)
+                // and get the complete tool set without needing per-provider merge logic.
+                if (!options.disableTools && this.supportsTools()) {
+                    const mergedTools = await this.getToolsForStream(options);
+                    options = { ...options, tools: mergedTools };
+                }
+                else {
+                    options = { ...options, tools: {} };
+                }
+                // CRITICAL FIX: Always prefer real streaming over fake streaming
+                // Try real streaming first, use fake streaming only as fallback
+                try {
+                    logger.debug(`Attempting real streaming`, {
+                        provider: this.providerName,
+                        timestamp: Date.now(),
+                    });
+                    const realStreamResult = await this.executeStream(options, analysisSchema);
+                    logger.info(`Real streaming succeeded`, {
+                        provider: this.providerName,
+                        timestamp: Date.now(),
+                    });
+                    span.setAttribute("neurolink.stream_mode", "real");
+                    // If real streaming succeeds, return it (with tools support via Vercel AI SDK)
+                    return realStreamResult;
+                }
+                catch (realStreamError) {
+                    logger.warn(`Real streaming failed for ${this.providerName}, falling back to fake streaming:`, {
+                        error: realStreamError instanceof Error
+                            ? realStreamError.message
+                            : String(realStreamError),
+                        timestamp: Date.now(),
+                    });
+                    // Fallback to fake streaming only if real streaming fails AND tools are enabled
+                    if (!options.disableTools && this.supportsTools()) {
+                        span.setAttribute("neurolink.stream_mode", "fake");
+                        return await this.executeFakeStreaming(options, analysisSchema);
+                    }
+                    else {
+                        // If real streaming failed and no tools are enabled, re-throw the original error
+                        logger.error(`Real streaming failed for ${this.providerName}:`, realStreamError);
+                        throw this.handleProviderError(realStreamError);
+                    }
+                }
             }
-            else {
-                // If real streaming failed and no tools are enabled, re-throw the original error
-                logger.error(`Real streaming failed for ${this.providerName}:`, realStreamError);
-                throw this.handleProviderError(realStreamError);
+            catch (error) {
+                span.setStatus({
+                    code: SpanStatusCode.ERROR,
+                    message: error instanceof Error ? error.message : String(error),
+                });
+                throw error;
             }
-        }
+            finally {
+                span.end();
+            }
+        });
     }
     /**
      * Execute fake streaming - extracted method for reusability
@@ -442,141 +468,223 @@ export class BaseProvider {
      * for consistency and better performance
      */
     async generate(optionsOrPrompt, _analysisSchema) {
-        const options = this.normalizeTextOptions(optionsOrPrompt);
-        this.validateOptions(options);
-        const startTime = Date.now();
-        try {
-            // ===== VIDEO GENERATION MODE =====
-            // Generate video from image + prompt using Veo 3.1
-            if (options.output?.mode === "video") {
-                return await this.handleVideoGeneration(options, startTime);
-            }
-            // ===== IMAGE GENERATION MODE =====
-            // Route to executeImageGeneration for image generation models
-            const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
-            if (isImageModel) {
-                logger.info(`Image generation model detected, routing to executeImageGeneration`, {
-                    provider: this.providerName,
-                    model: this.modelName,
-                });
-                const imageResult = await this.executeImageGeneration(options);
-                return await this.enhanceResult(imageResult, options, startTime);
-            }
-            // ===== TTS MODE 1: Direct Input Synthesis (useAiResponse=false) =====
-            // Synthesize input text directly without AI generation
-            // This is optimal for simple read-aloud scenarios
-            if (options.tts?.enabled && !options.tts?.useAiResponse) {
-                const textToSynthesize = options.prompt ?? options.input?.text ?? "";
-                // Build base result structure - common to both paths
-                const baseResult = {
-                    content: textToSynthesize,
-                    provider: options.provider ?? this.providerName,
-                    model: this.modelName,
-                    usage: { input: 0, output: 0, total: 0 },
-                };
-                try {
-                    const ttsResult = await TTSProcessor.synthesize(textToSynthesize, options.provider ?? this.providerName, options.tts);
-                    baseResult.audio = ttsResult;
+        return providerTracer.startActiveSpan("neurolink.provider.generate", { kind: SpanKind.INTERNAL }, async (span) => {
+            const options = this.normalizeTextOptions(optionsOrPrompt);
+            this.validateOptions(options);
+            const startTime = Date.now();
+            span.setAttribute("gen_ai.system", this.providerName || "unknown");
+            span.setAttribute("gen_ai.request.model", this.modelName || options.model || "unknown");
+            try {
+                // ===== VIDEO GENERATION MODE =====
+                // Generate video from image + prompt using Veo 3.1
+                if (options.output?.mode === "video") {
+                    return await this.handleVideoGeneration(options, startTime);
                 }
-                catch (ttsError) {
-                    logger.error(`TTS synthesis failed in Mode 1 (direct input synthesis):`, ttsError);
-                    // baseResult remains without audio - graceful degradation
+                // ===== IMAGE GENERATION MODE =====
+                // Route to executeImageGeneration for image generation models
+                const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
+                if (isImageModel) {
+                    logger.info(`Image generation model detected, routing to executeImageGeneration`, {
+                        provider: this.providerName,
+                        model: this.modelName,
+                    });
+                    const imageResult = await this.executeImageGeneration(options);
+                    return await this.enhanceResult(imageResult, options, startTime);
                 }
-                // Call enhanceResult for consistency - enables analytics/evaluation for TTS-only requests
-                return await this.enhanceResult(baseResult, options, startTime);
-            }
-            // ===== Normal AI Generation Flow =====
-            const { tools, model } = await this.prepareGenerationContext(options);
-            const messages = await this.buildMessages(options);
-            // ===== VIDEO ANALYSIS FROM MESSAGES CONTENT =====
-            // Check if video files are present in messages content array
-            // If video analysis is needed, perform it and return early to avoid running generation
-            if (hasVideoFrames(messages)) {
-                const videoAnalysisResult = await executeVideoAnalysis(messages, {
-                    provider: options.provider,
-                    providerName: this.providerName,
-                    region: options.region,
-                    model: options.model,
-                });
-                // Return video analysis result directly without running generation
-                const videoResult = {
-                    content: videoAnalysisResult,
-                    provider: options.provider ?? this.providerName,
-                    model: this.modelName,
-                    usage: { input: 0, output: 0, total: 0 }, // Video analysis doesn't use standard token counting
-                };
-                return await this.enhanceResult(videoResult, options, startTime);
-            }
-            // Compose timeout signal with user-provided abort signal (mirrors stream path)
-            const timeoutController = createTimeoutController(options.timeout, this.providerName, "generate");
-            const composedSignal = composeAbortSignals(options.abortSignal, timeoutController?.controller.signal);
-            const composedOptions = composedSignal
-                ? { ...options, abortSignal: composedSignal }
-                : options;
-            let generateResult;
-            try {
-                generateResult = await this.executeGeneration(model, messages, tools, composedOptions);
-            }
-            finally {
-                timeoutController?.cleanup();
-            }
-            this.analyzeAIResponse(generateResult);
-            this.logGenerationComplete(generateResult);
-            const responseTime = Date.now() - startTime;
-            await this.recordPerformanceMetrics(generateResult.usage, responseTime);
-            const { toolsUsed, toolExecutions } = this.extractToolInformation(generateResult);
-            let enhancedResult = this.formatEnhancedResult(generateResult, tools, toolsUsed, toolExecutions, options);
-            // ===== TTS MODE 2: AI Response Synthesis (useAiResponse=true) =====
-            // Synthesize AI-generated response after generation completes
-            if (options.tts?.enabled && options.tts?.useAiResponse) {
-                const aiResponse = enhancedResult.content;
-                const provider = options.provider ?? this.providerName;
-                // Validate AI response and provider before synthesis
-                if (aiResponse && provider) {
+                // ===== TTS MODE 1: Direct Input Synthesis (useAiResponse=false) =====
+                // Synthesize input text directly without AI generation
+                // This is optimal for simple read-aloud scenarios
+                if (options.tts?.enabled && !options.tts?.useAiResponse) {
+                    const textToSynthesize = options.prompt ?? options.input?.text ?? "";
+                    // Build base result structure - common to both paths
+                    const baseResult = {
+                        content: textToSynthesize,
+                        provider: options.provider ?? this.providerName,
+                        model: this.modelName,
+                        usage: { input: 0, output: 0, total: 0 },
+                    };
                     try {
-                        const ttsResult = await TTSProcessor.synthesize(aiResponse, provider, options.tts);
-                        // Add audio to enhanced result (TTSProcessor already includes latency in metadata)
-                        enhancedResult = {
-                            ...enhancedResult,
-                            audio: ttsResult,
-                        };
+                        const ttsResult = await TTSProcessor.synthesize(textToSynthesize, options.provider ?? this.providerName, options.tts);
+                        baseResult.audio = ttsResult;
                     }
                     catch (ttsError) {
-                        // Log TTS error but continue with text-only result
-                        logger.error(`TTS synthesis failed in Mode 2 (AI response synthesis):`, ttsError);
-                        // enhancedResult remains unchanged (no audio field added)
+                        logger.error(`TTS synthesis failed in Mode 1 (direct input synthesis):`, ttsError);
+                        // baseResult remains without audio - graceful degradation
                     }
+                    // Call enhanceResult for consistency - enables analytics/evaluation for TTS-only requests
+                    return await this.enhanceResult(baseResult, options, startTime);
                 }
-                else {
-                    logger.warn(`TTS synthesis skipped despite being enabled`, {
-                        provider: this.providerName,
-                        hasAiResponse: !!aiResponse,
-                        aiResponseLength: aiResponse?.length ?? 0,
-                        hasProvider: !!provider,
-                        ttsConfig: {
-                            enabled: options.tts?.enabled,
-                            useAiResponse: options.tts?.useAiResponse,
-                        },
-                        reason: !aiResponse
-                            ? "AI response is empty or undefined"
-                            : "Provider is missing",
+                // ===== Normal AI Generation Flow =====
+                const { tools, model } = await this.prepareGenerationContext(options);
+                const messages = await this.buildMessages(options);
+                // ===== VIDEO ANALYSIS FROM MESSAGES CONTENT =====
+                // Check if video files are present in messages content array
+                // If video analysis is needed, perform it via Gemini, then pass through Claude for formatting
+                if (hasVideoFrames(messages)) {
+                    const videoAnalysisResult = await executeVideoAnalysis(messages, {
+                        provider: options.provider,
+                        providerName: this.providerName,
+                        region: options.region,
+                        // Don't pass the main conversation model — video analysis uses
+                        // Google's Gemini API (generateContent) which only supports Gemini models.
+                        // Let videoAnalysisProcessor use its own default (gemini-2.5-flash).
                     });
+                    // Extract user's original text from messages (excluding image parts)
+                    const userTextParts = messages
+                        .filter((m) => m.role === "user")
+                        .flatMap((m) => Array.isArray(m.content)
+                        ? m.content
+                            .filter((p) => p.type === "text")
+                            .map((p) => p.text)
+                        : [typeof m.content === "string" ? m.content : ""])
+                        .filter(Boolean);
+                    const userText = userTextParts.join("\n").trim();
+                    // Pass Gemini's analysis through Claude for structured JSON formatting
+                    // The system prompt (from Curator) includes JSON_REPORT_PROMPT_SUFFIX
+                    // which instructs Claude to output {"summary": "...", "details": "..."}
+                    let formattedContent = videoAnalysisResult;
+                    let usage = { input: 0, output: 0, total: 0 };
+                    if (options.systemPrompt) {
+                        try {
+                            const formattingPrompt = userText
+                                ? `The user asked: "${userText}"\n\nHere is the video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`
+                                : `Here is a video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`;
+                            logger.debug("[VideoAnalysis] Formatting via Claude", {
+                                userTextLength: userText.length,
+                                analysisLength: videoAnalysisResult.length,
+                            });
+                            const formattedResult = await generateText({
+                                model,
+                                system: options.systemPrompt,
+                                messages: [
+                                    { role: "user", content: formattingPrompt },
+                                ],
+                                maxTokens: options.maxTokens || 8192,
+                                temperature: 0.3,
+                                abortSignal: options.abortSignal,
+                                experimental_telemetry: this.telemetryHandler?.getTelemetryConfig(options, "generate"),
+                            });
+                            formattedContent = formattedResult.text;
+                            usage = {
+                                input: formattedResult.usage?.promptTokens || 0,
+                                output: formattedResult.usage?.completionTokens || 0,
+                                total: (formattedResult.usage?.promptTokens || 0) +
+                                    (formattedResult.usage?.completionTokens || 0),
+                            };
+                            logger.debug("[VideoAnalysis] Claude formatting complete", {
+                                formattedLength: formattedContent.length,
+                                usage,
+                            });
+                        }
+                        catch (error) {
+                            logger.warn("[VideoAnalysis] Claude formatting failed, using raw Gemini output", {
+                                error: error instanceof Error ? error.message : String(error),
+                            });
+                            // formattedContent remains as raw videoAnalysisResult (graceful degradation)
+                        }
+                    }
+                    const videoResult = {
+                        content: formattedContent,
+                        provider: options.provider ?? this.providerName,
+                        model: this.modelName,
+                        usage,
+                    };
+                    return await this.enhanceResult(videoResult, options, startTime);
                 }
+                // Compose timeout signal with user-provided abort signal (mirrors stream path)
+                const timeoutController = createTimeoutController(options.timeout, this.providerName, "generate");
+                const composedSignal = composeAbortSignals(options.abortSignal, timeoutController?.controller.signal);
+                const composedOptions = composedSignal
+                    ? { ...options, abortSignal: composedSignal }
+                    : options;
+                let generateResult;
+                try {
+                    generateResult = await this.executeGeneration(model, messages, tools, composedOptions);
+                }
+                finally {
+                    timeoutController?.cleanup();
+                }
+                this.analyzeAIResponse(generateResult);
+                this.logGenerationComplete(generateResult);
+                const responseTime = Date.now() - startTime;
+                await this.recordPerformanceMetrics(generateResult.usage, responseTime);
+                const { toolsUsed, toolExecutions } = this.extractToolInformation(generateResult);
+                let enhancedResult = this.formatEnhancedResult(generateResult, tools, toolsUsed, toolExecutions, options);
+                // ===== TTS MODE 2: AI Response Synthesis (useAiResponse=true) =====
+                // Synthesize AI-generated response after generation completes
+                if (options.tts?.enabled && options.tts?.useAiResponse) {
+                    const aiResponse = enhancedResult.content;
+                    const provider = options.provider ?? this.providerName;
+                    // Validate AI response and provider before synthesis
+                    if (aiResponse && provider) {
+                        try {
+                            const ttsResult = await TTSProcessor.synthesize(aiResponse, provider, options.tts);
+                            // Add audio to enhanced result (TTSProcessor already includes latency in metadata)
+                            enhancedResult = {
+                                ...enhancedResult,
+                                audio: ttsResult,
+                            };
+                        }
+                        catch (ttsError) {
+                            // Log TTS error but continue with text-only result
+                            logger.error(`TTS synthesis failed in Mode 2 (AI response synthesis):`, ttsError);
+                            // enhancedResult remains unchanged (no audio field added)
+                        }
+                    }
+                    else {
+                        logger.warn(`TTS synthesis skipped despite being enabled`, {
+                            provider: this.providerName,
+                            hasAiResponse: !!aiResponse,
+                            aiResponseLength: aiResponse?.length ?? 0,
+                            hasProvider: !!provider,
+                            ttsConfig: {
+                                enabled: options.tts?.enabled,
+                                useAiResponse: options.tts?.useAiResponse,
+                            },
+                            reason: !aiResponse
+                                ? "AI response is empty or undefined"
+                                : "Provider is missing",
+                        });
+                    }
+                }
+                // Set token usage on span from the result
+                if (enhancedResult?.usage) {
+                    span.setAttribute("gen_ai.usage.input_tokens", enhancedResult.usage.input || 0);
+                    span.setAttribute("gen_ai.usage.output_tokens", enhancedResult.usage.output || 0);
+                    // Cost on span so users can query "what did this trace cost?"
+                    const cost = calculateCost(this.providerName, this.modelName, {
+                        input: enhancedResult.usage.input || 0,
+                        output: enhancedResult.usage.output || 0,
+                        total: enhancedResult.usage.total || 0,
+                    });
+                    span.setAttribute("neurolink.cost", cost ?? 0);
+                }
+                if (enhancedResult?.finishReason) {
+                    span.setAttribute("gen_ai.response.finish_reason", enhancedResult.finishReason);
+                }
+                span.setStatus({ code: SpanStatusCode.OK });
+                return await this.enhanceResult(enhancedResult, options, startTime);
             }
-            return await this.enhanceResult(enhancedResult, options, startTime);
-        }
-        catch (error) {
-            // Abort errors are expected when a generation is cancelled — log at info, not error
-            if (isAbortError(error)) {
-                logger.info(`Generate aborted for ${this.providerName}`, {
-                    error: error instanceof Error ? error.message : String(error),
+            catch (error) {
+                span.setStatus({
+                    code: SpanStatusCode.ERROR,
+                    message: error instanceof Error ? error.message : String(error),
                 });
+                // Abort errors are expected when a generation is cancelled — log at info, not error
+                if (isAbortError(error)) {
+                    logger.info(`Generate aborted for ${this.providerName}`, {
+                        error: error instanceof Error ? error.message : String(error),
+                    });
+                }
+                else {
+                    logger.error(`Generate failed for ${this.providerName}:`, error);
+                }
+                throw this.handleProviderError(error);
             }
-            else {
-                logger.error(`Generate failed for ${this.providerName}:`, error);
+            finally {
+                span.end();
             }
-            throw this.handleProviderError(error);
-        }
+        });
     }
     /**
      * Alias for generate method - implements AIProvider interface
@@ -857,8 +965,6 @@ export class BaseProvider {
      * @param functionTag - Function name for logging
      */
     setupToolExecutor(sdk, functionTag) {
-        this.customTools = sdk.customTools;
-        this.toolExecutor = sdk.executeTool;
         this.toolsManager.setupToolExecutor(sdk, functionTag);
     }
     // ===================