npm - @juspay/neurolink - Versions diffs - 9.42.0 → 9.43.0 - Mend

@juspay/neurolink 9.42.0 → 9.43.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (116) hide show

package/CHANGELOG.md +8 -0
package/dist/auth/anthropicOAuth.js +12 -0
package/dist/browser/neurolink.min.js +335 -334
package/dist/cli/commands/mcp.d.ts +6 -0
package/dist/cli/commands/mcp.js +200 -184
package/dist/cli/commands/proxy.js +560 -518
package/dist/core/baseProvider.d.ts +6 -1
package/dist/core/baseProvider.js +219 -232
package/dist/core/factory.d.ts +3 -0
package/dist/core/factory.js +140 -190
package/dist/core/modules/ToolsManager.d.ts +1 -0
package/dist/core/modules/ToolsManager.js +40 -42
package/dist/core/toolEvents.d.ts +3 -0
package/dist/core/toolEvents.js +7 -0
package/dist/evaluation/pipeline/evaluationPipeline.js +5 -2
package/dist/evaluation/scorers/scorerRegistry.d.ts +3 -0
package/dist/evaluation/scorers/scorerRegistry.js +356 -284
package/dist/lib/auth/anthropicOAuth.js +12 -0
package/dist/lib/core/baseProvider.d.ts +6 -1
package/dist/lib/core/baseProvider.js +219 -232
package/dist/lib/core/factory.d.ts +3 -0
package/dist/lib/core/factory.js +140 -190
package/dist/lib/core/modules/ToolsManager.d.ts +1 -0
package/dist/lib/core/modules/ToolsManager.js +40 -42
package/dist/lib/core/toolEvents.d.ts +3 -0
package/dist/lib/core/toolEvents.js +8 -0
package/dist/lib/evaluation/pipeline/evaluationPipeline.js +5 -2
package/dist/lib/evaluation/scorers/scorerRegistry.d.ts +3 -0
package/dist/lib/evaluation/scorers/scorerRegistry.js +356 -284
package/dist/lib/mcp/toolRegistry.d.ts +2 -0
package/dist/lib/mcp/toolRegistry.js +32 -31
package/dist/lib/neurolink.d.ts +38 -0
package/dist/lib/neurolink.js +1890 -1707
package/dist/lib/providers/googleAiStudio.js +0 -5
package/dist/lib/providers/googleNativeGemini3.d.ts +4 -0
package/dist/lib/providers/googleNativeGemini3.js +39 -1
package/dist/lib/providers/googleVertex.d.ts +10 -0
package/dist/lib/providers/googleVertex.js +445 -445
package/dist/lib/providers/litellm.d.ts +1 -0
package/dist/lib/providers/litellm.js +73 -64
package/dist/lib/providers/ollama.js +17 -4
package/dist/lib/providers/openAI.d.ts +2 -0
package/dist/lib/providers/openAI.js +139 -140
package/dist/lib/proxy/claudeFormat.js +14 -5
package/dist/lib/proxy/oauthFetch.js +298 -318
package/dist/lib/proxy/proxyConfig.js +3 -1
package/dist/lib/proxy/proxyFetch.js +250 -222
package/dist/lib/proxy/proxyHealth.d.ts +17 -0
package/dist/lib/proxy/proxyHealth.js +55 -0
package/dist/lib/proxy/requestLogger.js +140 -48
package/dist/lib/proxy/routingPolicy.d.ts +33 -0
package/dist/lib/proxy/routingPolicy.js +255 -0
package/dist/lib/proxy/snapshotPersistence.d.ts +2 -0
package/dist/lib/proxy/snapshotPersistence.js +41 -0
package/dist/lib/proxy/sseInterceptor.js +36 -11
package/dist/lib/server/routes/claudeProxyRoutes.d.ts +2 -1
package/dist/lib/server/routes/claudeProxyRoutes.js +2916 -2377
package/dist/lib/services/server/ai/observability/instrumentation.js +194 -218
package/dist/lib/tasks/backends/bullmqBackend.js +24 -18
package/dist/lib/tasks/store/redisTaskStore.js +42 -17
package/dist/lib/tasks/taskManager.d.ts +2 -0
package/dist/lib/tasks/taskManager.js +100 -5
package/dist/lib/telemetry/telemetryService.js +9 -5
package/dist/lib/types/cli.d.ts +4 -0
package/dist/lib/types/proxyTypes.d.ts +211 -1
package/dist/lib/types/tools.d.ts +18 -0
package/dist/lib/utils/providerHealth.d.ts +1 -0
package/dist/lib/utils/providerHealth.js +46 -31
package/dist/lib/utils/providerUtils.js +11 -22
package/dist/lib/utils/schemaConversion.d.ts +1 -0
package/dist/lib/utils/schemaConversion.js +3 -0
package/dist/mcp/toolRegistry.d.ts +2 -0
package/dist/mcp/toolRegistry.js +32 -31
package/dist/neurolink.d.ts +38 -0
package/dist/neurolink.js +1890 -1707
package/dist/providers/googleAiStudio.js +0 -5
package/dist/providers/googleNativeGemini3.d.ts +4 -0
package/dist/providers/googleNativeGemini3.js +39 -1
package/dist/providers/googleVertex.d.ts +10 -0
package/dist/providers/googleVertex.js +445 -445
package/dist/providers/litellm.d.ts +1 -0
package/dist/providers/litellm.js +73 -64
package/dist/providers/ollama.js +17 -4
package/dist/providers/openAI.d.ts +2 -0
package/dist/providers/openAI.js +139 -140
package/dist/proxy/claudeFormat.js +14 -5
package/dist/proxy/oauthFetch.js +298 -318
package/dist/proxy/proxyConfig.js +3 -1
package/dist/proxy/proxyFetch.js +250 -222
package/dist/proxy/proxyHealth.d.ts +17 -0
package/dist/proxy/proxyHealth.js +54 -0
package/dist/proxy/requestLogger.js +140 -48
package/dist/proxy/routingPolicy.d.ts +33 -0
package/dist/proxy/routingPolicy.js +254 -0
package/dist/proxy/snapshotPersistence.d.ts +2 -0
package/dist/proxy/snapshotPersistence.js +40 -0
package/dist/proxy/sseInterceptor.js +36 -11
package/dist/server/routes/claudeProxyRoutes.d.ts +2 -1
package/dist/server/routes/claudeProxyRoutes.js +2916 -2377
package/dist/services/server/ai/observability/instrumentation.js +194 -218
package/dist/tasks/backends/bullmqBackend.js +24 -18
package/dist/tasks/store/redisTaskStore.js +42 -17
package/dist/tasks/taskManager.d.ts +2 -0
package/dist/tasks/taskManager.js +100 -5
package/dist/telemetry/telemetryService.js +9 -5
package/dist/types/cli.d.ts +4 -0
package/dist/types/proxyTypes.d.ts +211 -1
package/dist/types/tools.d.ts +18 -0
package/dist/utils/providerHealth.d.ts +1 -0
package/dist/utils/providerHealth.js +46 -31
package/dist/utils/providerUtils.js +12 -22
package/dist/utils/schemaConversion.d.ts +1 -0
package/dist/utils/schemaConversion.js +3 -0
package/package.json +3 -2
package/scripts/observability/check-proxy-telemetry.mjs +1 -1
package/scripts/observability/manage-local-openobserve.sh +36 -5

package/dist/core/baseProvider.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import type { ModelMessage, LanguageModel, Tool } from "ai";
+import type { LanguageModel, ModelMessage, Tool } from "ai";
 import type { AIProviderName } from "../constants/enums.js";
 import type { EvaluationData } from "../index.js";
 import type { NeuroLink } from "../neurolink.js";
@@ -136,6 +136,11 @@ export declare abstract class BaseProvider implements AIProvider {
      * Alias for generate method - implements AIProvider interface
      */
     gen(optionsOrPrompt: TextGenerationOptions | string, analysisSchema?: ValidationSchema): Promise<EnhancedGenerateResult | null>;
+    private runGenerateInActiveContext;
+    private handleDirectTTSSynthesis;
+    private handleVideoFrameGeneration;
+    private executeStandardGenerateFlow;
+    private synthesizeAIResponseIfNeeded;
     /**
      * BACKWARD COMPATIBILITY: Legacy generateText method
      * Converts EnhancedGenerateResult to TextGenerationResult format

package/dist/core/baseProvider.js CHANGED Viewed

@@ -6,9 +6,9 @@ import { MiddlewareFactory } from "../middleware/factory.js";
 import { SpanStatus, SpanType } from "../observability/types/spanTypes.js";
 import { SpanSerializer } from "../observability/utils/spanSerializer.js";
 import { ATTR, tracers } from "../telemetry/index.js";
-import { calculateCost } from "../utils/pricing.js";
 import { isAbortError } from "../utils/errorHandling.js";
 import { logger } from "../utils/logger.js";
+import { calculateCost } from "../utils/pricing.js";
 import { composeAbortSignals, createTimeoutController, TimeoutError, } from "../utils/timeout.js";
 import { shouldDisableBuiltinTools } from "../utils/toolUtils.js";
 import { getKeyCount, getKeysAsString } from "../utils/transformationUtils.js";
@@ -131,9 +131,15 @@ export class BaseProvider {
                 }
             }
             // CRITICAL: Image generation models don't support real streaming
-            // Force fake streaming for image models to ensure image output is yielded
+            // Force fake streaming for image models to ensure image output is yielded.
+            // Skip this path when the caller explicitly requests non-image output (e.g.
+            // JSON analysis) so dual-mode models like gemini-3.1-flash-image-preview
+            // can still perform text/structured generation.
             const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
-            if (isImageModel) {
+            const requestsNonImageOutput = options.output?.format === "json" ||
+                options.output?.format === "structured" ||
+                options.output?.format === "text";
+            if (isImageModel && !requestsNonImageOutput) {
                 logger.info(`Image model detected, forcing fake streaming`, {
                     provider: this.providerName,
                     model: this.modelName,
@@ -522,242 +528,223 @@ export class BaseProvider {
         });
         // Set this span as the active context so child spans (GenerationHandler, etc.) become descendants
         const activeCtx = trace.setSpan(context.active(), otelSpan);
-        let otelSpanEnded = false;
-        return await context.with(activeCtx, async () => {
+        const otelSpanState = { ended: false };
+        return await context.with(activeCtx, async () => this.runGenerateInActiveContext(options, startTime, metricsSpan, otelSpan, otelSpanState));
+    }
+    /**
+     * Alias for generate method - implements AIProvider interface
+     */
+    async gen(optionsOrPrompt, analysisSchema) {
+        return this.generate(optionsOrPrompt, analysisSchema);
+    }
+    async runGenerateInActiveContext(options, startTime, metricsSpan, otelSpan, otelSpanState) {
+        try {
+            if (options.output?.mode === "video") {
+                return await this.handleVideoGeneration(options, startTime);
+            }
+            const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
+            const requestsNonImageOutput = options.output?.format === "json" ||
+                options.output?.format === "structured" ||
+                options.output?.format === "text";
+            if (isImageModel && !requestsNonImageOutput) {
+                logger.info(`Image generation model detected, routing to executeImageGeneration`, {
+                    provider: this.providerName,
+                    model: this.modelName,
+                });
+                const imageResult = await this.executeImageGeneration(options);
+                return await this.enhanceResult(imageResult, options, startTime);
+            }
+            if (options.tts?.enabled && !options.tts?.useAiResponse) {
+                return this.handleDirectTTSSynthesis(options, startTime);
+            }
+            const { tools, model } = await this.prepareGenerationContext(options);
+            const messages = await this.buildMessages(options);
+            const videoFrameResult = await this.handleVideoFrameGeneration(options, messages, model, startTime);
+            if (videoFrameResult) {
+                return videoFrameResult;
+            }
+            return await this.executeStandardGenerateFlow(options, startTime, metricsSpan, model, messages, tools);
+        }
+        catch (error) {
+            SpanSerializer.endSpan(metricsSpan, SpanStatus.ERROR, error instanceof Error ? error.message : String(error));
+            otelSpan.setStatus({
+                code: SpanStatusCode.ERROR,
+                message: error instanceof Error ? error.message : String(error),
+            });
+            otelSpan.end();
+            otelSpanState.ended = true;
+            if (isAbortError(error)) {
+                logger.info(`Generate aborted for ${this.providerName}`, {
+                    error: error instanceof Error ? error.message : String(error),
+                });
+            }
+            else {
+                logger.error(`Generate failed for ${this.providerName}:`, error);
+            }
+            throw this.handleProviderError(error);
+        }
+        finally {
+            if (!otelSpanState.ended) {
+                otelSpan.setStatus({ code: SpanStatusCode.OK });
+                otelSpan.end();
+            }
+        }
+    }
+    async handleDirectTTSSynthesis(options, startTime) {
+        const textToSynthesize = options.prompt ?? options.input?.text ?? "";
+        const baseResult = {
+            content: textToSynthesize,
+            provider: options.provider ?? this.providerName,
+            model: this.modelName,
+            usage: { input: 0, output: 0, total: 0 },
+        };
+        try {
+            if (!options.tts) {
+                return this.enhanceResult(baseResult, options, startTime);
+            }
+            baseResult.audio = await TTSProcessor.synthesize(textToSynthesize, options.provider ?? this.providerName, options.tts);
+        }
+        catch (ttsError) {
+            logger.error(`TTS synthesis failed in Mode 1 (direct input synthesis):`, ttsError);
+        }
+        return this.enhanceResult(baseResult, options, startTime);
+    }
+    async handleVideoFrameGeneration(options, messages, model, startTime) {
+        if (!hasVideoFrames(messages)) {
+            return null;
+        }
+        const videoAnalysisResult = await executeVideoAnalysis(messages, {
+            provider: options.provider,
+            providerName: this.providerName,
+            region: options.region,
+        });
+        const userText = messages
+            .filter((m) => m.role === "user")
+            .flatMap((m) => Array.isArray(m.content)
+            ? m.content
+                .filter((p) => p.type === "text")
+                .map((p) => p.text)
+            : [typeof m.content === "string" ? m.content : ""])
+            .filter(Boolean)
+            .join("\n")
+            .trim();
+        let formattedContent = videoAnalysisResult;
+        let usage = { input: 0, output: 0, total: 0 };
+        if (options.systemPrompt) {
             try {
-                // ===== VIDEO GENERATION MODE =====
-                // Generate video from image + prompt using Veo 3.1
-                if (options.output?.mode === "video") {
-                    return await this.handleVideoGeneration(options, startTime);
-                }
-                // ===== IMAGE GENERATION MODE =====
-                // Route to executeImageGeneration for image generation models
-                const isImageModel = IMAGE_GENERATION_MODELS.some((m) => this.modelName.includes(m));
-                if (isImageModel) {
-                    logger.info(`Image generation model detected, routing to executeImageGeneration`, {
-                        provider: this.providerName,
-                        model: this.modelName,
-                    });
-                    const imageResult = await this.executeImageGeneration(options);
-                    return await this.enhanceResult(imageResult, options, startTime);
-                }
-                // ===== TTS MODE 1: Direct Input Synthesis (useAiResponse=false) =====
-                // Synthesize input text directly without AI generation
-                // This is optimal for simple read-aloud scenarios
-                if (options.tts?.enabled && !options.tts?.useAiResponse) {
-                    const textToSynthesize = options.prompt ?? options.input?.text ?? "";
-                    // Build base result structure - common to both paths
-                    const baseResult = {
-                        content: textToSynthesize,
-                        provider: options.provider ?? this.providerName,
-                        model: this.modelName,
-                        usage: { input: 0, output: 0, total: 0 },
-                    };
-                    try {
-                        const ttsResult = await TTSProcessor.synthesize(textToSynthesize, options.provider ?? this.providerName, options.tts);
-                        baseResult.audio = ttsResult;
-                    }
-                    catch (ttsError) {
-                        logger.error(`TTS synthesis failed in Mode 1 (direct input synthesis):`, ttsError);
-                        // baseResult remains without audio - graceful degradation
-                    }
-                    // Call enhanceResult for consistency - enables analytics/evaluation for TTS-only requests
-                    return await this.enhanceResult(baseResult, options, startTime);
-                }
-                // ===== Normal AI Generation Flow =====
-                const { tools, model } = await this.prepareGenerationContext(options);
-                const messages = await this.buildMessages(options);
-                // ===== VIDEO ANALYSIS FROM MESSAGES CONTENT =====
-                // Check if video files are present in messages content array
-                // If video analysis is needed, perform it via Gemini, then pass through Claude for formatting
-                if (hasVideoFrames(messages)) {
-                    const videoAnalysisResult = await executeVideoAnalysis(messages, {
-                        provider: options.provider,
-                        providerName: this.providerName,
-                        region: options.region,
-                        // Don't pass the main conversation model — video analysis uses
-                        // Google's Gemini API (generateContent) which only supports Gemini models.
-                        // Let videoAnalysisProcessor use its own default (gemini-2.5-flash).
-                    });
-                    // Extract user's original text from messages (excluding image parts)
-                    const userTextParts = messages
-                        .filter((m) => m.role === "user")
-                        .flatMap((m) => Array.isArray(m.content)
-                        ? m.content
-                            .filter((p) => p.type === "text")
-                            .map((p) => p.text)
-                        : [typeof m.content === "string" ? m.content : ""])
-                        .filter(Boolean);
-                    const userText = userTextParts.join("\n").trim();
-                    // Pass Gemini's analysis through Claude for structured JSON formatting
-                    // The system prompt (from Curator) includes JSON_REPORT_PROMPT_SUFFIX
-                    // which instructs Claude to output {"summary": "...", "details": "..."}
-                    let formattedContent = videoAnalysisResult;
-                    let usage = { input: 0, output: 0, total: 0 };
-                    if (options.systemPrompt) {
-                        try {
-                            const formattingPrompt = userText
-                                ? `The user asked: "${userText}"\n\nHere is the video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`
-                                : `Here is a video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`;
-                            logger.debug("[VideoAnalysis] Formatting via Claude", {
-                                userTextLength: userText.length,
-                                analysisLength: videoAnalysisResult.length,
-                            });
-                            const formattedResult = await generateText({
-                                model,
-                                system: options.systemPrompt,
-                                messages: [
-                                    { role: "user", content: formattingPrompt },
-                                ],
-                                maxOutputTokens: options.maxTokens || 8192,
-                                temperature: 0.3,
-                                abortSignal: options.abortSignal,
-                                experimental_telemetry: this.telemetryHandler?.getTelemetryConfig(options, "generate"),
-                            });
-                            formattedContent = formattedResult.text;
-                            usage = {
-                                input: formattedResult.usage?.inputTokens || 0,
-                                output: formattedResult.usage?.outputTokens || 0,
-                                total: (formattedResult.usage?.inputTokens || 0) +
-                                    (formattedResult.usage?.outputTokens || 0),
-                            };
-                            logger.debug("[VideoAnalysis] Claude formatting complete", {
-                                formattedLength: formattedContent.length,
-                                usage,
-                            });
-                        }
-                        catch (error) {
-                            logger.warn("[VideoAnalysis] Claude formatting failed, using raw Gemini output", {
-                                error: error instanceof Error ? error.message : String(error),
-                            });
-                            // formattedContent remains as raw videoAnalysisResult (graceful degradation)
-                        }
-                    }
-                    const videoResult = {
-                        content: formattedContent,
-                        provider: options.provider ?? this.providerName,
-                        model: this.modelName,
-                        usage,
-                    };
-                    return await this.enhanceResult(videoResult, options, startTime);
-                }
-                // Compose timeout signal with user-provided abort signal (mirrors stream path)
-                const timeoutController = createTimeoutController(options.timeout, this.providerName, "generate");
-                const composedSignal = composeAbortSignals(options.abortSignal, timeoutController?.controller.signal);
-                const composedOptions = composedSignal
-                    ? { ...options, abortSignal: composedSignal }
-                    : options;
-                let generateResult;
-                try {
-                    generateResult = await this.executeGeneration(model, messages, tools, composedOptions);
-                }
-                finally {
-                    timeoutController?.cleanup();
-                }
-                this.analyzeAIResponse(generateResult);
-                this.logGenerationComplete(generateResult);
-                const responseTime = Date.now() - startTime;
-                await this.recordPerformanceMetrics(generateResult.usage, responseTime);
-                const { toolsUsed, toolExecutions } = this.extractToolInformation(generateResult);
-                let enhancedResult = this.formatEnhancedResult(generateResult, tools, toolsUsed, toolExecutions, options);
-                // ===== TTS MODE 2: AI Response Synthesis (useAiResponse=true) =====
-                // Synthesize AI-generated response after generation completes
-                if (options.tts?.enabled && options.tts?.useAiResponse) {
-                    const aiResponse = enhancedResult.content;
-                    const provider = options.provider ?? this.providerName;
-                    // Validate AI response and provider before synthesis
-                    if (aiResponse && provider) {
-                        try {
-                            const ttsResult = await TTSProcessor.synthesize(aiResponse, provider, options.tts);
-                            // Add audio to enhanced result (TTSProcessor already includes latency in metadata)
-                            enhancedResult = {
-                                ...enhancedResult,
-                                audio: ttsResult,
-                            };
-                        }
-                        catch (ttsError) {
-                            // Log TTS error but continue with text-only result
-                            logger.error(`TTS synthesis failed in Mode 2 (AI response synthesis):`, ttsError);
-                            // enhancedResult remains unchanged (no audio field added)
-                        }
-                    }
-                    else {
-                        logger.warn(`TTS synthesis skipped despite being enabled`, {
-                            provider: this.providerName,
-                            hasAiResponse: !!aiResponse,
-                            aiResponseLength: aiResponse?.length ?? 0,
-                            hasProvider: !!provider,
-                            ttsConfig: {
-                                enabled: options.tts?.enabled,
-                                useAiResponse: options.tts?.useAiResponse,
-                            },
-                            reason: !aiResponse
-                                ? "AI response is empty or undefined"
-                                : "Provider is missing",
-                        });
-                    }
-                }
-                // Observability: record successful generate span with token/cost data
-                let enrichedGenerateSpan = { ...metricsSpan };
-                if (enhancedResult?.usage) {
-                    enrichedGenerateSpan = SpanSerializer.enrichWithTokenUsage(enrichedGenerateSpan, {
-                        promptTokens: enhancedResult.usage.input || 0,
-                        completionTokens: enhancedResult.usage.output || 0,
-                        totalTokens: enhancedResult.usage.total || 0,
-                    });
-                    const cost = calculateCost(this.providerName, this.modelName, {
-                        input: enhancedResult.usage.input || 0,
-                        output: enhancedResult.usage.output || 0,
-                        total: enhancedResult.usage.total || 0,
-                    });
-                    if (cost && cost > 0) {
-                        enrichedGenerateSpan = SpanSerializer.enrichWithCost(enrichedGenerateSpan, {
-                            totalCost: cost,
-                        });
-                    }
-                }
-                const _endedGenerateSpan = SpanSerializer.endSpan(enrichedGenerateSpan, SpanStatus.OK);
-                // Note: Do NOT record to getMetricsAggregator() here — the neurolink.ts
-                // generation:end listener creates an authoritative span with richer context
-                // (provider name, model, input/output) and records to both aggregators.
-                // Recording here would double-count cost and token metrics.
-                return await this.enhanceResult(enhancedResult, options, startTime);
+                const formattingPrompt = userText
+                    ? `The user asked: "${userText}"\n\nHere is the video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`
+                    : `Here is a video/image analysis result from the visual analysis system:\n\n${videoAnalysisResult}\n\nBased on this analysis, provide your response.`;
+                logger.debug("[VideoAnalysis] Formatting via Claude", {
+                    userTextLength: userText.length,
+                    analysisLength: videoAnalysisResult.length,
+                });
+                const formattedResult = await generateText({
+                    model,
+                    system: options.systemPrompt,
+                    messages: [{ role: "user", content: formattingPrompt }],
+                    maxOutputTokens: options.maxTokens || 8192,
+                    temperature: 0.3,
+                    abortSignal: options.abortSignal,
+                    experimental_telemetry: this.telemetryHandler?.getTelemetryConfig(options, "generate"),
+                });
+                formattedContent = formattedResult.text;
+                usage = {
+                    input: formattedResult.usage?.inputTokens || 0,
+                    output: formattedResult.usage?.outputTokens || 0,
+                    total: (formattedResult.usage?.inputTokens || 0) +
+                        (formattedResult.usage?.outputTokens || 0),
+                };
+                logger.debug("[VideoAnalysis] Claude formatting complete", {
+                    formattedLength: formattedContent.length,
+                    usage,
+                });
             }
             catch (error) {
-                // Observability: record failed generate span
-                const _endedGenerateSpan = SpanSerializer.endSpan(metricsSpan, SpanStatus.ERROR, error instanceof Error ? error.message : String(error));
-                // Note: Do NOT record to getMetricsAggregator() here — neurolink.ts
-                // handles authoritative metrics recording to avoid double-counting.
-                otelSpan.setStatus({
-                    code: SpanStatusCode.ERROR,
-                    message: error instanceof Error ? error.message : String(error),
+                logger.warn("[VideoAnalysis] Claude formatting failed, using raw Gemini output", {
+                    error: error instanceof Error ? error.message : String(error),
                 });
-                otelSpan.end();
-                otelSpanEnded = true;
-                // Abort errors are expected when a generation is cancelled — log at info, not error
-                if (isAbortError(error)) {
-                    logger.info(`Generate aborted for ${this.providerName}`, {
-                        error: error instanceof Error ? error.message : String(error),
-                    });
-                }
-                else {
-                    logger.error(`Generate failed for ${this.providerName}:`, error);
-                }
-                throw this.handleProviderError(error);
             }
-            finally {
-                if (!otelSpanEnded) {
-                    otelSpan.setStatus({ code: SpanStatusCode.OK });
-                    otelSpan.end();
-                }
+        }
+        return this.enhanceResult({
+            content: formattedContent,
+            provider: options.provider ?? this.providerName,
+            model: this.modelName,
+            usage,
+        }, options, startTime);
+    }
+    async executeStandardGenerateFlow(options, startTime, metricsSpan, model, messages, tools) {
+        const timeoutController = createTimeoutController(options.timeout, this.providerName, "generate");
+        const composedSignal = composeAbortSignals(options.abortSignal, timeoutController?.controller.signal);
+        const composedOptions = composedSignal
+            ? { ...options, abortSignal: composedSignal }
+            : options;
+        let generateResult;
+        try {
+            generateResult = await this.executeGeneration(model, messages, tools, composedOptions);
+        }
+        finally {
+            timeoutController?.cleanup();
+        }
+        this.analyzeAIResponse(generateResult);
+        this.logGenerationComplete(generateResult);
+        const responseTime = Date.now() - startTime;
+        await this.recordPerformanceMetrics(generateResult.usage, responseTime);
+        const { toolsUsed, toolExecutions } = this.extractToolInformation(generateResult);
+        let enhancedResult = this.formatEnhancedResult(generateResult, tools, toolsUsed, toolExecutions, options);
+        enhancedResult = await this.synthesizeAIResponseIfNeeded(enhancedResult, options);
+        let enrichedGenerateSpan = { ...metricsSpan };
+        if (enhancedResult?.usage) {
+            enrichedGenerateSpan = SpanSerializer.enrichWithTokenUsage(enrichedGenerateSpan, {
+                promptTokens: enhancedResult.usage.input || 0,
+                completionTokens: enhancedResult.usage.output || 0,
+                totalTokens: enhancedResult.usage.total || 0,
+            });
+            const cost = calculateCost(this.providerName, this.modelName, {
+                input: enhancedResult.usage.input || 0,
+                output: enhancedResult.usage.output || 0,
+                total: enhancedResult.usage.total || 0,
+            });
+            if (cost && cost > 0) {
+                enrichedGenerateSpan = SpanSerializer.enrichWithCost(enrichedGenerateSpan, { totalCost: cost });
             }
-        }); // end context.with
+        }
+        SpanSerializer.endSpan(enrichedGenerateSpan, SpanStatus.OK);
+        return this.enhanceResult(enhancedResult, options, startTime);
     }
-    /**
-     * Alias for generate method - implements AIProvider interface
-     */
-    async gen(optionsOrPrompt, analysisSchema) {
-        return this.generate(optionsOrPrompt, analysisSchema);
+    async synthesizeAIResponseIfNeeded(enhancedResult, options) {
+        if (!options.tts?.enabled || !options.tts?.useAiResponse) {
+            return enhancedResult;
+        }
+        const aiResponse = enhancedResult.content;
+        const provider = options.provider ?? this.providerName;
+        if (!aiResponse || !provider) {
+            logger.warn(`TTS synthesis skipped despite being enabled`, {
+                provider: this.providerName,
+                hasAiResponse: !!aiResponse,
+                aiResponseLength: aiResponse?.length ?? 0,
+                hasProvider: !!provider,
+                ttsConfig: {
+                    enabled: options.tts?.enabled,
+                    useAiResponse: options.tts?.useAiResponse,
+                },
+                reason: !aiResponse
+                    ? "AI response is empty or undefined"
+                    : "Provider is missing",
+            });
+            return enhancedResult;
+        }
+        try {
+            const ttsResult = await TTSProcessor.synthesize(aiResponse, provider, options.tts);
+            return {
+                ...enhancedResult,
+                audio: ttsResult,
+            };
+        }
+        catch (ttsError) {
+            logger.error(`TTS synthesis failed in Mode 2 (AI response synthesis):`, ttsError);
+            return enhancedResult;
+        }
     }
     /**
      * BACKWARD COMPATIBILITY: Legacy generateText method

package/dist/core/factory.d.ts CHANGED Viewed

@@ -15,6 +15,9 @@ export declare class AIProviderFactory {
      * Prevents hanging on non-responsive endpoints
      */
     private static initializeDynamicProviderWithTimeout;
+    private static resolveModelFromEnvironment;
+    private static resolveDynamicModelName;
+    private static createResolvedProvider;
     /**
      * Create a provider instance for the specified provider type
      * @param providerName - Name of the provider ('vertex', 'bedrock', 'openai')