npm - @juspay/neurolink - Versions diffs - 9.15.0 → 9.16.0 - Mend

@juspay/neurolink 9.15.0 → 9.16.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (193) hide show

package/CHANGELOG.md +6 -0
package/dist/adapters/video/videoAnalyzer.d.ts +1 -1
package/dist/adapters/video/videoAnalyzer.js +10 -8
package/dist/cli/commands/setup-anthropic.js +1 -14
package/dist/cli/commands/setup-azure.js +1 -12
package/dist/cli/commands/setup-bedrock.js +1 -9
package/dist/cli/commands/setup-google-ai.js +1 -12
package/dist/cli/commands/setup-openai.js +1 -14
package/dist/cli/commands/workflow.d.ts +27 -0
package/dist/cli/commands/workflow.js +216 -0
package/dist/cli/factories/commandFactory.js +79 -20
package/dist/cli/index.js +0 -1
package/dist/cli/parser.js +4 -1
package/dist/cli/utils/maskCredential.d.ts +11 -0
package/dist/cli/utils/maskCredential.js +23 -0
package/dist/constants/contextWindows.js +107 -16
package/dist/constants/enums.d.ts +99 -15
package/dist/constants/enums.js +152 -22
package/dist/context/budgetChecker.js +1 -1
package/dist/context/contextCompactor.js +31 -4
package/dist/context/emergencyTruncation.d.ts +21 -0
package/dist/context/emergencyTruncation.js +88 -0
package/dist/context/errorDetection.d.ts +16 -0
package/dist/context/errorDetection.js +48 -1
package/dist/context/errors.d.ts +19 -0
package/dist/context/errors.js +21 -0
package/dist/context/stages/slidingWindowTruncator.d.ts +6 -0
package/dist/context/stages/slidingWindowTruncator.js +159 -24
package/dist/core/baseProvider.js +306 -200
package/dist/core/conversationMemoryManager.js +104 -61
package/dist/core/evaluationProviders.js +16 -33
package/dist/core/factory.js +237 -164
package/dist/core/modules/GenerationHandler.js +175 -116
package/dist/core/modules/MessageBuilder.js +222 -170
package/dist/core/modules/StreamHandler.d.ts +1 -0
package/dist/core/modules/StreamHandler.js +95 -27
package/dist/core/modules/TelemetryHandler.d.ts +10 -1
package/dist/core/modules/TelemetryHandler.js +25 -7
package/dist/core/modules/ToolsManager.js +115 -191
package/dist/core/redisConversationMemoryManager.js +418 -282
package/dist/factories/providerRegistry.d.ts +5 -0
package/dist/factories/providerRegistry.js +20 -2
package/dist/index.d.ts +2 -2
package/dist/index.js +4 -2
package/dist/lib/adapters/video/videoAnalyzer.d.ts +1 -1
package/dist/lib/adapters/video/videoAnalyzer.js +10 -8
package/dist/lib/constants/contextWindows.js +107 -16
package/dist/lib/constants/enums.d.ts +99 -15
package/dist/lib/constants/enums.js +152 -22
package/dist/lib/context/budgetChecker.js +1 -1
package/dist/lib/context/contextCompactor.js +31 -4
package/dist/lib/context/emergencyTruncation.d.ts +21 -0
package/dist/lib/context/emergencyTruncation.js +89 -0
package/dist/lib/context/errorDetection.d.ts +16 -0
package/dist/lib/context/errorDetection.js +48 -1
package/dist/lib/context/errors.d.ts +19 -0
package/dist/lib/context/errors.js +22 -0
package/dist/lib/context/stages/slidingWindowTruncator.d.ts +6 -0
package/dist/lib/context/stages/slidingWindowTruncator.js +159 -24
package/dist/lib/core/baseProvider.js +306 -200
package/dist/lib/core/conversationMemoryManager.js +104 -61
package/dist/lib/core/evaluationProviders.js +16 -33
package/dist/lib/core/factory.js +237 -164
package/dist/lib/core/modules/GenerationHandler.js +175 -116
package/dist/lib/core/modules/MessageBuilder.js +222 -170
package/dist/lib/core/modules/StreamHandler.d.ts +1 -0
package/dist/lib/core/modules/StreamHandler.js +95 -27
package/dist/lib/core/modules/TelemetryHandler.d.ts +10 -1
package/dist/lib/core/modules/TelemetryHandler.js +25 -7
package/dist/lib/core/modules/ToolsManager.js +115 -191
package/dist/lib/core/redisConversationMemoryManager.js +418 -282
package/dist/lib/factories/providerRegistry.d.ts +5 -0
package/dist/lib/factories/providerRegistry.js +20 -2
package/dist/lib/index.d.ts +2 -2
package/dist/lib/index.js +4 -2
package/dist/lib/mcp/externalServerManager.js +66 -0
package/dist/lib/mcp/mcpCircuitBreaker.js +24 -0
package/dist/lib/mcp/mcpClientFactory.js +16 -0
package/dist/lib/mcp/toolDiscoveryService.js +32 -6
package/dist/lib/mcp/toolRegistry.js +193 -123
package/dist/lib/neurolink.d.ts +6 -0
package/dist/lib/neurolink.js +1162 -646
package/dist/lib/providers/amazonBedrock.d.ts +1 -1
package/dist/lib/providers/amazonBedrock.js +521 -319
package/dist/lib/providers/anthropic.js +73 -17
package/dist/lib/providers/anthropicBaseProvider.js +77 -17
package/dist/lib/providers/googleAiStudio.d.ts +1 -1
package/dist/lib/providers/googleAiStudio.js +292 -227
package/dist/lib/providers/googleVertex.d.ts +36 -1
package/dist/lib/providers/googleVertex.js +553 -260
package/dist/lib/providers/ollama.js +329 -278
package/dist/lib/providers/openAI.js +77 -19
package/dist/lib/providers/sagemaker/parsers.js +3 -3
package/dist/lib/providers/sagemaker/streaming.js +3 -3
package/dist/lib/proxy/proxyFetch.js +81 -48
package/dist/lib/rag/ChunkerFactory.js +1 -1
package/dist/lib/rag/chunkers/MarkdownChunker.d.ts +22 -0
package/dist/lib/rag/chunkers/MarkdownChunker.js +213 -9
package/dist/lib/rag/chunking/markdownChunker.d.ts +16 -0
package/dist/lib/rag/chunking/markdownChunker.js +174 -2
package/dist/lib/rag/pipeline/contextAssembly.js +2 -1
package/dist/lib/rag/ragIntegration.d.ts +18 -1
package/dist/lib/rag/ragIntegration.js +94 -14
package/dist/lib/rag/retrieval/vectorQueryTool.js +21 -4
package/dist/lib/server/abstract/baseServerAdapter.js +4 -1
package/dist/lib/server/adapters/fastifyAdapter.js +35 -30
package/dist/lib/services/server/ai/observability/instrumentation.d.ts +32 -0
package/dist/lib/services/server/ai/observability/instrumentation.js +39 -0
package/dist/lib/telemetry/attributes.d.ts +52 -0
package/dist/lib/telemetry/attributes.js +61 -0
package/dist/lib/telemetry/index.d.ts +3 -0
package/dist/lib/telemetry/index.js +3 -0
package/dist/lib/telemetry/telemetryService.d.ts +6 -0
package/dist/lib/telemetry/telemetryService.js +6 -0
package/dist/lib/telemetry/tracers.d.ts +15 -0
package/dist/lib/telemetry/tracers.js +17 -0
package/dist/lib/telemetry/withSpan.d.ts +9 -0
package/dist/lib/telemetry/withSpan.js +35 -0
package/dist/lib/types/contextTypes.d.ts +10 -0
package/dist/lib/types/streamTypes.d.ts +14 -0
package/dist/lib/utils/conversationMemory.js +121 -82
package/dist/lib/utils/logger.d.ts +5 -0
package/dist/lib/utils/logger.js +50 -2
package/dist/lib/utils/messageBuilder.js +22 -42
package/dist/lib/utils/modelDetection.js +3 -3
package/dist/lib/utils/providerRetry.d.ts +41 -0
package/dist/lib/utils/providerRetry.js +114 -0
package/dist/lib/utils/retryability.d.ts +14 -0
package/dist/lib/utils/retryability.js +23 -0
package/dist/lib/utils/sanitizers/svg.js +4 -5
package/dist/lib/utils/tokenEstimation.d.ts +11 -1
package/dist/lib/utils/tokenEstimation.js +19 -4
package/dist/lib/utils/videoAnalysisProcessor.js +7 -3
package/dist/mcp/externalServerManager.js +66 -0
package/dist/mcp/mcpCircuitBreaker.js +24 -0
package/dist/mcp/mcpClientFactory.js +16 -0
package/dist/mcp/toolDiscoveryService.js +32 -6
package/dist/mcp/toolRegistry.js +193 -123
package/dist/neurolink.d.ts +6 -0
package/dist/neurolink.js +1162 -646
package/dist/providers/amazonBedrock.d.ts +1 -1
package/dist/providers/amazonBedrock.js +521 -319
package/dist/providers/anthropic.js +73 -17
package/dist/providers/anthropicBaseProvider.js +77 -17
package/dist/providers/googleAiStudio.d.ts +1 -1
package/dist/providers/googleAiStudio.js +292 -227
package/dist/providers/googleVertex.d.ts +36 -1
package/dist/providers/googleVertex.js +553 -260
package/dist/providers/ollama.js +329 -278
package/dist/providers/openAI.js +77 -19
package/dist/providers/sagemaker/parsers.js +3 -3
package/dist/providers/sagemaker/streaming.js +3 -3
package/dist/proxy/proxyFetch.js +81 -48
package/dist/rag/ChunkerFactory.js +1 -1
package/dist/rag/chunkers/MarkdownChunker.d.ts +22 -0
package/dist/rag/chunkers/MarkdownChunker.js +213 -9
package/dist/rag/chunking/markdownChunker.d.ts +16 -0
package/dist/rag/chunking/markdownChunker.js +174 -2
package/dist/rag/pipeline/contextAssembly.js +2 -1
package/dist/rag/ragIntegration.d.ts +18 -1
package/dist/rag/ragIntegration.js +94 -14
package/dist/rag/retrieval/vectorQueryTool.js +21 -4
package/dist/server/abstract/baseServerAdapter.js +4 -1
package/dist/server/adapters/fastifyAdapter.js +35 -30
package/dist/services/server/ai/observability/instrumentation.d.ts +32 -0
package/dist/services/server/ai/observability/instrumentation.js +39 -0
package/dist/telemetry/attributes.d.ts +52 -0
package/dist/telemetry/attributes.js +60 -0
package/dist/telemetry/index.d.ts +3 -0
package/dist/telemetry/index.js +3 -0
package/dist/telemetry/telemetryService.d.ts +6 -0
package/dist/telemetry/telemetryService.js +6 -0
package/dist/telemetry/tracers.d.ts +15 -0
package/dist/telemetry/tracers.js +16 -0
package/dist/telemetry/withSpan.d.ts +9 -0
package/dist/telemetry/withSpan.js +34 -0
package/dist/types/contextTypes.d.ts +10 -0
package/dist/types/streamTypes.d.ts +14 -0
package/dist/utils/conversationMemory.js +121 -82
package/dist/utils/logger.d.ts +5 -0
package/dist/utils/logger.js +50 -2
package/dist/utils/messageBuilder.js +22 -42
package/dist/utils/modelDetection.js +3 -3
package/dist/utils/providerRetry.d.ts +41 -0
package/dist/utils/providerRetry.js +113 -0
package/dist/utils/retryability.d.ts +14 -0
package/dist/utils/retryability.js +22 -0
package/dist/utils/sanitizers/svg.js +4 -5
package/dist/utils/tokenEstimation.d.ts +11 -1
package/dist/utils/tokenEstimation.js +19 -4
package/dist/utils/videoAnalysisProcessor.js +7 -3
package/dist/workflow/config.d.ts +26 -26
package/package.json +1 -1

package/dist/core/modules/GenerationHandler.js CHANGED Viewed

@@ -13,9 +13,14 @@
  * @module core/modules/GenerationHandler
  */
 import { generateText, Output, NoObjectGeneratedError } from "ai";
+import { SpanKind, SpanStatusCode } from "@opentelemetry/api";
+import { tracers } from "../../telemetry/tracers.js";
 import { logger } from "../../utils/logger.js";
 import { extractTokenUsage, extractCacheCreationTokens, extractCacheReadTokens, calculateCacheSavingsPercent, } from "../../utils/tokenUtils.js";
+import { withProviderRetry } from "../../utils/providerRetry.js";
+import { calculateCost } from "../../utils/pricing.js";
 import { DEFAULT_MAX_STEPS } from "../constants.js";
+const genTracer = tracers.generation;
 /**
  * Safely preview-serialize a value for debug logging.
  * Handles undefined, circular references, and non-serializable values.
@@ -59,10 +64,14 @@ export class GenerationHandler {
         const isAnthropicProvider = this.providerName === "anthropic" ||
             this.providerName === "bedrock" ||
             (this.providerName === "vertex" && this.modelName?.startsWith("claude-"));
-        const useStructuredOutput = includeStructuredOutput &&
+        // Gemini 2.5 and earlier cannot use tools + structured JSON output simultaneously.
+        // When both are requested on a Google provider, disable structured output (tools take priority).
+        const wantsStructuredOutput = includeStructuredOutput &&
             !!options.schema &&
             (options.output?.format === "json" ||
                 options.output?.format === "structured");
+        const useStructuredOutput = wantsStructuredOutput &&
+            !(isGoogleProvider && shouldUseTools && Object.keys(tools).length > 0);
         // Annotate the last tool with cache_control so the full tool-definition
         // block becomes a cache breakpoint for Anthropic-family providers.
         // Non-Anthropic providers harmlessly ignore unknown providerOptions.
@@ -98,6 +107,7 @@ export class GenerationHandler {
             }),
             temperature: options.temperature,
             maxTokens: options.maxTokens,
+            maxRetries: 0, // NL11: Disable AI SDK's invisible internal retries; we handle retries with OTel instrumentation
             abortSignal: options.abortSignal,
             ...(useStructuredOutput &&
                 options.schema && {
@@ -153,108 +163,59 @@ export class GenerationHandler {
      * Execute the generation with AI SDK
      */
     async executeGeneration(model, messages, tools, options) {
-        const shouldUseTools = !options.disableTools && this.supportsToolsFn();
-        const useStructuredOutput = !!options.schema &&
-            (options.output?.format === "json" ||
-                options.output?.format === "structured");
-        const requestId = options.requestId ||
-            options.context?.requestId ||
-            "unknown";
-        logger.info("[GenerationHandler] Calling generateText", {
-            requestId,
-            model: model.modelId || "unknown",
-            messageCount: messages.length,
-            toolCount: Object.keys(tools || {}).length,
-            maxSteps: options.maxSteps,
-            temperature: options.temperature,
-        });
-        if (logger.shouldLog("debug")) {
-            try {
-                logger.debug("[Observability] Full generateText parameters", {
-                    requestId,
-                    model: model.modelId || "unknown",
-                    messageCount: messages.length,
-                    messages: messages.map((msg, i) => ({
-                        index: i,
-                        role: msg.role,
-                        contentLength: typeof msg.content === "string"
-                            ? msg.content.length
-                            : safePreview(msg.content).length,
-                        contentPreview: typeof msg.content === "string"
-                            ? msg.content.substring(0, 200)
-                            : "[multimodal]",
-                    })),
-                    toolNames: Object.keys(tools || {}),
-                    toolCount: Object.keys(tools || {}).length,
-                    maxSteps: options.maxSteps,
-                    temperature: options.temperature,
-                    maxTokens: options.maxTokens,
-                });
-            }
-            catch {
-                // Ignore serialization errors in debug logging
-            }
-        }
-        const genStartTime = Date.now();
-        try {
-            const result = await this.callGenerateText(model, messages, tools, options, shouldUseTools, true);
-            logger.info("[GenerationHandler] generateText returned", {
+        return genTracer.startActiveSpan("neurolink.executeGeneration", { kind: SpanKind.INTERNAL }, async (span) => {
+            const shouldUseTools = !options.disableTools && this.supportsToolsFn();
+            const toolCount = Object.keys(tools || {}).length;
+            const useStructuredOutput = !!options.schema &&
+                (options.output?.format === "json" ||
+                    options.output?.format === "structured");
+            span.setAttribute("gen_ai.system", this.providerName || "unknown");
+            span.setAttribute("neurolink.structured_output", useStructuredOutput);
+            span.setAttribute("neurolink.tool_count", toolCount);
+            span.setAttribute("neurolink.message_count", messages.length);
+            span.setAttribute("gen_ai.request.model", model.modelId || this.modelName || "unknown");
+            const requestId = options.requestId ||
+                options.context?.requestId ||
+                "unknown";
+            logger.info("[GenerationHandler] Calling generateText", {
                 requestId,
-                durationMs: Date.now() - genStartTime,
-                finishReason: result.finishReason,
-                steps: result.steps?.length || 1,
-                toolCallsTotal: result.toolCalls?.length || 0,
-                responseChars: result.text?.length || 0,
+                model: model.modelId || "unknown",
+                messageCount: messages.length,
+                toolCount,
+                maxSteps: options.maxSteps,
+                temperature: options.temperature,
             });
             if (logger.shouldLog("debug")) {
-                logger.debug("[Observability] Full LLM response", {
-                    requestId,
-                    finishReason: result.finishReason,
-                    responseTextPreview: result.text?.substring(0, 200) || "",
-                    responseTextLength: result.text?.length || 0,
-                    toolCalls: result.toolCalls?.map((tc) => ({
-                        toolName: tc.toolName,
-                        argsPreview: safePreview(tc.args),
-                    })),
-                    toolResults: result.toolResults?.map((tr) => ({
-                        toolName: tr.toolName,
-                        resultPreview: safePreview(tr.result),
-                    })),
-                    steps: result.steps?.map((step, i) => ({
-                        stepIndex: i,
-                        stepType: step.stepType,
-                        textPreview: step.text?.substring(0, 200),
-                        textLength: step.text?.length || 0,
-                        toolCalls: step.toolCalls?.map((tc) => ({
-                            toolName: tc.toolName,
-                            argsPreview: safePreview(tc.args),
+                try {
+                    logger.debug("[Observability] Full generateText parameters", {
+                        requestId,
+                        model: model.modelId || "unknown",
+                        messageCount: messages.length,
+                        messages: messages.map((msg, i) => ({
+                            index: i,
+                            role: msg.role,
+                            contentLength: typeof msg.content === "string"
+                                ? msg.content.length
+                                : safePreview(msg.content).length,
+                            contentPreview: typeof msg.content === "string"
+                                ? msg.content.substring(0, 200)
+                                : "[multimodal]",
                         })),
-                        toolResults: step.toolResults?.map((tr) => ({
-                            toolName: tr.toolName,
-                            resultPreview: safePreview(tr.result),
-                        })),
-                        finishReason: step.finishReason,
-                    })),
-                    usage: result.usage,
-                    providerMetadata: result.experimental_providerMetadata ||
-                        result.providerMetadata,
-                });
+                        toolNames: Object.keys(tools || {}),
+                        toolCount,
+                        maxSteps: options.maxSteps,
+                        temperature: options.temperature,
+                        maxTokens: options.maxTokens,
+                    });
+                }
+                catch {
+                    // Ignore serialization errors in debug logging
+                }
             }
-            return result;
-        }
-        catch (error) {
-            // If NoObjectGeneratedError is thrown when using schema + tools together,
-            // fall back to generating without experimental_output and extract JSON manually
-            if (error instanceof NoObjectGeneratedError && useStructuredOutput) {
-                logger.debug("[GenerationHandler] NoObjectGeneratedError caught - falling back to manual JSON extraction", {
-                    provider: this.providerName,
-                    model: this.modelName,
-                    error: error.message,
-                });
-                // Retry without experimental_output - the formatEnhancedResult method
-                // will extract JSON from the text response
-                const result = await this.callGenerateText(model, messages, tools, options, shouldUseTools, false);
-                logger.info("[GenerationHandler] generateText returned (fallback)", {
+            const genStartTime = Date.now();
+            try {
+                const result = await withProviderRetry(() => this.callGenerateText(model, messages, tools, options, shouldUseTools, true), span, "generateText");
+                logger.info("[GenerationHandler] generateText returned", {
                     requestId,
                     durationMs: Date.now() - genStartTime,
                     finishReason: result.finishReason,
@@ -262,11 +223,107 @@ export class GenerationHandler {
                     toolCallsTotal: result.toolCalls?.length || 0,
                     responseChars: result.text?.length || 0,
                 });
+                if (logger.shouldLog("debug")) {
+                    logger.debug("[Observability] LLM response metadata", {
+                        requestId,
+                        responseLength: result.text?.length || 0,
+                        hasToolCalls: !!(result.toolCalls && result.toolCalls.length > 0),
+                        toolCallCount: result.toolCalls?.length || 0,
+                        toolNames: result.toolCalls?.map((tc) => tc.toolName),
+                        finishReason: result.finishReason,
+                        stepCount: result.steps?.length || 0,
+                        steps: result.steps?.map((step, i) => ({
+                            stepIndex: i,
+                            stepType: step.stepType,
+                            textLength: step.text?.length || 0,
+                            toolCallCount: step.toolCalls?.length || 0,
+                            toolNames: step.toolCalls?.map((tc) => tc.toolName),
+                            toolResultCount: step.toolResults?.length || 0,
+                            finishReason: step.finishReason,
+                        })),
+                        usage: result.usage,
+                    });
+                }
+                // Set token usage and completion attributes on span
+                if (result.usage) {
+                    span.setAttribute("gen_ai.usage.input_tokens", result.usage.promptTokens || 0);
+                    span.setAttribute("gen_ai.usage.output_tokens", result.usage.completionTokens || 0);
+                    // Cost on span so users can query "what did this trace cost?"
+                    const cost = calculateCost(this.providerName, this.modelName, {
+                        input: result.usage.promptTokens || 0,
+                        output: result.usage.completionTokens || 0,
+                        total: (result.usage.promptTokens || 0) +
+                            (result.usage.completionTokens || 0),
+                    });
+                    span.setAttribute("neurolink.cost", cost ?? 0);
+                }
+                if (result.finishReason) {
+                    span.setAttribute("gen_ai.response.finish_reason", result.finishReason);
+                }
+                span.setStatus({ code: SpanStatusCode.OK });
                 return result;
             }
-            // Re-throw other errors
-            throw error;
-        }
+            catch (error) {
+                // If NoObjectGeneratedError is thrown when using schema + tools together,
+                // fall back to generating without experimental_output and extract JSON manually
+                if (error instanceof NoObjectGeneratedError && useStructuredOutput) {
+                    span.setAttribute("neurolink.has_fallback", true);
+                    // NLK-GAP-007: Record initial failure event before fallback retry
+                    span.addEvent("retry.initial_failure", {
+                        "error.message": error.message,
+                        "retry.attempt": 1,
+                        "retry.reason": "NoObjectGeneratedError_structured_output_fallback",
+                    });
+                    logger.debug("[GenerationHandler] NoObjectGeneratedError caught - falling back to manual JSON extraction", {
+                        provider: this.providerName,
+                        model: this.modelName,
+                        error: error.message,
+                    });
+                    // Retry without experimental_output - the formatEnhancedResult method
+                    // will extract JSON from the text response
+                    const result = await withProviderRetry(() => this.callGenerateText(model, messages, tools, options, shouldUseTools, false), span, "generateText(fallback)");
+                    // NLK-GAP-007: Record recovery event after successful fallback
+                    span.addEvent("retry.recovered", {
+                        "retry.attempts": 2,
+                        "retry.strategy": "structured_output_disabled",
+                    });
+                    span.setAttribute("retry.count", 1);
+                    logger.info("[GenerationHandler] generateText returned (fallback)", {
+                        requestId,
+                        durationMs: Date.now() - genStartTime,
+                        finishReason: result.finishReason,
+                        steps: result.steps?.length || 1,
+                        toolCallsTotal: result.toolCalls?.length || 0,
+                        responseChars: result.text?.length || 0,
+                    });
+                    if (result.usage) {
+                        span.setAttribute("gen_ai.usage.input_tokens", result.usage.promptTokens || 0);
+                        span.setAttribute("gen_ai.usage.output_tokens", result.usage.completionTokens || 0);
+                        const fallbackCost = calculateCost(this.providerName, this.modelName, {
+                            input: result.usage.promptTokens || 0,
+                            output: result.usage.completionTokens || 0,
+                            total: (result.usage.promptTokens || 0) +
+                                (result.usage.completionTokens || 0),
+                        });
+                        span.setAttribute("neurolink.cost", fallbackCost ?? 0);
+                    }
+                    if (result.finishReason) {
+                        span.setAttribute("gen_ai.response.finish_reason", result.finishReason);
+                    }
+                    span.setStatus({ code: SpanStatusCode.OK });
+                    return result;
+                }
+                span.setStatus({
+                    code: SpanStatusCode.ERROR,
+                    message: error instanceof Error ? error.message : String(error),
+                });
+                // Re-throw other errors
+                throw error;
+            }
+            finally {
+                span.end();
+            }
+        });
     }
     /**
      * Extract cache metrics from provider metadata (e.g. Anthropic's providerMetadata.anthropic)
@@ -297,21 +354,23 @@ export class GenerationHandler {
      */
     logGenerationComplete(generateResult) {
         const cacheMetrics = this.extractCacheMetricsFromProviderMetadata(generateResult);
-        logger.debug(`generateText completed`, {
-            provider: this.providerName,
-            model: this.modelName,
-            responseLength: generateResult.text?.length || 0,
-            toolResultsCount: generateResult.toolResults?.length || 0,
-            finishReason: generateResult.finishReason,
-            usage: generateResult.usage,
-            ...(cacheMetrics.cacheCreationTokens !== undefined && {
-                cacheCreationTokens: cacheMetrics.cacheCreationTokens,
-            }),
-            ...(cacheMetrics.cacheReadTokens !== undefined && {
-                cacheReadTokens: cacheMetrics.cacheReadTokens,
-            }),
-            timestamp: Date.now(),
-        });
+        if (logger.shouldLog("debug")) {
+            logger.debug(`generateText completed`, {
+                provider: this.providerName,
+                model: this.modelName,
+                responseLength: generateResult.text?.length || 0,
+                toolResultsCount: generateResult.toolResults?.length || 0,
+                finishReason: generateResult.finishReason,
+                usage: generateResult.usage,
+                ...(cacheMetrics.cacheCreationTokens !== undefined && {
+                    cacheCreationTokens: cacheMetrics.cacheCreationTokens,
+                }),
+                ...(cacheMetrics.cacheReadTokens !== undefined && {
+                    cacheReadTokens: cacheMetrics.cacheReadTokens,
+                }),
+                timestamp: Date.now(),
+            });
+        }
     }
     /**
      * Extract tool information from generation result