npm - @voltagent/core - Versions diffs - 2.6.8 → 2.6.11 - Mend

@voltagent/core 2.6.8 → 2.6.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

package/dist/index.d.mts +3 -0
package/dist/index.d.ts +3 -0
package/dist/index.js +313 -14
package/dist/index.js.map +1 -1
package/dist/index.mjs +313 -14
package/dist/index.mjs.map +1 -1
package/docs/{home.md → index.md} +1 -0
package/docs/observability-platform/llm-usage-and-costs.md +122 -2
package/docs/observability-platform/mcp.md +161 -0
package/docs/observability-platform/overview.md +2 -1
package/package.json +1 -1

package/dist/index.d.mts CHANGED Viewed

@@ -8796,6 +8796,7 @@ declare class Memory {
      * Get messages by their IDs
      */
     private getMessagesByIds;
+    private getMessageVectorIdsForClear;
     /**
      * Merge two arrays of messages, removing duplicates
      */
@@ -9405,6 +9406,7 @@ declare class Agent {
     private createLLMSpanFinalizer;
     private buildLLMSpanAttributes;
     private recordLLMUsage;
+    private recordProviderCost;
     private createEvalHost;
     /**
      * Get observability instance (lazy initialization)
@@ -9683,6 +9685,7 @@ declare class Agent {
      * Maps AI SDK's LanguageModelUsage to trace context format
      */
     private setTraceContextUsage;
+    private recordRootSpanUsageAndProviderCost;
     /**
      * Create working memory tools if configured
      */

package/dist/index.d.ts CHANGED Viewed

@@ -8796,6 +8796,7 @@ declare class Memory {
      * Get messages by their IDs
      */
     private getMessagesByIds;
+    private getMessageVectorIdsForClear;
     /**
      * Merge two arrays of messages, removing duplicates
      */
@@ -9405,6 +9406,7 @@ declare class Agent {
     private createLLMSpanFinalizer;
     private buildLLMSpanAttributes;
     private recordLLMUsage;
+    private recordProviderCost;
     private createEvalHost;
     /**
      * Get observability instance (lazy initialization)
@@ -9683,6 +9685,7 @@ declare class Agent {
      * Maps AI SDK's LanguageModelUsage to trace context format
      */
     private setTraceContextUsage;
+    private recordRootSpanUsageAndProviderCost;
     /**
      * Create working memory tools if configured
      */

package/dist/index.js CHANGED Viewed

@@ -5248,6 +5248,7 @@ __name(cosineSimilarity, "cosineSimilarity");
 // src/memory/index.ts
 var isEmbeddingAdapter = /* @__PURE__ */ __name((value) => typeof value === "object" && value !== null && "embed" in value && typeof value.embed === "function" && "embedBatch" in value && typeof value.embedBatch === "function", "isEmbeddingAdapter");
 var isEmbeddingAdapterConfig = /* @__PURE__ */ __name((value) => typeof value === "object" && value !== null && "model" in value && !isEmbeddingAdapter(value), "isEmbeddingAdapterConfig");
+var VECTOR_CLEAR_CONVERSATION_PAGE_SIZE = 200;
 var resolveEmbeddingAdapter = /* @__PURE__ */ __name((embedding) => {
   if (!embedding) {
     return void 0;
@@ -5333,6 +5334,19 @@ var Memory = class {
    * Clear messages for a user
    */
   async clearMessages(userId, conversationId, context8) {
+    if (this.vector) {
+      try {
+        const vectorIds = await this.getMessageVectorIdsForClear(userId, conversationId);
+        if (vectorIds.length > 0) {
+          await this.vector.deleteBatch(vectorIds);
+        }
+      } catch (error) {
+        console.warn(
+          `Failed to delete vectors while clearing messages for user ${userId}${conversationId ? ` conversation ${conversationId}` : ""}:`,
+          error
+        );
+      }
+    }
     return this.storage.clearMessages(userId, conversationId, context8);
   }
   /**
@@ -5469,6 +5483,36 @@ var Memory = class {
     const ordered = messageIds.map((id) => byId.get(id)).filter((m) => Boolean(m));
     return ordered;
   }
+  async getMessageVectorIdsForClear(userId, conversationId) {
+    const vectorIds = /* @__PURE__ */ new Set();
+    if (conversationId) {
+      const messages = await this.storage.getMessages(userId, conversationId);
+      for (const message of messages) {
+        vectorIds.add(`msg_${conversationId}_${message.id}`);
+      }
+      return Array.from(vectorIds);
+    }
+    const totalConversations = await this.storage.countConversations({ userId });
+    let offset = 0;
+    while (offset < totalConversations) {
+      const conversations = await this.storage.queryConversations({
+        userId,
+        limit: VECTOR_CLEAR_CONVERSATION_PAGE_SIZE,
+        offset
+      });
+      for (const conversation of conversations) {
+        const messages = await this.storage.getMessages(userId, conversation.id);
+        for (const message of messages) {
+          vectorIds.add(`msg_${conversation.id}_${message.id}`);
+        }
+      }
+      if (conversations.length === 0) {
+        break;
+      }
+      offset += conversations.length;
+    }
+    return Array.from(vectorIds);
+  }
   /**
    * Merge two arrays of messages, removing duplicates
    */
@@ -24881,6 +24925,41 @@ function createScorerSpanAttributes(host, descriptor, config, storagePayload, me
   if (metrics.datasetMetadata?.datasetItemHash) {
     attributes["eval.dataset.item_hash"] = metrics.datasetMetadata.datasetItemHash;
   }
+  const judgeTelemetry = extractJudgeTelemetry(metrics.combinedMetadata);
+  if (judgeTelemetry?.modelName) {
+    attributes["ai.model.name"] = judgeTelemetry.modelName;
+    const provider = judgeTelemetry.modelName.includes("/") ? judgeTelemetry.modelName.split("/")[0] : void 0;
+    if (provider) {
+      attributes["ai.model.provider"] = provider;
+    }
+  }
+  if (judgeTelemetry?.promptTokens !== void 0) {
+    attributes["usage.prompt_tokens"] = judgeTelemetry.promptTokens;
+  }
+  if (judgeTelemetry?.completionTokens !== void 0) {
+    attributes["usage.completion_tokens"] = judgeTelemetry.completionTokens;
+  }
+  if (judgeTelemetry?.totalTokens !== void 0) {
+    attributes["usage.total_tokens"] = judgeTelemetry.totalTokens;
+  }
+  if (judgeTelemetry?.cachedTokens !== void 0) {
+    attributes["usage.cached_tokens"] = judgeTelemetry.cachedTokens;
+  }
+  if (judgeTelemetry?.reasoningTokens !== void 0) {
+    attributes["usage.reasoning_tokens"] = judgeTelemetry.reasoningTokens;
+  }
+  if (judgeTelemetry?.providerCost?.cost !== void 0) {
+    attributes["usage.cost"] = judgeTelemetry.providerCost.cost;
+  }
+  if (judgeTelemetry?.providerCost?.upstreamInferenceCost !== void 0) {
+    attributes["usage.cost_details.upstream_inference_cost"] = judgeTelemetry.providerCost.upstreamInferenceCost;
+  }
+  if (judgeTelemetry?.providerCost?.upstreamInferenceInputCost !== void 0) {
+    attributes["usage.cost_details.upstream_inference_input_cost"] = judgeTelemetry.providerCost.upstreamInferenceInputCost;
+  }
+  if (judgeTelemetry?.providerCost?.upstreamInferenceOutputCost !== void 0) {
+    attributes["usage.cost_details.upstream_inference_output_cost"] = judgeTelemetry.providerCost.upstreamInferenceOutputCost;
+  }
   if (storagePayload.userId) {
     attributes["user.id"] = storagePayload.userId;
   }
@@ -25763,6 +25842,64 @@ function extractErrorMessage(error) {
   }
 }
 __name(extractErrorMessage, "extractErrorMessage");
+function extractJudgeTelemetry(metadata) {
+  const record = isPlainRecord(metadata) ? metadata : void 0;
+  if (!record) {
+    return void 0;
+  }
+  const sources = [];
+  if (isPlainRecord(record.voltAgent)) {
+    sources.push(record.voltAgent);
+  }
+  if (isPlainRecord(record.scorer)) {
+    sources.push(record.scorer);
+  }
+  if (isPlainRecord(record.payload)) {
+    sources.push(record.payload);
+  }
+  for (const source of sources) {
+    const judge = isPlainRecord(source?.judge) ? source?.judge : void 0;
+    if (!judge) {
+      continue;
+    }
+    const usage = isPlainRecord(judge.usage) ? judge.usage : void 0;
+    const providerCost = isPlainRecord(judge.providerCost) ? judge.providerCost : void 0;
+    const telemetry = {
+      modelName: readString(judge.model),
+      promptTokens: readNumber(usage?.promptTokens),
+      completionTokens: readNumber(usage?.completionTokens),
+      totalTokens: readNumber(usage?.totalTokens),
+      cachedTokens: readNumber(usage?.cachedInputTokens ?? usage?.cachedTokens),
+      reasoningTokens: readNumber(usage?.reasoningTokens),
+      providerCost: providerCost ? {
+        cost: readNumber(providerCost.cost),
+        upstreamInferenceCost: readNumber(providerCost.upstreamInferenceCost),
+        upstreamInferenceInputCost: readNumber(providerCost.upstreamInferenceInputCost),
+        upstreamInferenceOutputCost: readNumber(providerCost.upstreamInferenceOutputCost)
+      } : void 0
+    };
+    if (telemetry.modelName || telemetry.promptTokens !== void 0 || telemetry.completionTokens !== void 0 || telemetry.totalTokens !== void 0 || telemetry.cachedTokens !== void 0 || telemetry.reasoningTokens !== void 0 || telemetry.providerCost?.cost !== void 0 || telemetry.providerCost?.upstreamInferenceCost !== void 0 || telemetry.providerCost?.upstreamInferenceInputCost !== void 0 || telemetry.providerCost?.upstreamInferenceOutputCost !== void 0) {
+      return telemetry;
+    }
+  }
+  return void 0;
+}
+__name(extractJudgeTelemetry, "extractJudgeTelemetry");
+function readString(value) {
+  return typeof value === "string" && value.length > 0 ? value : void 0;
+}
+__name(readString, "readString");
+function readNumber(value) {
+  if (typeof value === "number") {
+    return Number.isFinite(value) ? value : void 0;
+  }
+  if (typeof value === "string") {
+    const parsed = Number(value);
+    return Number.isFinite(parsed) ? parsed : void 0;
+  }
+  return void 0;
+}
+__name(readNumber, "readNumber");
 async function invokeEvalResultCallback(host, config, result) {
   if (!config.onResult) {
     return;
@@ -26315,6 +26452,10 @@ var AgentTraceContext = class {
 function addModelAttributesToSpan(span, modelName, options, defaultMaxOutputTokens, defaultTemperature) {
   if (!span) return;
   span.setAttribute("ai.model.name", modelName);
+  const provider = typeof modelName === "string" && modelName.includes("/") ? modelName.split("/")[0] : void 0;
+  if (provider) {
+    span.setAttribute("ai.model.provider", provider);
+  }
   const temperature = options?.temperature ?? options?.providerOptions?.temperature ?? defaultTemperature;
   if (temperature !== void 0 && typeof temperature === "number") {
     span.setAttribute("ai.model.temperature", temperature);
@@ -30028,6 +30169,7 @@ var DEFAULT_CONVERSATION_PERSISTENCE_OPTIONS = {
   flushOnToolResult: true
 };
 var isRecord4 = /* @__PURE__ */ __name((value) => typeof value === "object" && value !== null, "isRecord");
+var isPlainObject = /* @__PURE__ */ __name((value) => isRecord4(value) && !Array.isArray(value), "isPlainObject");
 var hasNonEmptyString2 = /* @__PURE__ */ __name((value) => typeof value === "string" && value.trim().length > 0, "hasNonEmptyString");
 var firstNonBlank = /* @__PURE__ */ __name((...values) => {
   for (const value of values) {
@@ -30045,6 +30187,79 @@ var firstDefined = /* @__PURE__ */ __name((...values) => {
   }
   return void 0;
 }, "firstDefined");
+var toFiniteNumber = /* @__PURE__ */ __name((value) => {
+  if (typeof value === "number") {
+    return Number.isFinite(value) ? value : void 0;
+  }
+  if (typeof value === "string") {
+    const parsed = Number(value);
+    return Number.isFinite(parsed) ? parsed : void 0;
+  }
+  return void 0;
+}, "toFiniteNumber");
+var toBoolean = /* @__PURE__ */ __name((value) => {
+  if (typeof value === "boolean") {
+    return value;
+  }
+  if (typeof value === "string") {
+    const normalized = value.trim().toLowerCase();
+    if (normalized === "true") return true;
+    if (normalized === "false") return false;
+  }
+  return void 0;
+}, "toBoolean");
+var extractOpenRouterUsageCost = /* @__PURE__ */ __name((providerMetadata) => {
+  if (!isPlainObject(providerMetadata)) {
+    return void 0;
+  }
+  const openRouterMetadata = isPlainObject(providerMetadata.openrouter) ? providerMetadata.openrouter : void 0;
+  const usage = openRouterMetadata && isPlainObject(openRouterMetadata.usage) ? openRouterMetadata.usage : void 0;
+  if (!usage) {
+    return void 0;
+  }
+  const costDetails = firstDefined(
+    isPlainObject(usage.costDetails) ? usage.costDetails : void 0,
+    isPlainObject(usage.cost_details) ? usage.cost_details : void 0
+  );
+  const result = {
+    cost: toFiniteNumber(usage.cost),
+    isByok: firstDefined(toBoolean(usage.isByok), toBoolean(usage.is_byok)),
+    upstreamInferenceCost: firstDefined(
+      toFiniteNumber(costDetails?.upstreamInferenceCost),
+      toFiniteNumber(costDetails?.upstream_inference_cost)
+    ),
+    upstreamInferenceInputCost: firstDefined(
+      toFiniteNumber(costDetails?.upstreamInferenceInputCost),
+      toFiniteNumber(costDetails?.upstream_inference_input_cost)
+    ),
+    upstreamInferenceOutputCost: firstDefined(
+      toFiniteNumber(costDetails?.upstreamInferenceOutputCost),
+      toFiniteNumber(costDetails?.upstream_inference_output_cost)
+    )
+  };
+  return Object.values(result).some((value) => value !== void 0) ? result : void 0;
+}, "extractOpenRouterUsageCost");
+var toLanguageModelUsage = /* @__PURE__ */ __name((value) => isPlainObject(value) ? value : void 0, "toLanguageModelUsage");
+var extractGenerationErrorDetails = /* @__PURE__ */ __name((error) => {
+  const metadata = isRecord4(error) && isPlainObject(error.metadata) ? error.metadata : void 0;
+  const originalError = isRecord4(error) ? error.originalError : void 0;
+  const usage = firstDefined(
+    isRecord4(error) ? toLanguageModelUsage(error.usage) : void 0,
+    metadata ? toLanguageModelUsage(metadata.usage) : void 0,
+    isRecord4(originalError) ? toLanguageModelUsage(originalError.usage) : void 0
+  );
+  const providerMetadata = firstDefined(
+    metadata?.providerMetadata,
+    isRecord4(error) ? error.providerMetadata : void 0,
+    isRecord4(originalError) ? originalError.providerMetadata : void 0
+  );
+  const finishReason = firstNonBlank(
+    isRecord4(error) ? error.finishReason : void 0,
+    metadata?.finishReason,
+    isRecord4(originalError) ? originalError.finishReason : void 0
+  );
+  return { usage, providerMetadata, finishReason };
+}, "extractGenerationErrorDetails");
 var isAssistantContentPart = /* @__PURE__ */ __name((value) => {
   if (!isRecord4(value)) {
     return false;
@@ -30604,7 +30819,7 @@ var Agent = class {
                       onStepFinish: this.createStepHandler(oc, options)
                     })
                   );
-                  this.ensureStructuredOutputGenerated({
+                  await this.ensureStructuredOutputGenerated({
                     result: response,
                     output,
                     tools,
@@ -30613,11 +30828,18 @@ var Agent = class {
                   const resolvedProviderUsage = response.usage ? await Promise.resolve(response.usage) : void 0;
                   finalizeLLMSpan(import_api16.SpanStatusCode.OK, {
                     usage: resolvedProviderUsage,
-                    finishReason: response.finishReason
+                    finishReason: response.finishReason,
+                    providerMetadata: response.providerMetadata
                   });
                   return response;
                 } catch (error) {
-                  finalizeLLMSpan(import_api16.SpanStatusCode.ERROR, { message: error.message });
+                  const errorDetails = extractGenerationErrorDetails(error);
+                  finalizeLLMSpan(import_api16.SpanStatusCode.ERROR, {
+                    message: error.message,
+                    usage: errorDetails.usage,
+                    finishReason: errorDetails.finishReason,
+                    providerMetadata: errorDetails.providerMetadata
+                  });
                   throw error;
                 }
               }, "run")
@@ -30635,6 +30857,11 @@ var Agent = class {
               usage: providerUsage,
               totalUsage: result.totalUsage
             });
+            this.recordRootSpanUsageAndProviderCost(
+              oc.traceContext,
+              usageForFinish,
+              result.providerMetadata
+            );
             const { toolCalls: aggregatedToolCalls, toolResults: aggregatedToolResults } = this.collectToolDataFromResult(result);
             const usageInfo = convertUsage(usageForFinish);
             const middlewareText = await runOutputMiddlewares(
@@ -30696,7 +30923,6 @@ var Agent = class {
                 text: finalText
               }
             );
-            this.setTraceContextUsage(oc.traceContext, usageForFinish);
             oc.traceContext.setOutput(finalText);
             oc.traceContext.setFinishReason(result.finishReason);
             if (result.steps && result.steps.length >= maxSteps) {
@@ -31170,14 +31396,19 @@ var Agent = class {
                   usage: providerUsage,
                   totalUsage: finalResult.totalUsage
                 });
+                this.recordRootSpanUsageAndProviderCost(
+                  oc.traceContext,
+                  usageForFinish,
+                  finalResult.providerMetadata
+                );
                 finalizeLLMSpan(import_api16.SpanStatusCode.OK, {
                   usage: providerUsage,
-                  finishReason: finalResult.finishReason
+                  finishReason: finalResult.finishReason,
+                  providerMetadata: finalResult.providerMetadata
                 });
                 if (!shouldDeferPersist && shouldPersistMemory) {
                   await persistQueue.flush(buffer, oc);
                 }
-                this.setTraceContextUsage(oc.traceContext, usageForFinish);
                 const usage = convertUsage(usageForFinish);
                 let finalText;
                 const bailedResult = oc.systemContext.get("bailedResult");
@@ -31279,7 +31510,8 @@ var Agent = class {
                 });
                 finalizeLLMSpan(import_api16.SpanStatusCode.OK, {
                   usage: usageForFinish,
-                  finishReason: finalResult.finishReason
+                  finishReason: finalResult.finishReason,
+                  providerMetadata: finalResult.providerMetadata
                 });
                 oc.traceContext.end("completed");
                 feedbackFinalizeRequested = true;
@@ -31735,6 +31967,11 @@ var Agent = class {
               usage: providerUsage,
               totalUsage: result.totalUsage
             });
+            this.recordRootSpanUsageAndProviderCost(
+              oc.traceContext,
+              usageForFinish,
+              result.providerMetadata
+            );
             const usageInfo = convertUsage(usageForFinish);
             const middlewareObject = await runOutputMiddlewares(
               result.object,
@@ -31782,7 +32019,6 @@ var Agent = class {
               };
               this.addStepToHistory(step, oc);
             }
-            this.setTraceContextUsage(oc.traceContext, usageForFinish);
             oc.traceContext.setOutput(finalObject);
             oc.output = finalObject;
             this.enqueueEvalScoring({
@@ -32090,6 +32326,11 @@ var Agent = class {
                     usage: providerUsage,
                     totalUsage: finalResult.totalUsage
                   });
+                  this.recordRootSpanUsageAndProviderCost(
+                    oc.traceContext,
+                    usageForFinish,
+                    finalResult.providerMetadata
+                  );
                   const usageInfo = convertUsage(usageForFinish);
                   let finalObject = finalResult.object;
                   if (guardrailSet.output.length > 0) {
@@ -32128,7 +32369,6 @@ var Agent = class {
                     };
                     this.addStepToHistory(step, oc);
                   }
-                  this.setTraceContextUsage(oc.traceContext, usageForFinish);
                   oc.traceContext.setOutput(finalObject);
                   oc.output = finalObject;
                   await this.getMergedHooks(options).onEnd?.({
@@ -32351,7 +32591,7 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
       toolResults: stepToolResults.length > 0 ? stepToolResults : result.toolResults ?? []
     };
   }
-  ensureStructuredOutputGenerated(params) {
+  async ensureStructuredOutputGenerated(params) {
     const { result, output, tools, maxSteps } = params;
     if (!output) {
       return;
@@ -32368,6 +32608,13 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
       const stepCount = result.steps?.length ?? 0;
       const finishReason = result.finishReason ?? "unknown";
       const reachedMaxSteps = stepCount >= maxSteps;
+      const providerMetadata = result.providerMetadata;
+      const providerUsage = result.usage ? await Promise.resolve(result.usage) : void 0;
+      const usageForFinish = resolveFinishUsage({
+        providerMetadata,
+        usage: providerUsage,
+        totalUsage: result.totalUsage
+      });
       const guidance = configuredToolCount > 0 || toolCalls.length > 0 ? "When tools are enabled, ensure the model emits a final non-tool response that matches the output schema, or split this into two calls (tools first, schema formatting second)." : "Ensure the model emits a final response that matches the requested output schema.";
       const maxStepHint = reachedMaxSteps ? ` Generation stopped after ${stepCount} steps (maxSteps=${maxSteps}).` : "";
       throw createVoltAgentError(
@@ -32381,7 +32628,9 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
             stepCount,
             maxSteps,
             configuredToolCount,
-            toolCallCount: toolCalls.length
+            toolCallCount: toolCalls.length,
+            usage: usageForFinish ? JSON.parse((0, import_utils33.safeStringify)(usageForFinish)) : void 0,
+            providerMetadata: providerMetadata !== void 0 ? JSON.parse((0, import_utils33.safeStringify)(providerMetadata)) : void 0
           }
         }
       );
@@ -32735,6 +32984,9 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
       if (details?.usage) {
         this.recordLLMUsage(span, details.usage);
       }
+      if (details?.providerMetadata !== void 0) {
+        this.recordProviderCost(span, details.providerMetadata);
+      }
       if (details?.finishReason) {
         span.setAttribute("llm.finish_reason", String(details.finishReason));
       }
@@ -32840,6 +33092,36 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
       span.setAttribute("llm.usage.total_tokens", totalTokens);
     }
   }
+  recordProviderCost(span, providerMetadata) {
+    const openRouterUsageCost = extractOpenRouterUsageCost(providerMetadata);
+    if (!openRouterUsageCost) {
+      return;
+    }
+    if (openRouterUsageCost.cost !== void 0) {
+      span.setAttribute("usage.cost", openRouterUsageCost.cost);
+    }
+    if (openRouterUsageCost.isByok !== void 0) {
+      span.setAttribute("usage.is_byok", openRouterUsageCost.isByok);
+    }
+    if (openRouterUsageCost.upstreamInferenceCost !== void 0) {
+      span.setAttribute(
+        "usage.cost_details.upstream_inference_cost",
+        openRouterUsageCost.upstreamInferenceCost
+      );
+    }
+    if (openRouterUsageCost.upstreamInferenceInputCost !== void 0) {
+      span.setAttribute(
+        "usage.cost_details.upstream_inference_input_cost",
+        openRouterUsageCost.upstreamInferenceInputCost
+      );
+    }
+    if (openRouterUsageCost.upstreamInferenceOutputCost !== void 0) {
+      span.setAttribute(
+        "usage.cost_details.upstream_inference_output_cost",
+        openRouterUsageCost.upstreamInferenceOutputCost
+      );
+    }
+  }
   createEvalHost() {
     return {
       id: this.id,
@@ -33044,7 +33326,8 @@ Metadata: ${(0, import_utils33.safeStringify)(metadata)}`;
           }
           finalizeLLMSpan(import_api16.SpanStatusCode.OK, {
             usage: resolvedUsage,
-            finishReason: result.finishReason
+            finishReason: result.finishReason,
+            providerMetadata: result.providerMetadata
           });
           return title || null;
         } catch (error) {
@@ -34824,7 +35107,8 @@ ${retrieverContext}`;
       const resolvedUsage = response.usage ? await Promise.resolve(response.usage) : void 0;
       finalizeLLMSpan(import_api16.SpanStatusCode.OK, {
         usage: resolvedUsage,
-        finishReason: response.finishReason
+        finishReason: response.finishReason,
+        providerMetadata: response.providerMetadata
       });
       return response;
     } catch (error) {
@@ -35255,7 +35539,18 @@ ${retrieverContext}`;
     if (!oc.isActive && oc.cancellationError) {
       throw oc.cancellationError;
     }
-    const voltagentError = createVoltAgentError(error);
+    const voltagentError = isVoltAgentError(error) ? error : createVoltAgentError(error);
+    const errorDetails = extractGenerationErrorDetails(voltagentError);
+    if (errorDetails.usage || errorDetails.providerMetadata !== void 0) {
+      this.recordRootSpanUsageAndProviderCost(
+        oc.traceContext,
+        errorDetails.usage,
+        errorDetails.providerMetadata
+      );
+    }
+    if (errorDetails.finishReason) {
+      oc.traceContext.setFinishReason(errorDetails.finishReason);
+    }
     oc.traceContext.end("error", error);
     const hooks = this.getMergedHooks(options);
     await hooks.onEnd?.({
@@ -35841,6 +36136,10 @@ ${retrieverContext}`;
       reasoningTokens: resolvedUsage.reasoningTokens
     });
   }
+  recordRootSpanUsageAndProviderCost(traceContext, usage, providerMetadata) {
+    this.setTraceContextUsage(traceContext, usage);
+    this.recordProviderCost(traceContext.getRootSpan(), providerMetadata);
+  }
   /**
    * Create working memory tools if configured
    */