npm - retrace-sdk - Versions diffs - 0.11.1 → 0.11.3 - Mend

retrace-sdk 0.11.1 → 0.11.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/dist/interceptors/anthropic.js +33 -21
package/dist/interceptors/gemini.js +2 -2
package/dist/interceptors/openai.js +37 -22
package/dist/replay.d.ts +3 -0
package/package.json +2 -2

package/dist/interceptors/anthropic.js CHANGED Viewed

@@ -2,6 +2,7 @@ import { SpanType } from "../trace.js";
 import { genId, nowIso, truncateJson } from "../utils.js";
 import { isReplaying, consumeCassetteEntry } from "../replay.js";
 import { emitAnthropicToolCalls, emitAnthropicToolResults, parseToolArgs, resetToolResultDedup, extractToolSchemas, extractSamplingParams } from "./tool-spans.js";
+import { dispatchRegisterOpenSpan, dispatchUnregisterOpenSpan } from "./_dispatch.js";
 const PRICING = {
     "claude-opus-4.7": [5.0, 25.0],
     "claude-opus-4.6": [5.0, 25.0],
@@ -63,7 +64,7 @@ function createPatchedCreate() {
         if (isReplaying()) {
             const entry = consumeCassetteEntry("anthropic.messages.create", "llm_call");
             if (entry) {
-                const output = typeof entry.output === "string" ? entry.output : JSON.stringify(entry.output || "");
+                const output = entry.output_raw ?? (typeof entry.output === "string" ? entry.output : JSON.stringify(entry.output || ""));
                 const span = {
                     id: spanId, trace_id: "", parent_id: null,
                     span_type: SpanType.LLM_CALL, name: "anthropic.messages.create", model,
@@ -93,30 +94,41 @@ function createPatchedCreate() {
                 const toolAcc = {};
                 // eslint-disable-next-line @typescript-eslint/no-explicit-any
                 const originalIterator = result[Symbol.asyncIterator]();
+                // Two-phase capture: finalize EXACTLY ONCE on clean drain (complete), early break / error
+                // (partial), or trace-end/exit (partial, via the sink) — never silently drop the span.
+                let finalized = false;
+                const finalize = (reason) => {
+                    if (finalized)
+                        return;
+                    finalized = true;
+                    dispatchUnregisterOpenSpan(spanId);
+                    const durationMs = Date.now() - startMs;
+                    const output = chunks.join("");
+                    const span = {
+                        id: spanId, trace_id: "", parent_id: null,
+                        span_type: SpanType.LLM_CALL, name: "anthropic.messages.create", model,
+                        input: truncateJson({ messages: messages.slice(0, 10) }),
+                        output: truncateJson(output),
+                        input_tokens: inputTokens, output_tokens: outputTokens,
+                        cost: calcCost(model, inputTokens, outputTokens),
+                        duration_ms: durationMs, started_at: startedAt, ended_at: nowIso(),
+                        metadata: { streaming: true, ...(reason === "partial" ? { partial: true } : {}), ...spanMeta },
+                    };
+                    onSpanCallback?.(span);
+                    if (onSpanCallback && reason === "complete") {
+                        emitAnthropicToolResults(messages, onSpanCallback);
+                        const blocks = Object.values(toolAcc).map((t) => ({ type: "tool_use", id: t.id, name: t.name, input: parseToolArgs(t.json) }));
+                        emitAnthropicToolCalls(blocks, spanId, model, onSpanCallback);
+                    }
+                };
+                dispatchRegisterOpenSpan(spanId, () => finalize("partial"));
                 const wrappedStream = {
                     [Symbol.asyncIterator]() {
                         return {
                             async next() {
                                 const { value, done } = await originalIterator.next();
                                 if (done) {
-                                    const durationMs = Date.now() - startMs;
-                                    const output = chunks.join("");
-                                    const span = {
-                                        id: spanId, trace_id: "", parent_id: null,
-                                        span_type: SpanType.LLM_CALL, name: "anthropic.messages.create", model,
-                                        input: truncateJson({ messages: messages.slice(0, 10) }),
-                                        output: truncateJson(output),
-                                        input_tokens: inputTokens, output_tokens: outputTokens,
-                                        cost: calcCost(model, inputTokens, outputTokens),
-                                        duration_ms: durationMs, started_at: startedAt, ended_at: nowIso(),
-                                        metadata: { streaming: true, ...spanMeta },
-                                    };
-                                    onSpanCallback?.(span);
-                                    if (onSpanCallback) {
-                                        emitAnthropicToolResults(messages, onSpanCallback);
-                                        const blocks = Object.values(toolAcc).map((t) => ({ type: "tool_use", id: t.id, name: t.name, input: parseToolArgs(t.json) }));
-                                        emitAnthropicToolCalls(blocks, spanId, model, onSpanCallback);
-                                    }
+                                    finalize("complete");
                                     return { value: undefined, done: true };
                                 }
                                 // Collect content_block_delta text
@@ -142,8 +154,8 @@ function createPatchedCreate() {
                                 }
                                 return { value, done: false };
                             },
-                            return() { return originalIterator.return?.() ?? Promise.resolve({ value: undefined, done: true }); },
-                            throw(e) { return originalIterator.throw?.(e) ?? Promise.reject(e); },
+                            return() { finalize("partial"); return originalIterator.return?.() ?? Promise.resolve({ value: undefined, done: true }); },
+                            throw(e) { finalize("partial"); return originalIterator.throw?.(e) ?? Promise.reject(e); },
                         };
                     },
                 };

package/dist/interceptors/gemini.js CHANGED Viewed

@@ -45,7 +45,7 @@ function wrapGenerate(original) {
         if (isReplaying()) {
             const entry = consumeCassetteEntry("retrace.ai.generate", "llm_call");
             if (entry) {
-                return { text: entry.output || "", usageMetadata: { promptTokenCount: 0, candidatesTokenCount: 0 }, candidates: [] };
+                return { text: entry.output_raw ?? (entry.output || ""), usageMetadata: { promptTokenCount: 0, candidatesTokenCount: 0 }, candidates: [] };
             }
         }
         try {
@@ -104,7 +104,7 @@ function wrapStream(original) {
         if (isReplaying()) {
             const entry = consumeCassetteEntry("retrace.ai.generate", "llm_call");
             if (entry) {
-                const text = entry.output || "";
+                const text = entry.output_raw ?? (entry.output || "");
                 async function* mockStream() { yield { text, usageMetadata: { promptTokenCount: 0, candidatesTokenCount: 0 } }; }
                 return mockStream();
             }

package/dist/interceptors/openai.js CHANGED Viewed

@@ -4,6 +4,7 @@ import { isReplaying, consumeCassetteEntry } from "../replay.js";
 import { getConfig } from "../config.js";
 import { RetraceRateLimitError, RetraceAuthError, RetraceConnectionError } from "../errors.js";
 import { emitOpenAIToolCalls, emitOpenAIToolResults, parseToolArgs, resetToolResultDedup, extractToolSchemas, extractSamplingParams } from "./tool-spans.js";
+import { dispatchRegisterOpenSpan, dispatchUnregisterOpenSpan } from "./_dispatch.js";
 /** Hardcoded fallback pricing ($/1M tokens: [input, output]). Updated periodically. */
 const FALLBACK_PRICING = {
     "gpt-5.5-pro": [30.0, 180.0],
@@ -120,7 +121,7 @@ function createPatchedCreate() {
         if (isReplaying()) {
             const entry = consumeCassetteEntry("openai.chat.completions.create", "llm_call");
             if (entry) {
-                const output = typeof entry.output === "string" ? entry.output : JSON.stringify(entry.output || "");
+                const output = entry.output_raw ?? (typeof entry.output === "string" ? entry.output : JSON.stringify(entry.output || ""));
                 const span = {
                     id: spanId, trace_id: "", parent_id: null,
                     span_type: SpanType.LLM_CALL, name: "openai.chat.completions.create", model,
@@ -151,31 +152,43 @@ function createPatchedCreate() {
                 const toolAcc = {};
                 // eslint-disable-next-line @typescript-eslint/no-explicit-any
                 const originalIterator = result[Symbol.asyncIterator]();
+                // Two-phase capture: register an OPEN span now and finalize EXACTLY ONCE — on clean drain
+                // (complete), on early break / error (partial), or at trace-end/exit (partial, via the sink).
+                // Previously the span was emitted only in the `done` branch, so an abandoned or errored
+                // stream silently lost its span entirely.
+                let finalized = false;
+                const finalize = (reason) => {
+                    if (finalized)
+                        return;
+                    finalized = true;
+                    dispatchUnregisterOpenSpan(spanId);
+                    const durationMs = Date.now() - startMs;
+                    const output = chunks.join("");
+                    const span = {
+                        id: spanId, trace_id: "", parent_id: null,
+                        span_type: SpanType.LLM_CALL, name: "openai.chat.completions.create", model,
+                        input: truncateJson({ messages: messages.slice(0, 10) }),
+                        output: truncateJson(output),
+                        input_tokens: inputTokens, output_tokens: outputTokens,
+                        cost: calcCost(model, inputTokens, outputTokens),
+                        duration_ms: durationMs, started_at: startedAt, ended_at: nowIso(),
+                        metadata: { streaming: true, ...(reason === "partial" ? { partial: true } : {}), ...(toolSchemas ? { tool_schemas: toolSchemas } : {}), ...(sampling ? { sampling } : {}) },
+                    };
+                    onSpanCallback?.(span);
+                    if (onSpanCallback && reason === "complete") {
+                        emitOpenAIToolResults(messages, onSpanCallback);
+                        const accMsg = { tool_calls: Object.values(toolAcc).map((t) => ({ id: t.id, function: { name: t.name, arguments: parseToolArgs(t.args) } })) };
+                        emitOpenAIToolCalls(accMsg, spanId, model, onSpanCallback);
+                    }
+                };
+                dispatchRegisterOpenSpan(spanId, () => finalize("partial"));
                 const wrappedStream = {
                     [Symbol.asyncIterator]() {
                         return {
                             async next() {
                                 const { value, done } = await originalIterator.next();
                                 if (done) {
-                                    // Stream complete — emit span
-                                    const durationMs = Date.now() - startMs;
-                                    const output = chunks.join("");
-                                    const span = {
-                                        id: spanId, trace_id: "", parent_id: null,
-                                        span_type: SpanType.LLM_CALL, name: "openai.chat.completions.create", model,
-                                        input: truncateJson({ messages: messages.slice(0, 10) }),
-                                        output: truncateJson(output),
-                                        input_tokens: inputTokens, output_tokens: outputTokens,
-                                        cost: calcCost(model, inputTokens, outputTokens),
-                                        duration_ms: durationMs, started_at: startedAt, ended_at: nowIso(),
-                                        metadata: { streaming: true, ...(toolSchemas ? { tool_schemas: toolSchemas } : {}), ...(sampling ? { sampling } : {}) },
-                                    };
-                                    onSpanCallback?.(span);
-                                    if (onSpanCallback) {
-                                        emitOpenAIToolResults(messages, onSpanCallback);
-                                        const accMsg = { tool_calls: Object.values(toolAcc).map((t) => ({ id: t.id, function: { name: t.name, arguments: parseToolArgs(t.args) } })) };
-                                        emitOpenAIToolCalls(accMsg, spanId, model, onSpanCallback);
-                                    }
+                                    finalize("complete");
                                     return { value: undefined, done: true };
                                 }
                                 // Collect content delta
@@ -203,8 +216,10 @@ function createPatchedCreate() {
                                 }
                                 return { value, done: false };
                             },
-                            return() { return originalIterator.return?.() ?? Promise.resolve({ value: undefined, done: true }); },
-                            throw(e) { return originalIterator.throw?.(e) ?? Promise.reject(e); },
+                            // Early break (consumer stops iterating) and errors must still finalize the span —
+                            // otherwise the streamed work is silently lost.
+                            return() { finalize("partial"); return originalIterator.return?.() ?? Promise.resolve({ value: undefined, done: true }); },
+                            throw(e) { finalize("partial"); return originalIterator.throw?.(e) ?? Promise.reject(e); },
                         };
                     },
                     // Preserve tee/controller methods if present

package/dist/replay.d.ts CHANGED Viewed

@@ -16,6 +16,9 @@ export interface CassetteEntry {
     model: string | null;
     input: unknown;
     output: unknown;
+    /** Exact original token for byte-identical replay (e.g. scalar-numeric outputs whose JSON.parse
+     *  form lost precision). Preferred over `output` when present. */
+    output_raw?: string;
     error: string | null;
 }
 export interface ReplayCommand {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "retrace-sdk",
-  "version": "0.11.1",
+  "version": "0.11.3",
   "description": "The execution replay engine for AI agents. Record, replay, fork, and share agent executions.",
   "type": "module",
   "main": "dist/index.js",
@@ -40,7 +40,7 @@
     "prepublishOnly": "npm run build"
   },
   "dependencies": {
-    "ws": "8.20.0"
+    "ws": "^8.20.1"
   },
   "peerDependencies": {
     "@google/genai": ">=1.52.0",