npm - @evalgate/sdk - Versions diffs - 2.2.2 → 2.2.4 - Mend

@evalgate/sdk 2.2.2 → 2.2.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (61) hide show

package/CHANGELOG.md +32 -0
package/README.md +40 -1
package/dist/assertions.d.ts +194 -10
package/dist/assertions.js +525 -73
package/dist/batch.js +4 -4
package/dist/cache.d.ts +5 -1
package/dist/cache.js +5 -1
package/dist/cli/baseline.d.ts +14 -0
package/dist/cli/baseline.js +43 -3
package/dist/cli/check.d.ts +5 -2
package/dist/cli/check.js +20 -12
package/dist/cli/compare.d.ts +80 -0
package/dist/cli/compare.js +266 -0
package/dist/cli/index.js +244 -101
package/dist/cli/regression-gate.js +23 -0
package/dist/cli/run.js +22 -0
package/dist/cli/start.d.ts +26 -0
package/dist/cli/start.js +130 -0
package/dist/cli/templates.d.ts +24 -0
package/dist/cli/templates.js +314 -0
package/dist/cli/traces.d.ts +109 -0
package/dist/cli/traces.js +152 -0
package/dist/cli/upgrade.js +5 -0
package/dist/cli/validate.d.ts +37 -0
package/dist/cli/validate.js +252 -0
package/dist/cli/watch.d.ts +19 -0
package/dist/cli/watch.js +175 -0
package/dist/client.js +6 -13
package/dist/constants.d.ts +2 -0
package/dist/constants.js +5 -0
package/dist/errors.js +7 -0
package/dist/export.js +2 -2
package/dist/index.d.ts +10 -9
package/dist/index.js +24 -7
package/dist/integrations/anthropic.js +6 -6
package/dist/integrations/openai.js +84 -61
package/dist/logger.d.ts +3 -1
package/dist/logger.js +2 -1
package/dist/otel.d.ts +130 -0
package/dist/otel.js +309 -0
package/dist/pagination.d.ts +13 -2
package/dist/pagination.js +28 -2
package/dist/runtime/adapters/testsuite-to-dsl.js +1 -6
package/dist/runtime/eval.d.ts +14 -4
package/dist/runtime/eval.js +127 -2
package/dist/runtime/executor.d.ts +3 -2
package/dist/runtime/executor.js +3 -2
package/dist/runtime/registry.d.ts +8 -3
package/dist/runtime/registry.js +15 -4
package/dist/runtime/run-report.d.ts +1 -1
package/dist/runtime/run-report.js +7 -4
package/dist/runtime/types.d.ts +38 -0
package/dist/snapshot.d.ts +12 -0
package/dist/snapshot.js +24 -1
package/dist/testing.d.ts +8 -0
package/dist/testing.js +45 -10
package/dist/version.d.ts +2 -2
package/dist/version.js +2 -2
package/dist/workflows.d.ts +2 -0
package/dist/workflows.js +184 -102
package/package.json +8 -1

package/dist/index.js CHANGED Viewed

@@ -8,8 +8,9 @@
  * @packageDocumentation
  */
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.defaultLocalExecutor = exports.createLocalExecutor = exports.evalai = exports.defineSuite = exports.defineEval = exports.createResult = exports.createEvalContext = exports.validateContext = exports.mergeContexts = exports.cloneContext = exports.ContextManager = exports.withContext = exports.getContext = exports.createContext = exports.withinRange = exports.similarTo = exports.respondedWithinTime = exports.notContainsPII = exports.matchesSchema = exports.matchesPattern = exports.isValidURL = exports.isValidEmail = exports.hasValidCodeSyntaxAsync = exports.hasValidCodeSyntax = exports.hasSentimentAsync = exports.hasSentiment = exports.hasReadabilityScore = exports.hasPII = exports.hasNoToxicityAsync = exports.hasNoToxicity = exports.hasNoHallucinationsAsync = exports.hasNoHallucinations = exports.hasLength = exports.hasFactualAccuracyAsync = exports.hasFactualAccuracy = exports.getAssertionConfig = exports.followsInstructions = exports.expect = exports.containsLanguageAsync = exports.containsLanguage = exports.containsKeywords = exports.containsJSON = exports.containsAllRequiredFields = exports.configureAssertions = exports.NetworkError = exports.ValidationError = exports.AuthenticationError = exports.RateLimitError = exports.EvalGateError = exports.AIEvalClient = void 0;
-exports.WorkflowTracer = exports.traceWorkflowStep = exports.traceLangChainAgent = exports.traceCrewAI = exports.traceAutoGen = exports.createWorkflowTracer = exports.EvaluationTemplates = exports.streamEvaluation = exports.RateLimiter = exports.batchRead = exports.batchProcess = exports.REPORT_SCHEMA_VERSION = exports.GATE_EXIT = exports.GATE_CATEGORY = exports.ARTIFACTS = exports.PaginatedIterator = exports.encodeCursor = exports.decodeCursor = exports.createPaginatedIterator = exports.autoPaginate = exports.extendExpectWithToPassGate = exports.Logger = exports.openAIChatEval = exports.traceOpenAI = exports.traceAnthropic = exports.runCheck = exports.parseArgs = exports.EXIT = exports.RequestCache = exports.CacheTTL = exports.RequestBatcher = exports.importData = exports.exportData = exports.compareSnapshots = exports.saveSnapshot = exports.compareWithSnapshot = exports.snapshot = exports.TestSuite = exports.createTestSuite = exports.SpecRegistrationError = exports.SpecExecutionError = exports.RuntimeError = exports.EvalRuntimeError = exports.setActiveRuntime = exports.getActiveRuntime = exports.disposeActiveRuntime = exports.createEvalRuntime = void 0;
+exports.validateContext = exports.mergeContexts = exports.cloneContext = exports.ContextManager = exports.withContext = exports.getContext = exports.createContext = exports.SDKError = exports.withinRange = exports.toSemanticallyContain = exports.similarTo = exports.respondedWithinTimeSince = exports.respondedWithinTime = exports.respondedWithinDuration = exports.notContainsPII = exports.matchesSchema = exports.matchesPattern = exports.isValidURL = exports.isValidEmail = exports.hasValidCodeSyntaxAsync = exports.hasValidCodeSyntax = exports.hasSentimentWithScore = exports.hasSentimentAsync = exports.hasSentiment = exports.hasReadabilityScore = exports.hasPII = exports.hasNoToxicityAsync = exports.hasNoToxicity = exports.hasNoHallucinationsAsync = exports.hasNoHallucinations = exports.hasLength = exports.hasFactualAccuracyAsync = exports.hasFactualAccuracy = exports.hasConsistencyAsync = exports.hasConsistency = exports.getAssertionConfig = exports.followsInstructions = exports.expect = exports.containsLanguageAsync = exports.containsLanguage = exports.containsKeywords = exports.containsJSON = exports.containsAllRequiredFields = exports.configureAssertions = exports.NetworkError = exports.ValidationError = exports.AuthenticationError = exports.RateLimitError = exports.EvalGateError = exports.AIEvalClient = void 0;
+exports.streamEvaluation = exports.RateLimiter = exports.batchRead = exports.batchProcess = exports.REPORT_SCHEMA_VERSION = exports.GATE_EXIT = exports.GATE_CATEGORY = exports.ARTIFACTS = exports.PaginatedIterator = exports.encodeCursor = exports.decodeCursor = exports.createPaginatedIterator = exports.autoPaginateGenerator = exports.autoPaginate = exports.OTelExporter = exports.createOTelExporter = exports.extendExpectWithToPassGate = exports.Logger = exports.openAIChatEval = exports.traceOpenAI = exports.traceAnthropic = exports.runCheck = exports.parseArgs = exports.EXIT = exports.CacheTTL = exports.RequestBatcher = exports.importData = exports.exportData = exports.saveSnapshot = exports.compareSnapshots = exports.compareWithSnapshot = exports.snapshot = exports.TestSuite = exports.createTestSuite = exports.SpecRegistrationError = exports.SpecExecutionError = exports.RuntimeError = exports.EvalRuntimeError = exports.setActiveRuntime = exports.getActiveRuntime = exports.disposeActiveRuntime = exports.createEvalRuntime = exports.defaultLocalExecutor = exports.createLocalExecutor = exports.getFilteredSpecs = exports.evalai = exports.defineSuite = exports.defineEval = exports.createResult = exports.createEvalContext = void 0;
+exports.WorkflowTracer = exports.traceWorkflowStep = exports.traceLangChainAgent = exports.traceCrewAI = exports.traceAutoGen = exports.createWorkflowTracer = exports.EvaluationTemplates = void 0;
 // Main SDK exports
 var client_1 = require("./client");
 Object.defineProperty(exports, "AIEvalClient", { enumerable: true, get: function () { return client_1.AIEvalClient; } });
@@ -19,7 +20,7 @@ Object.defineProperty(exports, "AuthenticationError", { enumerable: true, get: f
 Object.defineProperty(exports, "EvalGateError", { enumerable: true, get: function () { return errors_1.EvalGateError; } });
 Object.defineProperty(exports, "NetworkError", { enumerable: true, get: function () { return errors_1.NetworkError; } });
 Object.defineProperty(exports, "RateLimitError", { enumerable: true, get: function () { return errors_1.RateLimitError; } });
-Object.defineProperty(exports, "ValidationError", { enumerable: true, get: function () { return errors_1.SDKError; } });
+Object.defineProperty(exports, "ValidationError", { enumerable: true, get: function () { return errors_1.ValidationError; } });
 // Enhanced assertions (Tier 1.3)
 var assertions_1 = require("./assertions");
 // LLM config
@@ -33,6 +34,8 @@ Object.defineProperty(exports, "containsLanguageAsync", { enumerable: true, get:
 Object.defineProperty(exports, "expect", { enumerable: true, get: function () { return assertions_1.expect; } });
 Object.defineProperty(exports, "followsInstructions", { enumerable: true, get: function () { return assertions_1.followsInstructions; } });
 Object.defineProperty(exports, "getAssertionConfig", { enumerable: true, get: function () { return assertions_1.getAssertionConfig; } });
+Object.defineProperty(exports, "hasConsistency", { enumerable: true, get: function () { return assertions_1.hasConsistency; } });
+Object.defineProperty(exports, "hasConsistencyAsync", { enumerable: true, get: function () { return assertions_1.hasConsistencyAsync; } });
 Object.defineProperty(exports, "hasFactualAccuracy", { enumerable: true, get: function () { return assertions_1.hasFactualAccuracy; } });
 Object.defineProperty(exports, "hasFactualAccuracyAsync", { enumerable: true, get: function () { return assertions_1.hasFactualAccuracyAsync; } });
 Object.defineProperty(exports, "hasLength", { enumerable: true, get: function () { return assertions_1.hasLength; } });
@@ -44,6 +47,7 @@ Object.defineProperty(exports, "hasPII", { enumerable: true, get: function () {
 Object.defineProperty(exports, "hasReadabilityScore", { enumerable: true, get: function () { return assertions_1.hasReadabilityScore; } });
 Object.defineProperty(exports, "hasSentiment", { enumerable: true, get: function () { return assertions_1.hasSentiment; } });
 Object.defineProperty(exports, "hasSentimentAsync", { enumerable: true, get: function () { return assertions_1.hasSentimentAsync; } });
+Object.defineProperty(exports, "hasSentimentWithScore", { enumerable: true, get: function () { return assertions_1.hasSentimentWithScore; } });
 Object.defineProperty(exports, "hasValidCodeSyntax", { enumerable: true, get: function () { return assertions_1.hasValidCodeSyntax; } });
 Object.defineProperty(exports, "hasValidCodeSyntaxAsync", { enumerable: true, get: function () { return assertions_1.hasValidCodeSyntaxAsync; } });
 Object.defineProperty(exports, "isValidEmail", { enumerable: true, get: function () { return assertions_1.isValidEmail; } });
@@ -51,9 +55,15 @@ Object.defineProperty(exports, "isValidURL", { enumerable: true, get: function (
 Object.defineProperty(exports, "matchesPattern", { enumerable: true, get: function () { return assertions_1.matchesPattern; } });
 Object.defineProperty(exports, "matchesSchema", { enumerable: true, get: function () { return assertions_1.matchesSchema; } });
 Object.defineProperty(exports, "notContainsPII", { enumerable: true, get: function () { return assertions_1.notContainsPII; } });
+Object.defineProperty(exports, "respondedWithinDuration", { enumerable: true, get: function () { return assertions_1.respondedWithinDuration; } });
 Object.defineProperty(exports, "respondedWithinTime", { enumerable: true, get: function () { return assertions_1.respondedWithinTime; } });
+Object.defineProperty(exports, "respondedWithinTimeSince", { enumerable: true, get: function () { return assertions_1.respondedWithinTimeSince; } });
 Object.defineProperty(exports, "similarTo", { enumerable: true, get: function () { return assertions_1.similarTo; } });
+Object.defineProperty(exports, "toSemanticallyContain", { enumerable: true, get: function () { return assertions_1.toSemanticallyContain; } });
 Object.defineProperty(exports, "withinRange", { enumerable: true, get: function () { return assertions_1.withinRange; } });
+// Legacy backward compat — SDKError is the old name for EvalGateError
+var errors_2 = require("./errors");
+Object.defineProperty(exports, "SDKError", { enumerable: true, get: function () { return errors_2.EvalGateError; } });
 // Context propagation (Tier 2.9)
 const context_1 = require("./context");
 Object.defineProperty(exports, "createContext", { enumerable: true, get: function () { return context_1.createContext; } });
@@ -71,6 +81,7 @@ Object.defineProperty(exports, "createResult", { enumerable: true, get: function
 Object.defineProperty(exports, "defineEval", { enumerable: true, get: function () { return eval_1.defineEval; } });
 Object.defineProperty(exports, "defineSuite", { enumerable: true, get: function () { return eval_1.defineSuite; } });
 Object.defineProperty(exports, "evalai", { enumerable: true, get: function () { return eval_1.evalai; } });
+Object.defineProperty(exports, "getFilteredSpecs", { enumerable: true, get: function () { return eval_1.getFilteredSpecs; } });
 var executor_1 = require("./runtime/executor");
 Object.defineProperty(exports, "createLocalExecutor", { enumerable: true, get: function () { return executor_1.createLocalExecutor; } });
 Object.defineProperty(exports, "defaultLocalExecutor", { enumerable: true, get: function () { return executor_1.defaultLocalExecutor; } });
@@ -91,8 +102,8 @@ Object.defineProperty(exports, "createTestSuite", { enumerable: true, get: funct
 Object.defineProperty(exports, "TestSuite", { enumerable: true, get: function () { return testing_1.TestSuite; } });
 // Snapshot testing (Tier 2.8)
 const snapshot_1 = require("./snapshot");
+Object.defineProperty(exports, "compareSnapshots", { enumerable: true, get: function () { return snapshot_1.compareSnapshots; } });
 Object.defineProperty(exports, "compareWithSnapshot", { enumerable: true, get: function () { return snapshot_1.compareWithSnapshot; } });
-Object.defineProperty(exports, "compareSnapshots", { enumerable: true, get: function () { return snapshot_1.compareWithSnapshot; } });
 Object.defineProperty(exports, "snapshot", { enumerable: true, get: function () { return snapshot_1.snapshot; } });
 Object.defineProperty(exports, "saveSnapshot", { enumerable: true, get: function () { return snapshot_1.snapshot; } });
 // Export/Import utilities (Tier 4.18)
@@ -104,11 +115,12 @@ Object.defineProperty(exports, "importData", { enumerable: true, get: function (
 var batch_1 = require("./batch");
 Object.defineProperty(exports, "RequestBatcher", { enumerable: true, get: function () { return batch_1.RequestBatcher; } });
 // Performance optimization utilities (v1.3.0)
-// Note: RequestCache and CacheTTL are for advanced users only
-// Most users don't need these - caching is automatic
+// Note: CacheTTL is for advanced users only
+// Most users don't need this - caching is automatic
+// RequestCache is intentionally NOT exported — it's an internal HTTP cache.
+// Use CacheTTL to configure cache durations via client options.
 var cache_1 = require("./cache");
 Object.defineProperty(exports, "CacheTTL", { enumerable: true, get: function () { return cache_1.CacheTTL; } });
-Object.defineProperty(exports, "RequestCache", { enumerable: true, get: function () { return cache_1.RequestCache; } });
 // CLI (programmatic use)
 var check_1 = require("./cli/check");
 Object.defineProperty(exports, "EXIT", { enumerable: true, get: function () { return check_1.EXIT; } });
@@ -128,8 +140,13 @@ Object.defineProperty(exports, "Logger", { enumerable: true, get: function () {
 // Vitest matcher: expect(await openAIChatEval(...)).toPassGate()
 var matchers_1 = require("./matchers");
 Object.defineProperty(exports, "extendExpectWithToPassGate", { enumerable: true, get: function () { return matchers_1.extendExpectWithToPassGate; } });
+// OpenTelemetry export
+var otel_1 = require("./otel");
+Object.defineProperty(exports, "createOTelExporter", { enumerable: true, get: function () { return otel_1.createOTelExporter; } });
+Object.defineProperty(exports, "OTelExporter", { enumerable: true, get: function () { return otel_1.OTelExporter; } });
 var pagination_1 = require("./pagination");
 Object.defineProperty(exports, "autoPaginate", { enumerable: true, get: function () { return pagination_1.autoPaginate; } });
+Object.defineProperty(exports, "autoPaginateGenerator", { enumerable: true, get: function () { return pagination_1.autoPaginateGenerator; } });
 Object.defineProperty(exports, "createPaginatedIterator", { enumerable: true, get: function () { return pagination_1.createPaginatedIterator; } });
 Object.defineProperty(exports, "decodeCursor", { enumerable: true, get: function () { return pagination_1.decodeCursor; } });
 Object.defineProperty(exports, "encodeCursor", { enumerable: true, get: function () { return pagination_1.encodeCursor; } });

package/dist/integrations/anthropic.js CHANGED Viewed

@@ -67,7 +67,7 @@ function traceAnthropic(anthropic, evalClient, options = {}) {
                     }
                     : {}),
             });
-            await evalClient.traces.create({
+            await evalClient.traces?.create({
                 name: `Anthropic: ${params.model}`,
                 traceId,
                 organizationId: organizationId || evalClient.getOrganizationId(),
@@ -89,7 +89,7 @@ function traceAnthropic(anthropic, evalClient, options = {}) {
                 error: error instanceof Error ? error.message : String(error),
             });
             await evalClient.traces
-                .create({
+                ?.create({
                 name: `Anthropic: ${params.model}`,
                 traceId,
                 organizationId: organizationId || evalClient.getOrganizationId(),
@@ -97,7 +97,7 @@ function traceAnthropic(anthropic, evalClient, options = {}) {
                 durationMs,
                 metadata: errorMetadata,
             })
-                .catch(() => {
+                ?.catch(() => {
                 // Ignore errors in trace creation to avoid masking the original error
             });
             throw error;
@@ -127,7 +127,7 @@ async function traceAnthropicCall(evalClient, name, fn, options = {}) {
     const startTime = Date.now();
     const traceId = `anthropic-${Date.now()}-${Math.random().toString(36).substr(2, 9)}`;
     try {
-        await evalClient.traces.create({
+        await evalClient.traces?.create({
             name,
             traceId,
             organizationId: options.organizationId || evalClient.getOrganizationId(),
@@ -136,7 +136,7 @@ async function traceAnthropicCall(evalClient, name, fn, options = {}) {
         });
         const result = await fn();
         const durationMs = Date.now() - startTime;
-        await evalClient.traces.create({
+        await evalClient.traces?.create({
             name,
             traceId,
             organizationId: options.organizationId || evalClient.getOrganizationId(),
@@ -148,7 +148,7 @@ async function traceAnthropicCall(evalClient, name, fn, options = {}) {
     }
     catch (error) {
         const durationMs = Date.now() - startTime;
-        await evalClient.traces.create({
+        await evalClient.traces?.create({
             name,
             traceId,
             organizationId: options.organizationId || evalClient.getOrganizationId(),

package/dist/integrations/openai.js CHANGED Viewed

@@ -52,52 +52,59 @@ function traceOpenAI(openai, evalClient, options = {}) {
             const response = await originalCreate(params, requestOptions);
             const durationMs = Date.now() - startTime;
             // Create trace with success status and complete metadata
-            const traceMetadata = (0, context_1.mergeWithContext)({
-                model: params.model,
-                temperature: params.temperature,
-                max_tokens: params.max_tokens,
-                ...(captureInput ? { input: params.messages } : {}),
-                ...(captureOutput ? { output: response.choices[0]?.message } : {}),
-                ...(captureMetadata
-                    ? {
-                        usage: response.usage,
-                        finish_reason: response.choices[0]?.finish_reason,
-                    }
-                    : {}),
-            });
-            await evalClient.traces.create({
-                name: `OpenAI: ${params.model}`,
-                traceId,
-                organizationId: organizationId || evalClient.getOrganizationId(),
-                status: "success",
-                durationMs,
-                metadata: traceMetadata,
-            });
+            // Trace creation is non-fatal — never lose the OpenAI result due to tracing issues
+            try {
+                const traceMetadata = (0, context_1.mergeWithContext)({
+                    model: params.model,
+                    temperature: params.temperature,
+                    max_tokens: params.max_tokens,
+                    ...(captureInput ? { input: params.messages } : {}),
+                    ...(captureOutput ? { output: response.choices[0]?.message } : {}),
+                    ...(captureMetadata
+                        ? {
+                            usage: response.usage,
+                            finish_reason: response.choices[0]?.finish_reason,
+                        }
+                        : {}),
+                });
+                await evalClient.traces?.create({
+                    name: `OpenAI: ${params.model}`,
+                    traceId,
+                    organizationId: organizationId || evalClient.getOrganizationId(),
+                    status: "success",
+                    durationMs,
+                    metadata: traceMetadata,
+                });
+            }
+            catch {
+                /* trace failure is non-fatal */
+            }
             return response;
         }
         catch (error) {
             const durationMs = Date.now() - startTime;
-            // Create trace with error status
-            const errorMetadata = (0, context_1.mergeWithContext)({
-                model: params.model,
-                temperature: params.temperature,
-                max_tokens: params.max_tokens,
-                ...(captureInput ? { input: params.messages } : {}),
-                ...(captureMetadata ? { params } : {}),
-                error: error instanceof Error ? error.message : String(error),
-            });
-            await evalClient.traces
-                .create({
-                name: `OpenAI: ${params.model}`,
-                traceId,
-                organizationId: organizationId || evalClient.getOrganizationId(),
-                status: "error",
-                durationMs,
-                metadata: errorMetadata,
-            })
-                .catch(() => {
-                // Ignore errors in trace creation to avoid masking the original error
-            });
+            // Create trace with error status — non-fatal
+            try {
+                const errorMetadata = (0, context_1.mergeWithContext)({
+                    model: params.model,
+                    temperature: params.temperature,
+                    max_tokens: params.max_tokens,
+                    ...(captureInput ? { input: params.messages } : {}),
+                    ...(captureMetadata ? { params } : {}),
+                    error: error instanceof Error ? error.message : String(error),
+                });
+                await evalClient.traces?.create({
+                    name: `OpenAI: ${params.model}`,
+                    traceId,
+                    organizationId: organizationId || evalClient.getOrganizationId(),
+                    status: "error",
+                    durationMs,
+                    metadata: errorMetadata,
+                });
+            }
+            catch {
+                /* trace failure is non-fatal */
+            }
             throw error;
         }
     };
@@ -123,38 +130,54 @@ function traceOpenAI(openai, evalClient, options = {}) {
 async function traceOpenAICall(evalClient, name, fn, options = {}) {
     const startTime = Date.now();
     const traceId = `openai-${Date.now()}-${Math.random().toString(36).substr(2, 9)}`;
+    // Trace creation is non-fatal — never lose the fn() result due to tracing issues
     try {
-        await evalClient.traces.create({
+        await evalClient.traces?.create({
             name,
             traceId,
             organizationId: options.organizationId || evalClient.getOrganizationId(),
             status: "pending",
             metadata: (0, context_1.mergeWithContext)({}),
         });
+    }
+    catch {
+        /* trace failure is non-fatal */
+    }
+    try {
         const result = await fn();
         const durationMs = Date.now() - startTime;
-        await evalClient.traces.create({
-            name,
-            traceId,
-            organizationId: options.organizationId || evalClient.getOrganizationId(),
-            status: "success",
-            durationMs,
-            metadata: (0, context_1.mergeWithContext)({}),
-        });
+        try {
+            await evalClient.traces?.create({
+                name,
+                traceId,
+                organizationId: options.organizationId || evalClient.getOrganizationId(),
+                status: "success",
+                durationMs,
+                metadata: (0, context_1.mergeWithContext)({}),
+            });
+        }
+        catch {
+            /* trace failure is non-fatal */
+        }
         return result;
     }
     catch (error) {
         const durationMs = Date.now() - startTime;
-        await evalClient.traces.create({
-            name,
-            traceId,
-            organizationId: options.organizationId || evalClient.getOrganizationId(),
-            status: "error",
-            durationMs,
-            metadata: (0, context_1.mergeWithContext)({
-                error: error instanceof Error ? error.message : String(error),
-            }),
-        });
+        try {
+            await evalClient.traces?.create({
+                name,
+                traceId,
+                organizationId: options.organizationId || evalClient.getOrganizationId(),
+                status: "error",
+                durationMs,
+                metadata: (0, context_1.mergeWithContext)({
+                    error: error instanceof Error ? error.message : String(error),
+                }),
+            });
+        }
+        catch {
+            /* trace failure is non-fatal */
+        }
         throw error;
     }
 }

package/dist/logger.d.ts CHANGED Viewed

@@ -69,7 +69,9 @@ export declare class Logger {
     /**
      * Create child logger with prefix
      */
-    child(prefix: string): Logger;
+    child(prefix: string | {
+        prefix: string;
+    }): Logger;
     /**
      * Set log level
      */

package/dist/logger.js CHANGED Viewed

@@ -93,9 +93,10 @@ class Logger {
      * Create child logger with prefix
      */
     child(prefix) {
+        const resolvedPrefix = typeof prefix === "string" ? prefix : prefix.prefix;
         return new Logger({
             ...this.options,
-            prefix: `${this.options.prefix}:${prefix}`,
+            prefix: `${this.options.prefix}:${resolvedPrefix}`,
         });
     }
     /**

package/dist/otel.d.ts ADDED Viewed

@@ -0,0 +1,130 @@
+/**
+ * OpenTelemetry Export for WorkflowTracer
+ *
+ * Converts WorkflowTracer spans, decisions, and costs into
+ * OpenTelemetry-compatible span data for export to any OTEL collector.
+ *
+ * Usage:
+ *   import { OTelExporter } from "@evalgate/sdk/otel";
+ *
+ *   const exporter = new OTelExporter({ endpoint: "http://localhost:4318" });
+ *   const tracer = new WorkflowTracer(client, { debug: true });
+ *   // ... run workflow ...
+ *   await exporter.exportFromTracer(tracer);
+ */
+import type { WorkflowTracer } from "./workflows";
+/**
+ * OTEL-compatible span representation
+ * Follows the OpenTelemetry Trace specification
+ */
+export interface OTelSpan {
+    traceId: string;
+    spanId: string;
+    parentSpanId?: string;
+    name: string;
+    /** OTLP SpanKind: 0=UNSPECIFIED, 1=INTERNAL, 2=SERVER, 3=CLIENT, 4=PRODUCER, 5=CONSUMER */
+    kind: 0 | 1 | 2 | 3 | 4 | 5;
+    startTimeUnixNano: string;
+    endTimeUnixNano: string;
+    attributes: OTelAttribute[];
+    /** OTLP StatusCode: 0=STATUS_CODE_UNSET, 1=STATUS_CODE_OK, 2=STATUS_CODE_ERROR */
+    status: {
+        code: 0 | 1 | 2;
+        message?: string;
+    };
+    events: OTelEvent[];
+}
+export interface OTelAttribute {
+    key: string;
+    value: {
+        stringValue?: string;
+        intValue?: string;
+        doubleValue?: number;
+        boolValue?: boolean;
+    };
+}
+export interface OTelEvent {
+    name: string;
+    timeUnixNano: string;
+    attributes: OTelAttribute[];
+}
+/**
+ * OTEL export payload (OTLP JSON format)
+ */
+export interface OTelExportPayload {
+    resourceSpans: Array<{
+        resource: {
+            attributes: OTelAttribute[];
+        };
+        scopeSpans: Array<{
+            scope: {
+                name: string;
+                version: string;
+            };
+            spans: OTelSpan[];
+        }>;
+    }>;
+}
+export interface OTelExporterOptions {
+    /** OTEL collector endpoint (default: http://localhost:4318/v1/traces) */
+    endpoint?: string;
+    /** Service name for resource attributes */
+    serviceName?: string;
+    /** Additional resource attributes */
+    resourceAttributes?: Record<string, string>;
+    /** SDK version */
+    sdkVersion?: string;
+    /** Headers for the export request */
+    headers?: Record<string, string>;
+}
+/**
+ * OpenTelemetry Exporter for EvalGate WorkflowTracer
+ */
+export declare class OTelExporter {
+    private options;
+    constructor(options?: OTelExporterOptions);
+    /**
+     * Export workflow data from a WorkflowTracer instance
+     */
+    exportFromTracer(tracer: WorkflowTracer): OTelExportPayload;
+    /**
+     * Export a run result as OTEL spans
+     */
+    exportRunResult(runResult: {
+        runId: string;
+        metadata: {
+            startedAt: number;
+            completedAt: number;
+            duration: number;
+            mode: string;
+        };
+        results: Array<{
+            specId: string;
+            name: string;
+            filePath: string;
+            result: {
+                status: string;
+                score?: number;
+                duration: number;
+                error?: string;
+            };
+        }>;
+        summary: {
+            passed: number;
+            failed: number;
+            passRate: number;
+        };
+    }): OTelExportPayload;
+    /**
+     * Send payload to OTEL collector via HTTP
+     */
+    send(payload: OTelExportPayload): Promise<boolean>;
+    private decisionToSpan;
+    private handoffToSpan;
+    private costToSpan;
+    private buildPayload;
+}
+/**
+ * Convenience factory
+ */
+export declare function createOTelExporter(options?: OTelExporterOptions): OTelExporter;