npm - elasticdash-sdk - Versions diffs - 0.2.0 - Mend

elasticdash-sdk 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (349) hide show

package/LICENSE +21 -0
package/README.md +775 -0
package/dist/browser-ui.d.ts +43 -0
package/dist/browser-ui.d.ts.map +1 -0
package/dist/browser-ui.js +246 -0
package/dist/browser-ui.js.map +1 -0
package/dist/capture/event.d.ts +33 -0
package/dist/capture/event.d.ts.map +1 -0
package/dist/capture/event.js +2 -0
package/dist/capture/event.js.map +1 -0
package/dist/capture/index.d.ts +4 -0
package/dist/capture/index.d.ts.map +1 -0
package/dist/capture/index.js +4 -0
package/dist/capture/index.js.map +1 -0
package/dist/capture/recorder.d.ts +24 -0
package/dist/capture/recorder.d.ts.map +1 -0
package/dist/capture/recorder.js +46 -0
package/dist/capture/recorder.js.map +1 -0
package/dist/capture/replay.d.ts +20 -0
package/dist/capture/replay.d.ts.map +1 -0
package/dist/capture/replay.js +47 -0
package/dist/capture/replay.js.map +1 -0
package/dist/ci/api-client.d.ts +38 -0
package/dist/ci/api-client.d.ts.map +1 -0
package/dist/ci/api-client.js +96 -0
package/dist/ci/api-client.js.map +1 -0
package/dist/ci/benchmark.d.ts +33 -0
package/dist/ci/benchmark.d.ts.map +1 -0
package/dist/ci/benchmark.js +213 -0
package/dist/ci/benchmark.js.map +1 -0
package/dist/ci/ed-runner.d.ts +48 -0
package/dist/ci/ed-runner.d.ts.map +1 -0
package/dist/ci/ed-runner.js +260 -0
package/dist/ci/ed-runner.js.map +1 -0
package/dist/ci/executor.d.ts +13 -0
package/dist/ci/executor.d.ts.map +1 -0
package/dist/ci/executor.js +542 -0
package/dist/ci/executor.js.map +1 -0
package/dist/ci/git-info.d.ts +17 -0
package/dist/ci/git-info.d.ts.map +1 -0
package/dist/ci/git-info.js +102 -0
package/dist/ci/git-info.js.map +1 -0
package/dist/ci/index.d.ts +6 -0
package/dist/ci/index.d.ts.map +1 -0
package/dist/ci/index.js +4 -0
package/dist/ci/index.js.map +1 -0
package/dist/ci/measurement.d.ts +9 -0
package/dist/ci/measurement.d.ts.map +1 -0
package/dist/ci/measurement.js +15 -0
package/dist/ci/measurement.js.map +1 -0
package/dist/ci/replay.d.ts +31 -0
package/dist/ci/replay.d.ts.map +1 -0
package/dist/ci/replay.js +96 -0
package/dist/ci/replay.js.map +1 -0
package/dist/ci/reporters/default.d.ts +8 -0
package/dist/ci/reporters/default.d.ts.map +1 -0
package/dist/ci/reporters/default.js +46 -0
package/dist/ci/reporters/default.js.map +1 -0
package/dist/ci/reporters/index.d.ts +8 -0
package/dist/ci/reporters/index.d.ts.map +1 -0
package/dist/ci/reporters/index.js +14 -0
package/dist/ci/reporters/index.js.map +1 -0
package/dist/ci/reporters/json.d.ts +8 -0
package/dist/ci/reporters/json.d.ts.map +1 -0
package/dist/ci/reporters/json.js +14 -0
package/dist/ci/reporters/json.js.map +1 -0
package/dist/ci/reporters/junit.d.ts +8 -0
package/dist/ci/reporters/junit.d.ts.map +1 -0
package/dist/ci/reporters/junit.js +48 -0
package/dist/ci/reporters/junit.js.map +1 -0
package/dist/ci/runner.d.ts +3 -0
package/dist/ci/runner.d.ts.map +1 -0
package/dist/ci/runner.js +187 -0
package/dist/ci/runner.js.map +1 -0
package/dist/ci/test-discovery.d.ts +5 -0
package/dist/ci/test-discovery.d.ts.map +1 -0
package/dist/ci/test-discovery.js +11 -0
package/dist/ci/test-discovery.js.map +1 -0
package/dist/ci/test-loader.d.ts +19 -0
package/dist/ci/test-loader.d.ts.map +1 -0
package/dist/ci/test-loader.js +149 -0
package/dist/ci/test-loader.js.map +1 -0
package/dist/ci/test-registry.d.ts +42 -0
package/dist/ci/test-registry.d.ts.map +1 -0
package/dist/ci/test-registry.js +18 -0
package/dist/ci/test-registry.js.map +1 -0
package/dist/ci/trace-schema.d.ts +30 -0
package/dist/ci/trace-schema.d.ts.map +1 -0
package/dist/ci/trace-schema.js +66 -0
package/dist/ci/trace-schema.js.map +1 -0
package/dist/ci/trace-writer.d.ts +16 -0
package/dist/ci/trace-writer.d.ts.map +1 -0
package/dist/ci/trace-writer.js +108 -0
package/dist/ci/trace-writer.js.map +1 -0
package/dist/ci/types.d.ts +108 -0
package/dist/ci/types.d.ts.map +1 -0
package/dist/ci/types.js +3 -0
package/dist/ci/types.js.map +1 -0
package/dist/ci/upload-client.d.ts +74 -0
package/dist/ci/upload-client.d.ts.map +1 -0
package/dist/ci/upload-client.js +195 -0
package/dist/ci/upload-client.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +716 -0
package/dist/cli.js.map +1 -0
package/dist/core/agent-state.d.ts +47 -0
package/dist/core/agent-state.d.ts.map +1 -0
package/dist/core/agent-state.js +137 -0
package/dist/core/agent-state.js.map +1 -0
package/dist/core/judge-utils.d.ts +22 -0
package/dist/core/judge-utils.d.ts.map +1 -0
package/dist/core/judge-utils.js +211 -0
package/dist/core/judge-utils.js.map +1 -0
package/dist/core/registry.d.ts +28 -0
package/dist/core/registry.d.ts.map +1 -0
package/dist/core/registry.js +52 -0
package/dist/core/registry.js.map +1 -0
package/dist/dashboard-server.d.ts +65 -0
package/dist/dashboard-server.d.ts.map +1 -0
package/dist/dashboard-server.js +3940 -0
package/dist/dashboard-server.js.map +1 -0
package/dist/execution/tool-runner.d.ts +26 -0
package/dist/execution/tool-runner.d.ts.map +1 -0
package/dist/execution/tool-runner.js +316 -0
package/dist/execution/tool-runner.js.map +1 -0
package/dist/html/dashboard.html +2218 -0
package/dist/http.d.ts +14 -0
package/dist/http.d.ts.map +1 -0
package/dist/http.js +13 -0
package/dist/http.js.map +1 -0
package/dist/index.cjs +8102 -0
package/dist/index.d.ts +61 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +67 -0
package/dist/index.js.map +1 -0
package/dist/interceptors/ai-interceptor.d.ts +26 -0
package/dist/interceptors/ai-interceptor.d.ts.map +1 -0
package/dist/interceptors/ai-interceptor.js +756 -0
package/dist/interceptors/ai-interceptor.js.map +1 -0
package/dist/interceptors/db-auto.d.ts +8 -0
package/dist/interceptors/db-auto.d.ts.map +1 -0
package/dist/interceptors/db-auto.js +217 -0
package/dist/interceptors/db-auto.js.map +1 -0
package/dist/interceptors/db.d.ts +23 -0
package/dist/interceptors/db.d.ts.map +1 -0
package/dist/interceptors/db.js +137 -0
package/dist/interceptors/db.js.map +1 -0
package/dist/interceptors/http.d.ts +28 -0
package/dist/interceptors/http.d.ts.map +1 -0
package/dist/interceptors/http.js +356 -0
package/dist/interceptors/http.js.map +1 -0
package/dist/interceptors/side-effects.d.ts +7 -0
package/dist/interceptors/side-effects.d.ts.map +1 -0
package/dist/interceptors/side-effects.js +72 -0
package/dist/interceptors/side-effects.js.map +1 -0
package/dist/interceptors/telemetry-push.d.ts +142 -0
package/dist/interceptors/telemetry-push.d.ts.map +1 -0
package/dist/interceptors/telemetry-push.js +463 -0
package/dist/interceptors/telemetry-push.js.map +1 -0
package/dist/interceptors/tool.d.ts +2 -0
package/dist/interceptors/tool.d.ts.map +1 -0
package/dist/interceptors/tool.js +274 -0
package/dist/interceptors/tool.js.map +1 -0
package/dist/interceptors/workflow-ai.d.ts +5 -0
package/dist/interceptors/workflow-ai.d.ts.map +1 -0
package/dist/interceptors/workflow-ai.js +382 -0
package/dist/interceptors/workflow-ai.js.map +1 -0
package/dist/internals/conditional-recorder.d.ts +21 -0
package/dist/internals/conditional-recorder.d.ts.map +1 -0
package/dist/internals/conditional-recorder.js +54 -0
package/dist/internals/conditional-recorder.js.map +1 -0
package/dist/internals/mock-resolver.d.ts +146 -0
package/dist/internals/mock-resolver.d.ts.map +1 -0
package/dist/internals/mock-resolver.js +427 -0
package/dist/internals/mock-resolver.js.map +1 -0
package/dist/matchers/index.d.ts +96 -0
package/dist/matchers/index.d.ts.map +1 -0
package/dist/matchers/index.js +668 -0
package/dist/matchers/index.js.map +1 -0
package/dist/observability.d.ts +82 -0
package/dist/observability.d.ts.map +1 -0
package/dist/observability.js +471 -0
package/dist/observability.js.map +1 -0
package/dist/portal-executor.d.ts +30 -0
package/dist/portal-executor.d.ts.map +1 -0
package/dist/portal-executor.js +324 -0
package/dist/portal-executor.js.map +1 -0
package/dist/portal-server.d.ts +3 -0
package/dist/portal-server.d.ts.map +1 -0
package/dist/portal-server.js +279 -0
package/dist/portal-server.js.map +1 -0
package/dist/proxy/llm-capture.d.ts +14 -0
package/dist/proxy/llm-capture.d.ts.map +1 -0
package/dist/proxy/llm-capture.js +264 -0
package/dist/proxy/llm-capture.js.map +1 -0
package/dist/reporter.d.ts +3 -0
package/dist/reporter.d.ts.map +1 -0
package/dist/reporter.js +72 -0
package/dist/reporter.js.map +1 -0
package/dist/runWorkflowSubprocess.d.ts +14 -0
package/dist/runWorkflowSubprocess.d.ts.map +1 -0
package/dist/runWorkflowSubprocess.js +66 -0
package/dist/runWorkflowSubprocess.js.map +1 -0
package/dist/runner.d.ts +16 -0
package/dist/runner.d.ts.map +1 -0
package/dist/runner.js +138 -0
package/dist/runner.js.map +1 -0
package/dist/socket-connector.d.ts +22 -0
package/dist/socket-connector.d.ts.map +1 -0
package/dist/socket-connector.js +104 -0
package/dist/socket-connector.js.map +1 -0
package/dist/telemetry-batcher.d.ts +56 -0
package/dist/telemetry-batcher.d.ts.map +1 -0
package/dist/telemetry-batcher.js +143 -0
package/dist/telemetry-batcher.js.map +1 -0
package/dist/test-setup.d.ts +12 -0
package/dist/test-setup.d.ts.map +1 -0
package/dist/test-setup.js +13 -0
package/dist/test-setup.js.map +1 -0
package/dist/tool-registry.d.ts +31 -0
package/dist/tool-registry.d.ts.map +1 -0
package/dist/tool-registry.js +73 -0
package/dist/tool-registry.js.map +1 -0
package/dist/tool-runner-worker.d.ts +2 -0
package/dist/tool-runner-worker.d.ts.map +1 -0
package/dist/tool-runner-worker.js +215 -0
package/dist/tool-runner-worker.js.map +1 -0
package/dist/trace-adapter/context.d.ts +72 -0
package/dist/trace-adapter/context.d.ts.map +1 -0
package/dist/trace-adapter/context.js +80 -0
package/dist/trace-adapter/context.js.map +1 -0
package/dist/tracing.d.ts +2 -0
package/dist/tracing.d.ts.map +1 -0
package/dist/tracing.js +59 -0
package/dist/tracing.js.map +1 -0
package/dist/trigger-executor.d.ts +12 -0
package/dist/trigger-executor.d.ts.map +1 -0
package/dist/trigger-executor.js +130 -0
package/dist/trigger-executor.js.map +1 -0
package/dist/types/portal.d.ts +76 -0
package/dist/types/portal.d.ts.map +1 -0
package/dist/types/portal.js +2 -0
package/dist/types/portal.js.map +1 -0
package/dist/utils/debug.d.ts +3 -0
package/dist/utils/debug.d.ts.map +1 -0
package/dist/utils/debug.js +8 -0
package/dist/utils/debug.js.map +1 -0
package/dist/utils/license-error.d.ts +23 -0
package/dist/utils/license-error.d.ts.map +1 -0
package/dist/utils/license-error.js +42 -0
package/dist/utils/license-error.js.map +1 -0
package/dist/utils/redact.d.ts +7 -0
package/dist/utils/redact.d.ts.map +1 -0
package/dist/utils/redact.js +26 -0
package/dist/utils/redact.js.map +1 -0
package/dist/workflow-runner-worker.d.ts +2 -0
package/dist/workflow-runner-worker.d.ts.map +1 -0
package/dist/workflow-runner-worker.js +329 -0
package/dist/workflow-runner-worker.js.map +1 -0
package/dist/workflow-runner.d.ts +14 -0
package/dist/workflow-runner.d.ts.map +1 -0
package/dist/workflow-runner.js +34 -0
package/dist/workflow-runner.js.map +1 -0
package/docs/agent-coding-instructions.md +138 -0
package/docs/agent-integration-guide.md +564 -0
package/docs/agents.md +140 -0
package/docs/dashboard.md +394 -0
package/docs/deno.md +69 -0
package/docs/instrumentation.md +424 -0
package/docs/langfuse-trace-structure.md +145 -0
package/docs/matchers.md +173 -0
package/docs/observability_contract.md +192 -0
package/docs/observability_mode.md +195 -0
package/docs/quickstart.md +621 -0
package/docs/security-compliance.md +566 -0
package/docs/test-writing-guidelines.md +444 -0
package/docs/tools.md +165 -0
package/docs/workflow-modes.md +253 -0
package/package.json +76 -0
package/src/browser-ui.ts +281 -0
package/src/capture/event.ts +30 -0
package/src/capture/index.ts +3 -0
package/src/capture/recorder.ts +62 -0
package/src/capture/replay.ts +55 -0
package/src/ci/api-client.ts +136 -0
package/src/ci/benchmark.ts +257 -0
package/src/ci/ed-runner.ts +351 -0
package/src/ci/executor.ts +671 -0
package/src/ci/git-info.ts +127 -0
package/src/ci/index.ts +5 -0
package/src/ci/measurement.ts +25 -0
package/src/ci/replay.ts +127 -0
package/src/ci/reporters/default.ts +50 -0
package/src/ci/reporters/index.ts +21 -0
package/src/ci/reporters/json.ts +18 -0
package/src/ci/reporters/junit.ts +61 -0
package/src/ci/runner.ts +208 -0
package/src/ci/test-discovery.ts +16 -0
package/src/ci/test-loader.ts +187 -0
package/src/ci/test-registry.ts +62 -0
package/src/ci/trace-schema.ts +96 -0
package/src/ci/trace-writer.ts +107 -0
package/src/ci/types.ts +115 -0
package/src/ci/upload-client.ts +300 -0
package/src/cli.ts +811 -0
package/src/core/agent-state.ts +162 -0
package/src/core/judge-utils.ts +232 -0
package/src/core/registry.ts +92 -0
package/src/dashboard-server.ts +2047 -0
package/src/execution/tool-runner.ts +352 -0
package/src/html/dashboard.html +2218 -0
package/src/http.ts +13 -0
package/src/index.ts +138 -0
package/src/interceptors/ai-interceptor.ts +798 -0
package/src/interceptors/db-auto.ts +243 -0
package/src/interceptors/db.ts +156 -0
package/src/interceptors/http.ts +393 -0
package/src/interceptors/side-effects.ts +83 -0
package/src/interceptors/telemetry-push.ts +537 -0
package/src/interceptors/tool.ts +287 -0
package/src/interceptors/workflow-ai.ts +419 -0
package/src/internals/conditional-recorder.ts +63 -0
package/src/internals/mock-resolver.ts +492 -0
package/src/matchers/index.ts +824 -0
package/src/observability.ts +501 -0
package/src/portal-executor.ts +355 -0
package/src/portal-server.ts +304 -0
package/src/proxy/llm-capture.ts +301 -0
package/src/reporter.ts +81 -0
package/src/runWorkflowSubprocess.ts +74 -0
package/src/runner.ts +178 -0
package/src/socket-connector.ts +117 -0
package/src/telemetry-batcher.ts +191 -0
package/src/test-setup.ts +16 -0
package/src/tool-registry.ts +94 -0
package/src/tool-runner-worker.ts +244 -0
package/src/trace-adapter/context.ts +156 -0
package/src/tracing.ts +62 -0
package/src/trigger-executor.ts +171 -0
package/src/types/agent.d.ts +63 -0
package/src/types/expect.d.ts +81 -0
package/src/types/modules.d.ts +2 -0
package/src/types/portal.ts +69 -0
package/src/utils/debug.ts +8 -0
package/src/utils/license-error.ts +43 -0
package/src/utils/redact.ts +25 -0
package/src/workflow-runner-worker.ts +386 -0
package/src/workflow-runner.ts +58 -0

package/src/trace-adapter/context.ts ADDED Viewed

@@ -0,0 +1,156 @@
+export interface LLMStep {
+  model: string
+  provider?: string   // 'openai' | 'gemini' | 'grok' | undefined
+  prompt?: string
+  completion?: string
+  contains?: string
+  workflowEventId?: number
+  durationMs?: number
+}
+export interface ToolCall {
+  name: string
+  args?: Record<string, unknown>
+  result?: unknown
+  workflowEventId?: number
+  durationMs?: number
+}
+export type CustomStepKind = 'rag' | 'code' | 'fixed' | 'custom'
+export interface CustomStep {
+  kind: CustomStepKind
+  name?: string
+  tags?: string[]
+  payload?: unknown
+  result?: unknown
+  metadata?: Record<string, unknown>
+  contains?: string
+}
+export interface TraceStep {
+  type: 'llm' | 'tool' | 'custom'
+  timestamp: number
+  durationMs: number
+  data: Record<string, unknown>
+}
+export interface TraceHandle {
+  /** All recorded steps in this trace session */
+  getSteps(): TraceStep[]
+  /** Only LLM inference steps */
+  getLLMSteps(): LLMStep[]
+  /** Only tool-call steps */
+  getToolCalls(): ToolCall[]
+  /** Only custom steps (RAG, code, fixed, etc.) */
+  getCustomSteps(): CustomStep[]
+  /** Record an LLM step (used by stubs / real adapter) */
+  recordLLMStep(step: LLMStep): void
+  /** Record a tool call (used by stubs / real adapter) */
+  recordToolCall(call: ToolCall): void
+  /** Record a custom step (e.g., RAG, code) */
+  recordCustomStep(step: CustomStep): void
+}
+export interface AITestContext {
+  trace: TraceHandle
+}
+// --- AsyncLocalStorage-backed current trace (parallel-safe) ---
+import { AsyncLocalStorage } from 'node:async_hooks'
+import { rawDateNow } from '../interceptors/side-effects.js'
+const g = globalThis as Record<string, unknown>
+const TRACE_ALS_KEY = '__elasticdash_trace_als__'
+const traceAls: AsyncLocalStorage<TraceHandle | undefined> =
+  (g[TRACE_ALS_KEY] as AsyncLocalStorage<TraceHandle | undefined>) ??
+  new AsyncLocalStorage<TraceHandle | undefined>()
+if (!g[TRACE_ALS_KEY]) g[TRACE_ALS_KEY] = traceAls
+export function setCurrentTrace(trace: TraceHandle | undefined): void {
+  traceAls.enterWith(trace)
+}
+export function getCurrentTrace(): TraceHandle | undefined {
+  return traceAls.getStore()
+}
+/** Extension points for runner hooks (scaffold for future backend integration) */
+export interface RunnerHooks {
+  onTestStart?(name: string): void | Promise<void>
+  onTestFinish?(name: string, passed: boolean, durationMs: number, error?: Error): void | Promise<void>
+  onTraceComplete?(name: string, trace: TraceHandle): void | Promise<void>
+}
+/**
+ * Create a stubbed trace handle for a single test execution.
+ * Later this can be replaced with a real ElasticDash backend call.
+ */
+export function createTraceHandle(): TraceHandle {
+  const steps: TraceStep[] = []
+  const llmSteps: LLMStep[] = []
+  const toolCalls: ToolCall[] = []
+  const customSteps: CustomStep[] = []
+  return {
+    getSteps() {
+      return steps
+    },
+    getLLMSteps() {
+      return llmSteps
+    },
+    getToolCalls() {
+      return toolCalls
+    },
+    getCustomSteps() {
+      return customSteps
+    },
+    recordLLMStep(step: LLMStep) {
+      llmSteps.push(step)
+      steps.push({
+        type: 'llm',
+        timestamp: rawDateNow(),
+        durationMs: step.durationMs ?? 0,
+        data: step as unknown as Record<string, unknown>,
+      })
+    },
+    recordToolCall(call: ToolCall) {
+      toolCalls.push(call)
+      steps.push({
+        type: 'tool',
+        timestamp: rawDateNow(),
+        durationMs: call.durationMs ?? 0,
+        data: call as unknown as Record<string, unknown>,
+      })
+    },
+    recordCustomStep(step: CustomStep) {
+      customSteps.push(step)
+      steps.push({
+        type: 'custom',
+        timestamp: rawDateNow(),
+        durationMs: 0,
+        data: step as unknown as Record<string, unknown>,
+      })
+    },
+  }
+}
+/**
+ * Start a trace session before a test and return the context + a finalise fn.
+ */
+export function startTraceSession(): { context: AITestContext; finalise: () => void } {
+  const trace = createTraceHandle()
+  const context: AITestContext = { trace }
+  return {
+    context,
+    finalise() {
+      // Placeholder: flush / send to ElasticDash backend here in the future
+    },
+  }
+}

package/src/tracing.ts ADDED Viewed

@@ -0,0 +1,62 @@
+// src/tracing.ts
+// ElasticDash tool call recording utility
+/**
+ * Records a tool call for workflow tracing. Safe to call in any environment.
+ * If not running inside the ElasticDash runner, this is a no-op.
+ *
+ * @param name - The tool name
+ * @param args - The tool arguments (object or array)
+ * @param result - The tool result (or error)
+ */
+import { getCurrentTrace } from './trace-adapter/context.js'
+import { getCaptureContext } from './capture/recorder.js'
+import { rawDateNow } from './interceptors/side-effects.js'
+const TOOL_WRAPPER_ACTIVE_KEY = '__elasticdash_tool_wrapper_active__'
+function wrapperRecordingActive(): boolean {
+  return (globalThis as Record<string, unknown>)[TOOL_WRAPPER_ACTIVE_KEY] === true
+}
+export function recordToolCall(name: string, args: any, result: any, durationMs = 0) {
+  if (!(globalThis as any).__ELASTICDASH_WORKER__) return
+  try {
+    // Avoid double-recording when a replay-aware tool wrapper is already active.
+    if (wrapperRecordingActive()) return
+    const trace = getCurrentTrace()
+    if (!trace || typeof trace.recordToolCall !== 'function') return
+    const ctx = getCaptureContext()
+    if (!ctx) {
+      trace.recordToolCall({ name, args, result, durationMs })
+      return
+    }
+    const { recorder, replay } = ctx
+    const id = recorder.nextId()
+    if (replay.shouldReplay(id)) {
+      const historical = replay.getRecordedEvent(id)
+      if (historical) recorder.record(historical)
+      const replayed = replay.getRecordedResult(id)
+      trace.recordToolCall({ name, args, result: replayed, workflowEventId: id })
+      return
+    }
+    const output = result instanceof Error ? { error: String(result) } : result
+    recorder.record({
+      id,
+      type: 'tool',
+      name,
+      input: args,
+      output,
+      timestamp: rawDateNow(),
+      durationMs,
+    })
+    trace.recordToolCall({ name, args, result: output, workflowEventId: id, durationMs })
+  } catch {
+    // Never throw, always swallow errors
+  }
+}

package/src/trigger-executor.ts ADDED Viewed

@@ -0,0 +1,171 @@
+import type { TriggerSignal, FrozenEvent } from './telemetry-batcher.js'
+import { executePortalTask, checkToolAvailability, checkAIAvailability } from './portal-executor.js'
+import { getOriginalFetch } from './interceptors/http.js'
+import { getObservabilityContext } from './interceptors/telemetry-push.js'
+import { scanTools } from './execution/tool-runner.js'
+import { debugLog } from './utils/debug.js'
+/** Track trigger IDs that are currently executing or already completed to prevent duplicate execution. */
+const handledTriggers = new Set<number>()
+interface StepRunResult {
+  runIndex: number
+  input: unknown
+  output: unknown
+  durationMs: number
+  error?: string
+  usageInputTokens?: number
+  usageOutputTokens?: number
+  usageTotalTokens?: number
+}
+interface StepResult {
+  originalEventDbId: number
+  eventType: string
+  eventName: string
+  available: boolean
+  unavailableReason?: string
+  runs: StepRunResult[]
+}
+/**
+ * Executes a trigger received from the backend's event batch response.
+ *
+ * For each step:
+ * 1. Pre-validates availability (tool exists? API key set?)
+ * 2. If unavailable: reports `available: false` with reason, skips execution
+ * 3. If available: re-executes `runCount` times, collects results
+ * 4. POSTs each step's result individually to avoid payload size limits
+ */
+export async function executeTrigger(
+  serverUrl: string,
+  apiKey: string | undefined,
+  trigger: TriggerSignal,
+): Promise<void> {
+  // Feature flag: allow users to disable rerun acceptance per project
+  const acceptReruns = process.env.ELASTICDASH_ACCEPT_RERUNS
+  if (acceptReruns !== undefined && ['false', '0', 'no'].includes(acceptReruns.toLowerCase())) {
+    debugLog(`[elasticdash] Trigger ${trigger.triggerId} rejected: ELASTICDASH_ACCEPT_RERUNS=${acceptReruns}`)
+    return
+  }
+  // Dedup guard: skip if this trigger is already being handled
+  if (handledTriggers.has(trigger.triggerId)) {
+    debugLog(`[elasticdash] Trigger ${trigger.triggerId} already handled, skipping duplicate`)
+    return
+  }
+  handledTriggers.add(trigger.triggerId)
+  // Mark observability context as rerun so captured events are flagged
+  const obsCtx = getObservabilityContext()
+  if (obsCtx) obsCtx.isRerun = true
+  const cwd = process.cwd()
+  const tools = scanTools(cwd)
+  const frozenEvents = trigger.frozenEvents || []
+  const totalSteps = trigger.steps.length
+  debugLog(`[elasticdash] Executing trigger ${trigger.triggerId}: ${totalSteps} steps × ${trigger.runCount} runs, ${frozenEvents.length} frozenEvents`)
+  if (!serverUrl) {
+    debugLog(`[elasticdash] Trigger ${trigger.triggerId} aborted: serverUrl is empty`)
+    if (obsCtx) obsCtx.isRerun = false
+    return
+  }
+  const baseUrl = serverUrl.replace(/\/$/, '')
+  const headers: Record<string, string> = { 'Content-Type': 'application/json' }
+  if (apiKey) headers['Authorization'] = `Bearer ${apiKey}`
+  for (let stepIndex = 0; stepIndex < totalSteps; stepIndex++) {
+    const step = trigger.steps[stepIndex]
+    // Pre-validate availability
+    const availability = step.eventType === 'ai'
+      ? checkAIAvailability(step.provider, step.model ?? step.eventName)
+      : checkToolAvailability(step.eventName, cwd, tools)
+    let stepResult: StepResult
+    if (!availability.available) {
+      debugLog(`[elasticdash] Trigger ${trigger.triggerId} step=${step.eventName} unavailable: ${availability.reason}`)
+      stepResult = {
+        originalEventDbId: step.originalEventDbId,
+        eventType: step.eventType,
+        eventName: step.eventName,
+        available: false,
+        unavailableReason: availability.reason,
+        runs: [],
+      }
+    } else {
+      // Execute runs
+      const runs: StepRunResult[] = []
+      for (let i = 0; i < trigger.runCount; i++) {
+        const result = await executePortalTask(
+          {
+            taskId: `trigger-${trigger.triggerId}-${step.eventName}-${i}`,
+            type: step.eventType === 'ai' ? 'ai' : 'tool',
+            name: step.eventName,
+            input: step.input,
+            model: step.eventType === 'ai' ? (step.model ?? step.eventName) : undefined,
+            provider: step.provider,
+            frozenEvents,
+          },
+          cwd,
+          tools,
+        )
+        if (!result.ok) {
+          debugLog(`[elasticdash] Trigger ${trigger.triggerId} step=${step.eventName} run=${i} FAILED:\n${result.error}`)
+        }
+        runs.push({
+          runIndex: i,
+          input: step.input,
+          output: result.output,
+          durationMs: result.durationMs,
+          error: result.error,
+          usageInputTokens: result.usage?.inputTokens,
+          usageOutputTokens: result.usage?.outputTokens,
+          usageTotalTokens: result.usage?.totalTokens,
+        })
+        debugLog(`[elasticdash] Trigger ${trigger.triggerId} step=${step.eventName} run=${i} ok=${result.ok}`)
+      }
+      stepResult = {
+        originalEventDbId: step.originalEventDbId,
+        eventType: step.eventType,
+        eventName: step.eventName,
+        available: true,
+        runs,
+      }
+    }
+    // POST rerun results directly under the original event record
+    const url = `${baseUrl}/api/observability/events/${step.originalEventDbId}/reruns`
+    try {
+      const res = await getOriginalFetch()(url, {
+        method: 'POST',
+        headers,
+        body: JSON.stringify({
+          triggerId: trigger.triggerId,
+          eventType: stepResult.eventType,
+          eventName: stepResult.eventName,
+          available: stepResult.available,
+          unavailableReason: stepResult.unavailableReason,
+          runs: stepResult.runs,
+          stepIndex,
+          totalSteps,
+        }),
+      })
+      debugLog(`[elasticdash] Trigger ${trigger.triggerId} step ${stepIndex + 1}/${totalSteps} posted to event ${step.originalEventDbId} (status ${res.status})`)
+    } catch (err) {
+      debugLog(`[elasticdash] Trigger ${trigger.triggerId} step ${stepIndex + 1}/${totalSteps} POST to event ${step.originalEventDbId} failed: ${err instanceof Error ? err.message : String(err)}`)
+    }
+  }
+  // Restore context after rerun execution
+  if (obsCtx) obsCtx.isRerun = false
+}

package/src/types/agent.d.ts ADDED Viewed

@@ -0,0 +1,63 @@
+/**
+ * Agent state type definitions for mid-trace replay support.
+ *
+ * These types enable structured plan/task management for agents, allowing
+ * them to be resumed from any task in the plan without re-executing
+ * already-completed steps.
+ */
+export type AgentTaskStatus = 'pending' | 'in-progress' | 'completed' | 'failed'
+export interface AgentTask {
+  /** Unique task identifier (e.g. "task-1", "task-2") */
+  id: string
+  /** Current execution status */
+  status: AgentTaskStatus
+  /** Human-readable description of what this task does */
+  description: string
+  /** Tool/service to invoke (e.g. 'apiService', 'queryRefinement') */
+  tool: string
+  /**
+   * Task input parameters. May contain placeholder references to previous
+   * task outputs using the syntax: { $ref: "task-N.output.fieldName" }
+   */
+  input: unknown
+  /** Task result, populated after successful execution */
+  output?: unknown
+  /** Error message if task failed */
+  error?: string
+  /** Unix timestamp when task execution started */
+  startedAt?: number
+  /** Unix timestamp when task execution completed */
+  completedAt?: number
+}
+export type AgentPlanStatus = 'planning' | 'executing' | 'completed' | 'failed' | 'paused'
+export interface AgentPlan {
+  /** Unique plan identifier */
+  id: string
+  /** Ordered list of tasks to execute */
+  tasks: AgentTask[]
+  /** Overall plan execution status */
+  status: AgentPlanStatus
+  /** Zero-based index of the task currently being executed */
+  currentTaskIndex: number
+  /** Shared data/variables accessible to all tasks */
+  context: Record<string, unknown>
+  /** Additional plan metadata (user query, session ID, etc.) */
+  metadata: Record<string, unknown>
+}
+export interface AgentState {
+  /** The full agent plan including completed and pending tasks */
+  plan: AgentPlan
+  /** Partial trace events captured during previous execution */
+  trace: import('../capture/event.js').WorkflowEvent[]
+  /**
+   * Zero-based index of the task to resume from.
+   * Tasks 0..(resumeFromTaskIndex-1) will use cached outputs from plan.tasks.
+   * Tasks resumeFromTaskIndex..end will be executed fresh.
+   */
+  resumeFromTaskIndex: number
+}

package/src/types/expect.d.ts ADDED Viewed

@@ -0,0 +1,81 @@
+import 'expect';
+import type { TraceHandle, CustomStep, CustomStepKind } from '../trace-adapter/context';
+interface LLMStepConfig {
+  model?: string
+  contains?: string        // searches prompt + completion
+  promptContains?: string  // searches only in step.prompt
+  outputContains?: string  // searches only in step.completion
+  provider?: string        // 'openai' | 'claude' | 'gemini' | 'grok'
+  times?: number           // match count must equal exactly this value
+  minTimes?: number        // match count must be >= this value
+  maxTimes?: number        // match count must be <= this value
+}
+interface CustomStepConfig {
+  kind?: CustomStepKind
+  name?: string
+  tag?: string
+  contains?: string          // searches payload/result/metadata stringified
+  resultContains?: string    // searches result only
+  payloadContains?: string   // searches payload only
+  metadataContains?: string  // searches metadata only
+  times?: number
+  minTimes?: number
+  maxTimes?: number
+}
+interface PromptWhereConfig {
+  filterContains: string           // first filter: prompts that contain this substring
+  requireContains?: string         // then assert: filtered prompts must also contain this
+  requireNotContains?: string      // and must NOT contain this
+  times?: number                   // exact count of filtered prompts
+  minTimes?: number                // min count of filtered prompts
+  maxTimes?: number                // max count of filtered prompts
+  index?: number                   // optional 0-based index into filtered prompts to check specifically
+  nth?: number                     // optional 1-based alias for index
+}
+type SupportedProvider = 'openai' | 'claude' | 'gemini' | 'grok'
+interface SemanticMatchOptions {
+  provider?: SupportedProvider
+  model?: string
+  sdk?: unknown // optional user-supplied SDK instance
+  apiKey?: string // optional API key override (useful for OpenAI-compatible endpoints)
+  baseURL?: string // optional base URL override for OpenAI-compatible APIs
+}
+type EvaluationTarget = 'prompt' | 'result'
+interface EvaluationCondition {
+  greaterThan?: number
+  lessThan?: number
+  atLeast?: number
+  atMost?: number
+  equals?: number
+}
+interface EvaluateOutputMetricConfig {
+  evaluationPrompt: string
+  target?: EvaluationTarget       // 'prompt' or 'result'; default 'result'
+  index?: number                  // 0-based index into LLM steps
+  nth?: number                    // 1-based alias for index
+  condition?: EvaluationCondition // optional; default atLeast 0.7
+  provider?: SupportedProvider
+  model?: string
+  sdk?: unknown                   // optional SDK instance
+  apiKey?: string                 // optional API key override (useful for OpenAI-compatible endpoints)
+  baseURL?: string                // optional base URL override for OpenAI-compatible APIs
+}
+declare module 'expect' {
+  interface Matchers<R> {
+    toHaveLLMStep(config?: LLMStepConfig): R;
+    toCallTool(toolName: string): R;
+    toMatchSemanticOutput(expected: string, options?: SemanticMatchOptions): R;
+    toHaveCustomStep(config?: CustomStepConfig): R;
+    toHavePromptWhere(config: PromptWhereConfig): R;
+    toEvaluateOutputMetric(config: EvaluateOutputMetricConfig): Promise<R>;
+  }
+}

package/src/types/modules.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ declare module 'tsx/esm';
2	+ declare module 'tsx/cjs';

package/src/types/portal.ts ADDED Viewed

@@ -0,0 +1,69 @@
+export interface PortalTask {
+  /** Unique task ID assigned by the backend */
+  taskId: string
+  /** What to rerun */
+  type: 'tool' | 'ai'
+  /** Tool name or model name */
+  name: string
+  /** Tool arguments or LLM prompt/messages */
+  input: unknown
+  /** Model name (for AI tasks) */
+  model?: string
+  /** LLM provider: openai, anthropic, gemini, grok, etc. */
+  provider?: string
+  /** LLM generation parameters */
+  modelParameters?: {
+    temperature?: number
+    max_tokens?: number
+  }
+  /** Passthrough metadata (test group ID, expectation IDs, etc.) */
+  metadata?: Record<string, unknown>
+  /** HTTP/DB events from the same trace to freeze during execution */
+  frozenEvents?: { id: number; type: string; name: string; input: unknown; output: unknown; timestamp: number; durationMs: number | null; streamed?: boolean; streamRaw?: string | null }[]
+}
+export interface PortalTaskResult {
+  taskId: string
+  ok: boolean
+  output: unknown
+  error?: string
+  durationMs: number
+  usage?: {
+    inputTokens?: number
+    outputTokens?: number
+    totalTokens?: number
+  }
+  /** Echoed from the original task */
+  metadata?: Record<string, unknown>
+}
+export interface PortalServerOptions {
+  /** Port to listen on (default 4574) */
+  port?: number
+  /** Backend URL to POST results to */
+  backendUrl: string
+  /** Auth token for incoming and outgoing requests */
+  apiKey?: string
+  /** Project root directory (default process.cwd()) */
+  cwd?: string
+  /**
+   * Allowed origin domains that may send requests to this portal.
+   * By default only the `backendUrl` domain and localhost are allowed.
+   * Provide additional origins (e.g. 'https://app.elasticdash.com') to extend.
+   */
+  allowedOrigins?: string[]
+}
+export interface PortalServerHandle {
+  port: number
+  url: string
+  close: () => Promise<void>
+}
+export interface PortalStatus {
+  ok: boolean
+  queueLength: number
+  processing: string | null
+  completed: number
+  failed: number
+}

package/src/utils/debug.ts ADDED Viewed

@@ -0,0 +1,8 @@
+const DEBUG_KEY = 'ELASTICDASH_DEBUG'
+/** Log only when ELASTICDASH_DEBUG=1 is set. Writes to stderr so callers parsing stdout (e.g. `elasticdash run-tool`) get a clean JSON channel. */
+export function debugLog(...args: unknown[]): void {
+  if (typeof process !== 'undefined' && process.env?.[DEBUG_KEY] === '1') {
+    console.error(...args)
+  }
+}

package/src/utils/license-error.ts ADDED Viewed

@@ -0,0 +1,43 @@
+/**
+ * License-error notifier.
+ *
+ * The ElasticDash backend returns HTTP 402 ("Payment Required") when the
+ * caller's account has no available license / active plan. The SDK can hit
+ * this from several places (telemetry batcher, telemetry push, CI upload),
+ * so we centralise the user-facing message here and print it at most once
+ * per process to avoid spamming stderr on every retry / event.
+ */
+const BUY_URL = 'https://app.elasticdash.com'
+let alreadyNotified = false
+/**
+ * If `status` is 402, print a one-time message directing the user to buy a
+ * plan and return true. Returns false otherwise so callers can keep their
+ * existing branching.
+ *
+ * @param status   HTTP status code from the failed response.
+ * @param context  Optional short label for the failing subsystem (e.g.
+ *                 "telemetry", "ci-upload") — included in the printed
+ *                 prefix to help users locate the source.
+ */
+export function notifyLicenseError(status: number, context?: string): boolean {
+  if (status !== 402) return false
+  if (alreadyNotified) return true
+  alreadyNotified = true
+  const prefix = context ? `[elasticdash:${context}]` : '[elasticdash]'
+  // Write directly to stderr so this message is always visible regardless
+  // of the user's ELASTICDASH_DEBUG setting — a missing license is a hard
+  // blocker, not a debug detail.
+  console.error('')
+  console.error(`${prefix} No available license for your ElasticDash account (HTTP 402).`)
+  console.error(`${prefix} Please go to ${BUY_URL} to buy a plan.`)
+  console.error('')
+  return true
+}
+/** Reset the one-time guard. Exposed for tests only. */
+export function resetLicenseErrorNotifier(): void {
+  alreadyNotified = false
+}

package/src/utils/redact.ts ADDED Viewed

@@ -0,0 +1,25 @@
+/**
+ * Deep-clones a value and replaces any object property whose key matches
+ * one of `keys` (case-insensitive) with "[REDACTED]".
+ * Returns the original value when `keys` is empty.
+ */
+export function redactPayload(value: unknown, keys: string[]): unknown {
+  if (keys.length === 0) return value
+  const lowerKeys = new Set(keys.map((k) => k.toLowerCase()))
+  return redact(value, lowerKeys)
+}
+function redact(value: unknown, keys: Set<string>): unknown {
+  if (value === null || value === undefined) return value
+  if (typeof value !== 'object') return value
+  if (Array.isArray(value)) {
+    return value.map((item) => redact(item, keys))
+  }
+  const out: Record<string, unknown> = {}
+  for (const [k, v] of Object.entries(value as Record<string, unknown>)) {
+    out[k] = keys.has(k.toLowerCase()) ? '[REDACTED]' : redact(v, keys)
+  }
+  return out
+}