npm - ai-functions - Versions diffs - 2.1.1 → 2.3.0 - Mend

ai-functions 2.1.1 → 2.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (286) hide show

package/.turbo/turbo-build.log +1 -4
package/CHANGELOG.md +68 -1
package/README.md +397 -157
package/dist/ai-promise.d.ts +50 -3
package/dist/ai-promise.d.ts.map +1 -1
package/dist/ai-promise.js +410 -51
package/dist/ai-promise.js.map +1 -1
package/dist/ai-schemas.d.ts +56 -0
package/dist/ai-schemas.d.ts.map +1 -0
package/dist/ai-schemas.js +53 -0
package/dist/ai-schemas.js.map +1 -0
package/dist/ai.d.ts +16 -242
package/dist/ai.d.ts.map +1 -1
package/dist/ai.js +54 -837
package/dist/ai.js.map +1 -1
package/dist/batch/anthropic.d.ts +6 -4
package/dist/batch/anthropic.d.ts.map +1 -1
package/dist/batch/anthropic.js +83 -145
package/dist/batch/anthropic.js.map +1 -1
package/dist/batch/bedrock.d.ts +8 -30
package/dist/batch/bedrock.d.ts.map +1 -1
package/dist/batch/bedrock.js +155 -338
package/dist/batch/bedrock.js.map +1 -1
package/dist/batch/cloudflare.d.ts +8 -20
package/dist/batch/cloudflare.d.ts.map +1 -1
package/dist/batch/cloudflare.js +68 -189
package/dist/batch/cloudflare.js.map +1 -1
package/dist/batch/google.d.ts +6 -20
package/dist/batch/google.d.ts.map +1 -1
package/dist/batch/google.js +70 -238
package/dist/batch/google.js.map +1 -1
package/dist/batch/index.d.ts +4 -1
package/dist/batch/index.d.ts.map +1 -1
package/dist/batch/index.js +4 -1
package/dist/batch/index.js.map +1 -1
package/dist/batch/memory.d.ts +1 -1
package/dist/batch/memory.d.ts.map +1 -1
package/dist/batch/memory.js +14 -10
package/dist/batch/memory.js.map +1 -1
package/dist/batch/openai.d.ts +11 -14
package/dist/batch/openai.d.ts.map +1 -1
package/dist/batch/openai.js +52 -156
package/dist/batch/openai.js.map +1 -1
package/dist/batch/provider.d.ts +111 -0
package/dist/batch/provider.d.ts.map +1 -0
package/dist/batch/provider.js +233 -0
package/dist/batch/provider.js.map +1 -0
package/dist/batch-map.d.ts.map +1 -1
package/dist/batch-map.js +23 -17
package/dist/batch-map.js.map +1 -1
package/dist/batch-queue.d.ts +65 -0
package/dist/batch-queue.d.ts.map +1 -1
package/dist/batch-queue.js +169 -14
package/dist/batch-queue.js.map +1 -1
package/dist/budget.d.ts +272 -0
package/dist/budget.d.ts.map +1 -0
package/dist/budget.js +513 -0
package/dist/budget.js.map +1 -0
package/dist/cache.d.ts +295 -0
package/dist/cache.d.ts.map +1 -0
package/dist/cache.js +433 -0
package/dist/cache.js.map +1 -0
package/dist/context.d.ts +42 -8
package/dist/context.d.ts.map +1 -1
package/dist/context.js +64 -62
package/dist/context.js.map +1 -1
package/dist/digital-objects-registry.d.ts +229 -0
package/dist/digital-objects-registry.d.ts.map +1 -0
package/dist/digital-objects-registry.js +617 -0
package/dist/digital-objects-registry.js.map +1 -0
package/dist/embeddings.d.ts +2 -2
package/dist/embeddings.d.ts.map +1 -1
package/dist/errors.d.ts +22 -0
package/dist/errors.d.ts.map +1 -0
package/dist/errors.js +35 -0
package/dist/errors.js.map +1 -0
package/dist/eval/runner.d.ts +10 -1
package/dist/eval/runner.d.ts.map +1 -1
package/dist/eval/runner.js +41 -35
package/dist/eval/runner.js.map +1 -1
package/dist/eval-log/in-memory.d.ts +34 -0
package/dist/eval-log/in-memory.d.ts.map +1 -0
package/dist/eval-log/in-memory.js +84 -0
package/dist/eval-log/in-memory.js.map +1 -0
package/dist/eval-log/index.d.ts +29 -0
package/dist/eval-log/index.d.ts.map +1 -0
package/dist/eval-log/index.js +39 -0
package/dist/eval-log/index.js.map +1 -0
package/dist/eval-log/types.d.ts +101 -0
package/dist/eval-log/types.d.ts.map +1 -0
package/dist/eval-log/types.js +16 -0
package/dist/eval-log/types.js.map +1 -0
package/dist/function-registry.d.ts +116 -0
package/dist/function-registry.d.ts.map +1 -0
package/dist/function-registry.js +546 -0
package/dist/function-registry.js.map +1 -0
package/dist/generate.d.ts +9 -3
package/dist/generate.d.ts.map +1 -1
package/dist/generate.js +18 -22
package/dist/generate.js.map +1 -1
package/dist/index.d.ts +35 -20
package/dist/index.d.ts.map +1 -1
package/dist/index.js +89 -42
package/dist/index.js.map +1 -1
package/dist/logger.d.ts +118 -0
package/dist/logger.d.ts.map +1 -0
package/dist/logger.js +187 -0
package/dist/logger.js.map +1 -0
package/dist/middleware/budget.d.ts +84 -0
package/dist/middleware/budget.d.ts.map +1 -0
package/dist/middleware/budget.js +110 -0
package/dist/middleware/budget.js.map +1 -0
package/dist/middleware/cache.d.ts +103 -0
package/dist/middleware/cache.d.ts.map +1 -0
package/dist/middleware/cache.js +228 -0
package/dist/middleware/cache.js.map +1 -0
package/dist/middleware/embed-cache.d.ts +99 -0
package/dist/middleware/embed-cache.d.ts.map +1 -0
package/dist/middleware/embed-cache.js +128 -0
package/dist/middleware/embed-cache.js.map +1 -0
package/dist/middleware/index.d.ts +11 -0
package/dist/middleware/index.d.ts.map +1 -0
package/dist/middleware/index.js +11 -0
package/dist/middleware/index.js.map +1 -0
package/dist/middleware/trace.d.ts +103 -0
package/dist/middleware/trace.d.ts.map +1 -0
package/dist/middleware/trace.js +176 -0
package/dist/middleware/trace.js.map +1 -0
package/dist/primitives.d.ts +120 -1
package/dist/primitives.d.ts.map +1 -1
package/dist/primitives.js +398 -26
package/dist/primitives.js.map +1 -1
package/dist/retry.d.ts +368 -0
package/dist/retry.d.ts.map +1 -0
package/dist/retry.js +646 -0
package/dist/retry.js.map +1 -0
package/dist/schema.d.ts.map +1 -1
package/dist/schema.js +2 -10
package/dist/schema.js.map +1 -1
package/dist/telemetry.d.ts +128 -0
package/dist/telemetry.d.ts.map +1 -0
package/dist/telemetry.js +285 -0
package/dist/telemetry.js.map +1 -0
package/dist/template.d.ts.map +1 -1
package/dist/template.js +6 -1
package/dist/template.js.map +1 -1
package/dist/tool-orchestration.d.ts +453 -0
package/dist/tool-orchestration.d.ts.map +1 -0
package/dist/tool-orchestration.js +763 -0
package/dist/tool-orchestration.js.map +1 -0
package/dist/type-guards.d.ts +28 -0
package/dist/type-guards.d.ts.map +1 -0
package/dist/type-guards.js +29 -0
package/dist/type-guards.js.map +1 -0
package/dist/types.d.ts +135 -17
package/dist/types.d.ts.map +1 -1
package/dist/types.js +36 -1
package/dist/types.js.map +1 -1
package/dist/wrap-for-v3.d.ts +80 -0
package/dist/wrap-for-v3.d.ts.map +1 -0
package/dist/wrap-for-v3.js +89 -0
package/dist/wrap-for-v3.js.map +1 -0
package/examples/00-quickstart.ts +232 -0
package/examples/01-rag-chatbot.ts +212 -0
package/examples/02-multi-agent-research.ts +290 -0
package/examples/03-email-classification.ts +379 -0
package/examples/04-content-moderation.ts +400 -0
package/examples/05-document-extraction.ts +455 -0
package/examples/06-streaming-chat-nextjs.ts +437 -0
package/examples/07-cloudflare-worker.ts +483 -0
package/examples/08-batch-processing.ts +491 -0
package/examples/09-budget-constrained.ts +527 -0
package/examples/10-tool-orchestration.ts +565 -0
package/examples/11-retry-resilience.ts +403 -0
package/examples/12-caching-strategies.ts +422 -0
package/examples/README.md +145 -0
package/package.json +10 -6
package/src/ai-promise.ts +528 -99
package/src/ai-schemas.ts +122 -0
package/src/ai.ts +69 -1153
package/src/batch/anthropic.ts +96 -161
package/src/batch/bedrock.ts +203 -454
package/src/batch/cloudflare.ts +99 -282
package/src/batch/google.ts +91 -297
package/src/batch/index.ts +4 -1
package/src/batch/memory.ts +15 -10
package/src/batch/openai.ts +65 -193
package/src/batch/provider.ts +336 -0
package/src/batch-map.ts +29 -24
package/src/batch-queue.ts +200 -11
package/src/budget.ts +740 -0
package/src/cache.ts +681 -0
package/src/context.ts +122 -76
package/src/digital-objects-registry.ts +750 -0
package/src/errors.ts +37 -0
package/src/eval/runner.ts +63 -38
package/src/eval-log/in-memory.ts +90 -0
package/src/eval-log/index.ts +46 -0
package/src/eval-log/types.ts +110 -0
package/src/function-registry.ts +671 -0
package/src/generate.ts +33 -33
package/src/index.ts +325 -49
package/src/logger.ts +232 -0
package/src/middleware/budget.ts +171 -0
package/src/middleware/cache.ts +299 -0
package/src/middleware/embed-cache.ts +195 -0
package/src/middleware/index.ts +23 -0
package/src/middleware/trace.ts +248 -0
package/src/primitives.ts +589 -62
package/src/retry.ts +902 -0
package/src/schema.ts +8 -17
package/src/telemetry.ts +403 -0
package/src/template.ts +8 -4
package/src/tool-orchestration.ts +1173 -0
package/src/type-guards.ts +31 -0
package/src/types.ts +164 -25
package/src/wrap-for-v3.ts +105 -0
package/test/ai-promise.test.ts +1080 -0
package/test/ai-proxy.test.ts +1 -1
package/test/backward-compat.test.ts +147 -0
package/test/batch-autosubmit-errors.test.ts +610 -0
package/test/batch-blog-posts.test.ts +87 -129
package/test/budget-tracking.test.ts +800 -0
package/test/cache.test.ts +712 -0
package/test/context-isolation.test.ts +687 -0
package/test/core-functions.test.ts +183 -579
package/test/decide.test.ts +154 -322
package/test/define.test.ts +211 -8
package/test/digital-objects-registry.test.ts +760 -0
package/test/embedding-cache-middleware.test.ts +140 -0
package/test/evals/deterministic.eval.test.ts +376 -0
package/test/generate-core.test.ts +140 -229
package/test/implicit-batch.test.ts +22 -65
package/test/json-parse-error-handling.test.ts +463 -0
package/test/retry-policy-integration.test.ts +117 -0
package/test/retry.test.ts +1016 -0
package/test/schema.test.ts +55 -19
package/test/streaming.test.ts +316 -0
package/test/template.test.ts +1164 -0
package/test/tool-orchestration.test.ts +1040 -0
package/test/wrap-for-v3.test.ts +612 -0
package/vitest.config.js +6 -0
package/vitest.config.ts +20 -0
package/dist/rpc/auth.d.ts +0 -69
package/dist/rpc/auth.d.ts.map +0 -1
package/dist/rpc/auth.js +0 -136
package/dist/rpc/auth.js.map +0 -1
package/dist/rpc/client.d.ts +0 -62
package/dist/rpc/client.d.ts.map +0 -1
package/dist/rpc/client.js +0 -103
package/dist/rpc/client.js.map +0 -1
package/dist/rpc/deferred.d.ts +0 -60
package/dist/rpc/deferred.d.ts.map +0 -1
package/dist/rpc/deferred.js +0 -96
package/dist/rpc/deferred.js.map +0 -1
package/dist/rpc/index.d.ts +0 -22
package/dist/rpc/index.d.ts.map +0 -1
package/dist/rpc/index.js +0 -38
package/dist/rpc/index.js.map +0 -1
package/dist/rpc/local.d.ts +0 -42
package/dist/rpc/local.d.ts.map +0 -1
package/dist/rpc/local.js +0 -50
package/dist/rpc/local.js.map +0 -1
package/dist/rpc/server.d.ts +0 -165
package/dist/rpc/server.d.ts.map +0 -1
package/dist/rpc/server.js +0 -405
package/dist/rpc/server.js.map +0 -1
package/dist/rpc/session.d.ts +0 -32
package/dist/rpc/session.d.ts.map +0 -1
package/dist/rpc/session.js +0 -43
package/dist/rpc/session.js.map +0 -1
package/dist/rpc/transport.d.ts +0 -306
package/dist/rpc/transport.d.ts.map +0 -1
package/dist/rpc/transport.js +0 -731
package/dist/rpc/transport.js.map +0 -1
package/src/batch/anthropic.js +0 -256
package/src/batch/bedrock.js +0 -584
package/src/batch/cloudflare.js +0 -287
package/src/batch/google.js +0 -359
package/src/batch/index.js +0 -30
package/src/batch/memory.js +0 -187
package/src/batch/openai.js +0 -402
package/src/eval/index.js +0 -7
package/src/eval/models.js +0 -119
package/src/eval/runner.js +0 -147
package/test/schema.test.js +0 -96

package/test/wrap-for-v3.test.ts ADDED Viewed

@@ -0,0 +1,612 @@
+/**
+ * Tests for the v3 middleware stack — cacheMiddleware, budgetMiddleware,
+ * traceMiddleware, wrapForV3, and the EvalLogStore primitive.
+ *
+ * Uses the AI SDK 6 `MockLanguageModelV3` from `'ai/test'` to simulate
+ * doGenerate / doStream without hitting a real provider.
+ */
+import { describe, it, expect, beforeEach } from 'vitest'
+import { wrapLanguageModel } from 'ai'
+import { MockLanguageModelV3 } from 'ai/test'
+import type {
+  LanguageModelV3CallOptions,
+  LanguageModelV3GenerateResult,
+  LanguageModelV3StreamResult,
+  LanguageModelV3StreamPart,
+} from '@ai-sdk/provider'
+import {
+  BudgetTracker,
+  cacheMiddleware,
+  budgetMiddleware,
+  traceMiddleware,
+  wrapForV3,
+  InMemoryEvalLogStore,
+  configureEvalLogStore,
+  getEvalLogStore,
+  type TraceEvent,
+} from '../src/index.js'
+// ============================================================================
+// Helpers
+// ============================================================================
+function makeGenerateResult(
+  text: string,
+  inputTokens = 100,
+  outputTokens = 50
+): LanguageModelV3GenerateResult {
+  return {
+    content: [{ type: 'text', text }],
+    finishReason: 'stop',
+    usage: {
+      inputTokens: { total: inputTokens, noCache: inputTokens, cacheRead: 0, cacheWrite: 0 },
+      outputTokens: { total: outputTokens, text: outputTokens, reasoning: 0 },
+    },
+    warnings: [],
+  }
+}
+function makeStreamResult(
+  text: string,
+  inputTokens = 100,
+  outputTokens = 50
+): LanguageModelV3StreamResult {
+  const chunks: LanguageModelV3StreamPart[] = [
+    { type: 'stream-start', warnings: [] },
+    { type: 'text-start', id: '1' },
+    { type: 'text-delta', id: '1', delta: text },
+    { type: 'text-end', id: '1' },
+    {
+      type: 'finish',
+      finishReason: 'stop',
+      usage: {
+        inputTokens: { total: inputTokens, noCache: inputTokens, cacheRead: 0, cacheWrite: 0 },
+        outputTokens: { total: outputTokens, text: outputTokens, reasoning: 0 },
+      },
+    },
+  ]
+  return {
+    stream: new ReadableStream<LanguageModelV3StreamPart>({
+      start(controller) {
+        for (const chunk of chunks) controller.enqueue(chunk)
+        controller.close()
+      },
+    }),
+  }
+}
+function makeCallOptions(promptText: string): LanguageModelV3CallOptions {
+  return {
+    prompt: [{ role: 'user', content: [{ type: 'text', text: promptText }] }],
+  }
+}
+async function consumeStream(
+  stream: ReadableStream<LanguageModelV3StreamPart>
+): Promise<LanguageModelV3StreamPart[]> {
+  const reader = stream.getReader()
+  const out: LanguageModelV3StreamPart[] = []
+  while (true) {
+    const { done, value } = await reader.read()
+    if (done) break
+    out.push(value)
+  }
+  return out
+}
+// ============================================================================
+// cacheMiddleware
+// ============================================================================
+describe('cacheMiddleware', () => {
+  beforeEach(() => {
+    process.env['V3_EVAL_CACHE'] = '1'
+  })
+  it('hit: returns cached result; miss: invokes wrapped model', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult(`response-${calls}`)
+      },
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: cacheMiddleware() })
+    const params = makeCallOptions('hello')
+    const r1 = await wrapped.doGenerate(params)
+    const r2 = await wrapped.doGenerate(params)
+    expect(calls).toBe(1)
+    expect(r1.content).toEqual(r2.content)
+    expect((r1.content[0] as { text: string }).text).toBe('response-1')
+  })
+  it('key derivation invalidates on prompt change', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult(`r${calls}`)
+      },
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: cacheMiddleware() })
+    await wrapped.doGenerate(makeCallOptions('first'))
+    await wrapped.doGenerate(makeCallOptions('second'))
+    expect(calls).toBe(2)
+  })
+  it('key derivation invalidates on schema change', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult(`r${calls}`)
+      },
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: cacheMiddleware() })
+    const baseParams = makeCallOptions('hello')
+    await wrapped.doGenerate({
+      ...baseParams,
+      responseFormat: {
+        type: 'json',
+        schema: { type: 'object', properties: { a: { type: 'string' } } },
+      },
+    })
+    await wrapped.doGenerate({
+      ...baseParams,
+      responseFormat: {
+        type: 'json',
+        schema: { type: 'object', properties: { b: { type: 'string' } } },
+      },
+    })
+    expect(calls).toBe(2)
+  })
+  it('TTL: expired entries are evicted on access', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult(`r${calls}`)
+      },
+    })
+    // 1ms TTL — second call after a short await is past expiry.
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: cacheMiddleware({ ttlMs: 1 }),
+    })
+    const params = makeCallOptions('hello')
+    await wrapped.doGenerate(params)
+    await new Promise((r) => setTimeout(r, 10))
+    await wrapped.doGenerate(params)
+    expect(calls).toBe(2)
+  })
+  it('respects 24h TTL by default (no eviction in-test)', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult('cached')
+      },
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: cacheMiddleware() })
+    const params = makeCallOptions('hello')
+    await wrapped.doGenerate(params)
+    await wrapped.doGenerate(params)
+    await wrapped.doGenerate(params)
+    expect(calls).toBe(1)
+  })
+  it('passthrough when env gate is disabled', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => {
+        calls++
+        return makeGenerateResult(`r${calls}`)
+      },
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: cacheMiddleware({ enabled: false }),
+    })
+    const params = makeCallOptions('hello')
+    await wrapped.doGenerate(params)
+    await wrapped.doGenerate(params)
+    expect(calls).toBe(2)
+  })
+  it('streams: caches and replays chunks via simulateReadableStream', async () => {
+    let calls = 0
+    const base = new MockLanguageModelV3({
+      doStream: async () => {
+        calls++
+        return makeStreamResult(`stream-${calls}`)
+      },
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: cacheMiddleware() })
+    const params = makeCallOptions('streaming hello')
+    const r1 = await wrapped.doStream(params)
+    const chunks1 = await consumeStream(r1.stream)
+    const r2 = await wrapped.doStream(params)
+    const chunks2 = await consumeStream(r2.stream)
+    expect(calls).toBe(1)
+    // Same shape, same content
+    const text1 = chunks1.find((c) => c.type === 'text-delta') as { delta: string } | undefined
+    const text2 = chunks2.find((c) => c.type === 'text-delta') as { delta: string } | undefined
+    expect(text1?.delta).toBe('stream-1')
+    expect(text2?.delta).toBe('stream-1')
+  })
+})
+// ============================================================================
+// budgetMiddleware
+// ============================================================================
+describe('budgetMiddleware', () => {
+  beforeEach(() => {
+    process.env['V3_EVAL_CACHE'] = '1'
+  })
+  it('records usage to tracker on completion', async () => {
+    const tracker = new BudgetTracker()
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => makeGenerateResult('hi', 1000, 500),
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: budgetMiddleware({ tracker }) })
+    await wrapped.doGenerate(makeCallOptions('hello'))
+    expect(tracker.getTotalInputTokens()).toBe(1000)
+    expect(tracker.getTotalOutputTokens()).toBe(500)
+    // gpt-4o pricing: $2.5/M input, $10/M output → 0.0025 + 0.005 = 0.0075
+    expect(tracker.getTotalCost()).toBeCloseTo(0.0075, 6)
+  })
+  it('works on cached path AND fresh path', async () => {
+    const tracker = new BudgetTracker()
+    let underlyingCalls = 0
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => {
+        underlyingCalls++
+        return makeGenerateResult('cached', 100, 50)
+      },
+    })
+    // Order matters here: cache → budget. With this order, cache is FIRST
+    // in the array → outermost on the way in. On a cache hit, cache short-
+    // circuits and budget never sees the call. We flip the order so budget
+    // wraps cache: budget always sees the (cached or fresh) result.
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: [budgetMiddleware({ tracker }), cacheMiddleware()],
+    })
+    const params = makeCallOptions('budget+cache')
+    await wrapped.doGenerate(params)
+    await wrapped.doGenerate(params)
+    expect(underlyingCalls).toBe(1)
+    // Budget recorded twice (once on miss, once on hit).
+    expect(tracker.getTotalInputTokens()).toBe(200)
+    expect(tracker.getTotalOutputTokens()).toBe(100)
+  })
+  it('pricing overlay applied via modelIdOverride', async () => {
+    const tracker = new BudgetTracker({
+      customPricing: {
+        sonnet: { inputPricePerMillion: 3, outputPricePerMillion: 15 },
+      },
+    })
+    const base = new MockLanguageModelV3({
+      modelId: 'unknown-id',
+      doGenerate: async () => makeGenerateResult('hi', 1_000_000, 1_000_000),
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: budgetMiddleware({ tracker, modelIdOverride: 'sonnet' }),
+    })
+    await wrapped.doGenerate(makeCallOptions('hello'))
+    // 1M in @ $3 + 1M out @ $15 = $18
+    expect(tracker.getTotalCost()).toBeCloseTo(18, 4)
+  })
+  it('streams: records usage from finish part', async () => {
+    const tracker = new BudgetTracker()
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doStream: async () => makeStreamResult('streamed', 200, 100),
+    })
+    const wrapped = wrapLanguageModel({ model: base, middleware: budgetMiddleware({ tracker }) })
+    const r = await wrapped.doStream(makeCallOptions('hello'))
+    await consumeStream(r.stream)
+    expect(tracker.getTotalInputTokens()).toBe(200)
+    expect(tracker.getTotalOutputTokens()).toBe(100)
+  })
+})
+// ============================================================================
+// traceMiddleware
+// ============================================================================
+describe('traceMiddleware', () => {
+  it('emits expected event shape', async () => {
+    const events: TraceEvent[] = []
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => makeGenerateResult('the response', 10, 5),
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: traceMiddleware({ kind: 'eval-trace', emit: (e) => events.push(e) }),
+    })
+    await wrapped.doGenerate(makeCallOptions('the prompt'))
+    expect(events.length).toBe(1)
+    const ev = events[0]!
+    expect(ev.kind).toBe('eval-trace')
+    expect(ev.model).toBe('gpt-4o')
+    expect(ev.prompt).toContain('the prompt')
+    expect(ev.response).toBe('the response')
+    expect(ev.usage?.inputTokens.total).toBe(10)
+    expect(ev.usage?.outputTokens.total).toBe(5)
+    expect(typeof ev.durationMs).toBe('number')
+    expect(ev.durationMs).toBeGreaterThanOrEqual(0)
+  })
+  it("doesn't break the wrapped chain on emit error", async () => {
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => makeGenerateResult('ok', 1, 1),
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: traceMiddleware({
+        emit: () => {
+          throw new Error('sink is broken')
+        },
+      }),
+    })
+    // Should NOT throw — emit error is swallowed.
+    const result = await wrapped.doGenerate(makeCallOptions('hi'))
+    expect((result.content[0] as { text: string }).text).toBe('ok')
+  })
+  it('supports getCostUsd resolver for costUsd field', async () => {
+    const events: TraceEvent[] = []
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => makeGenerateResult('hi', 1000, 500),
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: traceMiddleware({
+        emit: (e) => events.push(e),
+        getCostUsd: (_modelId, usage) => {
+          const inT = usage?.inputTokens.total ?? 0
+          const outT = usage?.outputTokens.total ?? 0
+          return (inT / 1_000_000) * 2.5 + (outT / 1_000_000) * 10
+        },
+      }),
+    })
+    await wrapped.doGenerate(makeCallOptions('hi'))
+    expect(events[0]?.costUsd).toBeCloseTo(0.0075, 6)
+  })
+  it('streams: emits on stream end with collected text', async () => {
+    const events: TraceEvent[] = []
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doStream: async () => makeStreamResult('streamed-text', 50, 25),
+    })
+    const wrapped = wrapLanguageModel({
+      model: base,
+      middleware: traceMiddleware({ emit: (e) => events.push(e) }),
+    })
+    const r = await wrapped.doStream(makeCallOptions('hi'))
+    await consumeStream(r.stream)
+    // Wait a tick for flush handler
+    await new Promise((r) => setTimeout(r, 10))
+    expect(events.length).toBe(1)
+    expect(events[0]?.response).toBe('streamed-text')
+  })
+})
+// ============================================================================
+// wrapForV3
+// ============================================================================
+describe('wrapForV3', () => {
+  beforeEach(() => {
+    process.env['V3_EVAL_CACHE'] = '1'
+  })
+  it('composes in correct order (cache → budget → trace)', async () => {
+    const tracker = new BudgetTracker()
+    const events: TraceEvent[] = []
+    let underlyingCalls = 0
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => {
+        underlyingCalls++
+        return makeGenerateResult('combined', 100, 50)
+      },
+    })
+    const wrapped = wrapForV3(base, {
+      cache: {},
+      budget: { tracker },
+      trace: { emit: (e) => events.push(e) },
+    })
+    const params = makeCallOptions('hello combined')
+    // First call: miss → underlying invoked, budget records, trace emits
+    await (
+      wrapped as unknown as {
+        doGenerate: (o: LanguageModelV3CallOptions) => Promise<LanguageModelV3GenerateResult>
+      }
+    ).doGenerate(params)
+    // Second call: cache hit → cache short-circuits; budget+trace do NOT
+    // run because they're installed AFTER cache. (See JSDoc on wrapForV3
+    // composition order — cache-first is the eval-fixture default.)
+    await (
+      wrapped as unknown as {
+        doGenerate: (o: LanguageModelV3CallOptions) => Promise<LanguageModelV3GenerateResult>
+      }
+    ).doGenerate(params)
+    expect(underlyingCalls).toBe(1)
+    expect(tracker.getTotalInputTokens()).toBe(100)
+    expect(events.length).toBe(1)
+  })
+  it('options can be omitted partially', async () => {
+    const tracker = new BudgetTracker()
+    const base = new MockLanguageModelV3({
+      modelId: 'gpt-4o',
+      doGenerate: async () => makeGenerateResult('partial', 10, 5),
+    })
+    // Only budget — no cache, no trace
+    const wrapped = wrapForV3(base, { budget: { tracker } })
+    await (
+      wrapped as unknown as {
+        doGenerate: (o: LanguageModelV3CallOptions) => Promise<LanguageModelV3GenerateResult>
+      }
+    ).doGenerate(makeCallOptions('hi'))
+    expect(tracker.getTotalInputTokens()).toBe(10)
+  })
+  it('returns the underlying model when all options are absent', async () => {
+    const base = new MockLanguageModelV3({
+      doGenerate: async () => makeGenerateResult('untouched', 1, 1),
+    })
+    const wrapped = wrapForV3(base, {})
+    expect(wrapped).toBe(base)
+  })
+})
+// ============================================================================
+// EvalLogStore (in-memory)
+// ============================================================================
+describe('InMemoryEvalLogStore', () => {
+  let store: InMemoryEvalLogStore
+  beforeEach(() => {
+    store = new InMemoryEvalLogStore()
+  })
+  it('record + get round-trips', async () => {
+    const stored = await store.record({
+      model: 'gpt-4o',
+      prompt: 'hello',
+      response: 'hi',
+      usage: { inputTokens: 10, outputTokens: 5 },
+      costUsd: 0.001,
+      durationMs: 42,
+    })
+    expect(stored.$id).toBeTruthy()
+    expect(stored.createdAt).toBeGreaterThan(0)
+    const fetched = await store.get(stored.$id)
+    expect(fetched).toEqual(stored)
+  })
+  it('list returns most recent first', async () => {
+    await store.record({
+      model: 'a',
+      prompt: 'p1',
+      response: 'r1',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    await store.record({
+      model: 'b',
+      prompt: 'p2',
+      response: 'r2',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    const list = await store.list()
+    expect(list.length).toBe(2)
+    expect(list[0]?.model).toBe('b')
+    expect(list[1]?.model).toBe('a')
+  })
+  it('list filters by model and traceId', async () => {
+    await store.record({
+      model: 'gpt-4o',
+      traceId: 't1',
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    await store.record({
+      model: 'sonnet',
+      traceId: 't1',
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    await store.record({
+      model: 'gpt-4o',
+      traceId: 't2',
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    expect((await store.list({ model: 'gpt-4o' })).length).toBe(2)
+    expect((await store.list({ traceId: 't1' })).length).toBe(2)
+    expect((await store.list({ model: 'gpt-4o', traceId: 't1' })).length).toBe(1)
+  })
+  it('list filters by tags (superset match)', async () => {
+    await store.record({
+      model: 'a',
+      tags: { persona: 'cfo', step: '3' },
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    await store.record({
+      model: 'b',
+      tags: { persona: 'cto' },
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    expect((await store.list({ tags: { persona: 'cfo' } })).length).toBe(1)
+    expect((await store.list({ tags: { persona: 'cto' } })).length).toBe(1)
+    expect((await store.list({ tags: { persona: 'unknown' } })).length).toBe(0)
+  })
+  it('delete removes the entry', async () => {
+    const e = await store.record({
+      model: 'a',
+      prompt: 'p',
+      response: 'r',
+      usage: { inputTokens: 1, outputTokens: 1 },
+      costUsd: 0,
+      durationMs: 1,
+    })
+    expect(await store.delete(e.$id)).toBe(true)
+    expect(await store.get(e.$id)).toBeUndefined()
+    expect(await store.delete(e.$id)).toBe(false)
+  })
+  it('global accessor + override', async () => {
+    const custom = new InMemoryEvalLogStore()
+    configureEvalLogStore(custom)
+    expect(getEvalLogStore()).toBe(custom)
+    configureEvalLogStore(null)
+    const lazy = getEvalLogStore()
+    expect(lazy).toBeInstanceOf(InMemoryEvalLogStore)
+    expect(lazy).not.toBe(custom)
+    // Reset so subsequent test-runs see a clean default
+    configureEvalLogStore(null)
+  })
+})

package/vitest.config.js CHANGED Viewed

@@ -17,6 +17,12 @@ for (const envPath of envPaths) {
 }
 export default defineConfig({
     test: {
+    // CRITICAL: Limit concurrency to prevent resource exhaustion
+    maxConcurrency: 1,
+    maxWorkers: 1,
+    minWorkers: 1,
+    fileParallelism: false,
         globals: false,
         environment: 'node',
         include: ['test/**/*.test.ts'],

package/vitest.config.ts CHANGED Viewed

@@ -20,6 +20,12 @@ for (const envPath of envPaths) {
 export default defineConfig({
   test: {
+    // CRITICAL: Limit concurrency to prevent resource exhaustion
+    maxConcurrency: 1,
+    maxWorkers: 1,
+    minWorkers: 1,
+    fileParallelism: false,
     globals: false,
     environment: 'node',
     include: ['test/**/*.test.ts'],
@@ -38,5 +44,19 @@ export default defineConfig({
         singleFork: true,
       },
     },
+    // Coverage configuration
+    coverage: {
+      provider: 'v8',
+      reporter: ['text', 'json', 'html'],
+      include: ['src/**/*.ts'],
+      exclude: ['**/*.test.ts', '**/__tests__/**', '**/node_modules/**'],
+      thresholds: {
+        statements: 65,
+        branches: 60,
+        functions: 60,
+        lines: 65,
+      },
+    },
   },
 })