npm - @launchdarkly/server-sdk-ai - Versions diffs - 0.12.3 → 0.14.0 - Mend

@launchdarkly/server-sdk-ai 0.12.3 → 0.14.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

package/CHANGELOG.md +44 -0
package/README.md +2 -2
package/__tests__/Judge.test.ts +496 -0
package/__tests__/LDAIClientImpl.test.ts +530 -323
package/__tests__/LDAIConfigTrackerImpl.test.ts +50 -290
package/__tests__/TrackedChat.test.ts +4 -5
package/dist/package.json +53 -0
package/dist/src/LDAIClientImpl.d.ts +39 -0
package/dist/src/LDAIClientImpl.d.ts.map +1 -0
package/dist/src/LDAIClientImpl.js +164 -0
package/dist/src/LDAIClientImpl.js.map +1 -0
package/dist/{LDAIConfigTrackerImpl.d.ts → src/LDAIConfigTrackerImpl.d.ts} +13 -11
package/dist/src/LDAIConfigTrackerImpl.d.ts.map +1 -0
package/dist/{LDAIConfigTrackerImpl.js → src/LDAIConfigTrackerImpl.js} +59 -44
package/dist/src/LDAIConfigTrackerImpl.js.map +1 -0
package/dist/src/LDClientMin.d.ts.map +1 -0
package/dist/{LDClientMin.js.map → src/LDClientMin.js.map} +1 -1
package/dist/src/api/LDAIClient.d.ts +258 -0
package/dist/src/api/LDAIClient.d.ts.map +1 -0
package/dist/{api → src/api}/LDAIClient.js.map +1 -1
package/dist/{api → src/api}/chat/TrackedChat.d.ts +22 -4
package/dist/src/api/chat/TrackedChat.d.ts.map +1 -0
package/dist/{api → src/api}/chat/TrackedChat.js +43 -2
package/dist/src/api/chat/TrackedChat.js.map +1 -0
package/dist/src/api/chat/index.d.ts.map +1 -0
package/dist/src/api/chat/index.js.map +1 -0
package/dist/src/api/chat/types.d.ts +22 -0
package/dist/src/api/chat/types.d.ts.map +1 -0
package/dist/{api → src/api}/chat/types.js.map +1 -1
package/dist/{api → src/api}/config/LDAIConfigTracker.d.ts +41 -22
package/dist/src/api/config/LDAIConfigTracker.d.ts.map +1 -0
package/dist/src/api/config/LDAIConfigTracker.js.map +1 -0
package/dist/src/api/config/LDAIConfigUtils.d.ts +2 -0
package/dist/src/api/config/LDAIConfigUtils.d.ts.map +1 -0
package/dist/src/api/config/LDAIConfigUtils.js +141 -0
package/dist/src/api/config/LDAIConfigUtils.js.map +1 -0
package/dist/src/api/config/index.d.ts +3 -0
package/dist/src/api/config/index.d.ts.map +1 -0
package/dist/{api/agents → src/api/config}/index.js +1 -1
package/dist/src/api/config/index.js.map +1 -0
package/dist/src/api/config/types.d.ts +202 -0
package/dist/src/api/config/types.d.ts.map +1 -0
package/dist/{api/agents/LDAIAgent.js → src/api/config/types.js} +1 -1
package/dist/src/api/config/types.js.map +1 -0
package/dist/{api → src/api}/index.d.ts +1 -1
package/dist/src/api/index.d.ts.map +1 -0
package/dist/{api → src/api}/index.js +1 -1
package/dist/src/api/index.js.map +1 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.d.ts +11 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.d.ts.map +1 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.js +52 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.js.map +1 -0
package/dist/src/api/judge/Judge.d.ts +63 -0
package/dist/src/api/judge/Judge.d.ts.map +1 -0
package/dist/src/api/judge/Judge.js +149 -0
package/dist/src/api/judge/Judge.js.map +1 -0
package/dist/src/api/judge/index.d.ts +3 -0
package/dist/src/api/judge/index.d.ts.map +1 -0
package/dist/src/api/judge/index.js +6 -0
package/dist/src/api/judge/index.js.map +1 -0
package/dist/src/api/judge/types.d.ts +35 -0
package/dist/src/api/judge/types.d.ts.map +1 -0
package/dist/{api/config/LDAIConfig.js → src/api/judge/types.js} +1 -1
package/dist/src/api/judge/types.js.map +1 -0
package/dist/src/api/metrics/BedrockTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/BedrockTokenUsage.js.map +1 -0
package/dist/src/api/metrics/LDAIMetrics.d.ts.map +1 -0
package/dist/src/api/metrics/LDAIMetrics.js.map +1 -0
package/dist/src/api/metrics/LDFeedbackKind.d.ts.map +1 -0
package/dist/src/api/metrics/LDFeedbackKind.js.map +1 -0
package/dist/src/api/metrics/LDTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/LDTokenUsage.js.map +1 -0
package/dist/src/api/metrics/OpenAiUsage.d.ts.map +1 -0
package/dist/src/api/metrics/OpenAiUsage.js.map +1 -0
package/dist/src/api/metrics/VercelAISDKTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/VercelAISDKTokenUsage.js.map +1 -0
package/dist/src/api/metrics/index.d.ts.map +1 -0
package/dist/src/api/metrics/index.js.map +1 -0
package/dist/{api → src/api}/providers/AIProvider.d.ts +20 -3
package/dist/src/api/providers/AIProvider.d.ts.map +1 -0
package/dist/src/api/providers/AIProvider.js +88 -0
package/dist/src/api/providers/AIProvider.js.map +1 -0
package/dist/{api → src/api}/providers/AIProviderFactory.d.ts +2 -2
package/dist/src/api/providers/AIProviderFactory.d.ts.map +1 -0
package/dist/src/api/providers/AIProviderFactory.js.map +1 -0
package/dist/src/api/providers/index.d.ts.map +1 -0
package/dist/src/api/providers/index.js.map +1 -0
package/dist/src/index.d.ts.map +1 -0
package/dist/src/index.js.map +1 -0
package/docs/assets/search.js +1 -1
package/docs/classes/AIProvider.html +55 -20
package/docs/classes/AIProviderFactory.html +27 -17
package/docs/classes/Judge.html +322 -0
package/docs/classes/TrackedChat.html +97 -29
package/docs/enums/LDFeedbackKind.html +22 -12
package/docs/functions/createBedrockTokenUsage.html +20 -10
package/docs/functions/createOpenAiUsage.html +20 -10
package/docs/functions/createVercelAISDKTokenUsage.html +20 -10
package/docs/functions/initAi.html +20 -10
package/docs/index.html +36 -16
package/docs/interfaces/ChatResponse.html +35 -14
package/docs/interfaces/EvalScore.html +119 -0
package/docs/interfaces/JudgeResponse.html +129 -0
package/docs/interfaces/LDAIAgentConfig.html +81 -33
package/docs/interfaces/{LDAIAgent.html → LDAIAgentConfigDefault.html} +51 -41
package/docs/interfaces/LDAIAgentRequestConfig.html +129 -0
package/docs/interfaces/LDAIClient.html +234 -40
package/docs/interfaces/{VercelAISDKConfig.html → LDAICompletionConfig.html} +86 -86
package/docs/interfaces/LDAICompletionConfigDefault.html +155 -0
package/docs/interfaces/LDAIConfig.html +45 -75
package/docs/interfaces/LDAIConfigDefault.html +133 -0
package/docs/interfaces/LDAIConfigTracker.html +140 -59
package/docs/interfaces/LDAIJudgeConfig.html +167 -0
package/docs/interfaces/LDAIJudgeConfigDefault.html +155 -0
package/docs/interfaces/LDAIMetrics.html +22 -12
package/docs/interfaces/LDJudge.html +119 -0
package/docs/interfaces/{VercelAISDKMapOptions.html → LDJudgeConfiguration.html} +36 -19
package/docs/interfaces/LDLogger.html +19 -9
package/docs/interfaces/LDMessage.html +22 -12
package/docs/interfaces/LDModelConfig.html +23 -13
package/docs/interfaces/LDProviderConfig.html +21 -11
package/docs/interfaces/LDTokenUsage.html +23 -13
package/docs/interfaces/StructuredResponse.html +129 -0
package/docs/types/{VercelAISDKProvider.html → LDAIConfigDefaultKind.html} +26 -31
package/docs/types/{LDAIAgentDefaults.html → LDAIConfigKind.html} +24 -14
package/docs/types/{LDAIDefaults.html → LDAIConfigMode.html} +24 -24
package/docs/types/SupportedAIProvider.html +20 -10
package/docs/variables/SUPPORTED_AI_PROVIDERS.html +20 -10
package/package.json +3 -3
package/src/LDAIClientImpl.ts +222 -176
package/src/LDAIConfigTrackerImpl.ts +73 -54
package/src/api/LDAIClient.ts +166 -33
package/src/api/chat/TrackedChat.ts +64 -5
package/src/api/chat/types.ts +8 -1
package/src/api/config/LDAIConfigTracker.ts +46 -27
package/src/api/config/LDAIConfigUtils.ts +201 -0
package/src/api/config/index.ts +2 -2
package/src/api/config/types.ts +256 -0
package/src/api/index.ts +1 -1
package/src/api/judge/EvaluationSchemaBuilder.ts +54 -0
package/src/api/judge/Judge.ts +216 -0
package/src/api/judge/index.ts +2 -0
package/src/api/judge/types.ts +39 -0
package/src/api/providers/AIProvider.ts +54 -3
package/src/api/providers/AIProviderFactory.ts +4 -4
package/tsconfig.json +3 -3
package/tsconfig.ref.json +1 -1
package/__tests__/LDAIConfigMapper.test.ts +0 -159
package/dist/LDAIClientImpl.d.ts +0 -23
package/dist/LDAIClientImpl.d.ts.map +0 -1
package/dist/LDAIClientImpl.js +0 -128
package/dist/LDAIClientImpl.js.map +0 -1
package/dist/LDAIConfigMapper.d.ts +0 -10
package/dist/LDAIConfigMapper.d.ts.map +0 -1
package/dist/LDAIConfigMapper.js +0 -55
package/dist/LDAIConfigMapper.js.map +0 -1
package/dist/LDAIConfigTrackerImpl.d.ts.map +0 -1
package/dist/LDAIConfigTrackerImpl.js.map +0 -1
package/dist/LDClientMin.d.ts.map +0 -1
package/dist/api/LDAIClient.d.ts +0 -169
package/dist/api/LDAIClient.d.ts.map +0 -1
package/dist/api/agents/LDAIAgent.d.ts +0 -32
package/dist/api/agents/LDAIAgent.d.ts.map +0 -1
package/dist/api/agents/LDAIAgent.js.map +0 -1
package/dist/api/agents/index.d.ts +0 -2
package/dist/api/agents/index.d.ts.map +0 -1
package/dist/api/agents/index.js.map +0 -1
package/dist/api/chat/TrackedChat.d.ts.map +0 -1
package/dist/api/chat/TrackedChat.js.map +0 -1
package/dist/api/chat/index.d.ts.map +0 -1
package/dist/api/chat/index.js.map +0 -1
package/dist/api/chat/types.d.ts +0 -16
package/dist/api/chat/types.d.ts.map +0 -1
package/dist/api/config/LDAIConfig.d.ts +0 -92
package/dist/api/config/LDAIConfig.d.ts.map +0 -1
package/dist/api/config/LDAIConfig.js.map +0 -1
package/dist/api/config/LDAIConfigTracker.d.ts.map +0 -1
package/dist/api/config/LDAIConfigTracker.js.map +0 -1
package/dist/api/config/VercelAISDK.d.ts +0 -19
package/dist/api/config/VercelAISDK.d.ts.map +0 -1
package/dist/api/config/VercelAISDK.js +0 -3
package/dist/api/config/VercelAISDK.js.map +0 -1
package/dist/api/config/index.d.ts +0 -4
package/dist/api/config/index.d.ts.map +0 -1
package/dist/api/config/index.js +0 -19
package/dist/api/config/index.js.map +0 -1
package/dist/api/index.d.ts.map +0 -1
package/dist/api/index.js.map +0 -1
package/dist/api/metrics/BedrockTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/BedrockTokenUsage.js.map +0 -1
package/dist/api/metrics/LDAIMetrics.d.ts.map +0 -1
package/dist/api/metrics/LDAIMetrics.js.map +0 -1
package/dist/api/metrics/LDFeedbackKind.d.ts.map +0 -1
package/dist/api/metrics/LDFeedbackKind.js.map +0 -1
package/dist/api/metrics/LDTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/LDTokenUsage.js.map +0 -1
package/dist/api/metrics/OpenAiUsage.d.ts.map +0 -1
package/dist/api/metrics/OpenAiUsage.js.map +0 -1
package/dist/api/metrics/VercelAISDKTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/VercelAISDKTokenUsage.js.map +0 -1
package/dist/api/metrics/index.d.ts.map +0 -1
package/dist/api/metrics/index.js.map +0 -1
package/dist/api/providers/AIProvider.d.ts.map +0 -1
package/dist/api/providers/AIProvider.js +0 -31
package/dist/api/providers/AIProvider.js.map +0 -1
package/dist/api/providers/AIProviderFactory.d.ts.map +0 -1
package/dist/api/providers/AIProviderFactory.js.map +0 -1
package/dist/api/providers/index.d.ts.map +0 -1
package/dist/api/providers/index.js.map +0 -1
package/dist/index.d.ts.map +0 -1
package/dist/index.js.map +0 -1
package/src/LDAIConfigMapper.ts +0 -65
package/src/api/agents/LDAIAgent.ts +0 -36
package/src/api/agents/index.ts +0 -1
package/src/api/config/LDAIConfig.ts +0 -101
package/src/api/config/VercelAISDK.ts +0 -21
/package/dist/{LDClientMin.d.ts → src/LDClientMin.d.ts} +0 -0
/package/dist/{LDClientMin.js → src/LDClientMin.js} +0 -0
/package/dist/{api → src/api}/LDAIClient.js +0 -0
/package/dist/{api → src/api}/chat/index.d.ts +0 -0
/package/dist/{api → src/api}/chat/index.js +0 -0
/package/dist/{api → src/api}/chat/types.js +0 -0
/package/dist/{api → src/api}/config/LDAIConfigTracker.js +0 -0
/package/dist/{api → src/api}/metrics/BedrockTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/BedrockTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/LDAIMetrics.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDAIMetrics.js +0 -0
/package/dist/{api → src/api}/metrics/LDFeedbackKind.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDFeedbackKind.js +0 -0
/package/dist/{api → src/api}/metrics/LDTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/OpenAiUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/OpenAiUsage.js +0 -0
/package/dist/{api → src/api}/metrics/VercelAISDKTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/VercelAISDKTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/index.d.ts +0 -0
/package/dist/{api → src/api}/metrics/index.js +0 -0
/package/dist/{api → src/api}/providers/AIProviderFactory.js +0 -0
/package/dist/{api → src/api}/providers/index.d.ts +0 -0
/package/dist/{api → src/api}/providers/index.js +0 -0
/package/dist/{index.d.ts → src/index.d.ts} +0 -0
/package/dist/{index.js → src/index.js} +0 -0

package/__tests__/LDAIClientImpl.test.ts CHANGED Viewed

@@ -1,382 +1,589 @@
 import { LDContext } from '@launchdarkly/js-server-sdk-common';
-import { LDAIAgentDefaults } from '../src/api/agents';
-import { LDAIDefaults } from '../src/api/config';
+import {
+  LDAIAgentConfigDefault,
+  LDAICompletionConfigDefault,
+  LDAIJudgeConfigDefault,
+} from '../src/api/config/types';
+import { Judge } from '../src/api/judge/Judge';
+import { AIProviderFactory } from '../src/api/providers/AIProviderFactory';
 import { LDAIClientImpl } from '../src/LDAIClientImpl';
 import { LDClientMin } from '../src/LDClientMin';
+// Mock Judge and AIProviderFactory
+jest.mock('../src/api/judge/Judge');
+jest.mock('../src/api/providers/AIProviderFactory');
 const mockLdClient: jest.Mocked<LDClientMin> = {
   variation: jest.fn(),
   track: jest.fn(),
 };
+// Reset mocks before each test
+beforeEach(() => {
+  jest.clearAllMocks();
+});
 const testContext: LDContext = { kind: 'user', key: 'test-user' };
-it('returns config with interpolated messages', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-flag';
-  const defaultValue: LDAIDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    messages: [],
-    enabled: true,
-  };
-  const mockVariation = {
-    model: {
-      name: 'example-model',
-      parameters: { name: 'imagination', temperature: 0.7, maxTokens: 4096 },
-    },
-    provider: {
-      name: 'example-provider',
-    },
-    messages: [
-      { role: 'system', content: 'Hello {{name}}' },
-      { role: 'user', content: 'Score: {{score}}' },
-    ],
-    _ldMeta: {
-      variationKey: 'v1',
-      enabled: true,
-    },
-  };
-  mockLdClient.variation.mockResolvedValue(mockVariation);
-  const variables = { name: 'John', score: 42 };
-  const result = await client.config(key, testContext, defaultValue, variables);
-  expect(result).toEqual({
-    model: {
-      name: 'example-model',
-      parameters: { name: 'imagination', temperature: 0.7, maxTokens: 4096 },
-    },
-    provider: {
-      name: 'example-provider',
-    },
-    messages: [
+describe('config evaluation', () => {
+  it('evaluates completion config successfully with variable interpolation', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      enabled: false,
+    };
+    const mockVariation = {
+      model: {
+        name: 'example-model',
+        parameters: { name: 'imagination', temperature: 0.7, maxTokens: 4096 },
+      },
+      provider: {
+        name: 'example-provider',
+      },
+      messages: [
+        { role: 'system', content: 'Hello {{name}}' },
+        { role: 'user', content: 'Score: {{score}}' },
+      ],
+      _ldMeta: {
+        variationKey: 'v1',
+        enabled: true,
+        mode: 'completion',
+      },
+    };
+    mockLdClient.variation.mockResolvedValue(mockVariation);
+    const variables = { name: 'John', score: 42 };
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    const result = await client.completionConfig(key, testContext, defaultValue, variables);
+    expect(evaluateSpy).toHaveBeenCalledWith(
+      key,
+      testContext,
+      defaultValue,
+      'completion',
+      variables,
+    );
+    expect(result.messages).toEqual([
       { role: 'system', content: 'Hello John' },
       { role: 'user', content: 'Score: 42' },
-    ],
-    tracker: expect.any(Object),
-    enabled: true,
-    toVercelAISDK: expect.any(Function),
+    ]);
+    expect(result.tracker).toBeDefined();
+    expect(result.enabled).toBe(true);
+    evaluateSpy.mockRestore();
   });
-  // Verify tracking was called
-  expect(mockLdClient.track).toHaveBeenCalledWith(
-    '$ld:ai:config:function:single',
-    testContext,
-    key,
-    1,
-  );
-});
+  it('includes context (ldctx) in variables for message interpolation', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      enabled: false,
+    };
+    const mockVariation = {
+      messages: [{ role: 'system', content: 'User key: {{ldctx.key}}' }],
+      _ldMeta: { variationKey: 'v1', enabled: true, mode: 'completion' },
+    };
-it('includes context in variables for messages interpolation', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-flag';
-  const defaultValue: LDAIDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    messages: [],
-  };
+    mockLdClient.variation.mockResolvedValue(mockVariation);
-  const mockVariation = {
-    messages: [{ role: 'system', content: 'User key: {{ldctx.key}}' }],
-    _ldMeta: { variationKey: 'v1', enabled: true },
-  };
+    const result = await client.completionConfig(key, testContext, defaultValue);
-  mockLdClient.variation.mockResolvedValue(mockVariation);
+    expect(result.messages?.[0].content).toBe('User key: test-user');
+  });
-  const result = await client.config(key, testContext, defaultValue);
+  it('evaluates agent config successfully with instruction interpolation', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-agent';
+    const defaultValue: LDAIAgentConfigDefault = {
+      enabled: false,
+    };
-  expect(result.messages?.[0].content).toBe('User key: test-user');
-  expect(result.toVercelAISDK).toEqual(expect.any(Function));
-});
+    const mockVariation = {
+      model: {
+        name: 'example-model',
+        parameters: { temperature: 0.7, maxTokens: 4096 },
+      },
+      provider: {
+        name: 'example-provider',
+      },
+      instructions:
+        'You are a helpful assistant. Your name is {{name}} and your score is {{score}}',
+      _ldMeta: {
+        variationKey: 'v1',
+        enabled: true,
+        mode: 'agent',
+      },
+    };
-it('handles missing metadata in variation', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-flag';
-  const defaultValue: LDAIDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    messages: [],
-  };
-  const mockVariation = {
-    model: { name: 'example-provider', parameters: { name: 'imagination' } },
-    messages: [{ role: 'system', content: 'Hello' }],
-  };
-  mockLdClient.variation.mockResolvedValue(mockVariation);
-  const result = await client.config(key, testContext, defaultValue);
-  expect(result).toEqual({
-    model: { name: 'example-provider', parameters: { name: 'imagination' } },
-    messages: [{ role: 'system', content: 'Hello' }],
-    tracker: expect.any(Object),
-    enabled: false,
-    toVercelAISDK: expect.any(Function),
-  });
-});
+    mockLdClient.variation.mockResolvedValue(mockVariation);
-it('passes the default value to the underlying client', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'non-existent-flag';
-  const defaultValue: LDAIDefaults = {
-    model: { name: 'default-model', parameters: { name: 'default' } },
-    provider: { name: 'default-provider' },
-    messages: [{ role: 'system', content: 'Default messages' }],
-    enabled: true,
-  };
-  const expectedLDFlagValue = {
-    _ldMeta: { enabled: true },
-    model: defaultValue.model,
-    messages: defaultValue.messages,
-    provider: defaultValue.provider,
-  };
-  mockLdClient.variation.mockResolvedValue(expectedLDFlagValue);
-  const result = await client.config(key, testContext, defaultValue);
-  expect(result).toEqual({
-    model: defaultValue.model,
-    messages: defaultValue.messages,
-    provider: defaultValue.provider,
-    tracker: expect.any(Object),
-    enabled: defaultValue.enabled,
-    toVercelAISDK: expect.any(Function),
+    const variables = { name: 'John', score: 42 };
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    const result = await client.agentConfig(key, testContext, defaultValue, variables);
+    expect(evaluateSpy).toHaveBeenCalledWith(key, testContext, defaultValue, 'agent', variables);
+    expect(result.instructions).toBe(
+      'You are a helpful assistant. Your name is John and your score is 42',
+    );
+    expect(result.tracker).toBeDefined();
+    expect(result.enabled).toBe(true);
+    evaluateSpy.mockRestore();
   });
-  expect(mockLdClient.variation).toHaveBeenCalledWith(key, testContext, expectedLDFlagValue);
-});
+  it('evaluates judge config successfully', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
-// New agent-related tests
-it('returns single agent config with interpolated instructions', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-agent';
-  const defaultValue: LDAIAgentDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    instructions: 'You are a helpful assistant.',
-    enabled: true,
-  };
-  const mockVariation = {
-    model: {
-      name: 'example-model',
-      parameters: { name: 'imagination', temperature: 0.7, maxTokens: 4096 },
-    },
-    provider: {
-      name: 'example-provider',
-    },
-    instructions: 'You are a helpful assistant. Your name is {{name}} and your score is {{score}}',
-    _ldMeta: {
-      variationKey: 'v1',
+    const mockVariation = {
       enabled: true,
-      mode: 'agent',
-    },
-  };
-  mockLdClient.variation.mockResolvedValue(mockVariation);
-  const variables = { name: 'John', score: 42 };
-  const result = await client.agent(key, testContext, defaultValue, variables);
-  expect(result).toEqual({
-    model: {
-      name: 'example-model',
-      parameters: { name: 'imagination', temperature: 0.7, maxTokens: 4096 },
-    },
-    provider: {
-      name: 'example-provider',
-    },
-    instructions: 'You are a helpful assistant. Your name is John and your score is 42',
-    tracker: expect.any(Object),
-    enabled: true,
+      model: { name: 'gpt-4' },
+      provider: { name: 'openai' },
+      evaluationMetricKeys: ['relevance', 'accuracy'],
+      messages: [{ role: 'system', content: 'You are a judge.' }],
+      _ldMeta: {
+        variationKey: 'v1',
+        enabled: true,
+        mode: 'judge',
+      },
+    };
+    mockLdClient.variation.mockResolvedValue(mockVariation);
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    const result = await client.judgeConfig(key, testContext, defaultValue);
+    expect(evaluateSpy).toHaveBeenCalledWith(key, testContext, defaultValue, 'judge', undefined);
+    expect(result.evaluationMetricKeys).toEqual(['relevance', 'accuracy']);
+    expect(result.tracker).toBeDefined();
+    expect(result.enabled).toBe(true);
+    evaluateSpy.mockRestore();
   });
-  // Verify tracking was called
-  expect(mockLdClient.track).toHaveBeenCalledWith(
-    '$ld:ai:agent:function:single',
-    testContext,
-    key,
-    1,
-  );
-});
+  it('handles mode mismatch by returning disabled config', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      enabled: false,
+    };
-it('includes context in variables for agent instructions interpolation', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-agent';
-  const defaultValue: LDAIAgentDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    instructions: 'You are a helpful assistant.',
-    enabled: true,
-  };
+    const mockVariation = {
+      model: { name: 'example-provider', parameters: { name: 'imagination' } },
+      messages: [{ role: 'system', content: 'Hello' }],
+      _ldMeta: { variationKey: 'v1', enabled: true, mode: 'agent' }, // Wrong mode
+    };
-  const mockVariation = {
-    instructions: 'You are a helpful assistant. Your user key is {{ldctx.key}}',
-    _ldMeta: { variationKey: 'v1', enabled: true, mode: 'agent' },
-  };
+    mockLdClient.variation.mockResolvedValue(mockVariation);
-  mockLdClient.variation.mockResolvedValue(mockVariation);
+    const result = await client.completionConfig(key, testContext, defaultValue);
-  const result = await client.agent(key, testContext, defaultValue);
+    expect(result.enabled).toBe(false);
+    expect(result.tracker).toBeUndefined();
+  });
-  expect(result.instructions).toBe('You are a helpful assistant. Your user key is test-user');
-});
+  it('handles missing metadata mode by defaulting to completion mode', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      enabled: false,
+    };
+    const mockVariation = {
+      model: { name: 'example-provider', parameters: { name: 'imagination' } },
+      messages: [{ role: 'system', content: 'Hello' }],
+      // No _ldMeta - mode defaults to completion
+    };
-it('handles missing metadata in agent variation', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'test-agent';
-  const defaultValue: LDAIAgentDefaults = {
-    model: { name: 'test', parameters: { name: 'test-model' } },
-    instructions: 'You are a helpful assistant.',
-    enabled: true,
-  };
-  const mockVariation = {
-    model: { name: 'example-provider', parameters: { name: 'imagination' } },
-    instructions: 'Hello.',
-  };
-  mockLdClient.variation.mockResolvedValue(mockVariation);
-  const result = await client.agent(key, testContext, defaultValue);
-  expect(result).toEqual({
-    model: { name: 'example-provider', parameters: { name: 'imagination' } },
-    instructions: 'Hello.',
-    tracker: expect.any(Object),
-    enabled: false,
+    mockLdClient.variation.mockResolvedValue(mockVariation);
+    const result = await client.completionConfig(key, testContext, defaultValue);
+    expect(result.enabled).toBe(false);
+    expect(result.tracker).toBeDefined();
+    expect(result.messages).toEqual([{ role: 'system', content: 'Hello' }]);
+    expect(result.model).toEqual({ name: 'example-provider', parameters: { name: 'imagination' } });
   });
-});
-it('passes the default value to the underlying client for single agent', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
-  const key = 'non-existent-agent';
-  const defaultValue: LDAIAgentDefaults = {
-    model: { name: 'default-model', parameters: { name: 'default' } },
-    provider: { name: 'default-provider' },
-    instructions: 'Default instructions',
-    enabled: true,
-  };
-  const expectedLDFlagValue = {
-    _ldMeta: { enabled: defaultValue.enabled },
-    model: defaultValue.model,
-    provider: defaultValue.provider,
-    instructions: defaultValue.instructions,
-  };
-  mockLdClient.variation.mockResolvedValue(expectedLDFlagValue);
-  const result = await client.agent(key, testContext, defaultValue);
-  expect(result).toEqual({
-    model: defaultValue.model,
-    instructions: defaultValue.instructions,
-    provider: defaultValue.provider,
-    tracker: expect.any(Object),
-    enabled: defaultValue.enabled,
+  it('uses default value when flag does not exist', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'non-existent-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      model: { name: 'default-model', parameters: { name: 'default' } },
+      provider: { name: 'default-provider' },
+      messages: [{ role: 'system', content: 'Default messages' }],
+      enabled: true,
+    };
+    const expectedLDFlagValue = {
+      _ldMeta: { enabled: true, mode: 'completion', variationKey: '' },
+      model: defaultValue.model,
+      messages: defaultValue.messages,
+      provider: defaultValue.provider,
+    };
+    mockLdClient.variation.mockResolvedValue(expectedLDFlagValue);
+    const result = await client.completionConfig(key, testContext, defaultValue);
+    expect(result.model).toEqual(defaultValue.model);
+    expect(result.messages).toEqual(defaultValue.messages);
+    expect(result.provider).toEqual(defaultValue.provider);
+    expect(result.tracker).toBeDefined();
+    expect(result.enabled).toBe(defaultValue.enabled);
+    expect(mockLdClient.variation).toHaveBeenCalledWith(
+      key,
+      testContext,
+      expect.objectContaining({
+        model: defaultValue.model,
+        provider: defaultValue.provider,
+      }),
+    );
   });
+});
+describe('completionConfig method', () => {
+  it('calls _evaluate with correct parameters and tracks usage', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-flag';
+    const defaultValue: LDAICompletionConfigDefault = {
+      model: { name: 'test', parameters: { name: 'test-model' } },
+      messages: [],
+      enabled: true,
+    };
+    const variables = { var1: 'value1' };
-  expect(mockLdClient.variation).toHaveBeenCalledWith(key, testContext, expectedLDFlagValue);
+    const mockConfig = {
+      model: { name: 'test-model' },
+      messages: [],
+      tracker: {} as any,
+      enabled: true,
+    };
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    evaluateSpy.mockResolvedValue(mockConfig);
+    const result = await client.completionConfig(key, testContext, defaultValue, variables);
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:config:function:single',
+      testContext,
+      key,
+      1,
+    );
+    expect(evaluateSpy).toHaveBeenCalledWith(
+      key,
+      testContext,
+      defaultValue,
+      'completion',
+      variables,
+    );
+    expect(result).toBeDefined();
+    evaluateSpy.mockRestore();
+  });
 });
-it('returns multiple agents config with interpolated instructions', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
+describe('agentConfig method', () => {
+  it('calls _evaluate with correct parameters and tracks usage', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-agent';
+    const defaultValue: LDAIAgentConfigDefault = {
+      model: { name: 'test', parameters: { name: 'test-model' } },
+      instructions: 'You are a helpful assistant.',
+      enabled: true,
+    };
+    const variables = { var1: 'value1' };
+    const mockConfig = {
+      model: { name: 'test-model' },
+      instructions: 'You are a helpful assistant.',
+      tracker: {} as any,
+      enabled: true,
+    };
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    evaluateSpy.mockResolvedValue(mockConfig);
+    const result = await client.agentConfig(key, testContext, defaultValue, variables);
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:agent:function:single',
+      testContext,
+      key,
+      1,
+    );
+    expect(evaluateSpy).toHaveBeenCalledWith(key, testContext, defaultValue, 'agent', variables);
+    expect(result).toBe(mockConfig);
+    evaluateSpy.mockRestore();
+  });
+});
-  const agentConfigs = [
-    {
-      key: 'research-agent',
-      defaultValue: {
-        model: { name: 'test', parameters: { name: 'test-model' } },
-        instructions: 'You are a research assistant.',
+describe('agents method', () => {
+  it('retrieves multiple agent configs with interpolated instructions', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const agentConfigs = [
+      {
+        key: 'research-agent',
+        defaultValue: {
+          enabled: false,
+        },
+        variables: { topic: 'climate change' },
+      },
+      {
+        key: 'writing-agent',
+        defaultValue: {
+          enabled: false,
+        },
+        variables: { style: 'academic' },
+      },
+    ] as const;
+    const mockVariations = {
+      'research-agent': {
+        model: {
+          name: 'research-model',
+          parameters: { temperature: 0.3, maxTokens: 2048 },
+        },
+        provider: { name: 'openai' },
+        instructions: 'You are a research assistant specializing in {{topic}}.',
+        _ldMeta: { variationKey: 'v1', enabled: true, mode: 'agent' },
+      },
+      'writing-agent': {
+        model: {
+          name: 'writing-model',
+          parameters: { temperature: 0.7, maxTokens: 1024 },
+        },
+        provider: { name: 'anthropic' },
+        instructions: 'You are a writing assistant with {{style}} style.',
+        _ldMeta: { variationKey: 'v2', enabled: true, mode: 'agent' },
+      },
+    };
+    mockLdClient.variation.mockImplementation((key) =>
+      Promise.resolve(mockVariations[key as keyof typeof mockVariations]),
+    );
+    const result = await client.agentConfigs(agentConfigs, testContext);
+    expect(result).toEqual({
+      'research-agent': {
+        model: {
+          name: 'research-model',
+          parameters: { temperature: 0.3, maxTokens: 2048 },
+        },
+        provider: { name: 'openai' },
+        instructions: 'You are a research assistant specializing in climate change.',
+        tracker: expect.any(Object),
         enabled: true,
       },
-      variables: { topic: 'climate change' },
-    },
-    {
-      key: 'writing-agent',
-      defaultValue: {
-        model: { name: 'test', parameters: { name: 'test-model' } },
-        instructions: 'You are a writing assistant.',
+      'writing-agent': {
+        model: {
+          name: 'writing-model',
+          parameters: { temperature: 0.7, maxTokens: 1024 },
+        },
+        provider: { name: 'anthropic' },
+        instructions: 'You are a writing assistant with academic style.',
+        tracker: expect.any(Object),
         enabled: true,
       },
-      variables: { style: 'academic' },
-    },
-  ] as const;
+    });
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:agent:function:multiple',
+      testContext,
+      agentConfigs.length,
+      agentConfigs.length,
+    );
+  });
-  const mockVariations = {
-    'research-agent': {
-      model: {
-        name: 'research-model',
-        parameters: { temperature: 0.3, maxTokens: 2048 },
-      },
-      provider: { name: 'openai' },
-      instructions: 'You are a research assistant specializing in {{topic}}.',
-      _ldMeta: { variationKey: 'v1', enabled: true, mode: 'agent' },
-    },
-    'writing-agent': {
-      model: {
-        name: 'writing-model',
-        parameters: { temperature: 0.7, maxTokens: 1024 },
-      },
-      provider: { name: 'anthropic' },
-      instructions: 'You are a writing assistant with {{style}} style.',
-      _ldMeta: { variationKey: 'v2', enabled: true, mode: 'agent' },
-    },
-  };
+  it('handles empty agent configs array', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
-  mockLdClient.variation.mockImplementation((key) =>
-    Promise.resolve(mockVariations[key as keyof typeof mockVariations]),
-  );
+    const result = await client.agentConfigs([], testContext);
-  const result = await client.agents(agentConfigs, testContext);
+    expect(result).toEqual({});
-  expect(result).toEqual({
-    'research-agent': {
-      model: {
-        name: 'research-model',
-        parameters: { temperature: 0.3, maxTokens: 2048 },
-      },
-      provider: { name: 'openai' },
-      instructions: 'You are a research assistant specializing in climate change.',
-      tracker: expect.any(Object),
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:agent:function:multiple',
+      testContext,
+      0,
+      0,
+    );
+  });
+});
+describe('judgeConfig method', () => {
+  it('calls _evaluate with correct parameters and tracks usage', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
+    const variables = { metric: 'relevance' };
+    const mockJudgeConfig = {
       enabled: true,
-    },
-    'writing-agent': {
-      model: {
-        name: 'writing-model',
-        parameters: { temperature: 0.7, maxTokens: 1024 },
-      },
-      provider: { name: 'anthropic' },
-      instructions: 'You are a writing assistant with academic style.',
-      tracker: expect.any(Object),
+      model: { name: 'gpt-4' },
+      provider: { name: 'openai' },
+      evaluationMetricKeys: ['relevance'],
+      messages: [{ role: 'system' as const, content: 'You are a judge for {{metric}}.' }],
+      tracker: {} as any,
+      toVercelAISDK: jest.fn(),
+    };
+    const evaluateSpy = jest.spyOn(client as any, '_evaluate');
+    evaluateSpy.mockResolvedValue(mockJudgeConfig);
+    const result = await client.judgeConfig(key, testContext, defaultValue, variables);
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:judge:function:single',
+      testContext,
+      key,
+      1,
+    );
+    expect(evaluateSpy).toHaveBeenCalledWith(key, testContext, defaultValue, 'judge', variables);
+    expect(result).toBe(mockJudgeConfig);
+    evaluateSpy.mockRestore();
+  });
+});
+describe('createJudge method', () => {
+  let mockProvider: jest.Mocked<any>;
+  let mockJudge: jest.Mocked<Judge>;
+  beforeEach(() => {
+    mockProvider = {
+      invokeStructuredModel: jest.fn(),
+    };
+    mockJudge = {
+      evaluate: jest.fn(),
+      evaluateMessages: jest.fn(),
+    } as any;
+    // Mock AIProviderFactory.create
+    (AIProviderFactory.create as jest.Mock).mockResolvedValue(mockProvider);
+    // Mock Judge constructor
+    (Judge as jest.MockedClass<typeof Judge>).mockImplementation(() => mockJudge);
+  });
+  it('initializes judge successfully', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
+    const mockJudgeConfig = {
       enabled: true,
-    },
+      model: { name: 'gpt-4' },
+      provider: { name: 'openai' },
+      evaluationMetricKeys: ['relevance', 'accuracy'],
+      messages: [{ role: 'system' as const, content: 'You are a judge.' }],
+      tracker: {} as any,
+      toVercelAISDK: jest.fn(),
+    };
+    const judgeConfigSpy = jest.spyOn(client, 'judgeConfig');
+    judgeConfigSpy.mockResolvedValue(mockJudgeConfig);
+    const result = await client.createJudge(key, testContext, defaultValue);
+    expect(mockLdClient.track).toHaveBeenCalledWith(
+      '$ld:ai:judge:function:createJudge',
+      testContext,
+      key,
+      1,
+    );
+    expect(judgeConfigSpy).toHaveBeenCalledWith(key, testContext, defaultValue, {
+      message_history: '{{message_history}}',
+      response_to_evaluate: '{{response_to_evaluate}}',
+    });
+    expect(AIProviderFactory.create).toHaveBeenCalledWith(mockJudgeConfig, undefined, undefined);
+    expect(Judge).toHaveBeenCalledWith(
+      mockJudgeConfig,
+      mockJudgeConfig.tracker,
+      mockProvider,
+      undefined,
+    );
+    expect(result).toBe(mockJudge);
+    judgeConfigSpy.mockRestore();
   });
-  // Verify tracking was called
-  expect(mockLdClient.track).toHaveBeenCalledWith(
-    '$ld:ai:agent:function:multiple',
-    testContext,
-    agentConfigs.length,
-    agentConfigs.length,
-  );
-});
+  it('returns undefined when judge configuration is disabled', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
+    const mockJudgeConfig = {
+      enabled: false,
+      evaluationMetricKeys: [],
+    };
-it('handles empty agent configs array', async () => {
-  const client = new LDAIClientImpl(mockLdClient);
+    const judgeConfigSpy = jest.spyOn(client, 'judgeConfig');
+    judgeConfigSpy.mockResolvedValue(mockJudgeConfig);
-  const result = await client.agents([], testContext);
+    const result = await client.createJudge(key, testContext, defaultValue);
-  expect(result).toEqual({});
+    expect(result).toBeUndefined();
+    expect(AIProviderFactory.create).not.toHaveBeenCalled();
+    expect(Judge).not.toHaveBeenCalled();
+    judgeConfigSpy.mockRestore();
+  });
+  it('returns undefined when AIProviderFactory.create fails', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
-  // Verify tracking was called with 0 agents
-  expect(mockLdClient.track).toHaveBeenCalledWith(
-    '$ld:ai:agent:function:multiple',
-    testContext,
-    0,
-    0,
-  );
+    const mockJudgeConfig = {
+      enabled: true,
+      model: { name: 'gpt-4' },
+      provider: { name: 'openai' },
+      evaluationMetricKeys: ['relevance'],
+      messages: [{ role: 'system' as const, content: 'You are a judge.' }],
+      tracker: {} as any,
+      toVercelAISDK: jest.fn(),
+    };
+    const judgeConfigSpy = jest.spyOn(client, 'judgeConfig');
+    judgeConfigSpy.mockResolvedValue(mockJudgeConfig);
+    (AIProviderFactory.create as jest.Mock).mockResolvedValue(undefined);
+    const result = await client.createJudge(key, testContext, defaultValue);
+    expect(result).toBeUndefined();
+    expect(AIProviderFactory.create).toHaveBeenCalledWith(mockJudgeConfig, undefined, undefined);
+    expect(Judge).not.toHaveBeenCalled();
+    judgeConfigSpy.mockRestore();
+  });
+  it('handles errors gracefully', async () => {
+    const client = new LDAIClientImpl(mockLdClient);
+    const key = 'test-judge';
+    const defaultValue: LDAIJudgeConfigDefault = {
+      enabled: false,
+    };
+    const error = new Error('Judge configuration error');
+    const judgeConfigSpy = jest.spyOn(client, 'judgeConfig');
+    judgeConfigSpy.mockRejectedValue(error);
+    const result = await client.createJudge(key, testContext, defaultValue);
+    expect(result).toBeUndefined();
+    judgeConfigSpy.mockRestore();
+  });
 });