npm - @launchdarkly/server-sdk-ai - Versions diffs - 0.12.3 → 0.14.0 - Mend

@launchdarkly/server-sdk-ai 0.12.3 → 0.14.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

package/CHANGELOG.md +44 -0
package/README.md +2 -2
package/__tests__/Judge.test.ts +496 -0
package/__tests__/LDAIClientImpl.test.ts +530 -323
package/__tests__/LDAIConfigTrackerImpl.test.ts +50 -290
package/__tests__/TrackedChat.test.ts +4 -5
package/dist/package.json +53 -0
package/dist/src/LDAIClientImpl.d.ts +39 -0
package/dist/src/LDAIClientImpl.d.ts.map +1 -0
package/dist/src/LDAIClientImpl.js +164 -0
package/dist/src/LDAIClientImpl.js.map +1 -0
package/dist/{LDAIConfigTrackerImpl.d.ts → src/LDAIConfigTrackerImpl.d.ts} +13 -11
package/dist/src/LDAIConfigTrackerImpl.d.ts.map +1 -0
package/dist/{LDAIConfigTrackerImpl.js → src/LDAIConfigTrackerImpl.js} +59 -44
package/dist/src/LDAIConfigTrackerImpl.js.map +1 -0
package/dist/src/LDClientMin.d.ts.map +1 -0
package/dist/{LDClientMin.js.map → src/LDClientMin.js.map} +1 -1
package/dist/src/api/LDAIClient.d.ts +258 -0
package/dist/src/api/LDAIClient.d.ts.map +1 -0
package/dist/{api → src/api}/LDAIClient.js.map +1 -1
package/dist/{api → src/api}/chat/TrackedChat.d.ts +22 -4
package/dist/src/api/chat/TrackedChat.d.ts.map +1 -0
package/dist/{api → src/api}/chat/TrackedChat.js +43 -2
package/dist/src/api/chat/TrackedChat.js.map +1 -0
package/dist/src/api/chat/index.d.ts.map +1 -0
package/dist/src/api/chat/index.js.map +1 -0
package/dist/src/api/chat/types.d.ts +22 -0
package/dist/src/api/chat/types.d.ts.map +1 -0
package/dist/{api → src/api}/chat/types.js.map +1 -1
package/dist/{api → src/api}/config/LDAIConfigTracker.d.ts +41 -22
package/dist/src/api/config/LDAIConfigTracker.d.ts.map +1 -0
package/dist/src/api/config/LDAIConfigTracker.js.map +1 -0
package/dist/src/api/config/LDAIConfigUtils.d.ts +2 -0
package/dist/src/api/config/LDAIConfigUtils.d.ts.map +1 -0
package/dist/src/api/config/LDAIConfigUtils.js +141 -0
package/dist/src/api/config/LDAIConfigUtils.js.map +1 -0
package/dist/src/api/config/index.d.ts +3 -0
package/dist/src/api/config/index.d.ts.map +1 -0
package/dist/{api/agents → src/api/config}/index.js +1 -1
package/dist/src/api/config/index.js.map +1 -0
package/dist/src/api/config/types.d.ts +202 -0
package/dist/src/api/config/types.d.ts.map +1 -0
package/dist/{api/agents/LDAIAgent.js → src/api/config/types.js} +1 -1
package/dist/src/api/config/types.js.map +1 -0
package/dist/{api → src/api}/index.d.ts +1 -1
package/dist/src/api/index.d.ts.map +1 -0
package/dist/{api → src/api}/index.js +1 -1
package/dist/src/api/index.js.map +1 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.d.ts +11 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.d.ts.map +1 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.js +52 -0
package/dist/src/api/judge/EvaluationSchemaBuilder.js.map +1 -0
package/dist/src/api/judge/Judge.d.ts +63 -0
package/dist/src/api/judge/Judge.d.ts.map +1 -0
package/dist/src/api/judge/Judge.js +149 -0
package/dist/src/api/judge/Judge.js.map +1 -0
package/dist/src/api/judge/index.d.ts +3 -0
package/dist/src/api/judge/index.d.ts.map +1 -0
package/dist/src/api/judge/index.js +6 -0
package/dist/src/api/judge/index.js.map +1 -0
package/dist/src/api/judge/types.d.ts +35 -0
package/dist/src/api/judge/types.d.ts.map +1 -0
package/dist/{api/config/LDAIConfig.js → src/api/judge/types.js} +1 -1
package/dist/src/api/judge/types.js.map +1 -0
package/dist/src/api/metrics/BedrockTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/BedrockTokenUsage.js.map +1 -0
package/dist/src/api/metrics/LDAIMetrics.d.ts.map +1 -0
package/dist/src/api/metrics/LDAIMetrics.js.map +1 -0
package/dist/src/api/metrics/LDFeedbackKind.d.ts.map +1 -0
package/dist/src/api/metrics/LDFeedbackKind.js.map +1 -0
package/dist/src/api/metrics/LDTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/LDTokenUsage.js.map +1 -0
package/dist/src/api/metrics/OpenAiUsage.d.ts.map +1 -0
package/dist/src/api/metrics/OpenAiUsage.js.map +1 -0
package/dist/src/api/metrics/VercelAISDKTokenUsage.d.ts.map +1 -0
package/dist/src/api/metrics/VercelAISDKTokenUsage.js.map +1 -0
package/dist/src/api/metrics/index.d.ts.map +1 -0
package/dist/src/api/metrics/index.js.map +1 -0
package/dist/{api → src/api}/providers/AIProvider.d.ts +20 -3
package/dist/src/api/providers/AIProvider.d.ts.map +1 -0
package/dist/src/api/providers/AIProvider.js +88 -0
package/dist/src/api/providers/AIProvider.js.map +1 -0
package/dist/{api → src/api}/providers/AIProviderFactory.d.ts +2 -2
package/dist/src/api/providers/AIProviderFactory.d.ts.map +1 -0
package/dist/src/api/providers/AIProviderFactory.js.map +1 -0
package/dist/src/api/providers/index.d.ts.map +1 -0
package/dist/src/api/providers/index.js.map +1 -0
package/dist/src/index.d.ts.map +1 -0
package/dist/src/index.js.map +1 -0
package/docs/assets/search.js +1 -1
package/docs/classes/AIProvider.html +55 -20
package/docs/classes/AIProviderFactory.html +27 -17
package/docs/classes/Judge.html +322 -0
package/docs/classes/TrackedChat.html +97 -29
package/docs/enums/LDFeedbackKind.html +22 -12
package/docs/functions/createBedrockTokenUsage.html +20 -10
package/docs/functions/createOpenAiUsage.html +20 -10
package/docs/functions/createVercelAISDKTokenUsage.html +20 -10
package/docs/functions/initAi.html +20 -10
package/docs/index.html +36 -16
package/docs/interfaces/ChatResponse.html +35 -14
package/docs/interfaces/EvalScore.html +119 -0
package/docs/interfaces/JudgeResponse.html +129 -0
package/docs/interfaces/LDAIAgentConfig.html +81 -33
package/docs/interfaces/{LDAIAgent.html → LDAIAgentConfigDefault.html} +51 -41
package/docs/interfaces/LDAIAgentRequestConfig.html +129 -0
package/docs/interfaces/LDAIClient.html +234 -40
package/docs/interfaces/{VercelAISDKConfig.html → LDAICompletionConfig.html} +86 -86
package/docs/interfaces/LDAICompletionConfigDefault.html +155 -0
package/docs/interfaces/LDAIConfig.html +45 -75
package/docs/interfaces/LDAIConfigDefault.html +133 -0
package/docs/interfaces/LDAIConfigTracker.html +140 -59
package/docs/interfaces/LDAIJudgeConfig.html +167 -0
package/docs/interfaces/LDAIJudgeConfigDefault.html +155 -0
package/docs/interfaces/LDAIMetrics.html +22 -12
package/docs/interfaces/LDJudge.html +119 -0
package/docs/interfaces/{VercelAISDKMapOptions.html → LDJudgeConfiguration.html} +36 -19
package/docs/interfaces/LDLogger.html +19 -9
package/docs/interfaces/LDMessage.html +22 -12
package/docs/interfaces/LDModelConfig.html +23 -13
package/docs/interfaces/LDProviderConfig.html +21 -11
package/docs/interfaces/LDTokenUsage.html +23 -13
package/docs/interfaces/StructuredResponse.html +129 -0
package/docs/types/{VercelAISDKProvider.html → LDAIConfigDefaultKind.html} +26 -31
package/docs/types/{LDAIAgentDefaults.html → LDAIConfigKind.html} +24 -14
package/docs/types/{LDAIDefaults.html → LDAIConfigMode.html} +24 -24
package/docs/types/SupportedAIProvider.html +20 -10
package/docs/variables/SUPPORTED_AI_PROVIDERS.html +20 -10
package/package.json +3 -3
package/src/LDAIClientImpl.ts +222 -176
package/src/LDAIConfigTrackerImpl.ts +73 -54
package/src/api/LDAIClient.ts +166 -33
package/src/api/chat/TrackedChat.ts +64 -5
package/src/api/chat/types.ts +8 -1
package/src/api/config/LDAIConfigTracker.ts +46 -27
package/src/api/config/LDAIConfigUtils.ts +201 -0
package/src/api/config/index.ts +2 -2
package/src/api/config/types.ts +256 -0
package/src/api/index.ts +1 -1
package/src/api/judge/EvaluationSchemaBuilder.ts +54 -0
package/src/api/judge/Judge.ts +216 -0
package/src/api/judge/index.ts +2 -0
package/src/api/judge/types.ts +39 -0
package/src/api/providers/AIProvider.ts +54 -3
package/src/api/providers/AIProviderFactory.ts +4 -4
package/tsconfig.json +3 -3
package/tsconfig.ref.json +1 -1
package/__tests__/LDAIConfigMapper.test.ts +0 -159
package/dist/LDAIClientImpl.d.ts +0 -23
package/dist/LDAIClientImpl.d.ts.map +0 -1
package/dist/LDAIClientImpl.js +0 -128
package/dist/LDAIClientImpl.js.map +0 -1
package/dist/LDAIConfigMapper.d.ts +0 -10
package/dist/LDAIConfigMapper.d.ts.map +0 -1
package/dist/LDAIConfigMapper.js +0 -55
package/dist/LDAIConfigMapper.js.map +0 -1
package/dist/LDAIConfigTrackerImpl.d.ts.map +0 -1
package/dist/LDAIConfigTrackerImpl.js.map +0 -1
package/dist/LDClientMin.d.ts.map +0 -1
package/dist/api/LDAIClient.d.ts +0 -169
package/dist/api/LDAIClient.d.ts.map +0 -1
package/dist/api/agents/LDAIAgent.d.ts +0 -32
package/dist/api/agents/LDAIAgent.d.ts.map +0 -1
package/dist/api/agents/LDAIAgent.js.map +0 -1
package/dist/api/agents/index.d.ts +0 -2
package/dist/api/agents/index.d.ts.map +0 -1
package/dist/api/agents/index.js.map +0 -1
package/dist/api/chat/TrackedChat.d.ts.map +0 -1
package/dist/api/chat/TrackedChat.js.map +0 -1
package/dist/api/chat/index.d.ts.map +0 -1
package/dist/api/chat/index.js.map +0 -1
package/dist/api/chat/types.d.ts +0 -16
package/dist/api/chat/types.d.ts.map +0 -1
package/dist/api/config/LDAIConfig.d.ts +0 -92
package/dist/api/config/LDAIConfig.d.ts.map +0 -1
package/dist/api/config/LDAIConfig.js.map +0 -1
package/dist/api/config/LDAIConfigTracker.d.ts.map +0 -1
package/dist/api/config/LDAIConfigTracker.js.map +0 -1
package/dist/api/config/VercelAISDK.d.ts +0 -19
package/dist/api/config/VercelAISDK.d.ts.map +0 -1
package/dist/api/config/VercelAISDK.js +0 -3
package/dist/api/config/VercelAISDK.js.map +0 -1
package/dist/api/config/index.d.ts +0 -4
package/dist/api/config/index.d.ts.map +0 -1
package/dist/api/config/index.js +0 -19
package/dist/api/config/index.js.map +0 -1
package/dist/api/index.d.ts.map +0 -1
package/dist/api/index.js.map +0 -1
package/dist/api/metrics/BedrockTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/BedrockTokenUsage.js.map +0 -1
package/dist/api/metrics/LDAIMetrics.d.ts.map +0 -1
package/dist/api/metrics/LDAIMetrics.js.map +0 -1
package/dist/api/metrics/LDFeedbackKind.d.ts.map +0 -1
package/dist/api/metrics/LDFeedbackKind.js.map +0 -1
package/dist/api/metrics/LDTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/LDTokenUsage.js.map +0 -1
package/dist/api/metrics/OpenAiUsage.d.ts.map +0 -1
package/dist/api/metrics/OpenAiUsage.js.map +0 -1
package/dist/api/metrics/VercelAISDKTokenUsage.d.ts.map +0 -1
package/dist/api/metrics/VercelAISDKTokenUsage.js.map +0 -1
package/dist/api/metrics/index.d.ts.map +0 -1
package/dist/api/metrics/index.js.map +0 -1
package/dist/api/providers/AIProvider.d.ts.map +0 -1
package/dist/api/providers/AIProvider.js +0 -31
package/dist/api/providers/AIProvider.js.map +0 -1
package/dist/api/providers/AIProviderFactory.d.ts.map +0 -1
package/dist/api/providers/AIProviderFactory.js.map +0 -1
package/dist/api/providers/index.d.ts.map +0 -1
package/dist/api/providers/index.js.map +0 -1
package/dist/index.d.ts.map +0 -1
package/dist/index.js.map +0 -1
package/src/LDAIConfigMapper.ts +0 -65
package/src/api/agents/LDAIAgent.ts +0 -36
package/src/api/agents/index.ts +0 -1
package/src/api/config/LDAIConfig.ts +0 -101
package/src/api/config/VercelAISDK.ts +0 -21
/package/dist/{LDClientMin.d.ts → src/LDClientMin.d.ts} +0 -0
/package/dist/{LDClientMin.js → src/LDClientMin.js} +0 -0
/package/dist/{api → src/api}/LDAIClient.js +0 -0
/package/dist/{api → src/api}/chat/index.d.ts +0 -0
/package/dist/{api → src/api}/chat/index.js +0 -0
/package/dist/{api → src/api}/chat/types.js +0 -0
/package/dist/{api → src/api}/config/LDAIConfigTracker.js +0 -0
/package/dist/{api → src/api}/metrics/BedrockTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/BedrockTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/LDAIMetrics.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDAIMetrics.js +0 -0
/package/dist/{api → src/api}/metrics/LDFeedbackKind.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDFeedbackKind.js +0 -0
/package/dist/{api → src/api}/metrics/LDTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/LDTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/OpenAiUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/OpenAiUsage.js +0 -0
/package/dist/{api → src/api}/metrics/VercelAISDKTokenUsage.d.ts +0 -0
/package/dist/{api → src/api}/metrics/VercelAISDKTokenUsage.js +0 -0
/package/dist/{api → src/api}/metrics/index.d.ts +0 -0
/package/dist/{api → src/api}/metrics/index.js +0 -0
/package/dist/{api → src/api}/providers/AIProviderFactory.js +0 -0
/package/dist/{api → src/api}/providers/index.d.ts +0 -0
/package/dist/{api → src/api}/providers/index.js +0 -0
/package/dist/{index.d.ts → src/index.d.ts} +0 -0
/package/dist/{index.js → src/index.js} +0 -0

package/src/LDAIConfigTrackerImpl.ts CHANGED Viewed

@@ -1,7 +1,9 @@
 import { LDContext } from '@launchdarkly/js-server-sdk-common';
+import { name as aiSdkName, version as aiSdkVersion } from '../package.json';
 import { LDAIConfigTracker } from './api/config';
 import { LDAIMetricSummary } from './api/config/LDAIConfigTracker';
+import { EvalScore } from './api/judge/types';
 import {
   createBedrockTokenUsage,
   createOpenAiUsage,
@@ -25,12 +27,14 @@ export class LDAIConfigTrackerImpl implements LDAIConfigTracker {
     private _context: LDContext,
   ) {}
-  private _getTrackData(): {
+  getTrackData(): {
     variationKey: string;
     configKey: string;
     version: number;
     modelName: string;
     providerName: string;
+    aiSdkName: string;
+    aiSdkVersion: string;
   } {
     return {
       variationKey: this._variationKey,
@@ -38,12 +42,14 @@ export class LDAIConfigTrackerImpl implements LDAIConfigTracker {
       version: this._version,
       modelName: this._modelName,
       providerName: this._providerName,
+      aiSdkName,
+      aiSdkVersion,
     };
   }
   trackDuration(duration: number): void {
     this._trackedMetrics.durationMs = duration;
-    this._ldClient.track('$ld:ai:duration:total', this._context, this._getTrackData(), duration);
+    this._ldClient.track('$ld:ai:duration:total', this._context, this.getTrackData(), duration);
   }
   async trackDurationOf<TRes>(func: () => Promise<TRes>): Promise<TRes> {
@@ -64,28 +70,35 @@ export class LDAIConfigTrackerImpl implements LDAIConfigTracker {
     this._ldClient.track(
       '$ld:ai:tokens:ttf',
       this._context,
-      this._getTrackData(),
+      this.getTrackData(),
       timeToFirstTokenMs,
     );
   }
+  trackEvalScores(scores: Record<string, EvalScore>) {
+    // Track each evaluation score individually
+    Object.entries(scores).forEach(([metricKey, evalScore]) => {
+      this._ldClient.track(metricKey, this._context, this.getTrackData(), evalScore.score);
+    });
+  }
   trackFeedback(feedback: { kind: LDFeedbackKind }): void {
     this._trackedMetrics.feedback = feedback;
     if (feedback.kind === LDFeedbackKind.Positive) {
-      this._ldClient.track('$ld:ai:feedback:user:positive', this._context, this._getTrackData(), 1);
+      this._ldClient.track('$ld:ai:feedback:user:positive', this._context, this.getTrackData(), 1);
     } else if (feedback.kind === LDFeedbackKind.Negative) {
-      this._ldClient.track('$ld:ai:feedback:user:negative', this._context, this._getTrackData(), 1);
+      this._ldClient.track('$ld:ai:feedback:user:negative', this._context, this.getTrackData(), 1);
     }
   }
   trackSuccess(): void {
     this._trackedMetrics.success = true;
-    this._ldClient.track('$ld:ai:generation:success', this._context, this._getTrackData(), 1);
+    this._ldClient.track('$ld:ai:generation:success', this._context, this.getTrackData(), 1);
   }
   trackError(): void {
     this._trackedMetrics.success = false;
-    this._ldClient.track('$ld:ai:generation:error', this._context, this._getTrackData(), 1);
+    this._ldClient.track('$ld:ai:generation:error', this._context, this.getTrackData(), 1);
   }
   async trackMetricsOf<TRes>(
@@ -119,6 +132,58 @@ export class LDAIConfigTrackerImpl implements LDAIConfigTracker {
     return result;
   }
+  trackStreamMetricsOf<TStream>(
+    streamCreator: () => TStream,
+    metricsExtractor: (stream: TStream) => Promise<LDAIMetrics>,
+  ): TStream {
+    const startTime = Date.now();
+    try {
+      // Create the stream synchronously
+      const stream = streamCreator();
+      // Start background metrics tracking (fire and forget)
+      this._trackStreamMetricsInBackground(stream, metricsExtractor, startTime);
+      // Return stream immediately for consumption
+      return stream;
+    } catch (error) {
+      // Track error if stream creation fails
+      this.trackDuration(Date.now() - startTime);
+      this.trackError();
+      throw error;
+    }
+  }
+  private async _trackStreamMetricsInBackground<TStream>(
+    stream: TStream,
+    metricsExtractor: (stream: TStream) => Promise<LDAIMetrics>,
+    startTime: number,
+  ): Promise<void> {
+    try {
+      // Wait for metrics to be available
+      const metrics = await metricsExtractor(stream);
+      // Track success/error based on metrics
+      if (metrics.success) {
+        this.trackSuccess();
+      } else {
+        this.trackError();
+      }
+      // Track token usage if available
+      if (metrics.usage) {
+        this.trackTokens(metrics.usage);
+      }
+    } catch (error) {
+      // If metrics extraction fails, track error
+      this.trackError();
+    } finally {
+      // Track duration regardless of success/error
+      this.trackDuration(Date.now() - startTime);
+    }
+  }
   async trackOpenAIMetrics<
     TRes extends {
       usage?: {
@@ -190,55 +255,9 @@ export class LDAIConfigTrackerImpl implements LDAIConfigTracker {
     }
   }
-  trackVercelAISDKStreamTextMetrics<
-    TRes extends {
-      finishReason?: Promise<string>;
-      usage?: Promise<{
-        totalTokens?: number;
-        inputTokens?: number;
-        promptTokens?: number;
-        outputTokens?: number;
-        completionTokens?: number;
-      }>;
-    },
-  >(func: () => TRes): TRes {
-    const startTime = Date.now();
-    try {
-      const result = func();
-      result.finishReason
-        ?.then(async (finishReason) => {
-          const endTime = Date.now();
-          this.trackDuration(endTime - startTime);
-          if (finishReason === 'error') {
-            this.trackError();
-          } else {
-            this.trackSuccess();
-            if (result.usage) {
-              try {
-                this.trackTokens(createVercelAISDKTokenUsage(await result.usage));
-              } catch {
-                // Intentionally squashing this error
-              }
-            }
-          }
-        })
-        .catch(() => {
-          const endTime = Date.now();
-          this.trackDuration(endTime - startTime);
-          this.trackError();
-        });
-      return result;
-    } catch (err) {
-      const endTime = Date.now();
-      this.trackDuration(endTime - startTime);
-      this.trackError();
-      throw err;
-    }
-  }
   trackTokens(tokens: LDTokenUsage): void {
     this._trackedMetrics.tokens = tokens;
-    const trackData = this._getTrackData();
+    const trackData = this.getTrackData();
     if (tokens.total > 0) {
       this._ldClient.track('$ld:ai:tokens:total', this._context, trackData, tokens.total);
     }

package/src/api/LDAIClient.ts CHANGED Viewed

@@ -1,8 +1,16 @@
 import { LDContext } from '@launchdarkly/js-server-sdk-common';
-import { LDAIAgent, LDAIAgentConfig, LDAIAgentDefaults } from './agents';
 import { TrackedChat } from './chat';
-import { LDAIConfig, LDAIDefaults } from './config/LDAIConfig';
+import {
+  LDAIAgentConfig,
+  LDAIAgentConfigDefault,
+  LDAIAgentRequestConfig,
+  LDAICompletionConfig,
+  LDAICompletionConfigDefault,
+  LDAIJudgeConfig,
+  LDAIJudgeConfigDefault,
+} from './config';
+import { Judge } from './judge/Judge';
 import { SupportedAIProvider } from './providers';
 /**
@@ -10,7 +18,7 @@ import { SupportedAIProvider } from './providers';
  */
 export interface LDAIClient {
   /**
-   * Retrieves and processes an AI Config based on the provided key, LaunchDarkly context,
+   * Retrieves and processes a completion AI Config based on the provided key, LaunchDarkly context,
    * and variables. This includes the model configuration and the customized messages.
    *
    * @param key The key of the AI Config.
@@ -34,9 +42,11 @@ export interface LDAIClient {
    * const variables = {username: 'john'};
    * const defaultValue = {
    *  enabled: false,
+   *  model: { name: 'gpt-4' },
+   *  provider: { name: 'openai' },
    * };
    *
-   * const result = config(key, context, defaultValue, variables);
+   * const result = completionConfig(key, context, defaultValue, variables);
    * // Output:
    * {
    *   enabled: true,
@@ -60,12 +70,22 @@ export interface LDAIClient {
    * }
    * ```
    */
+  completionConfig(
+    key: string,
+    context: LDContext,
+    defaultValue: LDAICompletionConfigDefault,
+    variables?: Record<string, unknown>,
+  ): Promise<LDAICompletionConfig>;
+  /**
+   * @deprecated Use `completionConfig` instead. This method will be removed in a future version.
+   */
   config(
     key: string,
     context: LDContext,
-    defaultValue: LDAIDefaults,
+    defaultValue: LDAICompletionConfigDefault,
     variables?: Record<string, unknown>,
-  ): Promise<LDAIConfig>;
+  ): Promise<LDAICompletionConfig>;
   /**
    * Retrieves and processes a single AI Config agent based on the provided key, LaunchDarkly context,
@@ -89,21 +109,67 @@ export interface LDAIClient {
    * const key = "research_agent";
    * const context = {...};
    * const variables = { topic: 'climate change' };
-   * const agent = await client.agent(key, context, {
+   * const agentConfig = await client.agentConfig(key, context, {
    *   enabled: true,
+   *   model: { name: 'gpt-4' },
+   *   provider: { name: 'openai' },
    *   instructions: 'You are a research assistant.',
    * }, variables);
    *
-   * const researchResult = agent.instructions; // Interpolated instructions
-   * agent.tracker.trackSuccess();
+   * const researchResult = agentConfig.instructions; // Interpolated instructions
+   * agentConfig.tracker.trackSuccess();
    * ```
    */
+  agentConfig(
+    key: string,
+    context: LDContext,
+    defaultValue: LDAIAgentConfigDefault,
+    variables?: Record<string, unknown>,
+  ): Promise<LDAIAgentConfig>;
+  /**
+   * @deprecated Use `agentConfig` instead. This method will be removed in a future version.
+   */
   agent(
     key: string,
     context: LDContext,
-    defaultValue: LDAIAgentDefaults,
+    defaultValue: LDAIAgentConfigDefault,
+    variables?: Record<string, unknown>,
+  ): Promise<LDAIAgentConfig>;
+  /**
+   * Retrieves and processes a Judge AI Config based on the provided key, LaunchDarkly context,
+   * and variables. This includes the model configuration and the customized messages for evaluation.
+   *
+   * @param key The key of the Judge AI Config.
+   * @param context The LaunchDarkly context object that contains relevant information about the
+   * current environment, user, or session. This context may influence how the configuration is
+   * processed or personalized.
+   * @param defaultValue A fallback value containing model configuration and messages. This will
+   * be used if the configuration is not available from LaunchDarkly.
+   * @param variables Optional variables for template interpolation in messages and instructions.
+   * @returns A promise that resolves to a tracked judge configuration.
+   *
+   * @example
+   * ```typescript
+   * const judgeConf = await client.judgeConfig(key, context, {
+   *   enabled: true,
+   *   model: { name: 'gpt-4' },
+   *   provider: { name: 'openai' },
+   *   evaluationMetricKeys: ['$ld:ai:judge:relevance'],
+   *   messages: [{ role: 'system', content: 'You are a relevance judge.' }]
+   * }, variables);
+   *
+   * const config = judgeConf.config; // Interpolated configuration
+   * judgeConf.tracker.trackSuccess();
+   * ```
+   */
+  judgeConfig(
+    key: string,
+    context: LDContext,
+    defaultValue: LDAIJudgeConfigDefault,
     variables?: Record<string, unknown>,
-  ): Promise<LDAIAgent>;
+  ): Promise<LDAIJudgeConfig>;
   /**
    * Retrieves and processes multiple AI Config agents based on the provided agent configurations
@@ -122,38 +188,59 @@ export interface LDAIClient {
    *
    * @example
    * ```
-   * const agentConfigs = [
+   * const agentConfigsList = [
    *   {
    *     key: 'research_agent',
-   *     defaultValue: { enabled: true, instructions: 'You are a research assistant.' },
+   *     defaultValue: {
+   *       enabled: true,
+   *       model: { name: 'gpt-4' },
+   *       provider: { name: 'openai' },
+   *       instructions: 'You are a research assistant.'
+   *     },
    *     variables: { topic: 'climate change' }
    *   },
    *   {
    *     key: 'writing_agent',
-   *     defaultValue: { enabled: true, instructions: 'You are a writing assistant.' },
+   *     defaultValue: {
+   *       enabled: true,
+   *       model: { name: 'gpt-4' },
+   *       provider: { name: 'openai' },
+   *       instructions: 'You are a writing assistant.'
+   *     },
    *     variables: { style: 'academic' }
    *   }
    * ] as const;
    * const context = {...};
    *
-   * const agents = await client.agents(agentConfigs, context);
-   * const researchResult = agents["research_agent"].instructions; // Interpolated instructions
-   * agents["research_agent"].tracker.trackSuccess();
+   * const configs = await client.agentConfigs(agentConfigsList, context);
+   * const researchResult = configs["research_agent"].instructions; // Interpolated instructions
+   * configs["research_agent"].tracker.trackSuccess();
    * ```
    */
-  agents<const T extends readonly LDAIAgentConfig[]>(
+  agentConfigs<const T extends readonly LDAIAgentRequestConfig[]>(
+    agentConfigs: T,
+    context: LDContext,
+  ): Promise<Record<T[number]['key'], LDAIAgentConfig>>;
+  /**
+   * @deprecated Use `agentConfigs` instead. This method will be removed in a future version.
+   */
+  agents<const T extends readonly LDAIAgentRequestConfig[]>(
     agentConfigs: T,
     context: LDContext,
-  ): Promise<Record<T[number]['key'], LDAIAgent>>;
+  ): Promise<Record<T[number]['key'], LDAIAgentConfig>>;
   /**
-   * Initializes and returns a new TrackedChat instance for chat interactions.
+   * Returns a TrackedChat instance for chat interactions.
    * This method serves as the primary entry point for creating TrackedChat instances from configuration.
    *
    * @param key The key identifying the AI chat configuration to use.
    * @param context The standard LDContext used when evaluating flags.
    * @param defaultValue A default value representing a standard AI chat config result.
    * @param variables Dictionary of values for instruction interpolation.
+   * The variables will also be used for judge evaluation. For the judge only, the variables
+   * `message_history` and `response_to_evaluate` are reserved and will be ignored.
+   * @param defaultAiProvider Optional default AI provider to use.
    * @returns A promise that resolves to the TrackedChat instance, or null if the configuration is disabled.
    *
    * @example
@@ -161,32 +248,78 @@ export interface LDAIClient {
    * const key = "customer_support_chat";
    * const context = {...};
    * const defaultValue = {
-   *   config: {
-   *     enabled: false,
-   *     model: { name: "gpt-4" },
-   *     messages: [
-   *       { role: "system", content: "You are a helpful customer support agent." }
-   *     ]
-   *   }
+   *   enabled: false,
+   *   model: { name: "gpt-4" },
+   *   provider: { name: "openai" },
+   *   messages: [
+   *     { role: "system", content: "You are a helpful customer support agent." }
+   *   ]
    * };
    * const variables = { customerName: 'John' };
    *
-   * const chat = await client.initChat(key, context, defaultValue, variables);
+   * const chat = await client.createChat(key, context, defaultValue, variables);
    * if (chat) {
    *   const response = await chat.invoke("I need help with my order");
    *   console.log(response.message.content);
-   *
-   *   // Access configuration and tracker if needed
-   *   console.log('Model:', chat.getConfig().model?.name);
-   *   chat.getTracker().trackSuccess();
    * }
    * ```
    */
+  createChat(
+    key: string,
+    context: LDContext,
+    defaultValue: LDAICompletionConfigDefault,
+    variables?: Record<string, unknown>,
+    defaultAiProvider?: SupportedAIProvider,
+  ): Promise<TrackedChat | undefined>;
+  /**
+   * @deprecated Use `createChat` instead. This method will be removed in a future version.
+   */
   initChat(
     key: string,
     context: LDContext,
-    defaultValue: LDAIDefaults,
+    defaultValue: LDAICompletionConfigDefault,
     variables?: Record<string, unknown>,
     defaultAiProvider?: SupportedAIProvider,
   ): Promise<TrackedChat | undefined>;
+  /**
+   * Creates and returns a new Judge instance for AI evaluation.
+   *
+   * @param key The key identifying the AI judge configuration to use
+   * @param context Standard LDContext used when evaluating flags
+   * @param defaultValue A default value representing a standard AI config result
+   * @param variables Dictionary of values for instruction interpolation.
+   * The variables `message_history` and `response_to_evaluate` are reserved for the judge and will be ignored.
+   * @param defaultAiProvider Optional default AI provider to use.
+   * @returns Promise that resolves to a Judge instance or undefined if disabled/unsupported
+   *
+   * @example
+   * ```
+   * const judge = await client.createJudge(
+   *   "relevance-judge",
+   *   context,
+   *   {
+   *     enabled: true,
+   *     model: { name: "gpt-4" },
+   *     provider: { name: "openai" },
+   *     evaluationMetricKeys: ['$ld:ai:judge:relevance'],
+   *     messages: [{ role: 'system', content: 'You are a relevance judge.' }]
+   *   },
+   *   { metric: "relevance" }
+   * );
+   *
+   * if (judge) {
+   *   const result = await judge.evaluate("User question", "AI response");
+   *   console.log('Relevance score:', result.evals.relevance?.score);
+   * }
+   * ```
+   */
+  createJudge(
+    key: string,
+    context: LDContext,
+    defaultValue: LDAIJudgeConfigDefault,
+    variables?: Record<string, unknown>,
+    defaultAiProvider?: SupportedAIProvider,
+  ): Promise<Judge | undefined>;
 }

package/src/api/chat/TrackedChat.ts CHANGED Viewed

@@ -1,5 +1,9 @@
-import { LDAIConfig, LDMessage } from '../config/LDAIConfig';
+import { LDLogger } from '@launchdarkly/js-server-sdk-common';
 import { LDAIConfigTracker } from '../config/LDAIConfigTracker';
+import { LDAICompletionConfig, LDMessage } from '../config/types';
+import { Judge } from '../judge/Judge';
+import { JudgeResponse } from '../judge/types';
 import { AIProvider } from '../providers/AIProvider';
 import { ChatResponse } from './types';
@@ -13,9 +17,11 @@ export class TrackedChat {
   protected messages: LDMessage[];
   constructor(
-    protected readonly aiConfig: LDAIConfig,
+    protected readonly aiConfig: LDAICompletionConfig,
     protected readonly tracker: LDAIConfigTracker,
     protected readonly provider: AIProvider,
+    protected readonly judges: Record<string, Judge> = {},
+    private readonly _logger?: LDLogger,
   ) {
     this.messages = [];
   }
@@ -42,16 +48,61 @@ export class TrackedChat {
       () => this.provider.invokeModel(allMessages),
     );
-    // Add the assistant response to the conversation history
-    this.messages.push(response.message);
+    if (
+      this.aiConfig.judgeConfiguration?.judges &&
+      this.aiConfig.judgeConfiguration.judges.length > 0
+    ) {
+      response.evaluations = this._evaluateWithJudges(this.messages, response);
+    }
+    this.messages.push(response.message);
     return response;
   }
+  /**
+   * Evaluates the response with all configured judges.
+   * Returns a promise that resolves to an array of evaluation results.
+   *
+   * @param messages Array of messages representing the conversation history
+   * @param response The AI response to be evaluated
+   * @returns Promise resolving to array of judge evaluation results
+   */
+  private async _evaluateWithJudges(
+    messages: LDMessage[],
+    response: ChatResponse,
+  ): Promise<Array<JudgeResponse | undefined>> {
+    const judgeConfigs = this.aiConfig.judgeConfiguration!.judges;
+    // Start all judge evaluations in parallel
+    const evaluationPromises = judgeConfigs.map(async (judgeConfig) => {
+      const judge = this.judges[judgeConfig.key];
+      if (!judge) {
+        this._logger?.warn(
+          `Judge configuration is not enabled: ${judgeConfig.key}`,
+          this.tracker.getTrackData(),
+        );
+        return undefined;
+      }
+      const evalResult = await judge.evaluateMessages(messages, response, judgeConfig.samplingRate);
+      if (evalResult && evalResult.success) {
+        this.tracker.trackEvalScores(evalResult.evals);
+      }
+      return evalResult;
+    });
+    // ensure all evaluations complete even if some fail
+    const results = await Promise.allSettled(evaluationPromises);
+    return results.map((result) => (result.status === 'fulfilled' ? result.value : undefined));
+  }
   /**
    * Get the underlying AI configuration used to initialize this TrackedChat.
    */
-  getConfig(): LDAIConfig {
+  getConfig(): LDAICompletionConfig {
     return this.aiConfig;
   }
@@ -70,6 +121,14 @@ export class TrackedChat {
     return this.provider;
   }
+  /**
+   * Get the judges associated with this TrackedChat.
+   * Returns a record of judge instances keyed by their configuration keys.
+   */
+  getJudges(): Record<string, Judge> {
+    return this.judges;
+  }
   /**
    * Append messages to the conversation history.
    * Adds messages to the conversation history without invoking the model,

package/src/api/chat/types.ts CHANGED Viewed

@@ -1,4 +1,5 @@
-import { LDMessage } from '../config/LDAIConfig';
+import { LDMessage } from '../config/types';
+import { JudgeResponse } from '../judge/types';
 import { LDAIMetrics } from '../metrics/LDAIMetrics';
 /**
@@ -14,4 +15,10 @@ export interface ChatResponse {
    * Metrics information including success status and token usage.
    */
   metrics: LDAIMetrics;
+  /**
+   * Promise that resolves to judge evaluation results.
+   * Only present when judges are configured for evaluation.
+   */
+  evaluations?: Promise<Array<JudgeResponse | undefined>>;
 }