npm - @mastra/evals - Versions diffs - 1.0.1 → 1.1.0 - Mend

@mastra/evals 1.0.1 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

package/CHANGELOG.md +76 -0
package/dist/{chunk-6EA6D7JG.js → chunk-OEOE7ZHN.js} +21 -3
package/dist/chunk-OEOE7ZHN.js.map +1 -0
package/dist/{chunk-DSXZHUHI.cjs → chunk-W3U7MMDX.cjs} +21 -2
package/dist/chunk-W3U7MMDX.cjs.map +1 -0
package/dist/docs/README.md +1 -1
package/dist/docs/SKILL.md +1 -1
package/dist/docs/SOURCE_MAP.json +1 -1
package/dist/docs/evals/03-reference.md +84 -10
package/dist/scorers/code/tool-call-accuracy/index.d.ts +1 -1
package/dist/scorers/index.d.ts +1 -0
package/dist/scorers/index.d.ts.map +1 -1
package/dist/scorers/llm/hallucination/index.d.ts +19 -2
package/dist/scorers/llm/hallucination/index.d.ts.map +1 -1
package/dist/scorers/llm/tool-call-accuracy/index.d.ts +1 -1
package/dist/scorers/prebuilt/index.cjs +75 -63
package/dist/scorers/prebuilt/index.cjs.map +1 -1
package/dist/scorers/prebuilt/index.js +17 -5
package/dist/scorers/prebuilt/index.js.map +1 -1
package/dist/scorers/utils.cjs +20 -16
package/dist/scorers/utils.d.ts +39 -0
package/dist/scorers/utils.d.ts.map +1 -1
package/dist/scorers/utils.js +1 -1
package/package.json +4 -4
package/dist/chunk-6EA6D7JG.js.map +0 -1
package/dist/chunk-DSXZHUHI.cjs.map +0 -1

package/dist/scorers/prebuilt/index.cjs CHANGED Viewed

@@ -1,6 +1,6 @@
 'use strict';
-var chunkDSXZHUHI_cjs = require('../../chunk-DSXZHUHI.cjs');
+var chunkW3U7MMDX_cjs = require('../../chunk-W3U7MMDX.cjs');
 var evals = require('@mastra/core/evals');
 var zod = require('zod');
 var nlp = require('compromise');
@@ -239,14 +239,14 @@ function createAnswerRelevancyScorer({
     description: "Extract relevant statements from the LLM output",
     outputSchema: extractOutputSchema,
     createPrompt: ({ run }) => {
-      const assistantMessage = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const assistantMessage = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       return createExtractPrompt(assistantMessage);
     }
   }).analyze({
     description: "Score the relevance of the statements to the input",
     outputSchema: zod.z.object({ results: zod.z.array(zod.z.object({ result: zod.z.string(), reason: zod.z.string() })) }),
     createPrompt: ({ run, results }) => {
-      const input = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const input = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
       return createScorePrompt(JSON.stringify(input), results.preprocessStepResult?.statements || []);
     }
   }).generateScore(({ results }) => {
@@ -263,13 +263,13 @@ function createAnswerRelevancyScorer({
       }
     }
     const score = relevancyCount / numberOfResults;
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score * options.scale);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score * options.scale);
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ run, results, score }) => {
       return createReasonPrompt({
-        input: chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        input: chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         score,
         results: results.analyzeStepResult.results,
         scale: options.scale
@@ -466,7 +466,7 @@ function createAnswerSimilarityScorer({
           groundTruth: ""
         });
       }
-      const output = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const output = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const groundTruth = typeof run.groundTruth === "string" ? run.groundTruth : JSON.stringify(run.groundTruth);
       return createExtractPrompt2({
         output,
@@ -524,14 +524,14 @@ function createAnswerSimilarityScorer({
     );
     score -= extraInfoPenalty;
     score = Math.max(0, Math.min(1, score));
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score * mergedOptions.scale);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score * mergedOptions.scale);
   }).generateReason({
     description: "Generate explanation of similarity score",
     createPrompt: ({ run, results, score }) => {
       if (!run.groundTruth) {
         return "No ground truth was provided for comparison. Score is 0 by default.";
       }
-      const output = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const output = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const groundTruth = typeof run.groundTruth === "string" ? run.groundTruth : JSON.stringify(run.groundTruth);
       return createReasonPrompt2({
         output,
@@ -715,7 +715,7 @@ function createFaithfulnessScorer({
     description: "Extract relevant statements from the LLM output",
     outputSchema: zod.z.array(zod.z.string()),
     createPrompt: ({ run }) => {
-      const prompt = createFaithfulnessExtractPrompt({ output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
+      const prompt = createFaithfulnessExtractPrompt({ output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
       return prompt;
     }
   }).analyze({
@@ -739,14 +739,14 @@ function createFaithfulnessScorer({
       return 0;
     }
     const score = supportedClaims / totalClaims * (options?.scale || 1);
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ run, results, score }) => {
       const assistantMessage = run.output.find(({ role }) => role === "assistant");
       const prompt = createFaithfulnessReasonPrompt({
-        input: chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        input: chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         context: assistantMessage?.content?.toolInvocations?.map((toolCall) => JSON.stringify(toolCall)) || [],
         score,
         scale: options?.scale || 1,
@@ -879,13 +879,13 @@ function createBiasScorer({ model, options }) {
     outputSchema: zod.z.object({
       opinions: zod.z.array(zod.z.string())
     }),
-    createPrompt: ({ run }) => createBiasExtractPrompt({ output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" })
+    createPrompt: ({ run }) => createBiasExtractPrompt({ output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" })
   }).analyze({
     description: "Score the relevance of the statements to the input",
     outputSchema: zod.z.object({ results: zod.z.array(zod.z.object({ result: zod.z.string(), reason: zod.z.string() })) }),
     createPrompt: ({ run, results }) => {
       const prompt = createBiasAnalyzePrompt({
-        output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         opinions: results.preprocessStepResult?.opinions || []
       });
       return prompt;
@@ -896,7 +896,7 @@ function createBiasScorer({ model, options }) {
     }
     const biasedVerdicts = results.analyzeStepResult.results.filter((v) => v.result.toLowerCase() === "yes");
     const score = biasedVerdicts.length / results.analyzeStepResult.results.length;
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score * (options?.scale || 1));
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score * (options?.scale || 1));
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ score, results }) => {
@@ -1115,7 +1115,7 @@ function createHallucinationScorer({
       claims: zod.z.array(zod.z.string())
     }),
     createPrompt: ({ run }) => {
-      const prompt = createHallucinationExtractPrompt({ output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
+      const prompt = createHallucinationExtractPrompt({ output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
       return prompt;
     }
   }).analyze({
@@ -1123,10 +1123,16 @@ function createHallucinationScorer({
     outputSchema: zod.z.object({
       verdicts: zod.z.array(zod.z.object({ statement: zod.z.string(), verdict: zod.z.string(), reason: zod.z.string() }))
     }),
-    createPrompt: ({ results }) => {
+    createPrompt: async ({ run, results }) => {
+      let context;
+      if (options?.getContext) {
+        context = await options.getContext({ run, results, step: "analyze" });
+      } else {
+        context = options?.context ?? [];
+      }
       const prompt = createHallucinationAnalyzePrompt({
         claims: results.preprocessStepResult.claims,
-        context: options?.context || []
+        context
       });
       return prompt;
     }
@@ -1137,14 +1143,20 @@ function createHallucinationScorer({
       return 0;
     }
     const score = contradictedStatements / totalStatements * (options?.scale || 1);
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the results",
-    createPrompt: ({ run, results, score }) => {
+    createPrompt: async ({ run, results, score }) => {
+      let context;
+      if (options?.getContext) {
+        context = await options.getContext({ run, results, score, step: "generateReason" });
+      } else {
+        context = options?.context ?? [];
+      }
       const prompt = createHallucinationReasonPrompt({
-        input: chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
-        context: options?.context || [],
+        input: chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        context,
         score,
         scale: options?.scale || 1,
         verdicts: results.analyzeStepResult?.verdicts || []
@@ -1257,8 +1269,8 @@ function createToxicityScorer({
     outputSchema: zod.z.object({ verdicts: zod.z.array(zod.z.object({ verdict: zod.z.string(), reason: zod.z.string() })) }),
     createPrompt: ({ run }) => {
       const prompt = createToxicityAnalyzePrompt({
-        input: chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? ""
+        input: chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? ""
       });
       return prompt;
     }
@@ -1274,7 +1286,7 @@ function createToxicityScorer({
       }
     }
     const score = toxicityCount / numberOfVerdicts;
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score * (options?.scale || 1));
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score * (options?.scale || 1));
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ results, score }) => {
@@ -1408,7 +1420,7 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Input and output messages cannot be null or empty");
     }
-    const { tools: actualTools, toolCallInfos } = chunkDSXZHUHI_cjs.extractToolCalls(run.output);
+    const { tools: actualTools, toolCallInfos } = chunkW3U7MMDX_cjs.extractToolCalls(run.output);
     return {
       actualTools,
       hasToolCalls: actualTools.length > 0,
@@ -1418,8 +1430,8 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     description: "Analyze the appropriateness of tool selections",
     outputSchema: analyzeOutputSchema2,
     createPrompt: ({ run, results }) => {
-      const userInput = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const agentResponse = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userInput = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const agentResponse = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const toolsCalled = results.preprocessStepResult?.actualTools || [];
       return createAnalyzePrompt2({
         userInput,
@@ -1436,11 +1448,11 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     }
     const appropriateToolCalls = evaluations.filter((e) => e.wasAppropriate).length;
     const totalToolCalls = evaluations.length;
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(appropriateToolCalls / totalToolCalls);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(appropriateToolCalls / totalToolCalls);
   }).generateReason({
     description: "Generate human-readable explanation of tool selection evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userInput = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const userInput = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const evaluations = results.analyzeStepResult?.evaluations || [];
       const missingTools = results.analyzeStepResult?.missingTools || [];
       return createReasonPrompt3({
@@ -1645,8 +1657,8 @@ function createContextRelevanceScorerLLM({
     description: "Analyze the relevance and utility of provided context",
     outputSchema: analyzeOutputSchema3,
     createPrompt: ({ run }) => {
-      const userQuery = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const agentResponse = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userQuery = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const agentResponse = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = options.contextExtractor ? options.contextExtractor(run.input, run.output) : options.context;
       if (context.length === 0) {
         return createAnalyzePrompt3({
@@ -1694,11 +1706,11 @@ function createContextRelevanceScorerLLM({
     const missingContextPenalty = Math.min(missingContext.length * missingPenaltyRate, maxMissingPenalty);
     const finalScore = Math.max(0, relevanceScore - usagePenalty - missingContextPenalty);
     const scaledScore = finalScore * (options.scale || 1);
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(scaledScore);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(scaledScore);
   }).generateReason({
     description: "Generate human-readable explanation of context relevance evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userQuery = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const userQuery = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const context = options.contextExtractor ? options.contextExtractor(run.input, run.output) : options.context;
       if (context.length === 0) {
         return `No context was available for evaluation. The agent response was generated without any supporting context. Score: ${score}`;
@@ -1869,8 +1881,8 @@ function createContextPrecisionScorer({
     description: "Evaluate the relevance of each context piece for generating the expected output",
     outputSchema: contextRelevanceOutputSchema,
     createPrompt: ({ run }) => {
-      const input = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const output = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const input = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const output = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = options.contextExtractor ? options.contextExtractor(run.input, run.output) : options.context;
       if (context.length === 0) {
         throw new Error("No context available for evaluation");
@@ -1903,12 +1915,12 @@ function createContextPrecisionScorer({
     }
     const map = sumPrecision / relevantCount;
     const score = map * (options.scale || 1);
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(score);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the context precision results",
     createPrompt: ({ run, results, score }) => {
-      const input = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const output = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const input = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const output = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = options.contextExtractor ? options.contextExtractor(run.input, run.output) : options.context;
       return createContextPrecisionReasonPrompt({
         input,
@@ -2162,8 +2174,8 @@ function createNoiseSensitivityScorerLLM({
     description: "Analyze the impact of noise on agent response quality",
     outputSchema: analyzeOutputSchema4,
     createPrompt: ({ run }) => {
-      const originalQuery = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const noisyResponse = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const originalQuery = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const noisyResponse = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       if (!originalQuery || !noisyResponse) {
         throw new Error("Both original query and noisy response are required for evaluation");
       }
@@ -2206,11 +2218,11 @@ function createNoiseSensitivityScorerLLM({
     const majorIssues = analysisResult.majorIssues || [];
     const issuesPenalty = Math.min(majorIssues.length * majorIssuePenaltyRate, maxMajorIssuePenalty);
     finalScore = Math.max(0, finalScore - issuesPenalty);
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(finalScore);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(finalScore);
   }).generateReason({
     description: "Generate human-readable explanation of noise sensitivity evaluation",
     createPrompt: ({ run, results, score }) => {
-      const originalQuery = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const originalQuery = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const analysisResult = results.analyzeStepResult;
       if (!analysisResult) {
         throw new Error("Analysis step failed to produce results for reason generation");
@@ -2534,9 +2546,9 @@ function createPromptAlignmentScorerLLM({
     description: "Analyze prompt-response alignment across multiple dimensions",
     outputSchema: analyzeOutputSchema5,
     createPrompt: ({ run }) => {
-      const userPrompt = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const systemPrompt = chunkDSXZHUHI_cjs.getCombinedSystemPrompt(run.input) ?? "";
-      const agentResponse = chunkDSXZHUHI_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userPrompt = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const systemPrompt = chunkW3U7MMDX_cjs.getCombinedSystemPrompt(run.input) ?? "";
+      const agentResponse = chunkW3U7MMDX_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       if (evaluationMode === "user" && !userPrompt) {
         throw new Error("User prompt is required for user prompt alignment scoring");
       }
@@ -2572,12 +2584,12 @@ function createPromptAlignmentScorerLLM({
       weightedScore = userScore * SCORING_WEIGHTS.BOTH.USER_WEIGHT + systemScore * SCORING_WEIGHTS.BOTH.SYSTEM_WEIGHT;
     }
     const finalScore = weightedScore * scale;
-    return chunkDSXZHUHI_cjs.roundToTwoDecimals(finalScore);
+    return chunkW3U7MMDX_cjs.roundToTwoDecimals(finalScore);
   }).generateReason({
     description: "Generate human-readable explanation of prompt alignment evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userPrompt = chunkDSXZHUHI_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const systemPrompt = chunkDSXZHUHI_cjs.getCombinedSystemPrompt(run.input) ?? "";
+      const userPrompt = chunkW3U7MMDX_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const systemPrompt = chunkW3U7MMDX_cjs.getCombinedSystemPrompt(run.input) ?? "";
       const analysis = results.analyzeStepResult;
       if (!analysis) {
         return `Unable to analyze prompt alignment. Score: ${score}`;
@@ -2642,18 +2654,18 @@ function createCompletenessScorer() {
     type: "agent"
   }).preprocess(async ({ run }) => {
     const isInputInvalid = !run.input || run.input.inputMessages.some((i) => {
-      const content = chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i);
+      const content = chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i);
       return content === null || content === void 0;
     });
     const isOutputInvalid = !run.output || run.output.some((i) => {
-      const content = chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i);
+      const content = chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i);
       return content === null || content === void 0;
     });
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Inputs cannot be null or undefined");
     }
-    const input = run.input?.inputMessages.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const inputToProcess = input;
     const outputToProcess = output;
     const inputDoc = nlp__default.default(inputToProcess.trim());
@@ -2758,8 +2770,8 @@ function createTextualDifferenceScorer() {
     description: "Calculate textual difference between input and output using sequence matching algorithms.",
     type: "agent"
   }).preprocess(async ({ run }) => {
-    const input = run.input?.inputMessages?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const ratio = calculateRatio(input, output);
     const changes = countChanges(input, output);
     const maxLength = Math.max(input.length, output.length);
@@ -2782,8 +2794,8 @@ function createKeywordCoverageScorer() {
     description: 'Leverage the nlp method from "compromise" to extract elements from the input and output and calculate the coverage.',
     type: "agent"
   }).preprocess(async ({ run }) => {
-    const input = run.input?.inputMessages?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     if (!input && !output) {
       return {
         result: {
@@ -2836,8 +2848,8 @@ function createContentSimilarityScorer({ ignoreCase, ignoreWhitespace } = { igno
     description: "Calculates content similarity between input and output messages using string comparison algorithms.",
     type: "agent"
   }).preprocess(async ({ run }) => {
-    let processedInput = run.input?.inputMessages.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    let processedOutput = run.output.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    let processedInput = run.input?.inputMessages.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    let processedOutput = run.output.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     if (ignoreCase) {
       processedInput = processedInput.toLowerCase();
       processedOutput = processedOutput.toLowerCase();
@@ -2867,7 +2879,7 @@ function createToneScorer(config = {}) {
     type: "agent"
   }).preprocess(async ({ run }) => {
     const sentiment = new Sentiment__default.default();
-    const agentMessage = run.output?.map((i) => chunkDSXZHUHI_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const agentMessage = run.output?.map((i) => chunkW3U7MMDX_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const responseSentiment = sentiment.analyze(agentMessage);
     if (referenceTone) {
       const referenceSentiment = sentiment.analyze(referenceTone);
@@ -2954,7 +2966,7 @@ function createToolCallAccuracyScorerCode(options) {
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Input and output messages cannot be null or empty");
     }
-    const { tools: actualTools, toolCallInfos } = chunkDSXZHUHI_cjs.extractToolCalls(run.output);
+    const { tools: actualTools, toolCallInfos } = chunkW3U7MMDX_cjs.extractToolCalls(run.output);
     const correctToolCalled = expectedTool ? strictMode ? actualTools.length === 1 && actualTools[0] === expectedTool : actualTools.includes(expectedTool) : false;
     return {
       expectedTool,