npm - @mastra/evals - Versions diffs - 1.2.3 → 1.2.4-alpha.0 - Mend

@mastra/evals 1.2.3 → 1.2.4-alpha.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

package/CHANGELOG.md +9 -0
package/dist/{chunk-33T2SZZ2.cjs → chunk-BULMCHKJ.cjs} +20 -16
package/dist/chunk-BULMCHKJ.cjs.map +1 -0
package/dist/{chunk-ZRHCSFKL.js → chunk-XOXUFZEG.js} +20 -16
package/dist/chunk-XOXUFZEG.js.map +1 -0
package/dist/docs/SKILL.md +1 -1
package/dist/docs/assets/SOURCE_MAP.json +1 -1
package/dist/scorers/prebuilt/index.cjs +74 -74
package/dist/scorers/prebuilt/index.js +1 -1
package/dist/scorers/utils.cjs +25 -25
package/dist/scorers/utils.d.ts.map +1 -1
package/dist/scorers/utils.js +1 -1
package/package.json +7 -7
package/dist/chunk-33T2SZZ2.cjs.map +0 -1
package/dist/chunk-ZRHCSFKL.js.map +0 -1

package/dist/scorers/prebuilt/index.cjs CHANGED Viewed

@@ -1,6 +1,6 @@
 'use strict';
-var chunk33T2SZZ2_cjs = require('../../chunk-33T2SZZ2.cjs');
+var chunkBULMCHKJ_cjs = require('../../chunk-BULMCHKJ.cjs');
 var evals = require('@mastra/core/evals');
 var nlp = require('compromise');
 var keyword_extractor = require('keyword-extractor');
@@ -250,7 +250,7 @@ function createAnswerRelevancyScorer({
     description: "Extract relevant statements from the LLM output",
     outputSchema: extractOutputSchema,
     createPrompt: ({ run }) => {
-      const assistantMessage = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const assistantMessage = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       return createExtractPrompt(assistantMessage);
     }
   }).analyze({
@@ -283,7 +283,7 @@ function createAnswerRelevancyScorer({
       ]
     },
     createPrompt: ({ run, results }) => {
-      const input = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const input = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
       return createScorePrompt(JSON.stringify(input), results.preprocessStepResult?.statements || []);
     }
   }).generateScore(({ results }) => {
@@ -300,13 +300,13 @@ function createAnswerRelevancyScorer({
       }
     }
     const score = relevancyCount / numberOfResults;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score * options.scale);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score * options.scale);
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ run, results, score }) => {
       return createReasonPrompt({
-        input: chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        input: chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         score,
         results: results.analyzeStepResult.results,
         scale: options.scale
@@ -581,7 +581,7 @@ function createAnswerSimilarityScorer({
           groundTruth: ""
         });
       }
-      const output = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const output = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const groundTruth = typeof run.groundTruth === "string" ? run.groundTruth : JSON.stringify(run.groundTruth);
       return createExtractPrompt2({
         output,
@@ -639,14 +639,14 @@ function createAnswerSimilarityScorer({
     );
     score -= extraInfoPenalty;
     score = Math.max(0, Math.min(1, score));
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score * mergedOptions.scale);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score * mergedOptions.scale);
   }).generateReason({
     description: "Generate explanation of similarity score",
     createPrompt: ({ run, results, score }) => {
       if (!run.groundTruth) {
         return "No ground truth was provided for comparison. Score is 0 by default.";
       }
-      const output = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const output = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const groundTruth = typeof run.groundTruth === "string" ? run.groundTruth : JSON.stringify(run.groundTruth);
       return createReasonPrompt2({
         output,
@@ -848,7 +848,7 @@ function createFaithfulnessScorer({
       ]
     },
     createPrompt: ({ run }) => {
-      const prompt = createFaithfulnessExtractPrompt({ output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
+      const prompt = createFaithfulnessExtractPrompt({ output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
       return prompt;
     }
   }).analyze({
@@ -895,13 +895,13 @@ function createFaithfulnessScorer({
       return 0;
     }
     const score = supportedClaims / totalClaims * (options?.scale || 1);
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ run, results, score }) => {
       const prompt = createFaithfulnessReasonPrompt({
-        input: chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        input: chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         context: options?.context ?? getToolInvocationContext(run.output),
         score,
         scale: options?.scale || 1,
@@ -1046,7 +1046,7 @@ function createBiasScorer({ model, options }) {
         "opinions"
       ]
     },
-    createPrompt: ({ run }) => createBiasExtractPrompt({ output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" })
+    createPrompt: ({ run }) => createBiasExtractPrompt({ output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" })
   }).analyze({
     description: "Score the relevance of the statements to the input",
     outputSchema: {
@@ -1078,7 +1078,7 @@ function createBiasScorer({ model, options }) {
     },
     createPrompt: ({ run, results }) => {
       const prompt = createBiasAnalyzePrompt({
-        output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         opinions: results.preprocessStepResult?.opinions || []
       });
       return prompt;
@@ -1089,7 +1089,7 @@ function createBiasScorer({ model, options }) {
     }
     const biasedVerdicts = results.analyzeStepResult.results.filter((v) => v.result.toLowerCase() === "yes");
     const score = biasedVerdicts.length / results.analyzeStepResult.results.length;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score * (options?.scale || 1));
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score * (options?.scale || 1));
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ score, results }) => {
@@ -1320,7 +1320,7 @@ function createHallucinationScorer({
       ]
     },
     createPrompt: ({ run }) => {
-      const prompt = createHallucinationExtractPrompt({ output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
+      const prompt = createHallucinationExtractPrompt({ output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "" });
       return prompt;
     }
   }).analyze({
@@ -1376,7 +1376,7 @@ function createHallucinationScorer({
       return 0;
     }
     const score = contradictedStatements / totalStatements * (options?.scale || 1);
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the results",
     createPrompt: async ({ run, results, score }) => {
@@ -1387,8 +1387,8 @@ function createHallucinationScorer({
         context = options?.context ?? [];
       }
       const prompt = createHallucinationReasonPrompt({
-        input: chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
+        input: chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "",
         context,
         score,
         scale: options?.scale || 1,
@@ -1528,8 +1528,8 @@ function createToxicityScorer({
     },
     createPrompt: ({ run }) => {
       const prompt = createToxicityAnalyzePrompt({
-        input: chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "",
-        output: chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? ""
+        input: chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "",
+        output: chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? ""
       });
       return prompt;
     }
@@ -1545,7 +1545,7 @@ function createToxicityScorer({
       }
     }
     const score = toxicityCount / numberOfVerdicts;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score * (options?.scale || 1));
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score * (options?.scale || 1));
   }).generateReason({
     description: "Reason about the results",
     createPrompt: ({ results, score }) => {
@@ -1706,7 +1706,7 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Input and output messages cannot be null or empty");
     }
-    const { tools: actualTools, toolCallInfos } = chunk33T2SZZ2_cjs.extractToolCalls(run.output);
+    const { tools: actualTools, toolCallInfos } = chunkBULMCHKJ_cjs.extractToolCalls(run.output);
     return {
       actualTools,
       hasToolCalls: actualTools.length > 0,
@@ -1716,8 +1716,8 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     description: "Analyze the appropriateness of tool selections",
     outputSchema: analyzeOutputSchema2,
     createPrompt: ({ run, results }) => {
-      const userInput = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const agentResponse = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userInput = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const agentResponse = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const toolsCalled = results.preprocessStepResult?.actualTools || [];
       return createAnalyzePrompt2({
         userInput,
@@ -1734,11 +1734,11 @@ function createToolCallAccuracyScorerLLM({ model, availableTools }) {
     }
     const appropriateToolCalls = evaluations.filter((e) => e.wasAppropriate).length;
     const totalToolCalls = evaluations.length;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(appropriateToolCalls / totalToolCalls);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(appropriateToolCalls / totalToolCalls);
   }).generateReason({
     description: "Generate human-readable explanation of tool selection evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userInput = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const userInput = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const evaluations = results.analyzeStepResult?.evaluations || [];
       const missingTools = results.analyzeStepResult?.missingTools || [];
       return createReasonPrompt3({
@@ -1968,7 +1968,7 @@ var getContext = ({
   output,
   options
 }) => {
-  if (options.contextExtractor && chunk33T2SZZ2_cjs.isScorerRunInputForAgent(input) && chunk33T2SZZ2_cjs.isScorerRunOutputForAgent(output)) {
+  if (options.contextExtractor && chunkBULMCHKJ_cjs.isScorerRunInputForAgent(input) && chunkBULMCHKJ_cjs.isScorerRunOutputForAgent(output)) {
     return options.contextExtractor(input, output);
   }
   return options.context ?? [];
@@ -1996,8 +1996,8 @@ function createContextRelevanceScorerLLM({
     description: "Analyze the relevance and utility of provided context",
     outputSchema: analyzeOutputSchema3,
     createPrompt: ({ run }) => {
-      const userQuery = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const agentResponse = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userQuery = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const agentResponse = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = getContext({ input: run.input, output: run.output, options });
       if (context.length === 0) {
         return createAnalyzePrompt3({
@@ -2045,11 +2045,11 @@ function createContextRelevanceScorerLLM({
     const missingContextPenalty = Math.min(missingContext.length * missingPenaltyRate, maxMissingPenalty);
     const finalScore = Math.max(0, relevanceScore - usagePenalty - missingContextPenalty);
     const scaledScore = finalScore * (options.scale || 1);
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(scaledScore);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(scaledScore);
   }).generateReason({
     description: "Generate human-readable explanation of context relevance evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userQuery = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const userQuery = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const context = getContext({ input: run.input, output: run.output, options });
       if (context.length === 0) {
         return `No context was available for evaluation. The agent response was generated without any supporting context. Score: ${score}`;
@@ -2224,7 +2224,7 @@ var getContext2 = ({
   output,
   options
 }) => {
-  if (options.contextExtractor && chunk33T2SZZ2_cjs.isScorerRunInputForAgent(input) && chunk33T2SZZ2_cjs.isScorerRunOutputForAgent(output)) {
+  if (options.contextExtractor && chunkBULMCHKJ_cjs.isScorerRunInputForAgent(input) && chunkBULMCHKJ_cjs.isScorerRunOutputForAgent(output)) {
     return options.contextExtractor(input, output);
   }
   return options.context ?? [];
@@ -2252,8 +2252,8 @@ function createContextPrecisionScorer({
     description: "Evaluate the relevance of each context piece for generating the expected output",
     outputSchema: contextRelevanceOutputSchema,
     createPrompt: ({ run }) => {
-      const input = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const output = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const input = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const output = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = getContext2({ input: run.input, output: run.output, options });
       if (context.length === 0) {
         throw new Error("No context available for evaluation");
@@ -2286,12 +2286,12 @@ function createContextPrecisionScorer({
     }
     const map = sumPrecision / relevantCount;
     const score = map * (options.scale || 1);
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(score);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(score);
   }).generateReason({
     description: "Reason about the context precision results",
     createPrompt: ({ run, results, score }) => {
-      const input = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const output = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const input = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const output = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       const context = getContext2({ input: run.input, output: run.output, options });
       return createContextPrecisionReasonPrompt({
         input,
@@ -2589,8 +2589,8 @@ function createNoiseSensitivityScorerLLM({
     description: "Analyze the impact of noise on agent response quality",
     outputSchema: analyzeOutputSchema4,
     createPrompt: ({ run }) => {
-      const originalQuery = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const noisyResponse = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const originalQuery = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const noisyResponse = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       if (!originalQuery || !noisyResponse) {
         throw new Error("Both original query and noisy response are required for evaluation");
       }
@@ -2633,11 +2633,11 @@ function createNoiseSensitivityScorerLLM({
     const majorIssues = analysisResult.majorIssues || [];
     const issuesPenalty = Math.min(majorIssues.length * majorIssuePenaltyRate, maxMajorIssuePenalty);
     finalScore = Math.max(0, finalScore - issuesPenalty);
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(finalScore);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(finalScore);
   }).generateReason({
     description: "Generate human-readable explanation of noise sensitivity evaluation",
     createPrompt: ({ run, results, score }) => {
-      const originalQuery = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const originalQuery = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const analysisResult = results.analyzeStepResult;
       if (!analysisResult) {
         throw new Error("Analysis step failed to produce results for reason generation");
@@ -3049,9 +3049,9 @@ function createPromptAlignmentScorerLLM({
     description: "Analyze prompt-response alignment across multiple dimensions",
     outputSchema: analyzeOutputSchema5,
     createPrompt: ({ run }) => {
-      const userPrompt = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const systemPrompt = chunk33T2SZZ2_cjs.getCombinedSystemPrompt(run.input) ?? "";
-      const agentResponse = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
+      const userPrompt = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const systemPrompt = chunkBULMCHKJ_cjs.getCombinedSystemPrompt(run.input) ?? "";
+      const agentResponse = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output) ?? "";
       if (evaluationMode === "user" && !userPrompt) {
         throw new Error("User prompt is required for user prompt alignment scoring");
       }
@@ -3087,12 +3087,12 @@ function createPromptAlignmentScorerLLM({
       weightedScore = userScore * SCORING_WEIGHTS.BOTH.USER_WEIGHT + systemScore * SCORING_WEIGHTS.BOTH.SYSTEM_WEIGHT;
     }
     const finalScore = weightedScore * scale;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(finalScore);
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(finalScore);
   }).generateReason({
     description: "Generate human-readable explanation of prompt alignment evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userPrompt = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const systemPrompt = chunk33T2SZZ2_cjs.getCombinedSystemPrompt(run.input) ?? "";
+      const userPrompt = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const systemPrompt = chunkBULMCHKJ_cjs.getCombinedSystemPrompt(run.input) ?? "";
       const analysis = results.analyzeStepResult;
       if (!analysis) {
         return `Unable to analyze prompt alignment. Score: ${score}`;
@@ -3342,8 +3342,8 @@ function createTrajectoryAccuracyScorerLLM({
     description: "Analyze the quality and appropriateness of the agent trajectory",
     outputSchema: analyzeOutputSchema6,
     createPrompt: ({ run, results }) => {
-      const userInput = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
-      const agentResponse = chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput(run.output.rawOutput) ?? "";
+      const userInput = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const agentResponse = chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput(run.output.rawOutput) ?? "";
       return createAnalyzePrompt6({
         userInput,
         agentResponse,
@@ -3368,11 +3368,11 @@ function createTrajectoryAccuracyScorerLLM({
     const necessityScore = necessarySteps / totalSteps;
     const orderScore = orderedSteps / totalSteps;
     const score = necessityScore * 0.6 + orderScore * 0.3 - missingPenalty * 0.1;
-    return chunk33T2SZZ2_cjs.roundToTwoDecimals(Math.max(0, Math.min(1, score)));
+    return chunkBULMCHKJ_cjs.roundToTwoDecimals(Math.max(0, Math.min(1, score)));
   }).generateReason({
     description: "Generate human-readable explanation of trajectory evaluation",
     createPrompt: ({ run, results, score }) => {
-      const userInput = chunk33T2SZZ2_cjs.getUserMessageFromRunInput(run.input) ?? "";
+      const userInput = chunkBULMCHKJ_cjs.getUserMessageFromRunInput(run.input) ?? "";
       const stepEvaluations = results.analyzeStepResult?.stepEvaluations || [];
       const missingSteps = results.analyzeStepResult?.missingSteps || [];
       const extraSteps = results.analyzeStepResult?.extraSteps || [];
@@ -3435,18 +3435,18 @@ function createCompletenessScorer() {
     type: "agent"
   }).preprocess(async ({ run }) => {
     const isInputInvalid = !run.input || run.input.inputMessages.some((i) => {
-      const content = chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i);
+      const content = chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i);
       return content === null || content === void 0;
     });
     const isOutputInvalid = !run.output || run.output.some((i) => {
-      const content = chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i);
+      const content = chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i);
       return content === null || content === void 0;
     });
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Inputs cannot be null or undefined");
     }
-    const input = run.input?.inputMessages.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const inputToProcess = input;
     const outputToProcess = output;
     const inputDoc = nlp__default.default(inputToProcess.trim());
@@ -3551,8 +3551,8 @@ function createTextualDifferenceScorer() {
     description: "Calculate textual difference between input and output using sequence matching algorithms.",
     type: "agent"
   }).preprocess(async ({ run }) => {
-    const input = run.input?.inputMessages?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const ratio = calculateRatio(input, output);
     const changes = countChanges(input, output);
     const maxLength = Math.max(input.length, output.length);
@@ -3575,8 +3575,8 @@ function createKeywordCoverageScorer() {
     description: 'Leverage the nlp method from "compromise" to extract elements from the input and output and calculate the coverage.',
     type: "agent"
   }).preprocess(async ({ run }) => {
-    const input = run.input?.inputMessages?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    const output = run.output?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const input = run.input?.inputMessages?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const output = run.output?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     if (!input && !output) {
       return {
         result: {
@@ -3629,8 +3629,8 @@ function createContentSimilarityScorer({ ignoreCase, ignoreWhitespace } = { igno
     description: "Calculates content similarity between input and output messages using string comparison algorithms.",
     type: "agent"
   }).preprocess(async ({ run }) => {
-    let processedInput = run.input?.inputMessages.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
-    let processedOutput = run.output.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    let processedInput = run.input?.inputMessages.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    let processedOutput = run.output.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     if (ignoreCase) {
       processedInput = processedInput.toLowerCase();
       processedOutput = processedOutput.toLowerCase();
@@ -3660,7 +3660,7 @@ function createToneScorer(config = {}) {
     type: "agent"
   }).preprocess(async ({ run }) => {
     const sentiment = new Sentiment__default.default();
-    const agentMessage = run.output?.map((i) => chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
+    const agentMessage = run.output?.map((i) => chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage(i)).join(", ") || "";
     const responseSentiment = sentiment.analyze(agentMessage);
     if (referenceTone) {
       const referenceSentiment = sentiment.analyze(referenceTone);
@@ -3747,7 +3747,7 @@ function createToolCallAccuracyScorerCode(options) {
     if (isInputInvalid || isOutputInvalid) {
       throw new Error("Input and output messages cannot be null or empty");
     }
-    const { tools: actualTools, toolCallInfos } = chunk33T2SZZ2_cjs.extractToolCalls(run.output);
+    const { tools: actualTools, toolCallInfos } = chunkBULMCHKJ_cjs.extractToolCalls(run.output);
     const correctToolCalled = expectedTool ? strictMode ? actualTools.length === 1 && actualTools[0] === expectedTool : actualTools.includes(expectedTool) : false;
     return {
       expectedTool,
@@ -3822,7 +3822,7 @@ function createTrajectoryAccuracyScorerCode(options = {}) {
     const itemExpectation = run.expectedTrajectory;
     const effectiveOrdering = itemExpectation?.ordering ?? ordering;
     const effectiveAllowRepeated = itemExpectation?.allowRepeatedSteps ?? allowRepeatedSteps;
-    const comparison = chunk33T2SZZ2_cjs.compareTrajectories(
+    const comparison = chunkBULMCHKJ_cjs.compareTrajectories(
       actualTrajectory,
       { steps: resolvedExpectedSteps },
       {
@@ -3880,7 +3880,7 @@ function evaluateNestedExpectations(expectedSteps, actualSteps, weights = { accu
     const childConfig = expectedStep.children;
     let accuracy;
     if (childConfig.steps && childConfig.steps.length > 0) {
-      accuracy = chunk33T2SZZ2_cjs.compareTrajectories(
+      accuracy = chunkBULMCHKJ_cjs.compareTrajectories(
         childTrajectory,
         { steps: childConfig.steps },
         {
@@ -3890,18 +3890,18 @@ function evaluateNestedExpectations(expectedSteps, actualSteps, weights = { accu
       );
     }
     const hasEfficiencyConfig = childConfig.maxSteps !== void 0 || childConfig.maxTotalTokens !== void 0 || childConfig.maxTotalDurationMs !== void 0 || childConfig.noRedundantCalls !== void 0;
-    const efficiency = hasEfficiencyConfig ? chunk33T2SZZ2_cjs.checkTrajectoryEfficiency(childTrajectory, {
+    const efficiency = hasEfficiencyConfig ? chunkBULMCHKJ_cjs.checkTrajectoryEfficiency(childTrajectory, {
       maxSteps: childConfig.maxSteps,
       maxTotalTokens: childConfig.maxTotalTokens,
       maxTotalDurationMs: childConfig.maxTotalDurationMs,
       noRedundantCalls: childConfig.noRedundantCalls ?? true
     }) : void 0;
     const hasBlacklistConfig = childConfig.blacklistedTools && childConfig.blacklistedTools.length > 0 || childConfig.blacklistedSequences && childConfig.blacklistedSequences.length > 0;
-    const blacklist = hasBlacklistConfig ? chunk33T2SZZ2_cjs.checkTrajectoryBlacklist(childTrajectory, {
+    const blacklist = hasBlacklistConfig ? chunkBULMCHKJ_cjs.checkTrajectoryBlacklist(childTrajectory, {
       blacklistedTools: childConfig.blacklistedTools,
       blacklistedSequences: childConfig.blacklistedSequences
     }) : void 0;
-    const toolFailures = chunk33T2SZZ2_cjs.analyzeToolFailures(childTrajectory, {
+    const toolFailures = chunkBULMCHKJ_cjs.analyzeToolFailures(childTrajectory, {
       maxRetriesPerTool: childConfig.maxRetriesPerTool ?? 2
     });
     const nested = childConfig.steps ? evaluateNestedExpectations(childConfig.steps, actualStep.children, weights) : [];
@@ -3966,7 +3966,7 @@ function createTrajectoryScorerCode(options = {}) {
     }
     let accuracy;
     if (config.steps && config.steps.length > 0) {
-      accuracy = chunk33T2SZZ2_cjs.compareTrajectories(
+      accuracy = chunkBULMCHKJ_cjs.compareTrajectories(
         actualTrajectory,
         { steps: config.steps },
         {
@@ -3976,18 +3976,18 @@ function createTrajectoryScorerCode(options = {}) {
       );
     }
     const hasEfficiencyConfig = config.maxSteps !== void 0 || config.maxTotalTokens !== void 0 || config.maxTotalDurationMs !== void 0 || config.noRedundantCalls !== void 0;
-    const efficiency = hasEfficiencyConfig ? chunk33T2SZZ2_cjs.checkTrajectoryEfficiency(actualTrajectory, {
+    const efficiency = hasEfficiencyConfig ? chunkBULMCHKJ_cjs.checkTrajectoryEfficiency(actualTrajectory, {
       maxSteps: config.maxSteps,
       maxTotalTokens: config.maxTotalTokens,
       maxTotalDurationMs: config.maxTotalDurationMs,
       noRedundantCalls: config.noRedundantCalls ?? true
     }) : void 0;
     const hasBlacklistConfig = config.blacklistedTools && config.blacklistedTools.length > 0 || config.blacklistedSequences && config.blacklistedSequences.length > 0;
-    const blacklist = hasBlacklistConfig ? chunk33T2SZZ2_cjs.checkTrajectoryBlacklist(actualTrajectory, {
+    const blacklist = hasBlacklistConfig ? chunkBULMCHKJ_cjs.checkTrajectoryBlacklist(actualTrajectory, {
       blacklistedTools: config.blacklistedTools,
       blacklistedSequences: config.blacklistedSequences
     }) : void 0;
-    const toolFailures = chunk33T2SZZ2_cjs.analyzeToolFailures(actualTrajectory, {
+    const toolFailures = chunkBULMCHKJ_cjs.analyzeToolFailures(actualTrajectory, {
       maxRetriesPerTool: config.maxRetriesPerTool ?? 2
     });
     const nested = config.steps && config.steps.length > 0 ? evaluateNestedExpectations(config.steps, actualTrajectory.steps, w) : void 0;

package/dist/scorers/prebuilt/index.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { getAssistantMessageFromRunOutput, getUserMessageFromRunInput, roundToTwoDecimals, extractToolCalls, getCombinedSystemPrompt, getTextContentFromMastraDBMessage, compareTrajectories, checkTrajectoryEfficiency, checkTrajectoryBlacklist, analyzeToolFailures, isScorerRunInputForAgent, isScorerRunOutputForAgent } from '../../chunk-ZRHCSFKL.js';
+import { getAssistantMessageFromRunOutput, getUserMessageFromRunInput, roundToTwoDecimals, extractToolCalls, getCombinedSystemPrompt, getTextContentFromMastraDBMessage, compareTrajectories, checkTrajectoryEfficiency, checkTrajectoryBlacklist, analyzeToolFailures, isScorerRunInputForAgent, isScorerRunOutputForAgent } from '../../chunk-XOXUFZEG.js';
 import { createScorer } from '@mastra/core/evals';
 import nlp from 'compromise';
 import keyword_extractor from 'keyword-extractor';

package/dist/scorers/utils.cjs CHANGED Viewed

@@ -1,104 +1,104 @@
 'use strict';
-var chunk33T2SZZ2_cjs = require('../chunk-33T2SZZ2.cjs');
+var chunkBULMCHKJ_cjs = require('../chunk-BULMCHKJ.cjs');
 Object.defineProperty(exports, "analyzeToolFailures", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.analyzeToolFailures; }
+  get: function () { return chunkBULMCHKJ_cjs.analyzeToolFailures; }
 });
 Object.defineProperty(exports, "checkTrajectoryBlacklist", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.checkTrajectoryBlacklist; }
+  get: function () { return chunkBULMCHKJ_cjs.checkTrajectoryBlacklist; }
 });
 Object.defineProperty(exports, "checkTrajectoryEfficiency", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.checkTrajectoryEfficiency; }
+  get: function () { return chunkBULMCHKJ_cjs.checkTrajectoryEfficiency; }
 });
 Object.defineProperty(exports, "compareTrajectories", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.compareTrajectories; }
+  get: function () { return chunkBULMCHKJ_cjs.compareTrajectories; }
 });
 Object.defineProperty(exports, "createAgentTestRun", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.createAgentTestRun; }
+  get: function () { return chunkBULMCHKJ_cjs.createAgentTestRun; }
 });
 Object.defineProperty(exports, "createTestMessage", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.createTestMessage; }
+  get: function () { return chunkBULMCHKJ_cjs.createTestMessage; }
 });
 Object.defineProperty(exports, "createTestRun", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.createTestRun; }
+  get: function () { return chunkBULMCHKJ_cjs.createTestRun; }
 });
 Object.defineProperty(exports, "createToolInvocation", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.createToolInvocation; }
+  get: function () { return chunkBULMCHKJ_cjs.createToolInvocation; }
 });
 Object.defineProperty(exports, "createTrajectoryTestRun", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.createTrajectoryTestRun; }
+  get: function () { return chunkBULMCHKJ_cjs.createTrajectoryTestRun; }
 });
 Object.defineProperty(exports, "extractAgentResponseMessages", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.extractAgentResponseMessages; }
+  get: function () { return chunkBULMCHKJ_cjs.extractAgentResponseMessages; }
 });
 Object.defineProperty(exports, "extractInputMessages", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.extractInputMessages; }
+  get: function () { return chunkBULMCHKJ_cjs.extractInputMessages; }
 });
 Object.defineProperty(exports, "extractToolCalls", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.extractToolCalls; }
+  get: function () { return chunkBULMCHKJ_cjs.extractToolCalls; }
 });
 Object.defineProperty(exports, "extractToolResults", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.extractToolResults; }
+  get: function () { return chunkBULMCHKJ_cjs.extractToolResults; }
 });
 Object.defineProperty(exports, "extractTrajectory", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.extractTrajectory; }
+  get: function () { return chunkBULMCHKJ_cjs.extractTrajectory; }
 });
 Object.defineProperty(exports, "getAssistantMessageFromRunOutput", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getAssistantMessageFromRunOutput; }
+  get: function () { return chunkBULMCHKJ_cjs.getAssistantMessageFromRunOutput; }
 });
 Object.defineProperty(exports, "getCombinedSystemPrompt", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getCombinedSystemPrompt; }
+  get: function () { return chunkBULMCHKJ_cjs.getCombinedSystemPrompt; }
 });
 Object.defineProperty(exports, "getReasoningFromRunOutput", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getReasoningFromRunOutput; }
+  get: function () { return chunkBULMCHKJ_cjs.getReasoningFromRunOutput; }
 });
 Object.defineProperty(exports, "getSystemMessagesFromRunInput", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getSystemMessagesFromRunInput; }
+  get: function () { return chunkBULMCHKJ_cjs.getSystemMessagesFromRunInput; }
 });
 Object.defineProperty(exports, "getTextContentFromMastraDBMessage", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getTextContentFromMastraDBMessage; }
+  get: function () { return chunkBULMCHKJ_cjs.getTextContentFromMastraDBMessage; }
 });
 Object.defineProperty(exports, "getUserMessageFromRunInput", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.getUserMessageFromRunInput; }
+  get: function () { return chunkBULMCHKJ_cjs.getUserMessageFromRunInput; }
 });
 Object.defineProperty(exports, "isCloserTo", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.isCloserTo; }
+  get: function () { return chunkBULMCHKJ_cjs.isCloserTo; }
 });
 Object.defineProperty(exports, "isScorerRunInputForAgent", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.isScorerRunInputForAgent; }
+  get: function () { return chunkBULMCHKJ_cjs.isScorerRunInputForAgent; }
 });
 Object.defineProperty(exports, "isScorerRunOutputForAgent", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.isScorerRunOutputForAgent; }
+  get: function () { return chunkBULMCHKJ_cjs.isScorerRunOutputForAgent; }
 });
 Object.defineProperty(exports, "roundToTwoDecimals", {
   enumerable: true,
-  get: function () { return chunk33T2SZZ2_cjs.roundToTwoDecimals; }
+  get: function () { return chunkBULMCHKJ_cjs.roundToTwoDecimals; }
 });
 //# sourceMappingURL=utils.cjs.map
 //# sourceMappingURL=utils.cjs.map