npm - @mastra/evals - Versions diffs - 0.1.14 → 0.1.15-alpha.2 - Mend

@mastra/evals 0.1.14 → 0.1.15-alpha.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/dist/_tsup-dts-rollup.d.cts +9 -9
package/dist/_tsup-dts-rollup.d.ts +9 -9
package/package.json +3 -3

package/dist/_tsup-dts-rollup.d.cts CHANGED Viewed

@@ -1,10 +1,10 @@
 import { Agent } from '@mastra/core/agent';
+import { EvaluationResult } from '@mastra/core';
 import type { LanguageModel } from '@mastra/core/llm';
 import type { Mastra } from '@mastra/core';
 import type { Metric } from '@mastra/core';
 import { Metric as Metric_2 } from '@mastra/core/eval';
-import { MetricResult } from '@mastra/core';
-import type { MetricResult as MetricResult_2 } from '@mastra/core/eval';
+import type { MetricResult } from '@mastra/core/eval';
 export declare const ANSWER_RELEVANCY_AGENT_INSTRUCTIONS = "You are a balanced and nuanced answer relevancy evaluator. Your job is to determine if LLM outputs are relevant to the input, including handling partially relevant or uncertain cases.\n\nKey Principles:\n1. Evaluate whether the output addresses what the input is asking for\n2. Consider both direct answers and related context\n3. Prioritize relevance to the input over correctness\n4. Recognize that responses can be partially relevant\n5. Empty inputs or error messages should always be marked as \"no\"\n6. Responses that discuss the type of information being asked show partial relevance";
@@ -86,7 +86,7 @@ export { CompletenessMetric }
 export { CompletenessMetric as CompletenessMetric_alias_1 }
 export { CompletenessMetric as CompletenessMetric_alias_2 }
-declare interface CompletenessMetricResult extends MetricResult_2 {
+declare interface CompletenessMetricResult extends MetricResult {
     info: {
         inputElements: string[];
         outputElements: string[];
@@ -112,7 +112,7 @@ declare interface ContentSimilarityOptions {
     ignoreWhitespace?: boolean;
 }
-declare interface ContentSimilarityResult extends MetricResult_2 {
+declare interface ContentSimilarityResult extends MetricResult {
     info: {
         similarity: number;
     };
@@ -258,7 +258,7 @@ export declare interface ContextualRecallMetricOptions {
     context: string[];
 }
-declare function evaluate<T extends Agent>(agent: T, input: Parameters<T['generate']>[0], metric: Metric): Promise<MetricResult>;
+declare function evaluate<T extends Agent>(agent: T, input: Parameters<T['generate']>[0], metric: Metric): Promise<EvaluationResult>;
 export { evaluate }
 export { evaluate as evaluate_alias_1 }
@@ -552,7 +552,7 @@ export { KeywordCoverageMetric }
 export { KeywordCoverageMetric as KeywordCoverageMetric_alias_1 }
 export { KeywordCoverageMetric as KeywordCoverageMetric_alias_2 }
-declare interface KeywordCoverageResult extends MetricResult_2 {
+declare interface KeywordCoverageResult extends MetricResult {
     info: {
         totalKeywords: number;
         matchedKeywords: number;
@@ -566,7 +566,7 @@ declare abstract class MastraAgentJudge {
 export { MastraAgentJudge }
 export { MastraAgentJudge as MastraAgentJudge_alias_1 }
-export declare interface MetricResultWithReason extends MetricResult_2 {
+export declare interface MetricResultWithReason extends MetricResult {
     info: {
         reason: string;
     };
@@ -704,7 +704,7 @@ export { TextualDifferenceMetric }
 export { TextualDifferenceMetric as TextualDifferenceMetric_alias_1 }
 export { TextualDifferenceMetric as TextualDifferenceMetric_alias_2 }
-declare interface TextualDifferenceResult extends MetricResult_2 {
+declare interface TextualDifferenceResult extends MetricResult {
     info: {
         ratio: number;
         changes: number;
@@ -721,7 +721,7 @@ export { ToneConsistencyMetric }
 export { ToneConsistencyMetric as ToneConsistencyMetric_alias_1 }
 export { ToneConsistencyMetric as ToneConsistencyMetric_alias_2 }
-declare interface ToneConsitencyResult extends MetricResult_2 {
+declare interface ToneConsitencyResult extends MetricResult {
     info: {
         responseSentiment: number;
         referenceSentiment: number;

package/dist/_tsup-dts-rollup.d.ts CHANGED Viewed

@@ -1,10 +1,10 @@
 import { Agent } from '@mastra/core/agent';
+import { EvaluationResult } from '@mastra/core';
 import type { LanguageModel } from '@mastra/core/llm';
 import type { Mastra } from '@mastra/core';
 import type { Metric } from '@mastra/core';
 import { Metric as Metric_2 } from '@mastra/core/eval';
-import { MetricResult } from '@mastra/core';
-import type { MetricResult as MetricResult_2 } from '@mastra/core/eval';
+import type { MetricResult } from '@mastra/core/eval';
 export declare const ANSWER_RELEVANCY_AGENT_INSTRUCTIONS = "You are a balanced and nuanced answer relevancy evaluator. Your job is to determine if LLM outputs are relevant to the input, including handling partially relevant or uncertain cases.\n\nKey Principles:\n1. Evaluate whether the output addresses what the input is asking for\n2. Consider both direct answers and related context\n3. Prioritize relevance to the input over correctness\n4. Recognize that responses can be partially relevant\n5. Empty inputs or error messages should always be marked as \"no\"\n6. Responses that discuss the type of information being asked show partial relevance";
@@ -86,7 +86,7 @@ export { CompletenessMetric }
 export { CompletenessMetric as CompletenessMetric_alias_1 }
 export { CompletenessMetric as CompletenessMetric_alias_2 }
-declare interface CompletenessMetricResult extends MetricResult_2 {
+declare interface CompletenessMetricResult extends MetricResult {
     info: {
         inputElements: string[];
         outputElements: string[];
@@ -112,7 +112,7 @@ declare interface ContentSimilarityOptions {
     ignoreWhitespace?: boolean;
 }
-declare interface ContentSimilarityResult extends MetricResult_2 {
+declare interface ContentSimilarityResult extends MetricResult {
     info: {
         similarity: number;
     };
@@ -258,7 +258,7 @@ export declare interface ContextualRecallMetricOptions {
     context: string[];
 }
-declare function evaluate<T extends Agent>(agent: T, input: Parameters<T['generate']>[0], metric: Metric): Promise<MetricResult>;
+declare function evaluate<T extends Agent>(agent: T, input: Parameters<T['generate']>[0], metric: Metric): Promise<EvaluationResult>;
 export { evaluate }
 export { evaluate as evaluate_alias_1 }
@@ -552,7 +552,7 @@ export { KeywordCoverageMetric }
 export { KeywordCoverageMetric as KeywordCoverageMetric_alias_1 }
 export { KeywordCoverageMetric as KeywordCoverageMetric_alias_2 }
-declare interface KeywordCoverageResult extends MetricResult_2 {
+declare interface KeywordCoverageResult extends MetricResult {
     info: {
         totalKeywords: number;
         matchedKeywords: number;
@@ -566,7 +566,7 @@ declare abstract class MastraAgentJudge {
 export { MastraAgentJudge }
 export { MastraAgentJudge as MastraAgentJudge_alias_1 }
-export declare interface MetricResultWithReason extends MetricResult_2 {
+export declare interface MetricResultWithReason extends MetricResult {
     info: {
         reason: string;
     };
@@ -704,7 +704,7 @@ export { TextualDifferenceMetric }
 export { TextualDifferenceMetric as TextualDifferenceMetric_alias_1 }
 export { TextualDifferenceMetric as TextualDifferenceMetric_alias_2 }
-declare interface TextualDifferenceResult extends MetricResult_2 {
+declare interface TextualDifferenceResult extends MetricResult {
     info: {
         ratio: number;
         changes: number;
@@ -721,7 +721,7 @@ export { ToneConsistencyMetric }
 export { ToneConsistencyMetric as ToneConsistencyMetric_alias_1 }
 export { ToneConsistencyMetric as ToneConsistencyMetric_alias_2 }
-declare interface ToneConsitencyResult extends MetricResult_2 {
+declare interface ToneConsitencyResult extends MetricResult {
     info: {
         responseSentiment: number;
         referenceSentiment: number;

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@mastra/evals",
-  "version": "0.1.14",
+  "version": "0.1.15-alpha.2",
   "description": "",
   "type": "module",
   "files": [
@@ -62,7 +62,7 @@
     "sentiment": "^5.0.2",
     "string-similarity": "^4.0.4",
     "zod": "^3.24.2",
-    "@mastra/core": "^0.7.0"
+    "@mastra/core": "^0.8.0-alpha.2"
   },
   "peerDependencies": {
     "ai": "^4.0.0"
@@ -74,7 +74,7 @@
     "@types/fs-extra": "^11.0.4",
     "@types/sentiment": "^5.0.4",
     "@types/string-similarity": "^4.0.2",
-    "ai": "^4.1.54",
+    "ai": "^4.2.2",
     "dotenv": "^16.4.7",
     "eslint": "^9.23.0",
     "tsup": "^8.4.0",