npm - agentv - Versions diffs - 0.26.0 → 1.0.0 - Mend

agentv 0.26.0 → 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/dist/{chunk-6ZM7WVSC.js → chunk-RIJO5WBF.js} +13 -13
package/dist/chunk-RIJO5WBF.js.map +1 -0
package/dist/cli.js +1 -1
package/dist/cli.js.map +1 -1
package/dist/index.js +1 -1
package/dist/templates/.claude/skills/agentv-eval-builder/SKILL.md +36 -19
package/dist/templates/.claude/skills/agentv-eval-builder/references/eval-schema.json +217 -217
package/dist/templates/.claude/skills/agentv-eval-builder/references/example-evals.md +94 -2
package/dist/templates/.claude/skills/agentv-eval-builder/references/tool-trajectory-evaluator.md +8 -8
package/package.json +1 -1
package/dist/chunk-6ZM7WVSC.js.map +0 -1
package/dist/templates/agentv/.env.template +0 -23

package/dist/{chunk-6ZM7WVSC.js → chunk-RIJO5WBF.js} RENAMED Viewed

@@ -164,7 +164,7 @@ import { access as access6, mkdir as mkdir7 } from "node:fs/promises";
 import path19 from "node:path";
 import { pathToFileURL } from "node:url";
-// ../../packages/core/dist/chunk-NDEN3H2B.js
+// ../../packages/core/dist/chunk-V3JCB3HI.js
 import { constants } from "node:fs";
 import { access, readFile } from "node:fs/promises";
 import path from "node:path";
@@ -4211,7 +4211,7 @@ var coerce = {
 };
 var NEVER = INVALID;
-// ../../packages/core/dist/chunk-NDEN3H2B.js
+// ../../packages/core/dist/chunk-V3JCB3HI.js
 async function fileExists(filePath) {
   try {
     await access(filePath, constants.F_OK);
@@ -34578,7 +34578,7 @@ var EVALUATOR_KIND_VALUES = [
   "rubric",
   "composite",
   "tool_trajectory",
-  "expected_messages"
+  "expected_tool_calls"
 ];
 var EVALUATOR_KIND_SET = new Set(EVALUATOR_KIND_VALUES);
 function isEvaluatorKind(value) {
@@ -35058,11 +35058,11 @@ async function parseEvaluators(rawEvalCase, globalExecution, searchRoots, evalId
       });
       continue;
     }
-    if (typeValue === "expected_messages") {
+    if (typeValue === "expected_tool_calls") {
       const weight2 = validateWeight(rawEvaluator.weight, name16, evalId);
       evaluators.push({
         name: name16,
-        type: "expected_messages",
+        type: "expected_tool_calls",
         ...weight2 !== void 0 ? { weight: weight2 } : {}
       });
       continue;
@@ -38212,8 +38212,8 @@ var ToolTrajectoryEvaluator = class {
     };
   }
 };
-var ExpectedMessagesEvaluator = class {
-  kind = "expected_messages";
+var ExpectedToolCallsEvaluator = class {
+  kind = "expected_tool_calls";
   evaluate(context) {
     const { candidateTrace, evalCase } = context;
     const expectedSegments = evalCase.expected_segments;
@@ -39285,8 +39285,8 @@ async function runEvaluatorList(options) {
               return new ToolTrajectoryEvaluator({
                 config: memberConfig
               });
-            case "expected_messages":
-              return new ExpectedMessagesEvaluator();
+            case "expected_tool_calls":
+              return new ExpectedToolCallsEvaluator();
             default: {
               const unknownConfig = memberConfig;
               throw new Error(`Unsupported evaluator type in composite: ${unknownConfig.type}`);
@@ -39351,9 +39351,9 @@ async function runEvaluatorList(options) {
           reasoning: score2.reasoning
         });
       }
-      if (evaluator.type === "expected_messages") {
-        const expectedMessagesEvaluator = new ExpectedMessagesEvaluator();
-        const score2 = expectedMessagesEvaluator.evaluate({
+      if (evaluator.type === "expected_tool_calls") {
+        const expectedToolCallsEvaluator = new ExpectedToolCallsEvaluator();
+        const score2 = expectedToolCallsEvaluator.evaluate({
           evalCase,
           candidate,
           target,
@@ -42708,4 +42708,4 @@ export {
   app,
   runCli
 };
-//# sourceMappingURL=chunk-6ZM7WVSC.js.map
+//# sourceMappingURL=chunk-RIJO5WBF.js.map