npm - agentv - Versions diffs - 2.5.5 → 2.5.7 - Mend

agentv 2.5.5 → 2.5.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

package/README.md +5 -11
package/dist/{chunk-LTEYARQG.js → chunk-KM7W27VC.js} +1050 -354
package/dist/chunk-KM7W27VC.js.map +1 -0
package/dist/cli.js +1 -1
package/dist/index.js +1 -1
package/dist/templates/.claude/skills/agentv-eval-builder/SKILL.md +2 -2
package/package.json +1 -1
package/dist/chunk-LTEYARQG.js.map +0 -1

package/README.md CHANGED Viewed

@@ -31,13 +31,9 @@ evalcases:
   - id: addition
     expected_outcome: Correctly calculates 15 + 27 = 42
-    input_messages:
-      - role: user
-        content: What is 15 + 27?
+    input: What is 15 + 27?
-    expected_messages:
-      - role: assistant
-        content: "42"
+    expected_output: "42"
     execution:
       evaluators:
@@ -108,8 +104,8 @@ See [AGENTS.md](AGENTS.md) for development guidelines and design principles.
 For large-scale evaluations, AgentV supports JSONL (JSON Lines) format as an alternative to YAML:
 ```jsonl
-{"id": "test-1", "expected_outcome": "Calculates correctly", "input_messages": [{"role": "user", "content": "What is 2+2?"}]}
-{"id": "test-2", "expected_outcome": "Provides explanation", "input_messages": [{"role": "user", "content": "Explain variables"}]}
+{"id": "test-1", "expected_outcome": "Calculates correctly", "input": "What is 2+2?"}
+{"id": "test-2", "expected_outcome": "Provides explanation", "input": "Explain variables"}
 ```
 Optional sidecar YAML metadata file (`dataset.yaml` alongside `dataset.jsonl`):
@@ -264,9 +260,7 @@ evalcases:
   - id: quicksort-explain
     expected_outcome: Explain how quicksort works
-    input_messages:
-      - role: user
-        content: Explain quicksort algorithm
+    input: Explain quicksort algorithm
     rubrics:
       - Mentions divide-and-conquer approach