npm - vieval - Versions diffs - 0.0.11 → 0.0.12 - Mend

vieval 0.0.11 → 0.0.12

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (45) hide show

package/README.md +31 -31
package/dist/bin/vieval.mjs +1 -1
package/dist/cli/index.d.mts +1 -1
package/dist/cli/index.mjs +1 -1
package/dist/{cli-CHFCF8UR.mjs → cli-uzS81IPd.mjs} +1529 -1529
package/dist/cli-uzS81IPd.mjs.map +1 -0
package/dist/config.d.mts +1 -1
package/dist/core/assertions/index.d.mts +156 -156
package/dist/core/assertions/index.mjs +82 -82
package/dist/core/assertions/index.mjs.map +1 -1
package/dist/core/inference-executors/index.d.mts +37 -37
package/dist/core/inference-executors/index.mjs +53 -52
package/dist/core/inference-executors/index.mjs.map +1 -1
package/dist/core/processors/results/index.d.mts +18 -18
package/dist/core/processors/results/index.mjs.map +1 -1
package/dist/core/runner/index.d.mts +2 -2
package/dist/core/runner/index.mjs +258 -258
package/dist/core/runner/index.mjs.map +1 -1
package/dist/core/scheduler/index.d.mts +1 -1
package/dist/core/scheduler/index.mjs +64 -64
package/dist/core/scheduler/index.mjs.map +1 -1
package/dist/{env-bRH0K6fU.d.mts → env-Br6jaWGL.d.mts} +9 -9
package/dist/{env-BVYeJhGA.mjs → env-egxaJtNn.mjs} +8 -8
package/dist/env-egxaJtNn.mjs.map +1 -0
package/dist/{expect-extensions-Mf1sMNBv.mjs → expect-extensions-BKdEPt3h.mjs} +46 -46
package/dist/expect-extensions-BKdEPt3h.mjs.map +1 -0
package/dist/expect.mjs +1 -1
package/dist/{index-CwKBlCG9.d.mts → index-BLIlhiWT.d.mts} +565 -565
package/dist/{index-Be5I1ZJL.d.mts → index-CIaJClcC.d.mts} +48 -48
package/dist/index.d.mts +207 -195
package/dist/index.mjs +147 -147
package/dist/index.mjs.map +1 -1
package/dist/models-CaCOUPZw.mjs.map +1 -1
package/dist/plugins/chat-models/index.d.mts +279 -279
package/dist/plugins/chat-models/index.mjs +359 -359
package/dist/plugins/chat-models/index.mjs.map +1 -1
package/dist/{registry-BSyjwZFx.mjs → registry-BK7k6X81.mjs} +293 -293
package/dist/registry-BK7k6X81.mjs.map +1 -0
package/dist/testing/expect-extensions.d.mts +27 -27
package/dist/testing/expect-extensions.mjs +1 -1
package/package.json +3 -3
package/dist/cli-CHFCF8UR.mjs.map +0 -1
package/dist/env-BVYeJhGA.mjs.map +0 -1
package/dist/expect-extensions-Mf1sMNBv.mjs.map +0 -1
package/dist/registry-BSyjwZFx.mjs.map +0 -1

package/README.md CHANGED Viewed

@@ -31,6 +31,7 @@ import { defineConfig, loadEnv, requiredEnvFrom } from 'vieval'
 import { chatModelFrom, ChatModels } from 'vieval/plugins/chat-models'
 export default defineConfig({
+  env: loadEnv('test', cwd(), ''),
   plugins: [
     ChatModels({
       models: [
@@ -46,23 +47,22 @@ export default defineConfig({
       ],
     }),
   ],
-  env: loadEnv('test', cwd(), ''),
   projects: [
     {
+      evalMatrix: {
+        extend: {
+          rubric: ['default'],
+        },
+      },
+      include: ['evals/*.eval.ts'],
       name: 'default',
       root: '.',
-      include: ['evals/*.eval.ts'],
       runMatrix: {
         extend: {
           model: ['agent-mini'],
           scenario: ['baseline'],
         },
       },
-      evalMatrix: {
-        extend: {
-          rubric: ['default'],
-        },
-      },
     },
   ],
 })
@@ -129,8 +129,8 @@ Use builder style when loading a batch of inputs:
 import { describeTask, expect } from 'vieval'
 const arithmeticCases = [
-  { name: 'addition-small', input: { a: 1, b: 2, expected: 3 } },
-  { name: 'addition-large', input: { a: 20, b: 22, expected: 42 } },
+  { input: { a: 1, b: 2, expected: 3 }, name: 'addition-small' },
+  { input: { a: 20, b: 22, expected: 42 }, name: 'addition-large' },
 ]
 describeTask('arithmetic-quality', ({ casesFromInputs }) => {
@@ -191,6 +191,7 @@ import { defineConfig, loadEnv, requiredEnvFrom } from 'vieval'
 import { chatModelFrom, ChatModels } from 'vieval/plugins/chat-models'
 export default defineConfig({
+  env: loadEnv('test', cwd(), ''),
   plugins: [
     ChatModels({
       models: [
@@ -224,12 +225,17 @@ export default defineConfig({
       ],
     }),
   ],
-  env: loadEnv('test', cwd(), ''),
   projects: [
     {
+      evalMatrix: {
+        extend: {
+          rubric: ['strict', 'lenient'],
+          rubricModel: ['judge-mini', 'judge-large'],
+        },
+      },
+      include: ['evals/*.eval.ts'],
       name: 'chat-evals',
       root: '.',
-      include: ['evals/*.eval.ts'],
       runMatrix: {
         extend: {
           model: ['agent-mini', 'agent-large'],
@@ -237,12 +243,6 @@ export default defineConfig({
           scenario: ['baseline', 'stress'],
         },
       },
-      evalMatrix: {
-        extend: {
-          rubric: ['strict', 'lenient'],
-          rubricModel: ['judge-mini', 'judge-large'],
-        },
-      },
     },
   ],
 })
@@ -258,19 +258,6 @@ import { defineConfig } from 'vieval'
 export default defineConfig({
   projects: [
     {
-      name: 'motion-evals',
-      root: '.',
-      include: ['evals/*.eval.ts'],
-      inferenceExecutors: [{ id: 'motion-engine' }],
-      models: [
-        {
-          id: 'motion-engine:v2',
-          aliases: ['motion-default'],
-          inferenceExecutor: 'motion-engine',
-          inferenceExecutorId: 'motion-engine',
-          model: 'v2',
-        },
-      ],
       async executor(task, context) {
         const model = context.models.find(model =>
           model.id === 'motion-default'
@@ -285,13 +272,26 @@ export default defineConfig({
         const success = model.model === 'v2' && task.matrix.run.scenario === 'baseline'
         return {
-          id: task.id,
           entryId: task.entry.id,
+          id: task.id,
           inferenceExecutorId: task.inferenceExecutor.id,
           matrix: task.matrix,
           scores: [{ kind: 'exact', score: success ? 1 : 0 }],
         }
       },
+      include: ['evals/*.eval.ts'],
+      inferenceExecutors: [{ id: 'motion-engine' }],
+      models: [
+        {
+          aliases: ['motion-default'],
+          id: 'motion-engine:v2',
+          inferenceExecutor: 'motion-engine',
+          inferenceExecutorId: 'motion-engine',
+          model: 'v2',
+        },
+      ],
+      name: 'motion-evals',
+      root: '.',
     },
   ],
 })

package/dist/bin/vieval.mjs CHANGED Viewed

@@ -1,5 +1,5 @@
 #!/usr/bin/env node
-import { n as runTopLevelCli } from "../cli-CHFCF8UR.mjs";
+import { n as runTopLevelCli } from "../cli-uzS81IPd.mjs";
 import process from "node:process";
 import { errorMessageFrom } from "@moeru/std";
 //#region src/bin/vieval.ts

package/dist/cli/index.d.mts CHANGED Viewed

@@ -1,7 +1,7 @@
 //#region src/cli/index.d.ts
 type Command = 'compare' | 'report' | 'run';
 interface ParsedTopLevelCliArguments {
-  command: Command | 'help';
+  command: 'help' | Command;
   commandArgv: string[];
 }
 /**

package/dist/cli/index.mjs CHANGED Viewed

@@ -1,2 +1,2 @@
-import { n as runTopLevelCli, t as parseTopLevelCliArguments } from "../cli-CHFCF8UR.mjs";
+import { n as runTopLevelCli, t as parseTopLevelCliArguments } from "../cli-uzS81IPd.mjs";
 export { parseTopLevelCliArguments, runTopLevelCli };