npm - snapeval - Versions diffs - 1.5.0 → 1.7.0 - Mend

snapeval 1.5.0 → 1.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (139) hide show

package/bin/snapeval.ts +49 -197
package/dist/bin/snapeval.js +43 -159
package/dist/bin/snapeval.js.map +1 -1
package/dist/src/adapters/copilot-sdk-client.d.ts +0 -4
package/dist/src/adapters/copilot-sdk-client.js +0 -4
package/dist/src/adapters/copilot-sdk-client.js.map +1 -1
package/dist/src/adapters/harness/copilot-cli.d.ts +12 -0
package/dist/src/adapters/harness/copilot-cli.js +54 -0
package/dist/src/adapters/harness/copilot-cli.js.map +1 -0
package/dist/src/adapters/harness/resolve.d.ts +2 -0
package/dist/src/adapters/harness/resolve.js +9 -0
package/dist/src/adapters/harness/resolve.js.map +1 -0
package/dist/src/adapters/inference/copilot-sdk.d.ts +0 -4
package/dist/src/adapters/inference/copilot-sdk.js +0 -15
package/dist/src/adapters/inference/copilot-sdk.js.map +1 -1
package/dist/src/adapters/inference/copilot.d.ts +0 -4
package/dist/src/adapters/inference/copilot.js +0 -14
package/dist/src/adapters/inference/copilot.js.map +1 -1
package/dist/src/adapters/inference/github-models.d.ts +0 -2
package/dist/src/adapters/inference/github-models.js +0 -22
package/dist/src/adapters/inference/github-models.js.map +1 -1
package/dist/src/adapters/inference/resolve.js +2 -9
package/dist/src/adapters/inference/resolve.js.map +1 -1
package/dist/src/adapters/report/terminal.js +15 -32
package/dist/src/adapters/report/terminal.js.map +1 -1
package/dist/src/commands/eval.d.ts +6 -0
package/dist/src/commands/eval.js +55 -0
package/dist/src/commands/eval.js.map +1 -0
package/dist/src/commands/review.d.ts +7 -7
package/dist/src/commands/review.js +22 -24
package/dist/src/commands/review.js.map +1 -1
package/dist/src/config.js +3 -3
package/dist/src/config.js.map +1 -1
package/dist/src/engine/aggregator.d.ts +2 -0
package/dist/src/engine/aggregator.js +53 -0
package/dist/src/engine/aggregator.js.map +1 -0
package/dist/src/engine/generator.d.ts +0 -5
package/dist/src/engine/generator.js +4 -18
package/dist/src/engine/generator.js.map +1 -1
package/dist/src/engine/grader.d.ts +2 -0
package/dist/src/engine/grader.js +73 -0
package/dist/src/engine/grader.js.map +1 -0
package/dist/src/engine/runner.d.ts +14 -0
package/dist/src/engine/runner.js +41 -0
package/dist/src/engine/runner.js.map +1 -0
package/dist/src/engine/workspace.d.ts +8 -0
package/dist/src/engine/workspace.js +37 -0
package/dist/src/engine/workspace.js.map +1 -0
package/dist/src/errors.d.ts +3 -3
package/dist/src/errors.js +6 -6
package/dist/src/errors.js.map +1 -1
package/dist/src/types.d.ts +58 -98
package/dist/src/types.js +1 -0
package/dist/src/types.js.map +1 -1
package/package.json +4 -14
package/plugin.json +1 -1
package/skills/snapeval/SKILL.md +71 -198
package/src/adapters/copilot-sdk-client.ts +0 -4
package/src/adapters/harness/copilot-cli.ts +64 -0
package/src/adapters/harness/resolve.ts +10 -0
package/src/adapters/inference/copilot-sdk.ts +0 -18
package/src/adapters/inference/copilot.ts +0 -17
package/src/adapters/inference/github-models.ts +0 -29
package/src/adapters/inference/resolve.ts +2 -10
package/src/adapters/report/terminal.ts +16 -44
package/src/commands/eval.ts +91 -0
package/src/commands/review.ts +28 -30
package/src/config.ts +3 -3
package/src/engine/aggregator.ts +59 -0
package/src/engine/generator.ts +4 -26
package/src/engine/grader.ts +99 -0
package/src/engine/runner.ts +61 -0
package/src/engine/workspace.ts +40 -0
package/src/errors.ts +6 -6
package/src/types.ts +70 -103
package/dist/src/adapters/report/html.d.ts +0 -8
package/dist/src/adapters/report/html.js +0 -283
package/dist/src/adapters/report/html.js.map +0 -1
package/dist/src/adapters/report/json.d.ts +0 -7
package/dist/src/adapters/report/json.js +0 -39
package/dist/src/adapters/report/json.js.map +0 -1
package/dist/src/adapters/skill/copilot-cli.d.ts +0 -7
package/dist/src/adapters/skill/copilot-cli.js +0 -62
package/dist/src/adapters/skill/copilot-cli.js.map +0 -1
package/dist/src/adapters/skill/copilot-sdk.d.ts +0 -6
package/dist/src/adapters/skill/copilot-sdk.js +0 -68
package/dist/src/adapters/skill/copilot-sdk.js.map +0 -1
package/dist/src/commands/approve.d.ts +0 -5
package/dist/src/commands/approve.js +0 -40
package/dist/src/commands/approve.js.map +0 -1
package/dist/src/commands/capture.d.ts +0 -4
package/dist/src/commands/capture.js +0 -18
package/dist/src/commands/capture.js.map +0 -1
package/dist/src/commands/check.d.ts +0 -4
package/dist/src/commands/check.js +0 -67
package/dist/src/commands/check.js.map +0 -1
package/dist/src/commands/ideate.d.ts +0 -1
package/dist/src/commands/ideate.js +0 -69
package/dist/src/commands/ideate.js.map +0 -1
package/dist/src/commands/report.d.ts +0 -5
package/dist/src/commands/report.js +0 -35
package/dist/src/commands/report.js.map +0 -1
package/dist/src/engine/budget.d.ts +0 -10
package/dist/src/engine/budget.js +0 -25
package/dist/src/engine/budget.js.map +0 -1
package/dist/src/engine/comparison/embedding.d.ts +0 -6
package/dist/src/engine/comparison/embedding.js +0 -19
package/dist/src/engine/comparison/embedding.js.map +0 -1
package/dist/src/engine/comparison/judge.d.ts +0 -12
package/dist/src/engine/comparison/judge.js +0 -73
package/dist/src/engine/comparison/judge.js.map +0 -1
package/dist/src/engine/comparison/pipeline.d.ts +0 -2
package/dist/src/engine/comparison/pipeline.js +0 -18
package/dist/src/engine/comparison/pipeline.js.map +0 -1
package/dist/src/engine/comparison/schema.d.ts +0 -2
package/dist/src/engine/comparison/schema.js +0 -28
package/dist/src/engine/comparison/schema.js.map +0 -1
package/dist/src/engine/comparison/variance.d.ts +0 -3
package/dist/src/engine/comparison/variance.js +0 -26
package/dist/src/engine/comparison/variance.js.map +0 -1
package/dist/src/engine/snapshot.d.ts +0 -11
package/dist/src/engine/snapshot.js +0 -46
package/dist/src/engine/snapshot.js.map +0 -1
package/src/adapters/report/html.ts +0 -304
package/src/adapters/report/json.ts +0 -64
package/src/adapters/skill/copilot-cli.ts +0 -74
package/src/adapters/skill/copilot-sdk.ts +0 -72
package/src/commands/approve.ts +0 -58
package/src/commands/capture.ts +0 -25
package/src/commands/check.ts +0 -85
package/src/commands/ideate.ts +0 -101
package/src/commands/report.ts +0 -47
package/src/engine/budget.ts +0 -27
package/src/engine/comparison/embedding.ts +0 -26
package/src/engine/comparison/judge.ts +0 -88
package/src/engine/comparison/pipeline.ts +0 -24
package/src/engine/comparison/schema.ts +0 -22
package/src/engine/comparison/variance.ts +0 -31
package/src/engine/snapshot.ts +0 -48

package/bin/snapeval.ts CHANGED Viewed

@@ -2,16 +2,11 @@
 import { Command } from 'commander';
 import { resolveConfig } from '../src/config.js';
 import { resolveInference } from '../src/adapters/inference/resolve.js';
-import { CopilotCLIAdapter } from '../src/adapters/skill/copilot-cli.js';
-import { CopilotSDKAdapter } from '../src/adapters/skill/copilot-sdk.js';
-import { TerminalReporter } from '../src/adapters/report/terminal.js';
+import { resolveHarness } from '../src/adapters/harness/resolve.js';
 import { initCommand } from '../src/commands/init.js';
-import { captureCommand } from '../src/commands/capture.js';
-import { checkCommand } from '../src/commands/check.js';
-import { approveCommand, approveFromResults } from '../src/commands/approve.js';
-import { reportCommand } from '../src/commands/report.js';
-import { ideateCommand } from '../src/commands/ideate.js';
+import { evalCommand } from '../src/commands/eval.js';
 import { reviewCommand } from '../src/commands/review.js';
+import { TerminalReporter } from '../src/adapters/report/terminal.js';
 import { SnapevalError } from '../src/errors.js';
 import * as path from 'node:path';
@@ -19,41 +14,40 @@ const program = new Command();
 program
   .name('snapeval')
-  .description('Semantic snapshot testing for AI skills')
-  .version('1.0.0');
+  .description('Harness-agnostic eval runner for agentskills.io skills')
+  .version('2.0.0');
 // --- init ---
 program
   .command('init')
-  .description('Generate test cases from SKILL.md using AI')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
+  .description('Generate evals.json from SKILL.md (prompts + expected outputs, no assertions)')
+  .option('--harness <harness>', 'Harness to use')
+  .option('--inference <inference>', 'Inference adapter to use')
   .option('--verbose', 'Verbose output')
   .argument('[skill-dir]', 'Path to skill directory', process.cwd())
   .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
     try {
       const skillPath = path.resolve(skillDir);
       const config = resolveConfig(
-        { adapter: opts.adapter as string, inference: opts.inference as string },
-        process.cwd(),
-        skillPath
+        { harness: opts.harness as string, inference: opts.inference as string },
+        process.cwd(), skillPath
       );
       const inference = resolveInference(config.inference);
       await initCommand(skillPath, inference);
       console.log(`Generated evals at ${path.join(skillPath, 'evals', 'evals.json')}`);
       process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
+    } catch (err) { handleError(err); }
   });
-// --- capture ---
+// --- eval ---
 program
-  .command('capture')
-  .description('Run skill against all scenarios and save baseline snapshots')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
-  .option('--runs <n>', 'Number of runs per scenario', '1')
+  .command('eval')
+  .description('Run evals (with/without skill), grade assertions, compute benchmark')
+  .option('--harness <harness>', 'Harness to use')
+  .option('--inference <inference>', 'Inference adapter to use')
+  .option('--workspace <path>', 'Workspace directory')
+  .option('--runs <n>', 'Runs per eval for statistical significance', '1')
+  .option('--old-skill <path>', 'Compare against old skill version instead of no-skill')
   .option('--verbose', 'Verbose output')
   .argument('[skill-dir]', 'Path to skill directory', process.cwd())
   .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
@@ -61,148 +55,39 @@ program
       const skillPath = path.resolve(skillDir);
       const config = resolveConfig(
         {
-          adapter: opts.adapter as string,
+          harness: opts.harness as string,
           inference: opts.inference as string,
+          workspace: opts.workspace as string,
           runs: opts.runs ? parseInt(opts.runs as string, 10) : undefined,
         },
-        process.cwd(),
-        skillPath
-      );
-      const skillAdapter = resolveSkillAdapter(config.adapter);
-      await captureCommand(skillPath, skillAdapter, { runs: config.runs });
-      console.log(`Captured baselines at ${path.join(skillPath, 'evals', 'snapshots')}`);
-      process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
-  });
-// --- check ---
-program
-  .command('check')
-  .description('Compare current skill output against baselines')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
-  .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
-  .option('--ci', 'CI mode: exit 1 on regressions, no interactive prompts')
-  .option('--verbose', 'Verbose output')
-  .option('--scenario <ids>', 'Comma-separated scenario IDs to check')
-  .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-  .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
-    try {
-      const skillPath = path.resolve(skillDir);
-      const config = resolveConfig(
-        {
-          adapter: opts.adapter as string,
-          inference: opts.inference as string,
-          budget: opts.budget as string,
-        },
-        process.cwd(),
-        skillPath
-      );
-      const skillAdapter = resolveSkillAdapter(config.adapter);
-      const inference = resolveInference(config.inference);
-      const results = await checkCommand(skillPath, skillAdapter, inference, {
-        budget: config.budget,
-      });
-      // Always print terminal report
-      const reporter = new TerminalReporter();
-      await reporter.report(results);
-      const hasRegressions = results.summary.regressed > 0;
-      if (hasRegressions) {
-        process.exit(1);
-      }
-      process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
-  });
-// --- approve ---
-program
-  .command('approve')
-  .description('Approve regressed scenarios as new baselines')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
-  .option('--scenario <ids>', 'Comma-separated scenario IDs to approve (default: all)')
-  .option('--verbose', 'Verbose output')
-  .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-  .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
-    try {
-      const skillPath = path.resolve(skillDir);
-      const config = resolveConfig(
-        { adapter: opts.adapter as string, inference: opts.inference as string },
-        process.cwd(),
-        skillPath
-      );
-      const skillAdapter = resolveSkillAdapter(config.adapter);
-      const scenarioIds = opts.scenario
-        ? (opts.scenario as string).split(',').map((s) => parseInt(s.trim(), 10))
-        : undefined;
-      await approveCommand(skillPath, skillAdapter, { scenarioIds });
-      console.log('Approved snapshots updated.');
-      process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
-  });
-// --- report ---
-program
-  .command('report')
-  .description('Write latest check results to evals/results/iteration-N/')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
-  .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
-  .option('--verbose', 'Verbose output')
-  .option('--html', 'Generate HTML report viewer')
-  .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-  .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
-    try {
-      const skillPath = path.resolve(skillDir);
-      const config = resolveConfig(
-        {
-          adapter: opts.adapter as string,
-          inference: opts.inference as string,
-          budget: opts.budget as string,
-        },
-        process.cwd(),
-        skillPath
+        process.cwd(), skillPath
       );
-      const skillAdapter = resolveSkillAdapter(config.adapter);
+      const harness = resolveHarness(config.harness);
       const inference = resolveInference(config.inference);
-      const results = await checkCommand(skillPath, skillAdapter, inference, {
-        budget: config.budget,
+      const results = await evalCommand(skillPath, harness, inference, {
+        workspace: config.workspace,
+        runs: config.runs,
+        oldSkill: opts['old-skill'] as string | undefined,
       });
-      await reportCommand(skillPath, results, {
-        verbose: Boolean(opts.verbose),
-        html: Boolean(opts.html),
-      });
-      const hasRegressions = results.summary.regressed > 0;
-      if (hasRegressions) {
-        process.exit(1);
-      }
+      const terminal = new TerminalReporter();
+      await terminal.report(results);
+      console.log(`Results at ${results.iterationDir}`);
       process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
+    } catch (err) { handleError(err); }
   });
 // --- review ---
 program
   .command('review')
-  .description('Run checks, generate HTML report, and open in browser')
-  .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-  .option('--inference <inference>', 'Inference adapter to use', 'auto')
-  .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
+  .description('Run eval + generate HTML report + open in browser')
+  .option('--harness <harness>', 'Harness to use')
+  .option('--inference <inference>', 'Inference adapter to use')
+  .option('--workspace <path>', 'Workspace directory')
+  .option('--runs <n>', 'Runs per eval for statistical significance', '1')
+  .option('--old-skill <path>', 'Compare against old skill version instead of no-skill')
+  .option('--no-open', 'Do not open browser')
   .option('--verbose', 'Verbose output')
   .argument('[skill-dir]', 'Path to skill directory', process.cwd())
   .action(async (skillDir: string, opts: Record<string, string | boolean>) => {
@@ -210,59 +95,26 @@ program
       const skillPath = path.resolve(skillDir);
       const config = resolveConfig(
         {
-          adapter: opts.adapter as string,
+          harness: opts.harness as string,
           inference: opts.inference as string,
-          budget: opts.budget as string,
+          workspace: opts.workspace as string,
+          runs: opts.runs ? parseInt(opts.runs as string, 10) : undefined,
         },
-        process.cwd(),
-        skillPath
+        process.cwd(), skillPath
       );
-      const skillAdapter = resolveSkillAdapter(config.adapter);
+      const harness = resolveHarness(config.harness);
       const inference = resolveInference(config.inference);
-      const { hasRegressions } = await reviewCommand(skillPath, skillAdapter, inference, {
-        budget: config.budget,
+      await reviewCommand(skillPath, harness, inference, {
+        workspace: config.workspace,
+        runs: config.runs,
+        oldSkill: opts['old-skill'] as string | undefined,
+        noOpen: opts.open === false,
       });
-      if (hasRegressions) {
-        process.exit(1);
-      }
-      process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
-  });
-// --- ideate ---
-program
-  .command('ideate')
-  .description('Open the interactive scenario ideation viewer')
-  .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-  .action(async (skillDir: string) => {
-    try {
-      const skillPath = path.resolve(skillDir);
-      const outputPath = await ideateCommand(skillPath);
-      console.log(`Ideation viewer opened: ${outputPath}`);
       process.exit(0);
-    } catch (err) {
-      handleError(err);
-    }
+    } catch (err) { handleError(err); }
   });
-// --- helpers ---
-function resolveSkillAdapter(adapterName: string) {
-  if (adapterName === 'copilot-cli') {
-    return new CopilotCLIAdapter();
-  }
-  if (adapterName === 'copilot-sdk') {
-    return new CopilotSDKAdapter();
-  }
-  throw new SnapevalError(
-    `Unknown skill adapter "${adapterName}". Valid options: copilot-cli, copilot-sdk.`
-  );
-}
 function handleError(err: unknown): never {
   if (err instanceof SnapevalError) {
     console.error(`Error: ${err.message}`);

package/dist/bin/snapeval.js CHANGED Viewed

@@ -2,35 +2,30 @@
 import { Command } from 'commander';
 import { resolveConfig } from '../src/config.js';
 import { resolveInference } from '../src/adapters/inference/resolve.js';
-import { CopilotCLIAdapter } from '../src/adapters/skill/copilot-cli.js';
-import { CopilotSDKAdapter } from '../src/adapters/skill/copilot-sdk.js';
-import { TerminalReporter } from '../src/adapters/report/terminal.js';
+import { resolveHarness } from '../src/adapters/harness/resolve.js';
 import { initCommand } from '../src/commands/init.js';
-import { captureCommand } from '../src/commands/capture.js';
-import { checkCommand } from '../src/commands/check.js';
-import { approveCommand } from '../src/commands/approve.js';
-import { reportCommand } from '../src/commands/report.js';
-import { ideateCommand } from '../src/commands/ideate.js';
+import { evalCommand } from '../src/commands/eval.js';
 import { reviewCommand } from '../src/commands/review.js';
+import { TerminalReporter } from '../src/adapters/report/terminal.js';
 import { SnapevalError } from '../src/errors.js';
 import * as path from 'node:path';
 const program = new Command();
 program
     .name('snapeval')
-    .description('Semantic snapshot testing for AI skills')
-    .version('1.0.0');
+    .description('Harness-agnostic eval runner for agentskills.io skills')
+    .version('2.0.0');
 // --- init ---
 program
     .command('init')
-    .description('Generate test cases from SKILL.md using AI')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
+    .description('Generate evals.json from SKILL.md (prompts + expected outputs, no assertions)')
+    .option('--harness <harness>', 'Harness to use')
+    .option('--inference <inference>', 'Inference adapter to use')
     .option('--verbose', 'Verbose output')
     .argument('[skill-dir]', 'Path to skill directory', process.cwd())
     .action(async (skillDir, opts) => {
     try {
         const skillPath = path.resolve(skillDir);
-        const config = resolveConfig({ adapter: opts.adapter, inference: opts.inference }, process.cwd(), skillPath);
+        const config = resolveConfig({ harness: opts.harness, inference: opts.inference }, process.cwd(), skillPath);
         const inference = resolveInference(config.inference);
         await initCommand(skillPath, inference);
         console.log(`Generated evals at ${path.join(skillPath, 'evals', 'evals.json')}`);
@@ -40,125 +35,36 @@ program
         handleError(err);
     }
 });
-// --- capture ---
+// --- eval ---
 program
-    .command('capture')
-    .description('Run skill against all scenarios and save baseline snapshots')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
-    .option('--runs <n>', 'Number of runs per scenario', '1')
+    .command('eval')
+    .description('Run evals (with/without skill), grade assertions, compute benchmark')
+    .option('--harness <harness>', 'Harness to use')
+    .option('--inference <inference>', 'Inference adapter to use')
+    .option('--workspace <path>', 'Workspace directory')
+    .option('--runs <n>', 'Runs per eval for statistical significance', '1')
+    .option('--old-skill <path>', 'Compare against old skill version instead of no-skill')
     .option('--verbose', 'Verbose output')
     .argument('[skill-dir]', 'Path to skill directory', process.cwd())
     .action(async (skillDir, opts) => {
     try {
         const skillPath = path.resolve(skillDir);
         const config = resolveConfig({
-            adapter: opts.adapter,
+            harness: opts.harness,
             inference: opts.inference,
+            workspace: opts.workspace,
             runs: opts.runs ? parseInt(opts.runs, 10) : undefined,
         }, process.cwd(), skillPath);
-        const skillAdapter = resolveSkillAdapter(config.adapter);
-        await captureCommand(skillPath, skillAdapter, { runs: config.runs });
-        console.log(`Captured baselines at ${path.join(skillPath, 'evals', 'snapshots')}`);
-        process.exit(0);
-    }
-    catch (err) {
-        handleError(err);
-    }
-});
-// --- check ---
-program
-    .command('check')
-    .description('Compare current skill output against baselines')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
-    .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
-    .option('--ci', 'CI mode: exit 1 on regressions, no interactive prompts')
-    .option('--verbose', 'Verbose output')
-    .option('--scenario <ids>', 'Comma-separated scenario IDs to check')
-    .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-    .action(async (skillDir, opts) => {
-    try {
-        const skillPath = path.resolve(skillDir);
-        const config = resolveConfig({
-            adapter: opts.adapter,
-            inference: opts.inference,
-            budget: opts.budget,
-        }, process.cwd(), skillPath);
-        const skillAdapter = resolveSkillAdapter(config.adapter);
+        const harness = resolveHarness(config.harness);
         const inference = resolveInference(config.inference);
-        const results = await checkCommand(skillPath, skillAdapter, inference, {
-            budget: config.budget,
+        const results = await evalCommand(skillPath, harness, inference, {
+            workspace: config.workspace,
+            runs: config.runs,
+            oldSkill: opts['old-skill'],
         });
-        // Always print terminal report
-        const reporter = new TerminalReporter();
-        await reporter.report(results);
-        const hasRegressions = results.summary.regressed > 0;
-        if (hasRegressions) {
-            process.exit(1);
-        }
-        process.exit(0);
-    }
-    catch (err) {
-        handleError(err);
-    }
-});
-// --- approve ---
-program
-    .command('approve')
-    .description('Approve regressed scenarios as new baselines')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
-    .option('--scenario <ids>', 'Comma-separated scenario IDs to approve (default: all)')
-    .option('--verbose', 'Verbose output')
-    .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-    .action(async (skillDir, opts) => {
-    try {
-        const skillPath = path.resolve(skillDir);
-        const config = resolveConfig({ adapter: opts.adapter, inference: opts.inference }, process.cwd(), skillPath);
-        const skillAdapter = resolveSkillAdapter(config.adapter);
-        const scenarioIds = opts.scenario
-            ? opts.scenario.split(',').map((s) => parseInt(s.trim(), 10))
-            : undefined;
-        await approveCommand(skillPath, skillAdapter, { scenarioIds });
-        console.log('Approved snapshots updated.');
-        process.exit(0);
-    }
-    catch (err) {
-        handleError(err);
-    }
-});
-// --- report ---
-program
-    .command('report')
-    .description('Write latest check results to evals/results/iteration-N/')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
-    .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
-    .option('--verbose', 'Verbose output')
-    .option('--html', 'Generate HTML report viewer')
-    .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-    .action(async (skillDir, opts) => {
-    try {
-        const skillPath = path.resolve(skillDir);
-        const config = resolveConfig({
-            adapter: opts.adapter,
-            inference: opts.inference,
-            budget: opts.budget,
-        }, process.cwd(), skillPath);
-        const skillAdapter = resolveSkillAdapter(config.adapter);
-        const inference = resolveInference(config.inference);
-        const results = await checkCommand(skillPath, skillAdapter, inference, {
-            budget: config.budget,
-        });
-        await reportCommand(skillPath, results, {
-            verbose: Boolean(opts.verbose),
-            html: Boolean(opts.html),
-        });
-        const hasRegressions = results.summary.regressed > 0;
-        if (hasRegressions) {
-            process.exit(1);
-        }
+        const terminal = new TerminalReporter();
+        await terminal.report(results);
+        console.log(`Results at ${results.iterationDir}`);
         process.exit(0);
     }
     catch (err) {
@@ -168,60 +74,38 @@ program
 // --- review ---
 program
     .command('review')
-    .description('Run checks, generate HTML report, and open in browser')
-    .option('--adapter <adapter>', 'Skill adapter to use', 'copilot-cli')
-    .option('--inference <inference>', 'Inference adapter to use', 'auto')
-    .option('--budget <amount>', 'Spend cap in USD (or "unlimited")', 'unlimited')
+    .description('Run eval + generate HTML report + open in browser')
+    .option('--harness <harness>', 'Harness to use')
+    .option('--inference <inference>', 'Inference adapter to use')
+    .option('--workspace <path>', 'Workspace directory')
+    .option('--runs <n>', 'Runs per eval for statistical significance', '1')
+    .option('--old-skill <path>', 'Compare against old skill version instead of no-skill')
+    .option('--no-open', 'Do not open browser')
     .option('--verbose', 'Verbose output')
     .argument('[skill-dir]', 'Path to skill directory', process.cwd())
     .action(async (skillDir, opts) => {
     try {
         const skillPath = path.resolve(skillDir);
         const config = resolveConfig({
-            adapter: opts.adapter,
+            harness: opts.harness,
             inference: opts.inference,
-            budget: opts.budget,
+            workspace: opts.workspace,
+            runs: opts.runs ? parseInt(opts.runs, 10) : undefined,
         }, process.cwd(), skillPath);
-        const skillAdapter = resolveSkillAdapter(config.adapter);
+        const harness = resolveHarness(config.harness);
         const inference = resolveInference(config.inference);
-        const { hasRegressions } = await reviewCommand(skillPath, skillAdapter, inference, {
-            budget: config.budget,
+        await reviewCommand(skillPath, harness, inference, {
+            workspace: config.workspace,
+            runs: config.runs,
+            oldSkill: opts['old-skill'],
+            noOpen: opts.open === false,
         });
-        if (hasRegressions) {
-            process.exit(1);
-        }
         process.exit(0);
     }
     catch (err) {
         handleError(err);
     }
 });
-// --- ideate ---
-program
-    .command('ideate')
-    .description('Open the interactive scenario ideation viewer')
-    .argument('[skill-dir]', 'Path to skill directory', process.cwd())
-    .action(async (skillDir) => {
-    try {
-        const skillPath = path.resolve(skillDir);
-        const outputPath = await ideateCommand(skillPath);
-        console.log(`Ideation viewer opened: ${outputPath}`);
-        process.exit(0);
-    }
-    catch (err) {
-        handleError(err);
-    }
-});
-// --- helpers ---
-function resolveSkillAdapter(adapterName) {
-    if (adapterName === 'copilot-cli') {
-        return new CopilotCLIAdapter();
-    }
-    if (adapterName === 'copilot-sdk') {
-        return new CopilotSDKAdapter();
-    }
-    throw new SnapevalError(`Unknown skill adapter "${adapterName}". Valid options: copilot-cli, copilot-sdk.`);
-}
 function handleError(err) {
     if (err instanceof SnapevalError) {
         console.error(`Error: ${err.message}`);

package/dist/bin/snapeval.js.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"snapeval.js","sourceRoot":"","sources":["../../bin/snapeval.ts"],"names":[],"mappings":";AACA,OAAO,EAAE,OAAO,EAAE,MAAM,WAAW,CAAC;AACpC,OAAO,EAAE,aAAa,EAAE,MAAM,kBAAkB,CAAC;AACjD,OAAO,EAAE,gBAAgB,EAAE,MAAM,sCAAsC,CAAC;AACxE,OAAO,EAAE,~~iBAAiB~~,EAAE,MAAM,~~sCAAsC,CAAC;AACzE,OAAO,EAAE,iBAAiB,EAAE,MAAM,sCAAsC,CAAC;AACzE,OAAO,EAAE,gBAAgB,EAAE,MAAM,~~oCAAoC,CAAC;~~AACtE~~,OAAO,EAAE,WAAW,EAAE,MAAM,yBAAyB,CAAC;AACtD,OAAO,EAAE,~~cAAc~~,EAAE,MAAM,~~4BAA4B~~,CAAC;~~AAC5D~~,OAAO,EAAE,~~YAAY,EAAE,MAAM,0BAA0B,CAAC;AACxD,OAAO,EAAE,cAAc,EAAsB,MAAM,4BAA4B,CAAC;AAChF,OAAO,EAAE,~~aAAa,EAAE,MAAM,2BAA2B,CAAC;AAC1D,OAAO,EAAE,~~aAAa~~,EAAE,MAAM,~~2BAA2B~~,CAAC;~~AAC1D~~,OAAO,EAAE,aAAa,EAAE,MAAM,~~2BAA2B,CAAC;AAC1D,OAAO,EAAE,aAAa,EAAE,MAAM,~~kBAAkB,CAAC;AACjD,OAAO,KAAK,IAAI,MAAM,WAAW,CAAC;AAElC,MAAM,OAAO,GAAG,IAAI,OAAO,EAAE,CAAC;AAE9B,OAAO;KACJ,IAAI,CAAC,UAAU,CAAC;KAChB,WAAW,CAAC,~~yCAAyC~~,CAAC;~~KACtD~~,OAAO,CAAC,OAAO,CAAC,CAAC;AAEpB,eAAe;AACf,OAAO;KACJ,OAAO,CAAC,MAAM,CAAC;KACf,WAAW,CAAC,~~4CAA4C,~~CAAC;~~KACzD~~,MAAM,CAAC,qBAAqB,EAAE,~~sBAAsB~~,~~EAAE,aAAa,~~CAAC;~~KACpE~~,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,~~EAAE,MAAM,~~CAAC;~~KACrE~~,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B,EAAE,OAAO,EAAE,IAAI,CAAC,OAAiB,EAAE,SAAS,EAAE,IAAI,CAAC,SAAmB,EAAE,EACxE,OAAO,CAAC,GAAG,EAAE,~~EACb~~,SAAS,~~CACV~~,CAAC;QACF,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QACrD,MAAM,WAAW,CAAC,SAAS,EAAE,SAAS,CAAC,CAAC;QACxC,OAAO,CAAC,GAAG,CAAC,sBAAsB,IAAI,CAAC,IAAI,CAAC,SAAS,EAAE,OAAO,EAAE,YAAY,CAAC,EAAE,CAAC,CAAC;QACjF,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;~~QACb~~,WAAW,CAAC,GAAG,CAAC,CAAC;~~IACnB~~,CAAC;~~AACH~~,CAAC,CAAC,CAAC;AAEL,~~kBAAkB~~;~~AAClB~~,OAAO;KACJ,OAAO,CAAC,~~SAAS~~,CAAC;~~KAClB~~,WAAW,CAAC,~~6DAA6D~~,CAAC;~~KAC1E~~,MAAM,CAAC,qBAAqB,EAAE,~~sBAAsB~~,~~EAAE,aAAa,~~CAAC;~~KACpE~~,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,~~EAAE~~,MAAM,CAAC;~~KACrE~~,MAAM,CAAC,YAAY,EAAE,~~6BAA6B~~,EAAE,GAAG,CAAC;~~KACxD~~,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,EAAE,IAAI,CAAC,OAAiB;YAC/B,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,IAAI,EAAE,IAAI,CAAC,IAAI,CAAC,CAAC,CAAC,QAAQ,CAAC,IAAI,CAAC,IAAc,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,SAAS;SAChE,EACD,OAAO,CAAC,GAAG,EAAE,~~EACb~~,SAAS,~~CACV~~,CAAC;QACF,MAAM,~~YAAY~~,GAAG,~~mBAAmB~~,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;~~QACzD~~,MAAM,~~cAAc,CAAC,~~SAAS,~~EAAE,YAAY,EAAE,EAAE,IAAI,EAAE,MAAM,CAAC,IAAI,EAAE,CAAC,CAAC;QACrE,OAAO,CAAC,~~GAAG,~~CAAC~~,~~yBAAyB,IAAI,~~CAAC,~~IAAI~~,CAAC,SAAS,~~EAAE,OAAO,EAAE,WAAW,~~CAAC,~~EAAE,~~CAAC~~,CAAC~~;~~QACnF~~,~~OAAO~~,~~CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,~~OAAO,GAAG,~~EAAE,CAAC;QACb,WAAW,CAAC,GAAG,CAAC,CAAC;IACnB,CAAC;AACH,CAAC,CAAC,CAAC;AAEL,gBAAgB;AAChB,OAAO;KACJ,OAAO,CAAC,OAAO,CAAC;KAChB,WAAW,CAAC,gDAAgD,CAAC;KAC7D,~~MAAM,~~CAAC,qBAAqB,EAAE,sBAAsB,EAAE,aAAa,CAAC;KACpE,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,EAAE,MAAM,CAAC;KACrE,MAAM,CAAC,mBAAmB,EAAE,mCAAmC,EAAE,~~WAAW,CAAC~~;KAC7E~~,~~MAAM~~,~~CAAC,MAAM,~~EAAE,~~wDAAwD,CAAC;KACxE,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,MAAM,CAAC,kBAAkB,EAAE,uCAAuC,CAAC;KACnE,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,~~OAAO,~~CAAC,GAAG,~~EAAE,~~CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,~~SAAS,~~GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,~~EAAE~~,IAAI,CAAC,OAAiB~~;YAC/B,SAAS,EAAE,~~IAAI~~,CAAC,~~SAAmB~~;~~YACnC~~,~~MAAM,EAAE,~~IAAI,~~CAAC,MAAgB;SAC9B,EACD,OAAO,CAAC,GAAG,~~EAAE,~~EACb,SAAS,CACV,CAAC;QACF,~~MAAM,~~YAAY,GAAG,mBAAmB,~~CAAC,~~MAAM,CAAC,OAAO,CAAC,CAAC~~;~~QACzD~~,~~MAAM~~,~~SAAS~~,~~GAAG~~,~~gBAAgB,~~CAAC,~~MAAM~~,~~CAAC,SAAS,CAAC,CAAC~~;~~QAErD~~,~~MAAM,OAAO,GAAG,MAAM,YAAY,~~CAAC,~~SAAS,EAAE,YAAY,EAAE,SAAS,EAAE;YACrE,MAAM,EAAE,MAAM,~~CAAC~~,MAAM~~;~~SACtB,CAAC,CAAC;~~QAEH~~,+BAA+B;QAC/B~~,MAAM,QAAQ,GAAG,IAAI,gBAAgB,EAAE,CAAC;QACxC,MAAM,QAAQ,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;~~QAE~~/B,~~MAAM,cAAc,GAAG,~~OAAO,CAAC,~~OAAO,CAAC,SAAS,~~GAAG,CAAC,~~CAAC;QACrD,IAAI,~~cAAc,~~EAAE,CAAC;YACnB,~~OAAO,CAAC,~~IAAI~~,~~CAAC~~,CAAC,CAAC~~,CAAC~~;~~QAClB~~,~~CAAC;QACD,~~OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;~~QACb~~,WAAW,CAAC,GAAG,CAAC,CAAC;~~IACnB~~,CAAC;~~AACH~~,CAAC,CAAC,CAAC;AAEL,~~kBAAkB~~;~~AAClB~~,OAAO;KACJ,OAAO,CAAC,~~SAAS~~,CAAC;~~KAClB~~,WAAW,CAAC,~~8CAA8C~~,CAAC;~~KAC3D~~,MAAM,CAAC,qBAAqB,EAAE,~~sBAAsB~~,~~EAAE,aAAa,~~CAAC;~~KACpE~~,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,~~EAAE,MAAM,~~CAAC;~~KACrE~~,MAAM,CAAC,~~kBAAkB~~,EAAE,~~wDAAwD~~,CAAC;~~KACpF~~,MAAM,CAAC,~~WAAW~~,EAAE,~~gBAAgB~~,~~CAAC;KACrC,QAAQ,CAAC,aAAa,~~EAAE,~~yBAAyB,EAAE,OAAO,CAAC,~~GAAG,~~EAAE,~~CAAC;~~KACjE~~,MAAM,CAAC,~~KAAK~~,EAAE,~~QAAgB~~,~~EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,~~CAAC;~~QACH~~,MAAM,~~SAAS,GAAG,IAAI,~~CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B,EAAE,OAAO,EAAE,IAAI,CAAC,OAAiB,EAAE,SAAS,EAAE,IAAI,CAAC,SAAmB,EAAE,EACxE,OAAO,CAAC,GAAG,EAAE,EACb,SAAS,CACV,CAAC;QACF,MAAM,YAAY,GAAG,mBAAmB,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;QAEzD,MAAM,WAAW,~~GAAG,IAAI,CAAC,QAAQ;YAC/B,CAAC,CAAE,IAAI,CAAC,QAAmB,CAAC,KAAK,CAAC,GAAG,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,~~EAAE,EAAE,CAAC,QAAQ,CAAC,CAAC,CAAC,IAAI,EAAE,EAAE,EAAE,CAAC,CAAC;YACzE,CAAC,CAAC,SAAS,CAAC;QAEd,MAAM,cAAc,CAAC,SAAS,EAAE,YAAY,EAAE,EAAE,WAAW,EAAE,CAAC,CAAC;QAC/D,OAAO,CAAC,GAAG,CAAC,6BAA6B,CAAC,CAAC;QAC3C,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;QACb,WAAW,CAAC,GAAG,CAAC,CAAC;IACnB,CAAC;AACH,CAAC,CAAC,CAAC;AAEL,iBAAiB;AACjB,OAAO;KACJ,OAAO,CAAC,QAAQ,CAAC;KACjB,WAAW,CAAC,0DAA0D,CAAC;KACvE,MAAM,CAAC,qBAAqB,~~EAAE,sBAAsB,EAAE,aAAa,~~CAAC;~~KACpE~~,MAAM,CAAC,~~yBAAyB,EAAE,0BAA0B,EAAE,MAAM,CAAC;KACrE,MAAM,CAAC,mBAAmB,EAAE,mCAAmC,EAAE,~~WAAW,~~CAAC;KAC7E,MAAM,CAAC,WAAW,~~EAAE,gBAAgB,CAAC;KACrC,~~MAAM,CAAC,~~QAAQ,~~EAAE,6BAA6B,~~CAAC~~;KAC/C~~,~~QAAQ,CAAC,~~aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,EAAE,IAAI,CAAC,OAAiB;YAC/B,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,~~MAAM,EAAE,IAAI,CAAC,MAAgB;SAC9B,EACD,OAAO,CAAC,GAAG,EAAE,EACb,~~SAAS,~~CACV,CAAC;QACF,MAAM,YAAY,GAAG,mBAAmB,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;QACzD,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QAErD,MAAM,OAAO,GAAG,MAAM,YAAY,CAAC,SAAS,~~EAAE,~~YAAY,EAAE,SAAS,EAAE;YACrE,MAAM,EAAE,MAAM,CAAC,MAAM;SACtB,CAAC,CAAC;QAEH,MAAM,aAAa,CAAC,SAAS,EAAE,OAAO,EAAE;YACtC,OAAO,EAAE,OAAO,CAAC,~~IAAI,CAAC,~~OAAO,CAAC~~;~~YAC9B~~,IAAI,EAAE,~~OAAO,CAAC,~~IAAI,CAAC,IAAI,CAAC~~;SACzB~~,CAAC,CAAC~~;QAEH~~,~~MAAM~~,~~cAAc,GAAG,OAAO,~~CAAC,~~OAAO,CAAC,SAAS,GAAG,CAAC,CAAC;QACrD,~~IAAI,~~cAAc,EAAE,~~CAAC~~;YACnB~~,~~OAAO~~,~~CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;QAClB,CAAC;QACD,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,~~EAAE,~~CAAC;QACb,WAAW,CAAC,GAAG,CAAC,CAAC;IACnB,CAAC;AACH,CAAC,CAAC,CAAC;AAEL,iBAAiB;AACjB,OAAO;KACJ,OAAO,CAAC,QAAQ,CAAC;KACjB,WAAW,CAAC,uDAAuD,CAAC;KACpE,MAAM,CAAC,qBAAqB,~~EAAE,~~sBAAsB,EAAE,aAAa,~~CAAC~~;KACpE~~,~~MAAM,~~CAAC,~~yBAAyB,EAAE,0BAA0B,EAAE,MAAM,~~CAAC~~;KACrE~~,~~MAAM,~~CAAC,mBAAmB,EAAE,mCAAmC,EAAE,WAAW,CAAC;KAC7E,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS~~,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC~~;~~QACzC~~,~~MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,EAAE,IAAI,CAAC,OAAiB;YAC/B,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,MAAM,EAAE,IAAI,CAAC,MAAgB;SAC9B,~~EACD,OAAO,CAAC,GAAG,EAAE,~~EACb~~,SAAS,~~CACV~~,CAAC;QACF,MAAM,~~YAAY~~,GAAG,~~mBAAmB~~,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;~~QACzD~~,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QAErD,MAAM,~~EAAE,cAAc,EAAE,GAAG,MAAM,~~aAAa,CAAC,SAAS,EAAE,~~YAAY~~,EAAE,SAAS,EAAE;~~YACjF~~,~~MAAM~~,EAAE,MAAM,CAAC,~~MAAM~~;~~SACtB~~,~~CAAC,CAAC;QAEH,~~IAAI,~~cAAc,~~EAAE,~~CAAC;YACnB~~,~~OAAO,~~CAAC,IAAI~~,CAAC,CAAC,CAAC,CAAC~~;~~QAClB~~,~~CAAC;QACD~~,~~OAAO~~,~~CAAC,~~IAAI,CAAC,~~CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;QACb,~~WAAW,~~CAAC,GAAG,CAAC,CAAC~~;~~IACnB~~,~~CAAC;AACH,CAAC,CAAC,CAAC;AAEL,iBAAiB;AACjB,OAAO;KACJ,OAAO,CAAC,QAAQ,CAAC;KACjB,WAAW,CAAC,+CAA+C,CAAC;KAC5D,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,~~MAAM,~~CAAC,KAAK,~~EAAE,~~QAAgB,EAAE,EAAE;IACjC,~~IAAI,CAAC~~;QACH~~,~~MAAM,SAAS,GAAG,~~IAAI,~~CAAC~~,~~OAAO,CAAC,QAAQ,CAAC,CAAC~~;~~QACzC~~,~~MAAM,UAAU,GAAG,MAAM,aAAa,~~CAAC,~~SAAS,~~CAAC~~,CAAC~~;~~QAClD~~,OAAO,CAAC,~~GAAG,CAAC,2BAA2B,UAAU,EAAE,CAAC,CAAC;QACrD,OAAO,CAAC,~~IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;~~QACb~~,WAAW,CAAC,GAAG,CAAC,CAAC;~~IACnB~~,CAAC;~~AACH~~,CAAC,CAAC,CAAC;AAEL,~~kBAAkB;AAElB,~~SAAS,~~mBAAmB,CAAC,WAAmB;IAC9C,IAAI,~~WAAW,~~KAAK,aAAa,EAAE,~~CAAC~~;QAClC~~,OAAO,IAAI,iBAAiB,EAAE,CAAC;IACjC,CAAC;IACD,IAAI,WAAW,KAAK,aAAa,EAAE,CAAC;QAClC,OAAO,IAAI,iBAAiB,EAAE,CAAC;IACjC,CAAC;IACD,MAAM,IAAI,aAAa,CACrB,0BAA0B,WAAW,6CAA6C,CACnF,CAAC;AACJ,CAAC;AAED,SAAS,WAAW,CAAC,GAAY;IAC/B,IAAI,GAAG,YAAY,aAAa,EAAE,CAAC;QACjC,OAAO,CAAC,KAAK,CAAC,UAAU,GAAG,CAAC,OAAO,EAAE,CAAC,CAAC;QACvC,OAAO,CAAC,IAAI,CAAC,GAAG,CAAC,QAAQ,IAAI,CAAC,CAAC,CAAC;IAClC,CAAC;IACD,IAAI,GAAG,YAAY,KAAK,EAAE,CAAC;QACzB,OAAO,CAAC,KAAK,CAAC,UAAU,GAAG,CAAC,OAAO,EAAE,CAAC,CAAC;QACvC,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IACD,OAAO,CAAC,KAAK,CAAC,4BAA4B,CAAC,CAAC;IAC5C,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;AAClB,CAAC;AAED,OAAO,CAAC,KAAK,CAAC,OAAO,CAAC,IAAI,CAAC,CAAC"}
1	+ {"version":3,"file":"snapeval.js","sourceRoot":"","sources":["../../bin/snapeval.ts"],"names":[],"mappings":";AACA,OAAO,EAAE,OAAO,EAAE,MAAM,WAAW,CAAC;AACpC,OAAO,EAAE,aAAa,EAAE,MAAM,kBAAkB,CAAC;AACjD,OAAO,EAAE,gBAAgB,EAAE,MAAM,sCAAsC,CAAC;AACxE,OAAO,EAAE,cAAc,EAAE,MAAM,oCAAoC,CAAC;AACpE,OAAO,EAAE,WAAW,EAAE,MAAM,yBAAyB,CAAC;AACtD,OAAO,EAAE,WAAW,EAAE,MAAM,yBAAyB,CAAC;AACtD,OAAO,EAAE,aAAa,EAAE,MAAM,2BAA2B,CAAC;AAC1D,OAAO,EAAE,gBAAgB,EAAE,MAAM,oCAAoC,CAAC;AACtE,OAAO,EAAE,aAAa,EAAE,MAAM,kBAAkB,CAAC;AACjD,OAAO,KAAK,IAAI,MAAM,WAAW,CAAC;AAElC,MAAM,OAAO,GAAG,IAAI,OAAO,EAAE,CAAC;AAE9B,OAAO;KACJ,IAAI,CAAC,UAAU,CAAC;KAChB,WAAW,CAAC,wDAAwD,CAAC;KACrE,OAAO,CAAC,OAAO,CAAC,CAAC;AAEpB,eAAe;AACf,OAAO;KACJ,OAAO,CAAC,MAAM,CAAC;KACf,WAAW,CAAC,+EAA+E,CAAC;KAC5F,MAAM,CAAC,qBAAqB,EAAE,gBAAgB,CAAC;KAC/C,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,CAAC;KAC7D,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B,EAAE,OAAO,EAAE,IAAI,CAAC,OAAiB,EAAE,SAAS,EAAE,IAAI,CAAC,SAAmB,EAAE,EACxE,OAAO,CAAC,GAAG,EAAE,EAAE,SAAS,CACzB,CAAC;QACF,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QACrD,MAAM,WAAW,CAAC,SAAS,EAAE,SAAS,CAAC,CAAC;QACxC,OAAO,CAAC,GAAG,CAAC,sBAAsB,IAAI,CAAC,IAAI,CAAC,SAAS,EAAE,OAAO,EAAE,YAAY,CAAC,EAAE,CAAC,CAAC;QACjF,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;QAAC,WAAW,CAAC,GAAG,CAAC,CAAC;IAAC,CAAC;AACrC,CAAC,CAAC,CAAC;AAEL,eAAe;AACf,OAAO;KACJ,OAAO,CAAC,MAAM,CAAC;KACf,WAAW,CAAC,qEAAqE,CAAC;KAClF,MAAM,CAAC,qBAAqB,EAAE,gBAAgB,CAAC;KAC/C,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,CAAC;KAC7D,MAAM,CAAC,oBAAoB,EAAE,qBAAqB,CAAC;KACnD,MAAM,CAAC,YAAY,EAAE,4CAA4C,EAAE,GAAG,CAAC;KACvE,MAAM,CAAC,oBAAoB,EAAE,uDAAuD,CAAC;KACrF,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,EAAE,IAAI,CAAC,OAAiB;YAC/B,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,IAAI,EAAE,IAAI,CAAC,IAAI,CAAC,CAAC,CAAC,QAAQ,CAAC,IAAI,CAAC,IAAc,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,SAAS;SAChE,EACD,OAAO,CAAC,GAAG,EAAE,EAAE,SAAS,CACzB,CAAC;QACF,MAAM,OAAO,GAAG,cAAc,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;QAC/C,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QAErD,MAAM,OAAO,GAAG,MAAM,WAAW,CAAC,SAAS,EAAE,OAAO,EAAE,SAAS,EAAE;YAC/D,SAAS,EAAE,MAAM,CAAC,SAAS;YAC3B,IAAI,EAAE,MAAM,CAAC,IAAI;YACjB,QAAQ,EAAE,IAAI,CAAC,WAAW,CAAuB;SAClD,CAAC,CAAC;QAEH,MAAM,QAAQ,GAAG,IAAI,gBAAgB,EAAE,CAAC;QACxC,MAAM,QAAQ,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;QAC/B,OAAO,CAAC,GAAG,CAAC,cAAc,OAAO,CAAC,YAAY,EAAE,CAAC,CAAC;QAClD,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;QAAC,WAAW,CAAC,GAAG,CAAC,CAAC;IAAC,CAAC;AACrC,CAAC,CAAC,CAAC;AAEL,iBAAiB;AACjB,OAAO;KACJ,OAAO,CAAC,QAAQ,CAAC;KACjB,WAAW,CAAC,mDAAmD,CAAC;KAChE,MAAM,CAAC,qBAAqB,EAAE,gBAAgB,CAAC;KAC/C,MAAM,CAAC,yBAAyB,EAAE,0BAA0B,CAAC;KAC7D,MAAM,CAAC,oBAAoB,EAAE,qBAAqB,CAAC;KACnD,MAAM,CAAC,YAAY,EAAE,4CAA4C,EAAE,GAAG,CAAC;KACvE,MAAM,CAAC,oBAAoB,EAAE,uDAAuD,CAAC;KACrF,MAAM,CAAC,WAAW,EAAE,qBAAqB,CAAC;KAC1C,MAAM,CAAC,WAAW,EAAE,gBAAgB,CAAC;KACrC,QAAQ,CAAC,aAAa,EAAE,yBAAyB,EAAE,OAAO,CAAC,GAAG,EAAE,CAAC;KACjE,MAAM,CAAC,KAAK,EAAE,QAAgB,EAAE,IAAsC,EAAE,EAAE;IACzE,IAAI,CAAC;QACH,MAAM,SAAS,GAAG,IAAI,CAAC,OAAO,CAAC,QAAQ,CAAC,CAAC;QACzC,MAAM,MAAM,GAAG,aAAa,CAC1B;YACE,OAAO,EAAE,IAAI,CAAC,OAAiB;YAC/B,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,SAAS,EAAE,IAAI,CAAC,SAAmB;YACnC,IAAI,EAAE,IAAI,CAAC,IAAI,CAAC,CAAC,CAAC,QAAQ,CAAC,IAAI,CAAC,IAAc,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,SAAS;SAChE,EACD,OAAO,CAAC,GAAG,EAAE,EAAE,SAAS,CACzB,CAAC;QACF,MAAM,OAAO,GAAG,cAAc,CAAC,MAAM,CAAC,OAAO,CAAC,CAAC;QAC/C,MAAM,SAAS,GAAG,gBAAgB,CAAC,MAAM,CAAC,SAAS,CAAC,CAAC;QAErD,MAAM,aAAa,CAAC,SAAS,EAAE,OAAO,EAAE,SAAS,EAAE;YACjD,SAAS,EAAE,MAAM,CAAC,SAAS;YAC3B,IAAI,EAAE,MAAM,CAAC,IAAI;YACjB,QAAQ,EAAE,IAAI,CAAC,WAAW,CAAuB;YACjD,MAAM,EAAE,IAAI,CAAC,IAAI,KAAK,KAAK;SAC5B,CAAC,CAAC;QACH,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IAAC,OAAO,GAAG,EAAE,CAAC;QAAC,WAAW,CAAC,GAAG,CAAC,CAAC;IAAC,CAAC;AACrC,CAAC,CAAC,CAAC;AAEL,SAAS,WAAW,CAAC,GAAY;IAC/B,IAAI,GAAG,YAAY,aAAa,EAAE,CAAC;QACjC,OAAO,CAAC,KAAK,CAAC,UAAU,GAAG,CAAC,OAAO,EAAE,CAAC,CAAC;QACvC,OAAO,CAAC,IAAI,CAAC,GAAG,CAAC,QAAQ,IAAI,CAAC,CAAC,CAAC;IAClC,CAAC;IACD,IAAI,GAAG,YAAY,KAAK,EAAE,CAAC;QACzB,OAAO,CAAC,KAAK,CAAC,UAAU,GAAG,CAAC,OAAO,EAAE,CAAC,CAAC;QACvC,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;IAClB,CAAC;IACD,OAAO,CAAC,KAAK,CAAC,4BAA4B,CAAC,CAAC;IAC5C,OAAO,CAAC,IAAI,CAAC,CAAC,CAAC,CAAC;AAClB,CAAC;AAED,OAAO,CAAC,KAAK,CAAC,OAAO,CAAC,IAAI,CAAC,CAAC"}

package/dist/src/adapters/copilot-sdk-client.d.ts CHANGED Viewed

@@ -1,10 +1,6 @@
 /**
  * Shared lazy CopilotClient singleton.
  *
- * Both CopilotSDKAdapter (SkillAdapter) and CopilotSDKInference
- * (InferenceAdapter) share a single client to avoid spawning
- * multiple CLI server processes.
- *
  * The SDK is dynamically imported so that users who don't install
  * @github/copilot-sdk pay no cost.
  */

package/dist/src/adapters/copilot-sdk-client.js CHANGED Viewed

@@ -1,10 +1,6 @@
 /**
  * Shared lazy CopilotClient singleton.
  *
- * Both CopilotSDKAdapter (SkillAdapter) and CopilotSDKInference
- * (InferenceAdapter) share a single client to avoid spawning
- * multiple CLI server processes.
- *
  * The SDK is dynamically imported so that users who don't install
  * @github/copilot-sdk pay no cost.
  */

package/dist/src/adapters/copilot-sdk-client.js.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"copilot-sdk-client.js","sourceRoot":"","sources":["../../../src/adapters/copilot-sdk-client.ts"],"names":[],"mappings":"AAAA~~;;;;;;;;;GASG~~;AAEH,OAAO,KAAK,EAAE,MAAM,SAAS,CAAC;AAC9B,OAAO,KAAK,IAAI,MAAM,WAAW,CAAC;AAElC,iEAAiE;AACjE,4DAA4D;AAC5D,IAAI,cAAc,GAAQ,IAAI,CAAC;AAC/B,IAAI,aAAa,GAAG,KAAK,CAAC;AAE1B,MAAM,CAAC,KAAK,UAAU,SAAS;IAC7B,IAAI,cAAc,IAAI,aAAa;QAAE,OAAO,cAAc,CAAC;IAE3D,IAAI,GAAQ,CAAC;IACb,IAAI,CAAC;QACH,+DAA+D;QAC/D,GAAG,GAAG,MAAM,MAAM,CAAC,qBAAqB,CAAC,CAAC;IAC5C,CAAC;IAAC,MAAM,CAAC;QACP,MAAM,IAAI,KAAK,CACb,mGAAmG,CACpG,CAAC;IACJ,CAAC;IAED,MAAM,aAAa,GAAG,GAAG,CAAC,aAAa,IAAI,GAAG,CAAC,OAAO,EAAE,aAAa,CAAC;IACtE,IAAI,CAAC,aAAa,EAAE,CAAC;QACnB,MAAM,IAAI,KAAK,CACb,mGAAmG,CACpG,CAAC;IACJ,CAAC;IAED,cAAc,GAAG,IAAI,aAAa,EAAE,CAAC;IACrC,MAAM,cAAc,CAAC,KAAK,EAAE,CAAC;IAC7B,aAAa,GAAG,IAAI,CAAC;IACrB,OAAO,cAAc,CAAC;AACxB,CAAC;AAED,MAAM,CAAC,KAAK,UAAU,UAAU;IAC9B,IAAI,cAAc,IAAI,aAAa,EAAE,CAAC;QACpC,MAAM,cAAc,CAAC,IAAI,EAAE,CAAC;QAC5B,aAAa,GAAG,KAAK,CAAC;QACtB,cAAc,GAAG,IAAI,CAAC;IACxB,CAAC;AACH,CAAC;AAED,MAAM,UAAU,cAAc;IAC5B,iEAAiE;IACjE,mEAAmE;IACnE,IAAI,GAAG,GAAG,OAAO,CAAC,GAAG,EAAE,CAAC;IACxB,OAAO,IAAI,EAAE,CAAC;QACZ,MAAM,SAAS,GAAG,IAAI,CAAC,IAAI,CAAC,GAAG,EAAE,cAAc,EAAE,SAAS,EAAE,aAAa,EAAE,cAAc,CAAC,CAAC;QAC3F,IAAI,EAAE,CAAC,UAAU,CAAC,SAAS,CAAC;YAAE,OAAO,IAAI,CAAC;QAC1C,MAAM,MAAM,GAAG,IAAI,CAAC,OAAO,CAAC,GAAG,CAAC,CAAC;QACjC,IAAI,MAAM,KAAK,GAAG;YAAE,MAAM;QAC1B,GAAG,GAAG,MAAM,CAAC;IACf,CAAC;IACD,OAAO,KAAK,CAAC;AACf,CAAC"}
1	+ {"version":3,"file":"copilot-sdk-client.js","sourceRoot":"","sources":["../../../src/adapters/copilot-sdk-client.ts"],"names":[],"mappings":"AAAA;;;;;GAKG;AAEH,OAAO,KAAK,EAAE,MAAM,SAAS,CAAC;AAC9B,OAAO,KAAK,IAAI,MAAM,WAAW,CAAC;AAElC,iEAAiE;AACjE,4DAA4D;AAC5D,IAAI,cAAc,GAAQ,IAAI,CAAC;AAC/B,IAAI,aAAa,GAAG,KAAK,CAAC;AAE1B,MAAM,CAAC,KAAK,UAAU,SAAS;IAC7B,IAAI,cAAc,IAAI,aAAa;QAAE,OAAO,cAAc,CAAC;IAE3D,IAAI,GAAQ,CAAC;IACb,IAAI,CAAC;QACH,+DAA+D;QAC/D,GAAG,GAAG,MAAM,MAAM,CAAC,qBAAqB,CAAC,CAAC;IAC5C,CAAC;IAAC,MAAM,CAAC;QACP,MAAM,IAAI,KAAK,CACb,mGAAmG,CACpG,CAAC;IACJ,CAAC;IAED,MAAM,aAAa,GAAG,GAAG,CAAC,aAAa,IAAI,GAAG,CAAC,OAAO,EAAE,aAAa,CAAC;IACtE,IAAI,CAAC,aAAa,EAAE,CAAC;QACnB,MAAM,IAAI,KAAK,CACb,mGAAmG,CACpG,CAAC;IACJ,CAAC;IAED,cAAc,GAAG,IAAI,aAAa,EAAE,CAAC;IACrC,MAAM,cAAc,CAAC,KAAK,EAAE,CAAC;IAC7B,aAAa,GAAG,IAAI,CAAC;IACrB,OAAO,cAAc,CAAC;AACxB,CAAC;AAED,MAAM,CAAC,KAAK,UAAU,UAAU;IAC9B,IAAI,cAAc,IAAI,aAAa,EAAE,CAAC;QACpC,MAAM,cAAc,CAAC,IAAI,EAAE,CAAC;QAC5B,aAAa,GAAG,KAAK,CAAC;QACtB,cAAc,GAAG,IAAI,CAAC;IACxB,CAAC;AACH,CAAC;AAED,MAAM,UAAU,cAAc;IAC5B,iEAAiE;IACjE,mEAAmE;IACnE,IAAI,GAAG,GAAG,OAAO,CAAC,GAAG,EAAE,CAAC;IACxB,OAAO,IAAI,EAAE,CAAC;QACZ,MAAM,SAAS,GAAG,IAAI,CAAC,IAAI,CAAC,GAAG,EAAE,cAAc,EAAE,SAAS,EAAE,aAAa,EAAE,cAAc,CAAC,CAAC;QAC3F,IAAI,EAAE,CAAC,UAAU,CAAC,SAAS,CAAC;YAAE,OAAO,IAAI,CAAC;QAC1C,MAAM,MAAM,GAAG,IAAI,CAAC,OAAO,CAAC,GAAG,CAAC,CAAC;QACjC,IAAI,MAAM,KAAK,GAAG;YAAE,MAAM;QAC1B,GAAG,GAAG,MAAM,CAAC;IACf,CAAC;IACD,OAAO,KAAK,CAAC;AACf,CAAC"}