npm - opencode-swarm-plugin - Versions diffs - 0.43.0 → 0.44.1 - Mend

opencode-swarm-plugin 0.43.0 → 0.44.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (208) hide show

package/bin/cass.characterization.test.ts +422 -0
package/bin/swarm.serve.test.ts +6 -4
package/bin/swarm.test.ts +68 -0
package/bin/swarm.ts +81 -8
package/dist/compaction-prompt-scoring.js +139 -0
package/dist/contributor-tools.d.ts +42 -0
package/dist/contributor-tools.d.ts.map +1 -0
package/dist/eval-capture.js +12811 -0
package/dist/hive.d.ts.map +1 -1
package/dist/index.d.ts +12 -0
package/dist/index.d.ts.map +1 -1
package/dist/index.js +7728 -62590
package/dist/plugin.js +23833 -78695
package/dist/sessions/agent-discovery.d.ts +59 -0
package/dist/sessions/agent-discovery.d.ts.map +1 -0
package/dist/sessions/index.d.ts +10 -0
package/dist/sessions/index.d.ts.map +1 -0
package/dist/swarm-orchestrate.d.ts.map +1 -1
package/dist/swarm-prompts.d.ts.map +1 -1
package/dist/swarm-review.d.ts.map +1 -1
package/package.json +17 -5
package/.changeset/swarm-insights-data-layer.md +0 -63
package/.hive/analysis/eval-failure-analysis-2025-12-25.md +0 -331
package/.hive/analysis/session-data-quality-audit.md +0 -320
package/.hive/eval-results.json +0 -483
package/.hive/issues.jsonl +0 -138
package/.hive/memories.jsonl +0 -729
package/.opencode/eval-history.jsonl +0 -327
package/.turbo/turbo-build.log +0 -9
package/CHANGELOG.md +0 -2255
package/SCORER-ANALYSIS.md +0 -598
package/docs/analysis/subagent-coordination-patterns.md +0 -902
package/docs/analysis-socratic-planner-pattern.md +0 -504
package/docs/planning/ADR-001-monorepo-structure.md +0 -171
package/docs/planning/ADR-002-package-extraction.md +0 -393
package/docs/planning/ADR-003-performance-improvements.md +0 -451
package/docs/planning/ADR-004-message-queue-features.md +0 -187
package/docs/planning/ADR-005-devtools-observability.md +0 -202
package/docs/planning/ADR-007-swarm-enhancements-worktree-review.md +0 -168
package/docs/planning/ADR-008-worker-handoff-protocol.md +0 -293
package/docs/planning/ADR-009-oh-my-opencode-patterns.md +0 -353
package/docs/planning/ROADMAP.md +0 -368
package/docs/semantic-memory-cli-syntax.md +0 -123
package/docs/swarm-mail-architecture.md +0 -1147
package/docs/testing/context-recovery-test.md +0 -470
package/evals/ARCHITECTURE.md +0 -1189
package/evals/README.md +0 -768
package/evals/compaction-prompt.eval.ts +0 -149
package/evals/compaction-resumption.eval.ts +0 -289
package/evals/coordinator-behavior.eval.ts +0 -307
package/evals/coordinator-session.eval.ts +0 -154
package/evals/evalite.config.ts.bak +0 -15
package/evals/example.eval.ts +0 -31
package/evals/fixtures/compaction-cases.ts +0 -350
package/evals/fixtures/compaction-prompt-cases.ts +0 -311
package/evals/fixtures/coordinator-sessions.ts +0 -328
package/evals/fixtures/decomposition-cases.ts +0 -105
package/evals/lib/compaction-loader.test.ts +0 -248
package/evals/lib/compaction-loader.ts +0 -320
package/evals/lib/data-loader.evalite-test.ts +0 -289
package/evals/lib/data-loader.test.ts +0 -345
package/evals/lib/data-loader.ts +0 -281
package/evals/lib/llm.ts +0 -115
package/evals/scorers/compaction-prompt-scorers.ts +0 -145
package/evals/scorers/compaction-scorers.ts +0 -305
package/evals/scorers/coordinator-discipline.evalite-test.ts +0 -539
package/evals/scorers/coordinator-discipline.ts +0 -325
package/evals/scorers/index.test.ts +0 -146
package/evals/scorers/index.ts +0 -328
package/evals/scorers/outcome-scorers.evalite-test.ts +0 -27
package/evals/scorers/outcome-scorers.ts +0 -349
package/evals/swarm-decomposition.eval.ts +0 -121
package/examples/commands/swarm.md +0 -745
package/examples/plugin-wrapper-template.ts +0 -2426
package/examples/skills/hive-workflow/SKILL.md +0 -212
package/examples/skills/skill-creator/SKILL.md +0 -223
package/examples/skills/swarm-coordination/SKILL.md +0 -292
package/global-skills/cli-builder/SKILL.md +0 -344
package/global-skills/cli-builder/references/advanced-patterns.md +0 -244
package/global-skills/learning-systems/SKILL.md +0 -644
package/global-skills/skill-creator/LICENSE.txt +0 -202
package/global-skills/skill-creator/SKILL.md +0 -352
package/global-skills/skill-creator/references/output-patterns.md +0 -82
package/global-skills/skill-creator/references/workflows.md +0 -28
package/global-skills/swarm-coordination/SKILL.md +0 -995
package/global-skills/swarm-coordination/references/coordinator-patterns.md +0 -235
package/global-skills/swarm-coordination/references/strategies.md +0 -138
package/global-skills/system-design/SKILL.md +0 -213
package/global-skills/testing-patterns/SKILL.md +0 -430
package/global-skills/testing-patterns/references/dependency-breaking-catalog.md +0 -586
package/opencode-swarm-plugin-0.30.7.tgz +0 -0
package/opencode-swarm-plugin-0.31.0.tgz +0 -0
package/scripts/cleanup-test-memories.ts +0 -346
package/scripts/init-skill.ts +0 -222
package/scripts/migrate-unknown-sessions.ts +0 -349
package/scripts/validate-skill.ts +0 -204
package/src/agent-mail.ts +0 -1724
package/src/anti-patterns.test.ts +0 -1167
package/src/anti-patterns.ts +0 -448
package/src/compaction-capture.integration.test.ts +0 -257
package/src/compaction-hook.test.ts +0 -838
package/src/compaction-hook.ts +0 -1204
package/src/compaction-observability.integration.test.ts +0 -139
package/src/compaction-observability.test.ts +0 -187
package/src/compaction-observability.ts +0 -324
package/src/compaction-prompt-scorers.test.ts +0 -475
package/src/compaction-prompt-scoring.ts +0 -300
package/src/dashboard.test.ts +0 -611
package/src/dashboard.ts +0 -462
package/src/error-enrichment.test.ts +0 -403
package/src/error-enrichment.ts +0 -219
package/src/eval-capture.test.ts +0 -1015
package/src/eval-capture.ts +0 -929
package/src/eval-gates.test.ts +0 -306
package/src/eval-gates.ts +0 -218
package/src/eval-history.test.ts +0 -508
package/src/eval-history.ts +0 -214
package/src/eval-learning.test.ts +0 -378
package/src/eval-learning.ts +0 -360
package/src/eval-runner.test.ts +0 -223
package/src/eval-runner.ts +0 -402
package/src/export-tools.test.ts +0 -476
package/src/export-tools.ts +0 -257
package/src/hive.integration.test.ts +0 -2241
package/src/hive.ts +0 -1628
package/src/index.ts +0 -935
package/src/learning.integration.test.ts +0 -1815
package/src/learning.ts +0 -1079
package/src/logger.test.ts +0 -189
package/src/logger.ts +0 -135
package/src/mandate-promotion.test.ts +0 -473
package/src/mandate-promotion.ts +0 -239
package/src/mandate-storage.integration.test.ts +0 -601
package/src/mandate-storage.test.ts +0 -578
package/src/mandate-storage.ts +0 -794
package/src/mandates.ts +0 -540
package/src/memory-tools.test.ts +0 -195
package/src/memory-tools.ts +0 -344
package/src/memory.integration.test.ts +0 -334
package/src/memory.test.ts +0 -158
package/src/memory.ts +0 -527
package/src/model-selection.test.ts +0 -188
package/src/model-selection.ts +0 -68
package/src/observability-tools.test.ts +0 -359
package/src/observability-tools.ts +0 -871
package/src/output-guardrails.test.ts +0 -438
package/src/output-guardrails.ts +0 -381
package/src/pattern-maturity.test.ts +0 -1160
package/src/pattern-maturity.ts +0 -525
package/src/planning-guardrails.test.ts +0 -491
package/src/planning-guardrails.ts +0 -438
package/src/plugin.ts +0 -23
package/src/post-compaction-tracker.test.ts +0 -251
package/src/post-compaction-tracker.ts +0 -237
package/src/query-tools.test.ts +0 -636
package/src/query-tools.ts +0 -324
package/src/rate-limiter.integration.test.ts +0 -466
package/src/rate-limiter.ts +0 -774
package/src/replay-tools.test.ts +0 -496
package/src/replay-tools.ts +0 -240
package/src/repo-crawl.integration.test.ts +0 -441
package/src/repo-crawl.ts +0 -610
package/src/schemas/cell-events.test.ts +0 -347
package/src/schemas/cell-events.ts +0 -807
package/src/schemas/cell.ts +0 -257
package/src/schemas/evaluation.ts +0 -166
package/src/schemas/index.test.ts +0 -199
package/src/schemas/index.ts +0 -286
package/src/schemas/mandate.ts +0 -232
package/src/schemas/swarm-context.ts +0 -115
package/src/schemas/task.ts +0 -161
package/src/schemas/worker-handoff.test.ts +0 -302
package/src/schemas/worker-handoff.ts +0 -131
package/src/skills.integration.test.ts +0 -1192
package/src/skills.test.ts +0 -643
package/src/skills.ts +0 -1549
package/src/storage.integration.test.ts +0 -341
package/src/storage.ts +0 -884
package/src/structured.integration.test.ts +0 -817
package/src/structured.test.ts +0 -1046
package/src/structured.ts +0 -762
package/src/swarm-decompose.test.ts +0 -188
package/src/swarm-decompose.ts +0 -1302
package/src/swarm-deferred.integration.test.ts +0 -157
package/src/swarm-deferred.test.ts +0 -38
package/src/swarm-insights.test.ts +0 -214
package/src/swarm-insights.ts +0 -459
package/src/swarm-mail.integration.test.ts +0 -970
package/src/swarm-mail.ts +0 -739
package/src/swarm-orchestrate.integration.test.ts +0 -282
package/src/swarm-orchestrate.test.ts +0 -548
package/src/swarm-orchestrate.ts +0 -3084
package/src/swarm-prompts.test.ts +0 -1270
package/src/swarm-prompts.ts +0 -2077
package/src/swarm-research.integration.test.ts +0 -701
package/src/swarm-research.test.ts +0 -698
package/src/swarm-research.ts +0 -472
package/src/swarm-review.integration.test.ts +0 -285
package/src/swarm-review.test.ts +0 -879
package/src/swarm-review.ts +0 -709
package/src/swarm-strategies.ts +0 -407
package/src/swarm-worktree.test.ts +0 -501
package/src/swarm-worktree.ts +0 -575
package/src/swarm.integration.test.ts +0 -2377
package/src/swarm.ts +0 -38
package/src/tool-adapter.integration.test.ts +0 -1221
package/src/tool-availability.ts +0 -461
package/tsconfig.json +0 -28

package/evals/lib/compaction-loader.ts DELETED Viewed

@@ -1,320 +0,0 @@
-/**
- * Compaction Data Loader
- *
- * Loads COMPACTION events from session JSONL files for use in evals.
- *
- * Features:
- * - Lazy loading with early termination for large datasets
- * - Filtering by compaction_type, sessionIds, and limit
- * - Graceful error handling (skips invalid lines)
- * - Type-safe with Zod validation
- *
- * @module compaction-loader
- */
-import * as fs from "node:fs";
-import { createInterface } from "node:readline";
-import * as path from "node:path";
-import type { CoordinatorEvent } from "../../src/eval-capture.js";
-import { CoordinatorEventSchema } from "../../src/eval-capture.js";
-/**
- * Compaction event - subset of CoordinatorEvent with event_type === "COMPACTION"
- */
-export type CompactionEvent = Extract<
-  CoordinatorEvent,
-  { event_type: "COMPACTION" }
->;
-/**
- * Compaction session - session with only COMPACTION events
- */
-export interface CompactionSession {
-  session_id: string;
-  epic_id: string;
-  start_time: string;
-  end_time: string;
-  events: CompactionEvent[];
-}
-/**
- * Load options
- */
-export interface LoadOptions {
-  /** Filter by compaction_type */
-  compaction_type?:
-    | "detection_complete"
-    | "prompt_generated"
-    | "context_injected"
-    | "resumption_started"
-    | "tool_call_tracked";
-  /** Filter by session IDs */
-  sessionIds?: string[];
-  /** Limit number of results */
-  limit?: number;
-}
-/**
- * Load COMPACTION events from session JSONL files
- *
- * Reads all .jsonl files in the session directory, parses events,
- * and returns only COMPACTION events matching the filters.
- *
- * @param sessionDir - Path to session directory (default: ~/.config/swarm-tools/sessions)
- * @param options - Filter options
- * @returns Array of compaction events
- *
- * @example
- * // Load all COMPACTION events
- * const events = await loadCompactionEvents("/path/to/sessions");
- *
- * @example
- * // Load only detection_complete events
- * const events = await loadCompactionEvents("/path/to/sessions", {
- *   compaction_type: "detection_complete",
- * });
- *
- * @example
- * // Load events from specific sessions
- * const events = await loadCompactionEvents("/path/to/sessions", {
- *   sessionIds: ["session-1", "session-2"],
- *   limit: 10,
- * });
- */
-export async function loadCompactionEvents(
-  sessionDir: string,
-  options?: LoadOptions,
-): Promise<CompactionEvent[]> {
-  const { compaction_type, sessionIds, limit } = options ?? {};
-  // Check if directory exists
-  if (!fs.existsSync(sessionDir)) {
-    return [];
-  }
-  let files: string[];
-  try {
-    // Read all .jsonl files
-    files = fs.readdirSync(sessionDir).filter((f) => f.endsWith(".jsonl"));
-  } catch (error) {
-    // Directory exists but can't be read - log and return empty
-    console.warn(`Failed to read session directory ${sessionDir}:`, error);
-    return [];
-  }
-  // Filter by sessionIds if provided
-  const targetFiles = sessionIds
-    ? files.filter((f) => sessionIds.includes(f.replace(".jsonl", "")))
-    : files;
-  const events: CompactionEvent[] = [];
-  for (const file of targetFiles) {
-    const filePath = path.join(sessionDir, file);
-    try {
-      // Stream large files line-by-line to avoid loading entire file into memory
-      const shouldStream = limit && limit < 100; // For small limits, streaming is overkill
-      if (shouldStream) {
-        // Use streaming for better memory efficiency
-        const found = await loadFromFileStream(filePath, {
-          compaction_type,
-          remainingLimit: limit - events.length,
-        });
-        events.push(...found);
-      } else {
-        // For small files or no limit, read entire file (faster)
-        const content = fs.readFileSync(filePath, "utf-8");
-        const lines = content.trim().split("\n").filter(Boolean);
-        for (const line of lines) {
-          const event = parseLine(line);
-          if (event && event.event_type === "COMPACTION") {
-            // Filter by compaction_type if provided
-            if (!compaction_type || event.compaction_type === compaction_type) {
-              events.push(event);
-              // Apply limit early to avoid processing unnecessary files
-              if (limit && events.length >= limit) {
-                return events.slice(0, limit);
-              }
-            }
-          }
-        }
-      }
-      // Early termination if limit reached
-      if (limit && events.length >= limit) {
-        return events.slice(0, limit);
-      }
-    } catch (error) {
-      // Log file read errors but continue processing other files
-      console.warn(`Failed to read session file ${filePath}:`, error);
-    }
-  }
-  return limit ? events.slice(0, limit) : events;
-}
-/**
- * Parse a JSONL line into a CoordinatorEvent
- *
- * @param line - JSONL line to parse
- * @returns Parsed and validated event, or null if invalid
- */
-function parseLine(line: string): CoordinatorEvent | null {
-  try {
-    const parsed = JSON.parse(line);
-    return CoordinatorEventSchema.parse(parsed);
-  } catch {
-    // Invalid JSON or failed validation - skip silently
-    return null;
-  }
-}
-/**
- * Load COMPACTION events from a file using streaming (for large files)
- *
- * @param filePath - Path to session JSONL file
- * @param options - Filter options
- * @returns Array of matching compaction events
- */
-async function loadFromFileStream(
-  filePath: string,
-  options: {
-    compaction_type?: LoadOptions["compaction_type"];
-    remainingLimit?: number;
-  },
-): Promise<CompactionEvent[]> {
-  const { compaction_type, remainingLimit } = options;
-  const events: CompactionEvent[] = [];
-  const fileStream = fs.createReadStream(filePath, { encoding: "utf-8" });
-  const rl = createInterface({ input: fileStream, crlfDelay: Number.POSITIVE_INFINITY });
-  for await (const line of rl) {
-    const event = parseLine(line);
-    if (event && event.event_type === "COMPACTION") {
-      if (!compaction_type || event.compaction_type === compaction_type) {
-        events.push(event);
-        // Early termination for streaming
-        if (remainingLimit && events.length >= remainingLimit) {
-          rl.close();
-          fileStream.close();
-          break;
-        }
-      }
-    }
-  }
-  return events;
-}
-/**
- * Load COMPACTION sessions grouped by session_id
- *
- * Groups COMPACTION events by session_id and returns session metadata.
- *
- * @param sessionDir - Path to session directory
- * @param options - Filter options
- * @returns Array of compaction sessions
- *
- * @example
- * // Load all sessions with COMPACTION events
- * const sessions = await loadCompactionSessions("/path/to/sessions");
- *
- * @example
- * // Load sessions with specific compaction_type
- * const sessions = await loadCompactionSessions("/path/to/sessions", {
- *   compaction_type: "prompt_generated",
- * });
- */
-export async function loadCompactionSessions(
-  sessionDir: string,
-  options?: LoadOptions,
-): Promise<CompactionSession[]> {
-  const events = await loadCompactionEvents(sessionDir, options);
-  if (events.length === 0) {
-    return [];
-  }
-  // Group events by session_id
-  const sessionMap = new Map<string, CompactionEvent[]>();
-  for (const event of events) {
-    const existing = sessionMap.get(event.session_id);
-    if (existing) {
-      existing.push(event);
-    } else {
-      sessionMap.set(event.session_id, [event]);
-    }
-  }
-  // Build sessions with metadata
-  const sessions: CompactionSession[] = [];
-  for (const [sessionId, sessionEvents] of sessionMap.entries()) {
-    if (sessionEvents.length === 0) {
-      continue;
-    }
-    // Get epic_id from first event
-    const epicId = sessionEvents[0].epic_id;
-    // Get timestamps
-    const timestamps = sessionEvents.map((e) => new Date(e.timestamp).getTime());
-    const startTime = new Date(Math.min(...timestamps)).toISOString();
-    const endTime = new Date(Math.max(...timestamps)).toISOString();
-    sessions.push({
-      session_id: sessionId,
-      epic_id: epicId,
-      start_time: startTime,
-      end_time: endTime,
-      events: sessionEvents,
-    });
-  }
-  // Apply limit
-  return options?.limit ? sessions.slice(0, options.limit) : sessions;
-}
-/**
- * Load COMPACTION events from default session directory
- *
- * Convenience wrapper that uses the default ~/.config/swarm-tools/sessions directory.
- *
- * @param options - Filter options
- * @returns Array of compaction events
- *
- * @example
- * // Load recent compaction events
- * const events = await loadDefaultCompactionEvents({ limit: 10 });
- */
-export async function loadDefaultCompactionEvents(
-  options?: LoadOptions,
-): Promise<CompactionEvent[]> {
-  const { getSessionDir } = await import("../../src/eval-capture.js");
-  return loadCompactionEvents(getSessionDir(), options);
-}
-/**
- * Load COMPACTION sessions from default session directory
- *
- * Convenience wrapper that uses the default ~/.config/swarm-tools/sessions directory.
- *
- * @param options - Filter options
- * @returns Array of compaction sessions
- *
- * @example
- * // Load all compaction sessions
- * const sessions = await loadDefaultCompactionSessions();
- */
-export async function loadDefaultCompactionSessions(
-  options?: LoadOptions,
-): Promise<CompactionSession[]> {
-  const { getSessionDir } = await import("../../src/eval-capture.js");
-  return loadCompactionSessions(getSessionDir(), options);
-}

package/evals/lib/data-loader.evalite-test.ts DELETED Viewed

@@ -1,289 +0,0 @@
-/**
- * Data Loader Tests
- *
- * Tests the PGlite-backed eval data loader functions.
- * Uses a real in-memory PGlite database for accurate testing.
- */
-import { describe, it, expect, beforeAll, afterAll } from "bun:test";
-import {
-  loadEvalCases,
-  hasRealEvalData,
-  getEvalDataSummary,
-} from "./data-loader.js";
-import {
-  appendEvent,
-  getDatabase,
-  closeDatabase,
-  type DecompositionGeneratedEvent,
-  type SubtaskOutcomeEvent,
-} from "swarm-mail";
-import * as fs from "node:fs";
-import * as path from "node:path";
-import * as os from "node:os";
-const TEST_PROJECT_KEY = "test-project-eval-loader";
-// Create a unique temp directory for this test run
-let testDir: string;
-describe("Data Loader", () => {
-  beforeAll(async () => {
-    // Create temp directory for test database
-    testDir = fs.mkdtempSync(path.join(os.tmpdir(), "eval-loader-test-"));
-    // Initialize database by getting it (lazy init)
-    await getDatabase(testDir);
-  });
-  afterAll(async () => {
-    await closeDatabase(testDir);
-    // Clean up temp directory
-    fs.rmSync(testDir, { recursive: true, force: true });
-  });
-  describe("loadEvalCases", () => {
-    it("transforms eval records to EvalCase format", async () => {
-      // Insert a decomposition event
-      const decompositionEvent: DecompositionGeneratedEvent = {
-        type: "decomposition_generated",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-load-1",
-        task: "Add authentication",
-        context: "Next.js app",
-        strategy: "feature-based",
-        epic_title: "Auth Epic",
-        subtasks: [
-          { title: "OAuth setup", files: ["src/auth/oauth.ts"], priority: 1 },
-          {
-            title: "Session management",
-            files: ["src/auth/session.ts"],
-            priority: 2,
-          },
-        ],
-      };
-      await appendEvent(decompositionEvent, testDir);
-      // Insert outcome events for both subtasks
-      const outcome1: SubtaskOutcomeEvent = {
-        type: "subtask_outcome",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-load-1",
-        bead_id: "epic-load-1.1",
-        planned_files: ["src/auth/oauth.ts"],
-        actual_files: ["src/auth/oauth.ts"],
-        duration_ms: 5000,
-        error_count: 0,
-        retry_count: 0,
-        success: true,
-      };
-      await appendEvent(outcome1, testDir);
-      const outcome2: SubtaskOutcomeEvent = {
-        type: "subtask_outcome",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-load-1",
-        bead_id: "epic-load-1.2",
-        planned_files: ["src/auth/session.ts"],
-        actual_files: ["src/auth/session.ts"],
-        duration_ms: 3000,
-        error_count: 0,
-        retry_count: 0,
-        success: true,
-      };
-      await appendEvent(outcome2, testDir);
-      const cases = await loadEvalCases(TEST_PROJECT_KEY, {
-        projectPath: testDir,
-      });
-      expect(cases.length).toBeGreaterThanOrEqual(1);
-      const authCase = cases.find((c) => c.input.task === "Add authentication");
-      expect(authCase).toBeDefined();
-      expect(authCase!.input.context).toBe("Next.js app");
-      expect(authCase!.expected.minSubtasks).toBe(2);
-      expect(authCase!.expected.maxSubtasks).toBe(2);
-      expect(authCase!.expected.requiredFiles).toContain("src/auth/oauth.ts");
-      expect(authCase!.expected.requiredFiles).toContain("src/auth/session.ts");
-      expect(authCase!.actual).toBeDefined();
-    });
-    it("filters by success when successOnly is true", async () => {
-      // Insert a successful decomposition
-      const successEvent: DecompositionGeneratedEvent = {
-        type: "decomposition_generated",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-success-filter",
-        task: "Success task for filter",
-        strategy: "feature-based",
-        epic_title: "Success Epic",
-        subtasks: [{ title: "Sub", files: ["src/success.ts"], priority: 1 }],
-      };
-      await appendEvent(successEvent, testDir);
-      // Mark it successful
-      const successOutcome: SubtaskOutcomeEvent = {
-        type: "subtask_outcome",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-success-filter",
-        bead_id: "epic-success-filter.1",
-        planned_files: ["src/success.ts"],
-        actual_files: ["src/success.ts"],
-        duration_ms: 1000,
-        error_count: 0,
-        retry_count: 0,
-        success: true,
-      };
-      await appendEvent(successOutcome, testDir);
-      // Insert a failed decomposition
-      const failEvent: DecompositionGeneratedEvent = {
-        type: "decomposition_generated",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-fail-filter",
-        task: "Failed task for filter",
-        strategy: "feature-based",
-        epic_title: "Failed Epic",
-        subtasks: [{ title: "Sub", files: ["src/fail.ts"], priority: 1 }],
-      };
-      await appendEvent(failEvent, testDir);
-      // Mark it failed
-      const failOutcome: SubtaskOutcomeEvent = {
-        type: "subtask_outcome",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-fail-filter",
-        bead_id: "epic-fail-filter.1",
-        planned_files: ["src/fail.ts"],
-        actual_files: [],
-        duration_ms: 500,
-        error_count: 3,
-        retry_count: 2,
-        success: false,
-      };
-      await appendEvent(failOutcome, testDir);
-      const successCases = await loadEvalCases(TEST_PROJECT_KEY, {
-        successOnly: true,
-        projectPath: testDir,
-      });
-      // Should only include successful cases
-      const failedCase = successCases.find(
-        (c) => c.input.task === "Failed task for filter",
-      );
-      expect(failedCase).toBeUndefined();
-    });
-    it("passes strategy filter to getEvalRecords", async () => {
-      // Insert file-based decomposition
-      const fileBasedEvent: DecompositionGeneratedEvent = {
-        type: "decomposition_generated",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-file-based",
-        task: "File-based task",
-        strategy: "file-based",
-        epic_title: "File Epic",
-        subtasks: [{ title: "Sub", files: ["src/file.ts"], priority: 1 }],
-      };
-      await appendEvent(fileBasedEvent, testDir);
-      const fileBasedCases = await loadEvalCases(TEST_PROJECT_KEY, {
-        strategy: "file-based",
-        projectPath: testDir,
-      });
-      // All returned cases should be file-based
-      for (const c of fileBasedCases) {
-        expect(c.actual?.strategy).toBe("file-based");
-      }
-    });
-    it("passes limit to getEvalRecords", async () => {
-      const cases = await loadEvalCases(TEST_PROJECT_KEY, {
-        limit: 2,
-        projectPath: testDir,
-      });
-      expect(cases.length).toBeLessThanOrEqual(2);
-    });
-    it("handles records with no context", async () => {
-      const noContextEvent: DecompositionGeneratedEvent = {
-        type: "decomposition_generated",
-        timestamp: Date.now(),
-        project_key: TEST_PROJECT_KEY,
-        epic_id: "epic-no-context",
-        task: "Task without context",
-        // context is undefined
-        strategy: "feature-based",
-        epic_title: "No Context Epic",
-        subtasks: [{ title: "Sub", files: [], priority: 1 }],
-      };
-      await appendEvent(noContextEvent, testDir);
-      const cases = await loadEvalCases(TEST_PROJECT_KEY, {
-        projectPath: testDir,
-      });
-      const noContextCase = cases.find(
-        (c) => c.input.task === "Task without context",
-      );
-      expect(noContextCase).toBeDefined();
-      expect(noContextCase!.input.context).toBeUndefined();
-    });
-  });
-  describe("hasRealEvalData", () => {
-    it("returns true when enough records exist", async () => {
-      // We've inserted several records above, should have enough
-      const hasData = await hasRealEvalData(TEST_PROJECT_KEY, 1, testDir);
-      expect(hasData).toBe(true);
-    });
-    it("returns false when not enough records exist", async () => {
-      // Use a project key with no data
-      const hasData = await hasRealEvalData("nonexistent-project", 5, testDir);
-      expect(hasData).toBe(false);
-    });
-    it("uses custom minRecords threshold", async () => {
-      // Should have at least 1 record
-      const hasData = await hasRealEvalData(TEST_PROJECT_KEY, 1, testDir);
-      expect(hasData).toBe(true);
-      // Should not have 1000 records
-      const hasLotsOfData = await hasRealEvalData(
-        TEST_PROJECT_KEY,
-        1000,
-        testDir,
-      );
-      expect(hasLotsOfData).toBe(false);
-    });
-  });
-  describe("getEvalDataSummary", () => {
-    it("returns formatted summary with hasEnoughData flag", async () => {
-      const summary = await getEvalDataSummary(TEST_PROJECT_KEY, testDir);
-      expect(summary.totalRecords).toBeGreaterThanOrEqual(1);
-      expect(typeof summary.successRate).toBe("number");
-      expect(typeof summary.byStrategy).toBe("object");
-      expect(typeof summary.hasEnoughData).toBe("boolean");
-    });
-    it("sets hasEnoughData based on record count", async () => {
-      // Empty project should not have enough data
-      const emptySummary = await getEvalDataSummary("empty-project", testDir);
-      expect(emptySummary.hasEnoughData).toBe(false);
-      expect(emptySummary.totalRecords).toBe(0);
-    });
-  });
-});