npm - opencode-swarm-plugin - Versions diffs - 0.39.1 → 0.42.0 - Mend

opencode-swarm-plugin 0.39.1 → 0.42.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (82) hide show

package/.hive/analysis/eval-failure-analysis-2025-12-25.md +331 -0
package/.hive/analysis/session-data-quality-audit.md +320 -0
package/.hive/eval-results.json +481 -24
package/.hive/issues.jsonl +76 -11
package/.hive/memories.jsonl +159 -1
package/.opencode/eval-history.jsonl +315 -0
package/.turbo/turbo-build.log +5 -5
package/CHANGELOG.md +207 -0
package/README.md +2 -0
package/SCORER-ANALYSIS.md +598 -0
package/bin/eval-gate.test.ts +158 -0
package/bin/eval-gate.ts +74 -0
package/bin/swarm.test.ts +1054 -719
package/bin/swarm.ts +577 -0
package/dist/compaction-hook.d.ts +10 -1
package/dist/compaction-hook.d.ts.map +1 -1
package/dist/compaction-observability.d.ts +173 -0
package/dist/compaction-observability.d.ts.map +1 -0
package/dist/compaction-prompt-scoring.d.ts +1 -0
package/dist/compaction-prompt-scoring.d.ts.map +1 -1
package/dist/eval-capture.d.ts +93 -0
package/dist/eval-capture.d.ts.map +1 -1
package/dist/eval-runner.d.ts +134 -0
package/dist/eval-runner.d.ts.map +1 -0
package/dist/hive.d.ts.map +1 -1
package/dist/index.d.ts +65 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +84043 -28070
package/dist/memory-tools.d.ts +70 -2
package/dist/memory-tools.d.ts.map +1 -1
package/dist/memory.d.ts +37 -0
package/dist/memory.d.ts.map +1 -1
package/dist/observability-tools.d.ts +64 -0
package/dist/observability-tools.d.ts.map +1 -1
package/dist/plugin.js +83570 -27466
package/dist/schemas/task.d.ts +3 -3
package/dist/swarm-orchestrate.d.ts.map +1 -1
package/dist/swarm-prompts.d.ts +32 -1
package/dist/swarm-prompts.d.ts.map +1 -1
package/docs/planning/ADR-009-oh-my-opencode-patterns.md +353 -0
package/evals/ARCHITECTURE.md +1189 -0
package/evals/README.md +113 -0
package/evals/example.eval.ts +3 -4
package/evals/fixtures/compaction-prompt-cases.ts +6 -0
package/evals/scorers/coordinator-discipline.evalite-test.ts +163 -0
package/evals/scorers/coordinator-discipline.ts +82 -2
package/evals/scorers/index.test.ts +146 -0
package/evals/scorers/index.ts +104 -0
package/evals/swarm-decomposition.eval.ts +13 -4
package/examples/commands/swarm.md +291 -21
package/package.json +4 -3
package/src/compaction-hook.ts +258 -110
package/src/compaction-observability.integration.test.ts +139 -0
package/src/compaction-observability.test.ts +187 -0
package/src/compaction-observability.ts +324 -0
package/src/compaction-prompt-scorers.test.ts +10 -9
package/src/compaction-prompt-scoring.ts +7 -5
package/src/eval-capture.test.ts +204 -1
package/src/eval-capture.ts +194 -2
package/src/eval-runner.test.ts +223 -0
package/src/eval-runner.ts +402 -0
package/src/hive.ts +57 -22
package/src/index.ts +54 -1
package/src/memory-tools.test.ts +84 -0
package/src/memory-tools.ts +68 -3
package/src/memory.test.ts +2 -2
package/src/memory.ts +122 -49
package/src/observability-tools.test.ts +13 -0
package/src/observability-tools.ts +277 -0
package/src/swarm-orchestrate.test.ts +162 -0
package/src/swarm-orchestrate.ts +7 -5
package/src/swarm-prompts.test.ts +168 -4
package/src/swarm-prompts.ts +228 -7
package/.env +0 -2
package/.turbo/turbo-test.log +0 -481
package/.turbo/turbo-typecheck.log +0 -1
package/dist/beads.d.ts +0 -386
package/dist/beads.d.ts.map +0 -1
package/dist/schemas/bead-events.d.ts +0 -698
package/dist/schemas/bead-events.d.ts.map +0 -1
package/dist/schemas/bead.d.ts +0 -255
package/dist/schemas/bead.d.ts.map +0 -1

package/src/swarm-prompts.ts CHANGED Viewed

@@ -15,6 +15,7 @@
 import { tool } from "@opencode-ai/plugin";
 import { generateWorkerHandoff } from "./swarm-orchestrate";
 import { captureCoordinatorEvent } from "./eval-capture.js";
+import { getMemoryAdapter } from "./memory-tools.js";
 // ============================================================================
 // Prompt Templates
@@ -1097,6 +1098,209 @@ For each criterion, assess passed/failed and provide brief feedback:
 If any criterion fails, the overall evaluation fails and retry_suggestion
 should describe what needs to be fixed.`;
+// ============================================================================
+// Eval Failure Learning Integration
+// ============================================================================
+/**
+ * Query recent eval failures from semantic memory
+ *
+ * Coordinators call this at session start to learn from recent eval regressions.
+ * Returns formatted string for injection into coordinator prompts.
+ *
+ * @returns Formatted string of recent failures (empty if none or memory unavailable)
+ */
+export async function getRecentEvalFailures(): Promise<string> {
+  try {
+    const adapter = await getMemoryAdapter();
+    // Query memories for eval failures
+    const result = await adapter.find({
+      query: "eval-failure regression coordinator",
+      limit: 3,
+    });
+    if (result.count === 0) {
+      return "";
+    }
+    const lines = result.results.map((f) => `- ${f.content.slice(0, 200)}...`);
+    return `
+## ⚠️ Recent Eval Failures (Learn From These)
+The following eval regressions were detected recently. Avoid these patterns:
+${lines.join("\n")}
+**Action:** Review these failures and ensure your coordination avoids similar issues.
+`;
+  } catch (e) {
+    // Best effort - don't fail if memory unavailable
+    console.warn("Failed to query eval failures:", e);
+    return "";
+  }
+}
+// ============================================================================
+// Prompt Insights Integration
+// ============================================================================
+interface PromptInsightsOptions {
+  role: "coordinator" | "worker";
+  project_key?: string;
+  files?: string[];
+  domain?: string;
+}
+/**
+ * Get swarm insights for prompt injection
+ *
+ * Queries recent swarm outcomes and semantic memory to surface:
+ * - Strategy success rates
+ * - Common failure modes
+ * - Anti-patterns
+ * - File/domain-specific learnings
+ *
+ * Returns formatted string for injection into coordinator or worker prompts.
+ *
+ * @param options - Role and filters for insights
+ * @returns Formatted insights string (empty if no data or errors)
+ */
+export async function getPromptInsights(
+  options: PromptInsightsOptions,
+): Promise<string> {
+  try {
+    if (options.role === "coordinator") {
+      return await getCoordinatorInsights(options.project_key);
+    } else {
+      return await getWorkerInsights(options.files, options.domain);
+    }
+  } catch (e) {
+    // Best effort - don't fail if data unavailable
+    console.warn("Failed to query prompt insights:", e);
+    return "";
+  }
+}
+/**
+ * Get coordinator-specific insights (strategy stats, anti-patterns)
+ */
+async function getCoordinatorInsights(project_key?: string): Promise<string> {
+  try {
+    // Import swarm-mail and analytics
+    const { createLibSQLAdapter, createSwarmMailAdapter, strategySuccessRates } = await import("swarm-mail");
+    // Create libSQL database adapter
+    const dbAdapter = await createLibSQLAdapter({ url: "file:./.swarm-mail/streams.db" });
+    // Create swarm-mail adapter with database
+    const adapter = createSwarmMailAdapter(dbAdapter, project_key || "default");
+    // Get database for raw queries
+    const db = await adapter.getDatabase();
+    // Query strategy success rates
+    const query = strategySuccessRates({ project_key });
+    const result = await db.query(query.sql, Object.values(query.parameters || {}));
+    if (!result || !result.rows || result.rows.length === 0) {
+      return "";
+    }
+    // Format as markdown table
+    const rows = result.rows.map((r: any) => {
+      const strategy = r.strategy || "unknown";
+      const total = r.total_attempts || 0;
+      const successRate = r.success_rate || 0;
+      const emoji = successRate >= 80 ? "✅" : successRate >= 60 ? "⚠️" : "❌";
+      return `| ${emoji} ${strategy} | ${successRate.toFixed(1)}% | ${total} |`;
+    });
+    // Limit to top 5 strategies to prevent context bloat
+    const topRows = rows.slice(0, 5);
+    // Add anti-pattern hints for low-success strategies
+    const antiPatterns = result.rows
+      .filter((r: any) => r.success_rate < 60)
+      .map((r: any) => `- AVOID: ${r.strategy} strategy (${r.success_rate.toFixed(1)}% success rate)`)
+      .slice(0, 3);
+    const antiPatternsSection = antiPatterns.length > 0
+      ? `\n\n**Anti-Patterns:**\n${antiPatterns.join("\n")}`
+      : "";
+    return `
+## 📊 Swarm Insights (Strategy Success Rates)
+| Strategy | Success Rate | Total Attempts |
+|----------|--------------|----------------|
+${topRows.join("\n")}
+**Use these insights to select decomposition strategies.**${antiPatternsSection}
+`;
+  } catch (e) {
+    console.warn("Failed to get coordinator insights:", e);
+    return "";
+  }
+}
+/**
+ * Get worker-specific insights (file/domain learnings, common pitfalls)
+ */
+async function getWorkerInsights(
+  files?: string[],
+  domain?: string,
+): Promise<string> {
+  try {
+    const adapter = await getMemoryAdapter();
+    // Build query from files and domain
+    let query = "";
+    if (files && files.length > 0) {
+      // Extract domain keywords from file paths
+      const keywords = files
+        .flatMap((f) => f.split(/[\/\\.]/).filter((part) => part.length > 2))
+        .slice(0, 5);
+      query = keywords.join(" ");
+    } else if (domain) {
+      query = domain;
+    } else {
+      return ""; // No context to query
+    }
+    // Query semantic memory for relevant learnings
+    const result = await adapter.find({
+      query: `${query} gotcha pitfall pattern bug`,
+      limit: 3,
+    });
+    if (result.count === 0) {
+      return "";
+    }
+    // Format as bullet list
+    const learnings = result.results.map((r) => {
+      const content = r.content.length > 150
+        ? r.content.slice(0, 150) + "..."
+        : r.content;
+      return `- ${content}`;
+    });
+    return `
+## 💡 Relevant Learnings (from past agents)
+${learnings.join("\n")}
+**Check semantic-memory for full details if needed.**
+`;
+  } catch (e) {
+    console.warn("Failed to get worker insights:", e);
+    return "";
+  }
+}
 // ============================================================================
 // Helper Functions
 // ============================================================================
@@ -1140,7 +1344,7 @@ export function formatCoordinatorPrompt(params: {
 /**
  * Format the V2 subtask prompt for a specific agent
  */
-export function formatSubtaskPromptV2(params: {
+export async function formatSubtaskPromptV2(params: {
   bead_id: string;
   epic_id: string;
   subtask_title: string;
@@ -1155,7 +1359,7 @@ export function formatSubtaskPromptV2(params: {
     skills_to_load?: string[];
     coordinator_notes?: string;
   };
-}): string {
+}): Promise<string> {
   const fileList =
     params.files.length > 0
       ? params.files.map((f) => `- \`${f}\``).join("\n")
@@ -1166,6 +1370,13 @@ export function formatSubtaskPromptV2(params: {
     : "";
   const errorSection = params.error_context ? params.error_context : "";
+  // Fetch worker insights (file/domain specific learnings)
+  const insights = await getPromptInsights({
+    role: "worker",
+    files: params.files,
+    domain: params.subtask_title.split(/\s+/).slice(0, 3).join(" ") // Extract domain from title
+  });
   // Build recovery context section
   let recoverySection = "";
@@ -1218,6 +1429,11 @@ export function formatSubtaskPromptV2(params: {
   const handoffJson = JSON.stringify(handoff, null, 2);
   const handoffSection = `\n## WorkerHandoff Contract\n\nThis is your machine-readable contract. The contract IS the instruction.\n\n\`\`\`json\n${handoffJson}\n\`\`\`\n`;
+  // Inject insights into shared_context section
+  const sharedContextWithInsights = insights
+    ? `${params.shared_context || "(none)"}\n\n${insights}`
+    : params.shared_context || "(none)";
   return SUBTASK_PROMPT_V2.replace(/{bead_id}/g, params.bead_id)
     .replace(/{epic_id}/g, params.epic_id)
     .replace(/{project_path}/g, params.project_path || "$PWD")
@@ -1227,7 +1443,7 @@ export function formatSubtaskPromptV2(params: {
       params.subtask_description || "(see title)",
     )
     .replace("{file_list}", fileList)
-    .replace("{shared_context}", params.shared_context || "(none)")
+    .replace("{shared_context}", sharedContextWithInsights)
     .replace("{compressed_context}", compressedSection)
     .replace("{error_context}", errorSection + recoverySection + handoffSection);
 }
@@ -1359,7 +1575,7 @@ export const swarm_spawn_subtask = tool({
       .describe("Optional explicit model override (auto-selected if not provided)"),
   },
   async execute(args, _ctx) {
-    const prompt = formatSubtaskPromptV2({
+    const prompt = await formatSubtaskPromptV2({
       bead_id: args.bead_id,
       epic_id: args.epic_id,
       subtask_title: args.subtask_title,
@@ -1776,13 +1992,18 @@ export const swarm_plan_prompt = tool({
       }
     }
+    // Fetch swarm insights (strategy success rates, anti-patterns)
+    const insights = await getPromptInsights({ role: "coordinator" });
     // Format strategy guidelines
     const strategyGuidelines = formatStrategyGuidelines(selectedStrategy);
-    // Combine user context
+    // Combine user context and insights
     const contextSection = args.context
-      ? `## Additional Context\n${args.context}`
-      : "## Additional Context\n(none provided)";
+      ? `## Additional Context\n${args.context}\n\n${insights}`
+      : insights
+        ? `## Additional Context\n(none provided)\n\n${insights}`
+        : "## Additional Context\n(none provided)";
     // Build the prompt (without CASS - we'll let the module handle that)
     const prompt = STRATEGY_DECOMPOSITION_PROMPT.replace("{task}", args.task)

package/.env DELETED Viewed

	@@ -1,2 +0,0 @@
1	- NPM_1P_ITEM=yeu4tbknx5crxmudtu3pfg3eba
2	- AI_GATEWAY_API_KEY=vck_2w2KCfF5YskBaxnsIaOqnr87kAOIyL6HpPwtLCTWtn7DFyKXEP4IJsKA