npm - jfl - Versions diffs - 0.8.1 → 0.9.0 - Mend

jfl 0.8.1 → 0.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (247) hide show

package/dist/commands/doctor.d.ts +1 -0
package/dist/commands/doctor.d.ts.map +1 -1
package/dist/commands/doctor.js +30 -1
package/dist/commands/doctor.js.map +1 -1
package/dist/commands/ide.d.ts +2 -1
package/dist/commands/ide.d.ts.map +1 -1
package/dist/commands/ide.js +60 -1
package/dist/commands/ide.js.map +1 -1
package/dist/commands/init-from-service.d.ts +15 -0
package/dist/commands/init-from-service.d.ts.map +1 -0
package/dist/commands/init-from-service.js +541 -0
package/dist/commands/init-from-service.js.map +1 -0
package/dist/commands/init.d.ts +1 -0
package/dist/commands/init.d.ts.map +1 -1
package/dist/commands/init.js +32 -1
package/dist/commands/init.js.map +1 -1
package/dist/commands/kanban.d.ts.map +1 -1
package/dist/commands/kanban.js +13 -4
package/dist/commands/kanban.js.map +1 -1
package/dist/commands/linear.d.ts +41 -0
package/dist/commands/linear.d.ts.map +1 -0
package/dist/commands/linear.js +715 -0
package/dist/commands/linear.js.map +1 -0
package/dist/commands/peter.d.ts.map +1 -1
package/dist/commands/peter.js +232 -25
package/dist/commands/peter.js.map +1 -1
package/dist/commands/services.d.ts.map +1 -1
package/dist/commands/services.js +146 -0
package/dist/commands/services.js.map +1 -1
package/dist/commands/setup.d.ts.map +1 -1
package/dist/commands/setup.js +173 -13
package/dist/commands/setup.js.map +1 -1
package/dist/commands/telemetry-monitor.d.ts +11 -0
package/dist/commands/telemetry-monitor.d.ts.map +1 -0
package/dist/commands/telemetry-monitor.js +224 -0
package/dist/commands/telemetry-monitor.js.map +1 -0
package/dist/commands/telemetry-test.d.ts +11 -0
package/dist/commands/telemetry-test.d.ts.map +1 -0
package/dist/commands/telemetry-test.js +67 -0
package/dist/commands/telemetry-test.js.map +1 -0
package/dist/commands/tenet-agents.d.ts +13 -0
package/dist/commands/tenet-agents.d.ts.map +1 -0
package/dist/commands/tenet-agents.js +191 -0
package/dist/commands/tenet-agents.js.map +1 -0
package/dist/commands/tenet-setup.d.ts +19 -0
package/dist/commands/tenet-setup.d.ts.map +1 -0
package/dist/commands/tenet-setup.js +131 -0
package/dist/commands/tenet-setup.js.map +1 -0
package/dist/commands/train.d.ts +18 -0
package/dist/commands/train.d.ts.map +1 -1
package/dist/commands/train.js +182 -0
package/dist/commands/train.js.map +1 -1
package/dist/commands/whoami.d.ts +2 -0
package/dist/commands/whoami.d.ts.map +1 -0
package/dist/commands/whoami.js +24 -0
package/dist/commands/whoami.js.map +1 -0
package/dist/index.js +159 -10
package/dist/index.js.map +1 -1
package/dist/lib/advanced-setup.d.ts +78 -0
package/dist/lib/advanced-setup.d.ts.map +1 -0
package/dist/lib/advanced-setup.js +433 -0
package/dist/lib/advanced-setup.js.map +1 -0
package/dist/lib/agent-config.d.ts +33 -0
package/dist/lib/agent-config.d.ts.map +1 -1
package/dist/lib/agent-config.js +26 -0
package/dist/lib/agent-config.js.map +1 -1
package/dist/lib/counterfactual-training-bridge.d.ts +114 -0
package/dist/lib/counterfactual-training-bridge.d.ts.map +1 -0
package/dist/lib/counterfactual-training-bridge.js +322 -0
package/dist/lib/counterfactual-training-bridge.js.map +1 -0
package/dist/lib/discovery-agent.d.ts +48 -0
package/dist/lib/discovery-agent.d.ts.map +1 -0
package/dist/lib/discovery-agent.js +111 -0
package/dist/lib/discovery-agent.js.map +1 -0
package/dist/lib/flow-engine.d.ts.map +1 -1
package/dist/lib/flow-engine.js +46 -8
package/dist/lib/flow-engine.js.map +1 -1
package/dist/lib/gtm-generator.d.ts +29 -0
package/dist/lib/gtm-generator.d.ts.map +1 -0
package/dist/lib/gtm-generator.js +252 -0
package/dist/lib/gtm-generator.js.map +1 -0
package/dist/lib/hub-health.d.ts +40 -0
package/dist/lib/hub-health.d.ts.map +1 -0
package/dist/lib/hub-health.js +89 -0
package/dist/lib/hub-health.js.map +1 -0
package/dist/lib/invariant-monitor.d.ts +6 -2
package/dist/lib/invariant-monitor.d.ts.map +1 -1
package/dist/lib/invariant-monitor.js +89 -2
package/dist/lib/invariant-monitor.js.map +1 -1
package/dist/lib/journal-analyzer.d.ts +71 -0
package/dist/lib/journal-analyzer.d.ts.map +1 -0
package/dist/lib/journal-analyzer.js +306 -0
package/dist/lib/journal-analyzer.js.map +1 -0
package/dist/lib/linear-client.d.ts +73 -0
package/dist/lib/linear-client.d.ts.map +1 -0
package/dist/lib/linear-client.js +112 -0
package/dist/lib/linear-client.js.map +1 -0
package/dist/lib/linear-id-map.d.ts +20 -0
package/dist/lib/linear-id-map.d.ts.map +1 -0
package/dist/lib/linear-id-map.js +57 -0
package/dist/lib/linear-id-map.js.map +1 -0
package/dist/lib/linear-kanban.d.ts +66 -0
package/dist/lib/linear-kanban.d.ts.map +1 -0
package/dist/lib/linear-kanban.js +175 -0
package/dist/lib/linear-kanban.js.map +1 -0
package/dist/lib/onboarding.d.ts +40 -0
package/dist/lib/onboarding.d.ts.map +1 -0
package/dist/lib/onboarding.js +213 -0
package/dist/lib/onboarding.js.map +1 -0
package/dist/lib/physical-world-model.d.ts +50 -0
package/dist/lib/physical-world-model.d.ts.map +1 -0
package/dist/lib/physical-world-model.js +251 -0
package/dist/lib/physical-world-model.js.map +1 -0
package/dist/lib/planning-loop.d.ts +157 -0
package/dist/lib/planning-loop.d.ts.map +1 -0
package/dist/lib/planning-loop.js +537 -0
package/dist/lib/planning-loop.js.map +1 -0
package/dist/lib/policy-head.d.ts +13 -0
package/dist/lib/policy-head.d.ts.map +1 -1
package/dist/lib/policy-head.js +168 -2
package/dist/lib/policy-head.js.map +1 -1
package/dist/lib/resource-optimizer-middleware.d.ts +39 -0
package/dist/lib/resource-optimizer-middleware.d.ts.map +1 -0
package/dist/lib/resource-optimizer-middleware.js +222 -0
package/dist/lib/resource-optimizer-middleware.js.map +1 -0
package/dist/lib/resource-optimizer.d.ts +71 -0
package/dist/lib/resource-optimizer.d.ts.map +1 -0
package/dist/lib/resource-optimizer.js +228 -0
package/dist/lib/resource-optimizer.js.map +1 -0
package/dist/lib/rl-manager.d.ts +74 -0
package/dist/lib/rl-manager.d.ts.map +1 -0
package/dist/lib/rl-manager.js +244 -0
package/dist/lib/rl-manager.js.map +1 -0
package/dist/lib/service-analyzer.d.ts +76 -0
package/dist/lib/service-analyzer.d.ts.map +1 -0
package/dist/lib/service-analyzer.js +704 -0
package/dist/lib/service-analyzer.js.map +1 -0
package/dist/lib/service-gtm.js +2 -2
package/dist/lib/service-gtm.js.map +1 -1
package/dist/lib/service-questionnaire.d.ts +11 -0
package/dist/lib/service-questionnaire.d.ts.map +1 -0
package/dist/lib/service-questionnaire.js +89 -0
package/dist/lib/service-questionnaire.js.map +1 -0
package/dist/lib/setup/agent-generator.d.ts +2 -0
package/dist/lib/setup/agent-generator.d.ts.map +1 -1
package/dist/lib/setup/agent-generator.js +128 -4
package/dist/lib/setup/agent-generator.js.map +1 -1
package/dist/lib/setup/flow-generator.d.ts +10 -0
package/dist/lib/setup/flow-generator.d.ts.map +1 -0
package/dist/lib/setup/flow-generator.js +113 -0
package/dist/lib/setup/flow-generator.js.map +1 -0
package/dist/lib/setup/invariant-bridge.d.ts +91 -0
package/dist/lib/setup/invariant-bridge.d.ts.map +1 -0
package/dist/lib/setup/invariant-bridge.js +384 -0
package/dist/lib/setup/invariant-bridge.js.map +1 -0
package/dist/lib/setup/spec-generator.d.ts +41 -5
package/dist/lib/setup/spec-generator.d.ts.map +1 -1
package/dist/lib/setup/spec-generator.js +503 -29
package/dist/lib/setup/spec-generator.js.map +1 -1
package/dist/lib/stratus-client.js +1 -1
package/dist/lib/stratus-client.js.map +1 -1
package/dist/lib/surface-agent.d.ts +78 -0
package/dist/lib/surface-agent.d.ts.map +1 -0
package/dist/lib/surface-agent.js +105 -0
package/dist/lib/surface-agent.js.map +1 -0
package/dist/lib/surface-coordination-example.d.ts +30 -0
package/dist/lib/surface-coordination-example.d.ts.map +1 -0
package/dist/lib/surface-coordination-example.js +164 -0
package/dist/lib/surface-coordination-example.js.map +1 -0
package/dist/lib/telemetry/physical-world-collector.d.ts +15 -0
package/dist/lib/telemetry/physical-world-collector.d.ts.map +1 -0
package/dist/lib/telemetry/physical-world-collector.js +177 -0
package/dist/lib/telemetry/physical-world-collector.js.map +1 -0
package/dist/lib/telemetry/training-bridge.d.ts +51 -0
package/dist/lib/telemetry/training-bridge.d.ts.map +1 -0
package/dist/lib/telemetry/training-bridge.js +185 -0
package/dist/lib/telemetry/training-bridge.js.map +1 -0
package/dist/lib/telemetry.d.ts +2 -1
package/dist/lib/telemetry.d.ts.map +1 -1
package/dist/lib/telemetry.js +23 -2
package/dist/lib/telemetry.js.map +1 -1
package/dist/lib/tenet-board-agent.d.ts +52 -0
package/dist/lib/tenet-board-agent.d.ts.map +1 -0
package/dist/lib/tenet-board-agent.js +226 -0
package/dist/lib/tenet-board-agent.js.map +1 -0
package/dist/lib/tenet-ide-agent.d.ts +40 -0
package/dist/lib/tenet-ide-agent.d.ts.map +1 -0
package/dist/lib/tenet-ide-agent.js +199 -0
package/dist/lib/tenet-ide-agent.js.map +1 -0
package/dist/lib/workspace/data-pipeline.d.ts.map +1 -1
package/dist/lib/workspace/data-pipeline.js +27 -5
package/dist/lib/workspace/data-pipeline.js.map +1 -1
package/dist/lib/workspace/sidebar-runner.d.ts +13 -0
package/dist/lib/workspace/sidebar-runner.d.ts.map +1 -0
package/dist/lib/workspace/sidebar-runner.js +419 -0
package/dist/lib/workspace/sidebar-runner.js.map +1 -0
package/dist/lib/workspace/surface-registry.d.ts.map +1 -1
package/dist/lib/workspace/surface-registry.js +4 -1
package/dist/lib/workspace/surface-registry.js.map +1 -1
package/dist/lib/workspace/surfaces/agent-overview.d.ts +3 -3
package/dist/lib/workspace/surfaces/agent-overview.d.ts.map +1 -1
package/dist/lib/workspace/surfaces/agent-overview.js +3 -3
package/dist/lib/workspace/surfaces/agent-overview.js.map +1 -1
package/dist/lib/workspace/surfaces/index.d.ts +3 -0
package/dist/lib/workspace/surfaces/index.d.ts.map +1 -1
package/dist/lib/workspace/surfaces/index.js +3 -0
package/dist/lib/workspace/surfaces/index.js.map +1 -1
package/dist/lib/workspace/surfaces/kanban.d.ts +15 -0
package/dist/lib/workspace/surfaces/kanban.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/kanban.js +43 -0
package/dist/lib/workspace/surfaces/kanban.js.map +1 -0
package/dist/lib/workspace/surfaces/physical-world.d.ts +15 -0
package/dist/lib/workspace/surfaces/physical-world.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/physical-world.js +37 -0
package/dist/lib/workspace/surfaces/physical-world.js.map +1 -0
package/dist/lib/workspace/surfaces/sidebar.d.ts +22 -0
package/dist/lib/workspace/surfaces/sidebar.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/sidebar.js +90 -0
package/dist/lib/workspace/surfaces/sidebar.js.map +1 -0
package/dist/types/flows.d.ts +2 -1
package/dist/types/flows.d.ts.map +1 -1
package/dist/types/physical-world-model.d.ts +65 -0
package/dist/types/physical-world-model.d.ts.map +1 -0
package/dist/types/physical-world-model.js +43 -0
package/dist/types/physical-world-model.js.map +1 -0
package/dist/types/telemetry.d.ts +37 -0
package/dist/types/telemetry.d.ts.map +1 -1
package/dist/types/world-model.d.ts.map +1 -1
package/dist/types/world-model.js +14 -7
package/dist/types/world-model.js.map +1 -1
package/dist/utils/context-hub-port.d.ts.map +1 -1
package/dist/utils/context-hub-port.js +6 -1
package/dist/utils/context-hub-port.js.map +1 -1
package/package.json +3 -2
package/packages/pi/extensions/index.ts +34 -6
package/scripts/telemetry-dashboard.sh +44 -0
package/scripts/test-planning-loop-e2e.ts +181 -0
package/scripts/test-server-inference.ts +49 -0
package/scripts/test-state-sensitivity.ts +32 -0
package/scripts/train/v2/benchmark.py +661 -0
package/scripts/train/v2/generate_balanced.py +439 -0
package/scripts/train/v2/generate_hard_negatives.py +219 -0
package/scripts/train/v2/infer.py +149 -36
package/scripts/train/v2/infer_server.py +224 -0
package/scripts/train/v2/online_train.py +576 -0
package/scripts/train/v2/precompute.py +24 -6
package/template/CLAUDE.md +74 -132

package/packages/pi/extensions/index.ts CHANGED Viewed

@@ -347,15 +347,19 @@ export default async function jflExtension(pi: any): Promise<void> {
           content: [
             `JFL session ready: "${projectName}" on branch ${ctx.session.branch}.`,
             "",
-            "You have full project context injected in your system prompt (CLAUDE.md + recent journal + knowledge docs).",
-            "Tools available: jfl_context, jfl_memory_search, jfl_hud, jfl_journal.",
+            "Your system prompt already contains full project context: CLAUDE.md, recent journal entries, knowledge docs, and code headers.",
+            "Everything was loaded during the boot screen. You do NOT need to call any tools.",
             "",
-            "Greet the user naturally with a brief status:",
-            "- What was worked on recently (from your injected context)",
+            "DO NOT call jfl_context, jfl_hud, jfl_memory_search, or run any bash commands at startup.",
+            "DO NOT run session-sync.sh, jfl-doctor.sh, or read journal files.",
+            "All of that is already done and injected into your system prompt.",
+            "",
+            "Just greet the user naturally with a brief status (3-5 lines):",
+            "- What was worked on recently (from the journal entries in your system prompt)",
             "- Current phase and any blockers",
             "- A suggested next action",
             "",
-            "Keep it to 3-5 lines. No setup noise. Just be ready to work.",
+            "No tool calls. No setup noise. Just talk.",
             "Write journal entries as you work. Capture decisions immediately.",
           ].join("\n"),
           display: false,
@@ -380,7 +384,31 @@ export default async function jflExtension(pi: any): Promise<void> {
     latestPiCtx = piCtx
     const result = await injectContext(ctx, event)
     if (result?.systemPromptAddition) {
-      const current = piCtx.getSystemPrompt?.() ?? ""
+      let current = piCtx.getSystemPrompt?.() ?? ""
+      // Strip Path B (Claude Code manual startup) from system prompt.
+      // We're running in Pi with the extension — Path B instructions are
+      // noise that can confuse the LLM into running manual startup commands.
+      const pathBStart = "### Path B: Claude Code / No Extension"
+      const pathBEnd = "### How to Tell Which Path You're On"
+      const startIdx = current.indexOf(pathBStart)
+      const endIdx = current.indexOf(pathBEnd)
+      if (startIdx !== -1 && endIdx !== -1 && endIdx > startIdx) {
+        current = current.slice(0, startIdx) + current.slice(endIdx)
+      }
+      // Also strip the "How to Tell" section — it references Path B
+      const howToTell = "### How to Tell Which Path You're On"
+      const howToTellIdx = current.indexOf(howToTell)
+      if (howToTellIdx !== -1) {
+        // Find the next ### or ## heading after it
+        const afterHowToTell = current.slice(howToTellIdx + howToTell.length)
+        const nextHeading = afterHowToTell.search(/\n###? /)
+        if (nextHeading !== -1) {
+          current = current.slice(0, howToTellIdx) + afterHowToTell.slice(nextHeading)
+        }
+      }
       return {
         systemPrompt: current
           ? `${current}\n\n${result.systemPromptAddition}`

package/scripts/telemetry-dashboard.sh ADDED Viewed

@@ -0,0 +1,44 @@
+#!/usr/bin/env bash
+# Physical-World Telemetry Dashboard
+# Quick overview of telemetry monitoring capabilities
+set -euo pipefail
+echo "🌍 Physical-World Telemetry Dashboard"
+echo "====================================="
+echo
+# Check if telemetry is enabled
+echo "📊 Telemetry Status:"
+jfl telemetry status
+echo
+# Generate some sample data if none exists
+echo "🧪 Generating sample data..."
+jfl telemetry test --count 3 --interval 100 --categories "command,performance"
+echo
+# Show current snapshot
+echo "📈 Current Physical-World Metrics:"
+jfl telemetry monitor --compact
+echo
+echo "🔍 Available Monitoring Options:"
+echo "  jfl telemetry monitor --live          # Real-time updates"
+echo "  jfl telemetry monitor --filter cpu    # Filter for CPU-related events"
+echo "  jfl telemetry monitor --compact       # Compact display"
+echo
+echo "💡 Physical-World Data Captured:"
+echo "  • System: CPU usage, memory, thermal state, system load"
+echo "  • Hardware: battery level, disk space, sensors"
+echo "  • Workflow: git branch, dirty files, terminal count, IDE"
+echo "  • Network: latency, connectivity, local dev servers"
+echo "  • Performance: build times, test durations, command timing"
+echo
+echo "🎯 Competitive Advantage:"
+echo "  This data is impossible for web UIs to access!"
+echo "  You own the edge - local machine context during live operations."
+echo

package/scripts/test-planning-loop-e2e.ts ADDED Viewed

@@ -0,0 +1,181 @@
+/**
+ * End-to-end test for the Planning Loop
+ *
+ * Exercises: PolicyHead v2 → DynamicsModel rollouts → InvariantMonitor → Action Selection
+ *
+ * Run: npx tsx scripts/test-planning-loop-e2e.ts
+ */
+import { createPlanningLoop } from "../src/lib/planning-loop.js"
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+import type { PlanningResult, EvaluatedAction } from "../src/lib/planning-loop.js"
+const projectRoot = process.cwd()
+// ============================================================================
+// Test scenarios — represent real situations Peter Parker faces
+// ============================================================================
+const SCENARIOS = [
+  {
+    name: "Bug reported — tests failing",
+    agentId: "error-fixer",
+    goal: "Tests are failing in planning-loop.test.ts — TypeError on undefined property. Fix the failing test.",
+    expectedTypes: ["fix"],
+  },
+  {
+    name: "Feature request — add new capability",
+    agentId: "feature-builder",
+    goal: "Add multi-step rollout support to the planning loop for deeper lookahead.",
+    expectedTypes: ["feature"],
+  },
+  {
+    name: "Performance optimization",
+    agentId: "optimizer",
+    goal: "Reduce PolicyHead inference latency from 2s to under 500ms for interactive use.",
+    expectedTypes: ["experiment", "refactor"],
+  },
+  {
+    name: "Test coverage gap",
+    agentId: "test-coverage",
+    goal: "Add unit tests for the counterfactual training bridge — currently 0% coverage.",
+    expectedTypes: ["test"],
+  },
+  {
+    name: "Config change needed",
+    agentId: "config-updater",
+    goal: "Update the nightly pipeline schedule to run at 2am MST instead of midnight.",
+    expectedTypes: ["config"],
+  },
+]
+// ============================================================================
+// Helpers
+// ============================================================================
+function formatAction(ea: EvaluatedAction): string {
+  const pred = ea.prediction
+  const delta = pred.outcome?.immediate?.evalScoreChange
+  const deltaStr = delta !== undefined ? `Δ=${delta > 0 ? "+" : ""}${delta.toFixed(4)}` : "Δ=N/A"
+  const violations = ea.invariantViolations.length > 0 ? ` ⚠️${ea.invariantViolations.length} violations` : ""
+  const filtered = ea.filtered ? ` [FILTERED: ${ea.filterReason}]` : ""
+  return `  ${ea.action.actionType.padEnd(12)} conf=${ea.phConfidence.toFixed(3)} score=${ea.combinedScore.toFixed(3)} ${deltaStr} src=${pred.source}${violations}${filtered}`
+}
+function logResult(scenario: typeof SCENARIOS[0], result: PlanningResult) {
+  console.log(`\n${"═".repeat(70)}`)
+  console.log(`  Scenario: ${scenario.name}`)
+  console.log(`  Agent:    ${scenario.agentId}`)
+  console.log(`  Goal:     ${scenario.goal.slice(0, 70)}...`)
+  console.log(`${"─".repeat(70)}`)
+  console.log(`  Time:     ${result.planningTimeMs}ms`)
+  console.log(`  Rollouts: ${result.rolloutsPerformed}`)
+  console.log(`  Complete: ${result.completed}`)
+  console.log()
+  // All actions
+  console.log(`  Actions evaluated (${result.allActions.length}):`)
+  for (const ea of result.allActions) {
+    const selected = result.selectedAction === ea ? " ← SELECTED" : ""
+    console.log(`${formatAction(ea)}${selected}`)
+  }
+  // Selected action
+  if (result.selectedAction) {
+    const sel = result.selectedAction
+    const correctType = scenario.expectedTypes.includes(sel.action.actionType)
+    const check = correctType ? "✅" : "❌"
+    console.log(`\n  ${check} Selected: ${sel.action.actionType} (expected: ${scenario.expectedTypes.join("|")})`)
+  } else {
+    console.log(`\n  ❌ No action selected: ${result.noSelectionReason}`)
+  }
+}
+// ============================================================================
+// Main
+// ============================================================================
+async function main() {
+  console.log("╔══════════════════════════════════════════════════════════════════════╗")
+  console.log("║  Planning Loop — End-to-End Test                                    ║")
+  console.log("║  PH (v2 transformer) → DM (rollouts) → IM (invariants) → Select    ║")
+  console.log("╚══════════════════════════════════════════════════════════════════════╝")
+  // Check prerequisites
+  const ph = new PolicyHeadInference(projectRoot)
+  console.log(`\n  PolicyHead loaded: ${ph.isLoaded} (version: ${ph.version})`)
+  if (ph.stats) {
+    console.log(`  Trained on: ${ph.stats.trained_on} examples`)
+    const valAcc = ph.stats.val_accuracy ?? ph.stats.direction_accuracy
+    console.log(`  Val accuracy: ${(valAcc > 1 ? valAcc : valAcc * 100).toFixed(1)}%`)
+  }
+  if (!ph.isLoaded) {
+    console.error("\n  ❌ PolicyHead not loaded — cannot run e2e test")
+    console.error("  Copy checkpoint to .jfl/checkpoints/best_policy_head.pt")
+    process.exit(1)
+  }
+  // Create planning loop
+  const planner = createPlanningLoop(projectRoot, {
+    topK: 5,
+    verbose: true,
+    maxPlanningTimeMs: 30000, // 30s for test
+    checkInvariants: true,
+    recordTransitions: false, // Don't pollute real data during test
+    writeTrainingTuples: false,
+  })
+  console.log(`  Planning loop ready: ${planner.isReady}`)
+  // Run each scenario
+  let passed = 0
+  let failed = 0
+  const results: Array<{ scenario: string; result: PlanningResult; correct: boolean }> = []
+  for (const scenario of SCENARIOS) {
+    try {
+      console.log(`\n  Running: ${scenario.name}...`)
+      const result = await planner.plan(scenario.agentId, scenario.goal)
+      logResult(scenario, result)
+      const correct = result.selectedAction
+        ? scenario.expectedTypes.includes(result.selectedAction.action.actionType)
+        : false
+      if (correct) passed++
+      else failed++
+      results.push({ scenario: scenario.name, result, correct })
+    } catch (err: any) {
+      console.error(`\n  ❌ ${scenario.name} THREW: ${err.message}`)
+      failed++
+      results.push({
+        scenario: scenario.name,
+        result: null as any,
+        correct: false,
+      })
+    }
+  }
+  // Summary
+  console.log(`\n${"═".repeat(70)}`)
+  console.log(`  SUMMARY`)
+  console.log(`${"─".repeat(70)}`)
+  for (const r of results) {
+    const check = r.correct ? "✅" : "❌"
+    const time = r.result ? `${r.result.planningTimeMs}ms` : "ERRORED"
+    const selected = r.result?.selectedAction?.action.actionType ?? "none"
+    console.log(`  ${check} ${r.scenario.padEnd(35)} → ${selected.padEnd(12)} (${time})`)
+  }
+  console.log(`\n  Passed: ${passed}/${SCENARIOS.length}  Failed: ${failed}/${SCENARIOS.length}`)
+  console.log(`${"═".repeat(70)}`)
+  process.exit(failed > 0 ? 1 : 0)
+}
+main().catch(err => {
+  console.error("Fatal error:", err)
+  process.exit(1)
+})

package/scripts/test-server-inference.ts ADDED Viewed

@@ -0,0 +1,49 @@
+#!/usr/bin/env npx tsx
+/**
+ * Test the inference server path in PolicyHead
+ */
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+async function main() {
+  const ph = new PolicyHeadInference(".")
+  console.log("PH loaded:", ph.isLoaded, "version:", ph.version)
+  if (!ph.isLoaded || ph.version !== 2) {
+    console.log("v2 not loaded, aborting")
+    process.exit(1)
+  }
+  const state = {
+    composite_score: 0.72,
+    dimension_scores: { test_pass_rate: 0.85, build_health: 0.9, code_quality: 0.8 },
+    tests_passing: 17,
+    tests_total: 20,
+    trajectory_length: 3,
+    recent_deltas: [-0.03, 0.01],
+    agent: "error-fixer",
+  }
+  const goals = [
+    "Fix failing tests in planning-loop.test.ts — TypeError on undefined property",
+    "Add multi-step rollout support to the planning loop",
+    "Add unit tests for the counterfactual training bridge",
+    "Update the nightly pipeline schedule to run at 2am MST",
+    "Reduce PolicyHead inference latency from 20s to under 5s",
+  ]
+  for (const goal of goals) {
+    const t0 = Date.now()
+    const result = await ph.selectAction(state, goal)
+    const elapsed = Date.now() - t0
+    console.log(`[${elapsed}ms] ${result.action} (${(result.confidence * 100).toFixed(1)}%) ← ${goal.slice(0, 60)}`)
+  }
+  console.log("\nStopping server...")
+  ph.stopServer()
+  console.log("Done")
+}
+main().catch(err => {
+  console.error(err)
+  process.exit(1)
+})

package/scripts/test-state-sensitivity.ts ADDED Viewed

@@ -0,0 +1,32 @@
+#!/usr/bin/env npx tsx
+/**
+ * Test how state values affect PolicyHead predictions
+ */
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+async function main() {
+  const ph = new PolicyHeadInference(".")
+  if (!ph.isLoaded || ph.version !== 2) { process.exit(1) }
+  const goal = "Add multi-step rollout support to the planning loop"
+  const states = [
+    { label: "healthy (all high)", composite_score: 0.95, dimension_scores: { test_pass_rate: 1.0, build_health: 1.0, code_quality: 0.95 }, tests_passing: 25, tests_total: 25, trajectory_length: 5, recent_deltas: [0.02, 0.01], agent: "feature-builder" },
+    { label: "degraded tests", composite_score: 0.72, dimension_scores: { test_pass_rate: 0.85, build_health: 0.9, code_quality: 0.8 }, tests_passing: 17, tests_total: 20, trajectory_length: 3, recent_deltas: [-0.03], agent: "error-fixer" },
+    { label: "low coverage", composite_score: 0.55, dimension_scores: { test_pass_rate: 1.0, build_health: 0.9, code_quality: 0.5 }, tests_passing: 15, tests_total: 15, trajectory_length: 2, recent_deltas: [0.01], agent: "test-coverage" },
+    { label: "fresh start", composite_score: 0.3, dimension_scores: { test_pass_rate: 0.5, build_health: 0.5, code_quality: 0.5 }, tests_passing: 5, tests_total: 10, trajectory_length: 0, recent_deltas: [], agent: "onboarding" },
+    { label: "near perfect", composite_score: 0.98, dimension_scores: { test_pass_rate: 1.0, build_health: 1.0, code_quality: 1.0, hub_health: 1.0 }, tests_passing: 30, tests_total: 30, trajectory_length: 10, recent_deltas: [0.005, 0.003], agent: "optimizer" },
+  ]
+  for (const s of states) {
+    const { label, ...state } = s
+    const t0 = Date.now()
+    const result = await ph.selectAction(state as any, goal)
+    const elapsed = Date.now() - t0
+    const alts = result.alternatives?.map(a => `${a.action}(${(a.confidence*100).toFixed(0)}%)`).join(", ") || ""
+    console.log(`[${elapsed}ms] ${label}: ${result.action} (${(result.confidence*100).toFixed(1)}%) | alts: ${alts}`)
+  }
+  ph.stopServer()
+}
+main().catch(err => { console.error(err); process.exit(1) })