npm - jfl - Versions diffs - 0.8.1 → 0.9.1 - Mend

jfl 0.8.1 → 0.9.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (296) hide show

package/README.md +35 -4
package/dist/commands/digest.d.ts +6 -0
package/dist/commands/digest.d.ts.map +1 -1
package/dist/commands/digest.js +70 -69
package/dist/commands/digest.js.map +1 -1
package/dist/commands/doctor.d.ts +1 -0
package/dist/commands/doctor.d.ts.map +1 -1
package/dist/commands/doctor.js +30 -1
package/dist/commands/doctor.js.map +1 -1
package/dist/commands/eval.d.ts +40 -0
package/dist/commands/eval.d.ts.map +1 -1
package/dist/commands/eval.js +8 -8
package/dist/commands/eval.js.map +1 -1
package/dist/commands/findings.d.ts +7 -0
package/dist/commands/findings.d.ts.map +1 -1
package/dist/commands/findings.js +4 -4
package/dist/commands/findings.js.map +1 -1
package/dist/commands/ide.d.ts +2 -1
package/dist/commands/ide.d.ts.map +1 -1
package/dist/commands/ide.js +61 -1
package/dist/commands/ide.js.map +1 -1
package/dist/commands/init-from-service.d.ts +15 -0
package/dist/commands/init-from-service.d.ts.map +1 -0
package/dist/commands/init-from-service.js +541 -0
package/dist/commands/init-from-service.js.map +1 -0
package/dist/commands/init.d.ts +1 -0
package/dist/commands/init.d.ts.map +1 -1
package/dist/commands/init.js +32 -1
package/dist/commands/init.js.map +1 -1
package/dist/commands/kanban.d.ts.map +1 -1
package/dist/commands/kanban.js +13 -4
package/dist/commands/kanban.js.map +1 -1
package/dist/commands/linear.d.ts +41 -0
package/dist/commands/linear.d.ts.map +1 -0
package/dist/commands/linear.js +715 -0
package/dist/commands/linear.js.map +1 -0
package/dist/commands/peter.d.ts.map +1 -1
package/dist/commands/peter.js +232 -25
package/dist/commands/peter.js.map +1 -1
package/dist/commands/portfolio.d.ts +5 -0
package/dist/commands/portfolio.d.ts.map +1 -1
package/dist/commands/portfolio.js +193 -203
package/dist/commands/portfolio.js.map +1 -1
package/dist/commands/predict.d.ts +19 -0
package/dist/commands/predict.d.ts.map +1 -1
package/dist/commands/predict.js +4 -4
package/dist/commands/predict.js.map +1 -1
package/dist/commands/services.d.ts.map +1 -1
package/dist/commands/services.js +146 -0
package/dist/commands/services.js.map +1 -1
package/dist/commands/setup.d.ts.map +1 -1
package/dist/commands/setup.js +279 -20
package/dist/commands/setup.js.map +1 -1
package/dist/commands/start.d.ts +25 -0
package/dist/commands/start.d.ts.map +1 -0
package/dist/commands/start.js +191 -0
package/dist/commands/start.js.map +1 -0
package/dist/commands/telemetry-monitor.d.ts +11 -0
package/dist/commands/telemetry-monitor.d.ts.map +1 -0
package/dist/commands/telemetry-monitor.js +224 -0
package/dist/commands/telemetry-monitor.js.map +1 -0
package/dist/commands/telemetry-test.d.ts +11 -0
package/dist/commands/telemetry-test.d.ts.map +1 -0
package/dist/commands/telemetry-test.js +67 -0
package/dist/commands/telemetry-test.js.map +1 -0
package/dist/commands/tenet-agents.d.ts +13 -0
package/dist/commands/tenet-agents.d.ts.map +1 -0
package/dist/commands/tenet-agents.js +191 -0
package/dist/commands/tenet-agents.js.map +1 -0
package/dist/commands/tenet-setup.d.ts +20 -0
package/dist/commands/tenet-setup.d.ts.map +1 -0
package/dist/commands/tenet-setup.js +135 -0
package/dist/commands/tenet-setup.js.map +1 -0
package/dist/commands/train.d.ts +18 -0
package/dist/commands/train.d.ts.map +1 -1
package/dist/commands/train.js +182 -0
package/dist/commands/train.js.map +1 -1
package/dist/commands/viz.d.ts +33 -0
package/dist/commands/viz.d.ts.map +1 -1
package/dist/commands/viz.js +9 -9
package/dist/commands/viz.js.map +1 -1
package/dist/commands/whoami.d.ts +2 -0
package/dist/commands/whoami.d.ts.map +1 -0
package/dist/commands/whoami.js +24 -0
package/dist/commands/whoami.js.map +1 -0
package/dist/index.js +230 -30
package/dist/index.js.map +1 -1
package/dist/lib/advanced-setup.d.ts +78 -0
package/dist/lib/advanced-setup.d.ts.map +1 -0
package/dist/lib/advanced-setup.js +433 -0
package/dist/lib/advanced-setup.js.map +1 -0
package/dist/lib/agent-config.d.ts +33 -0
package/dist/lib/agent-config.d.ts.map +1 -1
package/dist/lib/agent-config.js +26 -0
package/dist/lib/agent-config.js.map +1 -1
package/dist/lib/counterfactual-training-bridge.d.ts +114 -0
package/dist/lib/counterfactual-training-bridge.d.ts.map +1 -0
package/dist/lib/counterfactual-training-bridge.js +322 -0
package/dist/lib/counterfactual-training-bridge.js.map +1 -0
package/dist/lib/discovery-agent.d.ts +48 -0
package/dist/lib/discovery-agent.d.ts.map +1 -0
package/dist/lib/discovery-agent.js +111 -0
package/dist/lib/discovery-agent.js.map +1 -0
package/dist/lib/flow-engine.d.ts.map +1 -1
package/dist/lib/flow-engine.js +46 -8
package/dist/lib/flow-engine.js.map +1 -1
package/dist/lib/gtm-generator.d.ts +29 -0
package/dist/lib/gtm-generator.d.ts.map +1 -0
package/dist/lib/gtm-generator.js +252 -0
package/dist/lib/gtm-generator.js.map +1 -0
package/dist/lib/hub-health.d.ts +40 -0
package/dist/lib/hub-health.d.ts.map +1 -0
package/dist/lib/hub-health.js +89 -0
package/dist/lib/hub-health.js.map +1 -0
package/dist/lib/invariant-monitor.d.ts +6 -2
package/dist/lib/invariant-monitor.d.ts.map +1 -1
package/dist/lib/invariant-monitor.js +89 -2
package/dist/lib/invariant-monitor.js.map +1 -1
package/dist/lib/journal-analyzer.d.ts +71 -0
package/dist/lib/journal-analyzer.d.ts.map +1 -0
package/dist/lib/journal-analyzer.js +306 -0
package/dist/lib/journal-analyzer.js.map +1 -0
package/dist/lib/linear-client.d.ts +73 -0
package/dist/lib/linear-client.d.ts.map +1 -0
package/dist/lib/linear-client.js +112 -0
package/dist/lib/linear-client.js.map +1 -0
package/dist/lib/linear-id-map.d.ts +20 -0
package/dist/lib/linear-id-map.d.ts.map +1 -0
package/dist/lib/linear-id-map.js +59 -0
package/dist/lib/linear-id-map.js.map +1 -0
package/dist/lib/linear-kanban.d.ts +66 -0
package/dist/lib/linear-kanban.d.ts.map +1 -0
package/dist/lib/linear-kanban.js +175 -0
package/dist/lib/linear-kanban.js.map +1 -0
package/dist/lib/onboarding.d.ts +40 -0
package/dist/lib/onboarding.d.ts.map +1 -0
package/dist/lib/onboarding.js +213 -0
package/dist/lib/onboarding.js.map +1 -0
package/dist/lib/physical-world-model.d.ts +50 -0
package/dist/lib/physical-world-model.d.ts.map +1 -0
package/dist/lib/physical-world-model.js +251 -0
package/dist/lib/physical-world-model.js.map +1 -0
package/dist/lib/planning-loop.d.ts +157 -0
package/dist/lib/planning-loop.d.ts.map +1 -0
package/dist/lib/planning-loop.js +537 -0
package/dist/lib/planning-loop.js.map +1 -0
package/dist/lib/policy-head.d.ts +13 -0
package/dist/lib/policy-head.d.ts.map +1 -1
package/dist/lib/policy-head.js +168 -2
package/dist/lib/policy-head.js.map +1 -1
package/dist/lib/resource-optimizer-middleware.d.ts +39 -0
package/dist/lib/resource-optimizer-middleware.d.ts.map +1 -0
package/dist/lib/resource-optimizer-middleware.js +222 -0
package/dist/lib/resource-optimizer-middleware.js.map +1 -0
package/dist/lib/resource-optimizer.d.ts +71 -0
package/dist/lib/resource-optimizer.d.ts.map +1 -0
package/dist/lib/resource-optimizer.js +228 -0
package/dist/lib/resource-optimizer.js.map +1 -0
package/dist/lib/rl-manager.d.ts +74 -0
package/dist/lib/rl-manager.d.ts.map +1 -0
package/dist/lib/rl-manager.js +245 -0
package/dist/lib/rl-manager.js.map +1 -0
package/dist/lib/service-analyzer.d.ts +76 -0
package/dist/lib/service-analyzer.d.ts.map +1 -0
package/dist/lib/service-analyzer.js +704 -0
package/dist/lib/service-analyzer.js.map +1 -0
package/dist/lib/service-gtm.js +2 -2
package/dist/lib/service-gtm.js.map +1 -1
package/dist/lib/service-questionnaire.d.ts +11 -0
package/dist/lib/service-questionnaire.d.ts.map +1 -0
package/dist/lib/service-questionnaire.js +89 -0
package/dist/lib/service-questionnaire.js.map +1 -0
package/dist/lib/setup/agent-generator.d.ts +2 -0
package/dist/lib/setup/agent-generator.d.ts.map +1 -1
package/dist/lib/setup/agent-generator.js +128 -4
package/dist/lib/setup/agent-generator.js.map +1 -1
package/dist/lib/setup/flow-generator.d.ts +10 -0
package/dist/lib/setup/flow-generator.d.ts.map +1 -0
package/dist/lib/setup/flow-generator.js +113 -0
package/dist/lib/setup/flow-generator.js.map +1 -0
package/dist/lib/setup/invariant-bridge.d.ts +91 -0
package/dist/lib/setup/invariant-bridge.d.ts.map +1 -0
package/dist/lib/setup/invariant-bridge.js +384 -0
package/dist/lib/setup/invariant-bridge.js.map +1 -0
package/dist/lib/setup/spec-generator.d.ts +41 -5
package/dist/lib/setup/spec-generator.d.ts.map +1 -1
package/dist/lib/setup/spec-generator.js +503 -29
package/dist/lib/setup/spec-generator.js.map +1 -1
package/dist/lib/setup/starter-intelligence.d.ts +25 -0
package/dist/lib/setup/starter-intelligence.d.ts.map +1 -0
package/dist/lib/setup/starter-intelligence.js +309 -0
package/dist/lib/setup/starter-intelligence.js.map +1 -0
package/dist/lib/stratus-client.js +1 -1
package/dist/lib/stratus-client.js.map +1 -1
package/dist/lib/surface-agent.d.ts +78 -0
package/dist/lib/surface-agent.d.ts.map +1 -0
package/dist/lib/surface-agent.js +105 -0
package/dist/lib/surface-agent.js.map +1 -0
package/dist/lib/surface-coordination-example.d.ts +30 -0
package/dist/lib/surface-coordination-example.d.ts.map +1 -0
package/dist/lib/surface-coordination-example.js +164 -0
package/dist/lib/surface-coordination-example.js.map +1 -0
package/dist/lib/telemetry/physical-world-collector.d.ts +15 -0
package/dist/lib/telemetry/physical-world-collector.d.ts.map +1 -0
package/dist/lib/telemetry/physical-world-collector.js +177 -0
package/dist/lib/telemetry/physical-world-collector.js.map +1 -0
package/dist/lib/telemetry/training-bridge.d.ts +51 -0
package/dist/lib/telemetry/training-bridge.d.ts.map +1 -0
package/dist/lib/telemetry/training-bridge.js +185 -0
package/dist/lib/telemetry/training-bridge.js.map +1 -0
package/dist/lib/telemetry.d.ts +2 -1
package/dist/lib/telemetry.d.ts.map +1 -1
package/dist/lib/telemetry.js +23 -2
package/dist/lib/telemetry.js.map +1 -1
package/dist/lib/tenet-board-agent.d.ts +52 -0
package/dist/lib/tenet-board-agent.d.ts.map +1 -0
package/dist/lib/tenet-board-agent.js +226 -0
package/dist/lib/tenet-board-agent.js.map +1 -0
package/dist/lib/tenet-ide-agent.d.ts +40 -0
package/dist/lib/tenet-ide-agent.d.ts.map +1 -0
package/dist/lib/tenet-ide-agent.js +199 -0
package/dist/lib/tenet-ide-agent.js.map +1 -0
package/dist/lib/workspace/data-pipeline.d.ts.map +1 -1
package/dist/lib/workspace/data-pipeline.js +27 -5
package/dist/lib/workspace/data-pipeline.js.map +1 -1
package/dist/lib/workspace/sidebar-runner.d.ts +13 -0
package/dist/lib/workspace/sidebar-runner.d.ts.map +1 -0
package/dist/lib/workspace/sidebar-runner.js +419 -0
package/dist/lib/workspace/sidebar-runner.js.map +1 -0
package/dist/lib/workspace/surface-registry.d.ts.map +1 -1
package/dist/lib/workspace/surface-registry.js +9 -1
package/dist/lib/workspace/surface-registry.js.map +1 -1
package/dist/lib/workspace/surfaces/agent-overview.d.ts +3 -3
package/dist/lib/workspace/surfaces/agent-overview.d.ts.map +1 -1
package/dist/lib/workspace/surfaces/agent-overview.js +3 -3
package/dist/lib/workspace/surfaces/agent-overview.js.map +1 -1
package/dist/lib/workspace/surfaces/index.d.ts +3 -0
package/dist/lib/workspace/surfaces/index.d.ts.map +1 -1
package/dist/lib/workspace/surfaces/index.js +3 -0
package/dist/lib/workspace/surfaces/index.js.map +1 -1
package/dist/lib/workspace/surfaces/kanban.d.ts +15 -0
package/dist/lib/workspace/surfaces/kanban.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/kanban.js +43 -0
package/dist/lib/workspace/surfaces/kanban.js.map +1 -0
package/dist/lib/workspace/surfaces/physical-world.d.ts +15 -0
package/dist/lib/workspace/surfaces/physical-world.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/physical-world.js +37 -0
package/dist/lib/workspace/surfaces/physical-world.js.map +1 -0
package/dist/lib/workspace/surfaces/sidebar.d.ts +22 -0
package/dist/lib/workspace/surfaces/sidebar.d.ts.map +1 -0
package/dist/lib/workspace/surfaces/sidebar.js +94 -0
package/dist/lib/workspace/surfaces/sidebar.js.map +1 -0
package/dist/lib/workspace/tmux-adapter.d.ts +8 -5
package/dist/lib/workspace/tmux-adapter.d.ts.map +1 -1
package/dist/lib/workspace/tmux-adapter.js +38 -7
package/dist/lib/workspace/tmux-adapter.js.map +1 -1
package/dist/lib/workspace/tmux-sidebar.d.ts +14 -0
package/dist/lib/workspace/tmux-sidebar.d.ts.map +1 -0
package/dist/lib/workspace/tmux-sidebar.js +230 -0
package/dist/lib/workspace/tmux-sidebar.js.map +1 -0
package/dist/types/flows.d.ts +2 -1
package/dist/types/flows.d.ts.map +1 -1
package/dist/types/physical-world-model.d.ts +65 -0
package/dist/types/physical-world-model.d.ts.map +1 -0
package/dist/types/physical-world-model.js +43 -0
package/dist/types/physical-world-model.js.map +1 -0
package/dist/types/telemetry.d.ts +37 -0
package/dist/types/telemetry.d.ts.map +1 -1
package/dist/types/world-model.d.ts.map +1 -1
package/dist/types/world-model.js +14 -7
package/dist/types/world-model.js.map +1 -1
package/dist/utils/context-hub-port.d.ts.map +1 -1
package/dist/utils/context-hub-port.js +6 -1
package/dist/utils/context-hub-port.js.map +1 -1
package/dist/utils/jfl-config.d.ts +7 -2
package/dist/utils/jfl-config.d.ts.map +1 -1
package/dist/utils/jfl-config.js +14 -4
package/dist/utils/jfl-config.js.map +1 -1
package/package.json +3 -2
package/packages/pi/extensions/context.ts +51 -1
package/packages/pi/extensions/hub-tools.ts +247 -0
package/packages/pi/extensions/index.ts +38 -6
package/packages/pi/extensions/memory-tool.ts +84 -4
package/packages/pi/extensions/service-skills.ts +214 -0
package/scripts/telemetry-dashboard.sh +44 -0
package/scripts/test-planning-loop-e2e.ts +181 -0
package/scripts/test-server-inference.ts +49 -0
package/scripts/test-state-sensitivity.ts +32 -0
package/scripts/train/v2/benchmark.py +661 -0
package/scripts/train/v2/generate_balanced.py +439 -0
package/scripts/train/v2/generate_hard_negatives.py +219 -0
package/scripts/train/v2/infer.py +149 -36
package/scripts/train/v2/infer_server.py +224 -0
package/scripts/train/v2/online_train.py +576 -0
package/scripts/train/v2/precompute.py +24 -6
package/template/CLAUDE.md +74 -132

package/scripts/test-planning-loop-e2e.ts ADDED Viewed

@@ -0,0 +1,181 @@
+/**
+ * End-to-end test for the Planning Loop
+ *
+ * Exercises: PolicyHead v2 → DynamicsModel rollouts → InvariantMonitor → Action Selection
+ *
+ * Run: npx tsx scripts/test-planning-loop-e2e.ts
+ */
+import { createPlanningLoop } from "../src/lib/planning-loop.js"
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+import type { PlanningResult, EvaluatedAction } from "../src/lib/planning-loop.js"
+const projectRoot = process.cwd()
+// ============================================================================
+// Test scenarios — represent real situations Peter Parker faces
+// ============================================================================
+const SCENARIOS = [
+  {
+    name: "Bug reported — tests failing",
+    agentId: "error-fixer",
+    goal: "Tests are failing in planning-loop.test.ts — TypeError on undefined property. Fix the failing test.",
+    expectedTypes: ["fix"],
+  },
+  {
+    name: "Feature request — add new capability",
+    agentId: "feature-builder",
+    goal: "Add multi-step rollout support to the planning loop for deeper lookahead.",
+    expectedTypes: ["feature"],
+  },
+  {
+    name: "Performance optimization",
+    agentId: "optimizer",
+    goal: "Reduce PolicyHead inference latency from 2s to under 500ms for interactive use.",
+    expectedTypes: ["experiment", "refactor"],
+  },
+  {
+    name: "Test coverage gap",
+    agentId: "test-coverage",
+    goal: "Add unit tests for the counterfactual training bridge — currently 0% coverage.",
+    expectedTypes: ["test"],
+  },
+  {
+    name: "Config change needed",
+    agentId: "config-updater",
+    goal: "Update the nightly pipeline schedule to run at 2am MST instead of midnight.",
+    expectedTypes: ["config"],
+  },
+]
+// ============================================================================
+// Helpers
+// ============================================================================
+function formatAction(ea: EvaluatedAction): string {
+  const pred = ea.prediction
+  const delta = pred.outcome?.immediate?.evalScoreChange
+  const deltaStr = delta !== undefined ? `Δ=${delta > 0 ? "+" : ""}${delta.toFixed(4)}` : "Δ=N/A"
+  const violations = ea.invariantViolations.length > 0 ? ` ⚠️${ea.invariantViolations.length} violations` : ""
+  const filtered = ea.filtered ? ` [FILTERED: ${ea.filterReason}]` : ""
+  return `  ${ea.action.actionType.padEnd(12)} conf=${ea.phConfidence.toFixed(3)} score=${ea.combinedScore.toFixed(3)} ${deltaStr} src=${pred.source}${violations}${filtered}`
+}
+function logResult(scenario: typeof SCENARIOS[0], result: PlanningResult) {
+  console.log(`\n${"═".repeat(70)}`)
+  console.log(`  Scenario: ${scenario.name}`)
+  console.log(`  Agent:    ${scenario.agentId}`)
+  console.log(`  Goal:     ${scenario.goal.slice(0, 70)}...`)
+  console.log(`${"─".repeat(70)}`)
+  console.log(`  Time:     ${result.planningTimeMs}ms`)
+  console.log(`  Rollouts: ${result.rolloutsPerformed}`)
+  console.log(`  Complete: ${result.completed}`)
+  console.log()
+  // All actions
+  console.log(`  Actions evaluated (${result.allActions.length}):`)
+  for (const ea of result.allActions) {
+    const selected = result.selectedAction === ea ? " ← SELECTED" : ""
+    console.log(`${formatAction(ea)}${selected}`)
+  }
+  // Selected action
+  if (result.selectedAction) {
+    const sel = result.selectedAction
+    const correctType = scenario.expectedTypes.includes(sel.action.actionType)
+    const check = correctType ? "✅" : "❌"
+    console.log(`\n  ${check} Selected: ${sel.action.actionType} (expected: ${scenario.expectedTypes.join("|")})`)
+  } else {
+    console.log(`\n  ❌ No action selected: ${result.noSelectionReason}`)
+  }
+}
+// ============================================================================
+// Main
+// ============================================================================
+async function main() {
+  console.log("╔══════════════════════════════════════════════════════════════════════╗")
+  console.log("║  Planning Loop — End-to-End Test                                    ║")
+  console.log("║  PH (v2 transformer) → DM (rollouts) → IM (invariants) → Select    ║")
+  console.log("╚══════════════════════════════════════════════════════════════════════╝")
+  // Check prerequisites
+  const ph = new PolicyHeadInference(projectRoot)
+  console.log(`\n  PolicyHead loaded: ${ph.isLoaded} (version: ${ph.version})`)
+  if (ph.stats) {
+    console.log(`  Trained on: ${ph.stats.trained_on} examples`)
+    const valAcc = ph.stats.val_accuracy ?? ph.stats.direction_accuracy
+    console.log(`  Val accuracy: ${(valAcc > 1 ? valAcc : valAcc * 100).toFixed(1)}%`)
+  }
+  if (!ph.isLoaded) {
+    console.error("\n  ❌ PolicyHead not loaded — cannot run e2e test")
+    console.error("  Copy checkpoint to .jfl/checkpoints/best_policy_head.pt")
+    process.exit(1)
+  }
+  // Create planning loop
+  const planner = createPlanningLoop(projectRoot, {
+    topK: 5,
+    verbose: true,
+    maxPlanningTimeMs: 30000, // 30s for test
+    checkInvariants: true,
+    recordTransitions: false, // Don't pollute real data during test
+    writeTrainingTuples: false,
+  })
+  console.log(`  Planning loop ready: ${planner.isReady}`)
+  // Run each scenario
+  let passed = 0
+  let failed = 0
+  const results: Array<{ scenario: string; result: PlanningResult; correct: boolean }> = []
+  for (const scenario of SCENARIOS) {
+    try {
+      console.log(`\n  Running: ${scenario.name}...`)
+      const result = await planner.plan(scenario.agentId, scenario.goal)
+      logResult(scenario, result)
+      const correct = result.selectedAction
+        ? scenario.expectedTypes.includes(result.selectedAction.action.actionType)
+        : false
+      if (correct) passed++
+      else failed++
+      results.push({ scenario: scenario.name, result, correct })
+    } catch (err: any) {
+      console.error(`\n  ❌ ${scenario.name} THREW: ${err.message}`)
+      failed++
+      results.push({
+        scenario: scenario.name,
+        result: null as any,
+        correct: false,
+      })
+    }
+  }
+  // Summary
+  console.log(`\n${"═".repeat(70)}`)
+  console.log(`  SUMMARY`)
+  console.log(`${"─".repeat(70)}`)
+  for (const r of results) {
+    const check = r.correct ? "✅" : "❌"
+    const time = r.result ? `${r.result.planningTimeMs}ms` : "ERRORED"
+    const selected = r.result?.selectedAction?.action.actionType ?? "none"
+    console.log(`  ${check} ${r.scenario.padEnd(35)} → ${selected.padEnd(12)} (${time})`)
+  }
+  console.log(`\n  Passed: ${passed}/${SCENARIOS.length}  Failed: ${failed}/${SCENARIOS.length}`)
+  console.log(`${"═".repeat(70)}`)
+  process.exit(failed > 0 ? 1 : 0)
+}
+main().catch(err => {
+  console.error("Fatal error:", err)
+  process.exit(1)
+})

package/scripts/test-server-inference.ts ADDED Viewed

@@ -0,0 +1,49 @@
+#!/usr/bin/env npx tsx
+/**
+ * Test the inference server path in PolicyHead
+ */
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+async function main() {
+  const ph = new PolicyHeadInference(".")
+  console.log("PH loaded:", ph.isLoaded, "version:", ph.version)
+  if (!ph.isLoaded || ph.version !== 2) {
+    console.log("v2 not loaded, aborting")
+    process.exit(1)
+  }
+  const state = {
+    composite_score: 0.72,
+    dimension_scores: { test_pass_rate: 0.85, build_health: 0.9, code_quality: 0.8 },
+    tests_passing: 17,
+    tests_total: 20,
+    trajectory_length: 3,
+    recent_deltas: [-0.03, 0.01],
+    agent: "error-fixer",
+  }
+  const goals = [
+    "Fix failing tests in planning-loop.test.ts — TypeError on undefined property",
+    "Add multi-step rollout support to the planning loop",
+    "Add unit tests for the counterfactual training bridge",
+    "Update the nightly pipeline schedule to run at 2am MST",
+    "Reduce PolicyHead inference latency from 20s to under 5s",
+  ]
+  for (const goal of goals) {
+    const t0 = Date.now()
+    const result = await ph.selectAction(state, goal)
+    const elapsed = Date.now() - t0
+    console.log(`[${elapsed}ms] ${result.action} (${(result.confidence * 100).toFixed(1)}%) ← ${goal.slice(0, 60)}`)
+  }
+  console.log("\nStopping server...")
+  ph.stopServer()
+  console.log("Done")
+}
+main().catch(err => {
+  console.error(err)
+  process.exit(1)
+})

package/scripts/test-state-sensitivity.ts ADDED Viewed

@@ -0,0 +1,32 @@
+#!/usr/bin/env npx tsx
+/**
+ * Test how state values affect PolicyHead predictions
+ */
+import { PolicyHeadInference } from "../src/lib/policy-head.js"
+async function main() {
+  const ph = new PolicyHeadInference(".")
+  if (!ph.isLoaded || ph.version !== 2) { process.exit(1) }
+  const goal = "Add multi-step rollout support to the planning loop"
+  const states = [
+    { label: "healthy (all high)", composite_score: 0.95, dimension_scores: { test_pass_rate: 1.0, build_health: 1.0, code_quality: 0.95 }, tests_passing: 25, tests_total: 25, trajectory_length: 5, recent_deltas: [0.02, 0.01], agent: "feature-builder" },
+    { label: "degraded tests", composite_score: 0.72, dimension_scores: { test_pass_rate: 0.85, build_health: 0.9, code_quality: 0.8 }, tests_passing: 17, tests_total: 20, trajectory_length: 3, recent_deltas: [-0.03], agent: "error-fixer" },
+    { label: "low coverage", composite_score: 0.55, dimension_scores: { test_pass_rate: 1.0, build_health: 0.9, code_quality: 0.5 }, tests_passing: 15, tests_total: 15, trajectory_length: 2, recent_deltas: [0.01], agent: "test-coverage" },
+    { label: "fresh start", composite_score: 0.3, dimension_scores: { test_pass_rate: 0.5, build_health: 0.5, code_quality: 0.5 }, tests_passing: 5, tests_total: 10, trajectory_length: 0, recent_deltas: [], agent: "onboarding" },
+    { label: "near perfect", composite_score: 0.98, dimension_scores: { test_pass_rate: 1.0, build_health: 1.0, code_quality: 1.0, hub_health: 1.0 }, tests_passing: 30, tests_total: 30, trajectory_length: 10, recent_deltas: [0.005, 0.003], agent: "optimizer" },
+  ]
+  for (const s of states) {
+    const { label, ...state } = s
+    const t0 = Date.now()
+    const result = await ph.selectAction(state as any, goal)
+    const elapsed = Date.now() - t0
+    const alts = result.alternatives?.map(a => `${a.action}(${(a.confidence*100).toFixed(0)}%)`).join(", ") || ""
+    console.log(`[${elapsed}ms] ${label}: ${result.action} (${(result.confidence*100).toFixed(1)}%) | alts: ${alts}`)
+  }
+  ph.stopServer()
+}
+main().catch(err => { console.error(err); process.exit(1) })