npm - ultimate-pi - Versions diffs - 0.10.1 → 0.11.0 - Mend

ultimate-pi 0.10.1 → 0.11.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (50) hide show

package/.agents/skills/harness-decisions/SKILL.md +3 -3
package/.agents/skills/harness-orchestration/SKILL.md +19 -11
package/.agents/skills/harness-plan/SKILL.md +15 -9
package/.pi/agents/harness/planner.md +6 -47
package/.pi/agents/harness/planning/decompose.md +84 -0
package/.pi/agents/harness/planning/hypothesis-eval.md +59 -0
package/.pi/agents/harness/planning/hypothesis.md +90 -0
package/.pi/agents/harness/planning/plan-adversary.md +50 -0
package/.pi/agents/harness/planning/planner.md +20 -0
package/.pi/agents/harness/planning/scout-graphify.md +48 -0
package/.pi/agents/harness/planning/scout-semantic.md +42 -0
package/.pi/agents/harness/planning/scout-structure.md +44 -0
package/.pi/extensions/harness-ask-user.ts +5 -0
package/.pi/extensions/harness-plan-approval.ts +137 -3
package/.pi/extensions/harness-run-context.ts +1 -1
package/.pi/extensions/harness-subagents.ts +8 -3
package/.pi/extensions/harness-web-tools.ts +2 -0
package/.pi/extensions/lib/extension-load-guard.ts +39 -0
package/.pi/extensions/lib/harness-subagents/harness-subagent-policy.ts +33 -5
package/.pi/extensions/lib/harness-subagents/parent-harness-ui-bridge.ts +2 -175
package/.pi/extensions/lib/harness-subagents/parent-harness-ui-hooks.ts +18 -0
package/.pi/extensions/lib/harness-subagents/spawn-policy.ts +1 -5
package/.pi/extensions/lib/harness-subagents/vendored/agent-runner.ts +0 -18
package/.pi/extensions/lib/harness-subagents/vendored/index.ts +1 -35
package/.pi/extensions/lib/plan-approval/create-plan.ts +5 -0
package/.pi/extensions/lib/plan-approval/plan-review.ts +393 -0
package/.pi/extensions/lib/plan-approval/schema.ts +16 -1
package/.pi/extensions/lib/plan-approval/types.ts +10 -0
package/.pi/extensions/lib/plan-approval/validate.ts +2 -0
package/.pi/extensions/policy-gate.ts +1 -1
package/.pi/extensions/ultimate-pi-vcc.ts +5 -0
package/.pi/harness/agents.manifest.json +114 -82
package/.pi/harness/docs/adrs/0032-harness-command-orchestration.md +3 -3
package/.pi/harness/docs/adrs/0033-parent-orchestrated-planning.md +34 -0
package/.pi/harness/docs/adrs/0034-darwin-plan-research-pipeline.md +41 -0
package/.pi/harness/docs/adrs/README.md +2 -0
package/.pi/harness/specs/README.md +1 -1
package/.pi/harness/specs/harness-spawn-context.schema.json +2 -1
package/.pi/harness/specs/plan-adversary-brief.schema.json +45 -0
package/.pi/harness/specs/plan-decomposition-brief.schema.json +108 -0
package/.pi/harness/specs/plan-hypothesis-brief.schema.json +96 -0
package/.pi/harness/specs/plan-hypothesis-eval.schema.json +61 -0
package/.pi/lib/harness-run-context.ts +12 -0
package/.pi/prompts/harness-auto.md +1 -1
package/.pi/prompts/harness-plan.md +111 -28
package/.pi/prompts/harness-setup.md +1 -1
package/.pi/scripts/harness-resolve-up-pkg.mjs +13 -0
package/CHANGELOG.md +12 -0
package/biome.json +4 -1
package/package.json +2 -2

package/.pi/harness/agents.manifest.json CHANGED Viewed

@@ -1,84 +1,116 @@
 {
-  "schema_version": "1.0.0",
-  "package": "ultimate-pi",
-  "package_version": "0.9.0",
-  "generated_at": "2026-05-17T10:06:28.388Z",
-  "agents": {
-    "pi-pi/agent-expert": {
-      "path": ".pi/agents/pi-pi/agent-expert.md",
-      "sha256": "86561eb092b92fa43f221bfc6305de8d5afe10d43c5f577b9bf15a71bda051c6"
-    },
-    "pi-pi/cli-expert": {
-      "path": ".pi/agents/pi-pi/cli-expert.md",
-      "sha256": "6ecdbc37c60f1da7c68d504187454c95197dd19bd7091d97d136c6fb9e866838"
-    },
-    "pi-pi/config-expert": {
-      "path": ".pi/agents/pi-pi/config-expert.md",
-      "sha256": "c23b9b70a4c326cca2d139f18de48f8db2e0e28fa5ceb8205600f25430822a40"
-    },
-    "pi-pi/ext-expert": {
-      "path": ".pi/agents/pi-pi/ext-expert.md",
-      "sha256": "47c64a9e2cffe00a50cac5541b0edc89fe8bcbd66ec3bb302eecc10d405a977f"
-    },
-    "pi-pi/keybinding-expert": {
-      "path": ".pi/agents/pi-pi/keybinding-expert.md",
-      "sha256": "bb83f5fd2178075c8374ef28c360339f7de9faeedf811670b43a536c5f65c58e"
-    },
-    "pi-pi/pi-orchestrator": {
-      "path": ".pi/agents/pi-pi/pi-orchestrator.md",
-      "sha256": "1323fc262112030320bdd7d7866fd69e1b861377bb30fd3553a5e3a4398f9090"
-    },
-    "pi-pi/prompt-expert": {
-      "path": ".pi/agents/pi-pi/prompt-expert.md",
-      "sha256": "0d9f5e3e8ab162149cac8f08e159a7b2150a11f53ebe7021e72f8277fa004d0c"
-    },
-    "pi-pi/skill-expert": {
-      "path": ".pi/agents/pi-pi/skill-expert.md",
-      "sha256": "91732a2479097a2645b6af56171d5cdc1ed67a0896ca54bc4badba250341698f"
-    },
-    "pi-pi/theme-expert": {
-      "path": ".pi/agents/pi-pi/theme-expert.md",
-      "sha256": "3d256049203356d87c36eac2232c0ad6261fec8af02eb15d3144b18a400ed64d"
-    },
-    "pi-pi/tui-expert": {
-      "path": ".pi/agents/pi-pi/tui-expert.md",
-      "sha256": "a619b2ee3d3d94fe599abb61db0904f90d30335ec426851c3f1efdf2e5ce5390"
-    },
-    "harness/adversary": {
-      "path": ".pi/agents/harness/adversary.md",
-      "sha256": "b965f90610ca942d08b656f1aee839266d08a92beb174b8761dd5e840694a899"
-    },
-    "harness/evaluator": {
-      "path": ".pi/agents/harness/evaluator.md",
-      "sha256": "6c0de777a10de26dba4a6feb5641495fa5c2d31072a8b0e597a5ecc9921f129f"
-    },
-    "harness/executor": {
-      "path": ".pi/agents/harness/executor.md",
-      "sha256": "5af3ec2be4d64a738834e36d480a36c2bee4359e8cd5a2e1aac49be4cff79589"
-    },
-    "harness/incident-recorder": {
-      "path": ".pi/agents/harness/incident-recorder.md",
-      "sha256": "2de405f77b62dde38f331665bff220a3ef131c3c1cd42eebee364000fc83352b"
-    },
-    "harness/meta-optimizer": {
-      "path": ".pi/agents/harness/meta-optimizer.md",
-      "sha256": "ef2fb950e18e3a6439e91a68f764fc7ec922cd2d6b35de8f656f376854974d04"
-    },
-    "harness/planner": {
-      "path": ".pi/agents/harness/planner.md",
-      "sha256": "eb0459a1fcb018e4ca8d4339141e294828fa7014879d9a64258ae01abc13d3ad"
-    },
-    "harness/sentrux-bootstrap": {
-      "path": ".pi/agents/harness/sentrux-bootstrap.md",
-      "sha256": "3a0b43b94386a7c541b8a806a37524a5e53f1c8049270db7a420680df5799eeb"
-    },
-    "harness/tie-breaker": {
-      "path": ".pi/agents/harness/tie-breaker.md",
-      "sha256": "651f50b9e2c7903c542700e94908b1fcd026ebed12aa1f1d6ec481df3567e34f"
-    },
-    "harness/trace-librarian": {
-      "path": ".pi/agents/harness/trace-librarian.md",
-      "sha256": "d63fe08a2ea0466c0fd89fff4da03ac1d9d3580c306381cee251c89d4e8fdb97"
-    }
-  }
+	"schema_version": "1.0.0",
+	"package": "ultimate-pi",
+	"package_version": "0.10.1",
+	"generated_at": "2026-05-17T17:48:22.826Z",
+	"agents": {
+		"pi-pi/agent-expert": {
+			"path": ".pi/agents/pi-pi/agent-expert.md",
+			"sha256": "86561eb092b92fa43f221bfc6305de8d5afe10d43c5f577b9bf15a71bda051c6"
+		},
+		"pi-pi/cli-expert": {
+			"path": ".pi/agents/pi-pi/cli-expert.md",
+			"sha256": "6ecdbc37c60f1da7c68d504187454c95197dd19bd7091d97d136c6fb9e866838"
+		},
+		"pi-pi/config-expert": {
+			"path": ".pi/agents/pi-pi/config-expert.md",
+			"sha256": "c23b9b70a4c326cca2d139f18de48f8db2e0e28fa5ceb8205600f25430822a40"
+		},
+		"pi-pi/ext-expert": {
+			"path": ".pi/agents/pi-pi/ext-expert.md",
+			"sha256": "47c64a9e2cffe00a50cac5541b0edc89fe8bcbd66ec3bb302eecc10d405a977f"
+		},
+		"pi-pi/keybinding-expert": {
+			"path": ".pi/agents/pi-pi/keybinding-expert.md",
+			"sha256": "bb83f5fd2178075c8374ef28c360339f7de9faeedf811670b43a536c5f65c58e"
+		},
+		"pi-pi/pi-orchestrator": {
+			"path": ".pi/agents/pi-pi/pi-orchestrator.md",
+			"sha256": "1323fc262112030320bdd7d7866fd69e1b861377bb30fd3553a5e3a4398f9090"
+		},
+		"pi-pi/prompt-expert": {
+			"path": ".pi/agents/pi-pi/prompt-expert.md",
+			"sha256": "0d9f5e3e8ab162149cac8f08e159a7b2150a11f53ebe7021e72f8277fa004d0c"
+		},
+		"pi-pi/skill-expert": {
+			"path": ".pi/agents/pi-pi/skill-expert.md",
+			"sha256": "91732a2479097a2645b6af56171d5cdc1ed67a0896ca54bc4badba250341698f"
+		},
+		"pi-pi/theme-expert": {
+			"path": ".pi/agents/pi-pi/theme-expert.md",
+			"sha256": "3d256049203356d87c36eac2232c0ad6261fec8af02eb15d3144b18a400ed64d"
+		},
+		"pi-pi/tui-expert": {
+			"path": ".pi/agents/pi-pi/tui-expert.md",
+			"sha256": "a619b2ee3d3d94fe599abb61db0904f90d30335ec426851c3f1efdf2e5ce5390"
+		},
+		"harness/adversary": {
+			"path": ".pi/agents/harness/adversary.md",
+			"sha256": "b965f90610ca942d08b656f1aee839266d08a92beb174b8761dd5e840694a899"
+		},
+		"harness/evaluator": {
+			"path": ".pi/agents/harness/evaluator.md",
+			"sha256": "6c0de777a10de26dba4a6feb5641495fa5c2d31072a8b0e597a5ecc9921f129f"
+		},
+		"harness/executor": {
+			"path": ".pi/agents/harness/executor.md",
+			"sha256": "5af3ec2be4d64a738834e36d480a36c2bee4359e8cd5a2e1aac49be4cff79589"
+		},
+		"harness/incident-recorder": {
+			"path": ".pi/agents/harness/incident-recorder.md",
+			"sha256": "2de405f77b62dde38f331665bff220a3ef131c3c1cd42eebee364000fc83352b"
+		},
+		"harness/meta-optimizer": {
+			"path": ".pi/agents/harness/meta-optimizer.md",
+			"sha256": "ef2fb950e18e3a6439e91a68f764fc7ec922cd2d6b35de8f656f376854974d04"
+		},
+		"harness/planner": {
+			"path": ".pi/agents/harness/planner.md",
+			"sha256": "648b9e4c56a6c0f983ae990238952579bb4745af81eb6c79add5325ea4929c91"
+		},
+		"harness/sentrux-bootstrap": {
+			"path": ".pi/agents/harness/sentrux-bootstrap.md",
+			"sha256": "3a0b43b94386a7c541b8a806a37524a5e53f1c8049270db7a420680df5799eeb"
+		},
+		"harness/tie-breaker": {
+			"path": ".pi/agents/harness/tie-breaker.md",
+			"sha256": "651f50b9e2c7903c542700e94908b1fcd026ebed12aa1f1d6ec481df3567e34f"
+		},
+		"harness/trace-librarian": {
+			"path": ".pi/agents/harness/trace-librarian.md",
+			"sha256": "d63fe08a2ea0466c0fd89fff4da03ac1d9d3580c306381cee251c89d4e8fdb97"
+		},
+		"harness/planning/decompose": {
+			"path": ".pi/agents/harness/planning/decompose.md",
+			"sha256": "a4f33869759ebdc049e77b344ae050be5ede08ea9a92216b8599cc7d2f14c052"
+		},
+		"harness/planning/hypothesis-eval": {
+			"path": ".pi/agents/harness/planning/hypothesis-eval.md",
+			"sha256": "7a05e2f746bf79f20096cbfb12aaee31a0717e660680b44cb285ea967b3141e5"
+		},
+		"harness/planning/hypothesis": {
+			"path": ".pi/agents/harness/planning/hypothesis.md",
+			"sha256": "7f2af6dda328d6cc1279dbff20a46b1d93aacfda9d57857cc6117685f8a585dd"
+		},
+		"harness/planning/plan-adversary": {
+			"path": ".pi/agents/harness/planning/plan-adversary.md",
+			"sha256": "4beceb8c4181f82b7eb006d87392c0adb4c7ce41992193790888e7298c1b7594"
+		},
+		"harness/planning/planner": {
+			"path": ".pi/agents/harness/planning/planner.md",
+			"sha256": "570c501c976e26d79a36814787eb03fab6aa97f79cc895af319dc717648a2a65"
+		},
+		"harness/planning/scout-graphify": {
+			"path": ".pi/agents/harness/planning/scout-graphify.md",
+			"sha256": "76a66a3dc8bce60a91ed30ffdc683fb1eab0692006b0ee80fbdc67b11b374b61"
+		},
+		"harness/planning/scout-semantic": {
+			"path": ".pi/agents/harness/planning/scout-semantic.md",
+			"sha256": "99aedca25fd81000d3bb532e0191ce9e1a87b84ab4039f089734f3a0d24ba44b"
+		},
+		"harness/planning/scout-structure": {
+			"path": ".pi/agents/harness/planning/scout-structure.md",
+			"sha256": "83fd09e5eccd77b27d9de464d7e32536d9a762469e021b86b0ca665942bb40af"
+		}
+	}
 }

package/.pi/harness/docs/adrs/0032-harness-command-orchestration.md CHANGED Viewed

@@ -10,11 +10,11 @@ Harness slash prompts duplicated logic already defined in `harness/*` agents. Co
 ## Decision
 1. **Slash commands** (prompt templates) are orchestrators: spawn `harness/*` agents once, perform policy-gated writes, emit handoff blocks. Command identity is captured on Pi **`input`** as `harness-turn` (raw `/harness-*`), not from expanded prompt markdown.
-2. **Agents** perform multi-turn reads and emit structured JSON drafts. **Planner** runs clarification and plan approval via `ask_user` (parent UI bridge); planner does not write `plan-packet.json`.
+2. **Agents** perform multi-turn reads and emit structured JSON drafts. **Planning** (`harness/planning/*`) scouts and plan-adversary are read-only; parent orchestrator runs `ask_user`, `approve_plan`, and `create_plan` (see ADR 0033).
 3. **HarnessSpawnContext** is injected in `[HarnessRunContext]`; orchestrator copies it into spawn prompts. Subagents do not receive `[HarnessActivePlan]` injection.
 4. **Review isolation** uses `Agent` spawn with `inherit_context: false`. `review-integrity` allows `Agent` / `get_subagent_result` for evaluator/adversary/tie-breaker.
-5. **Subagent policy** blocks mutating tools for read-only phase agents; `ask_user` allowed for planner/evaluator/adversary/tie-breaker only.
-6. **Parent** does not duplicate planner `ask_user` or re-spawn for clarification. `get_subagent_result` syncs `harness-plan-approval` from subagent sessions.
+5. **Subagent policy** blocks mutating tools for read-only phase agents; `ask_user` bridged for evaluator/adversary/tie-breaker only (not planning scouts).
+6. **Parent** owns plan-phase `ask_user`, `approve_plan`, and `create_plan` per ADR 0033.
 ## Consequences

package/.pi/harness/docs/adrs/0033-parent-orchestrated-planning.md ADDED Viewed

@@ -0,0 +1,34 @@
+# ADR 0033: Parent-orchestrated harness planning
+- **Status:** Accepted
+- **Date:** 2026-05-17
+## Context
+`/harness-plan` delegated the full plan lifecycle to a single `harness/planner` subagent. Plans and approval UI were largely invisible in the parent transcript until `get_subagent_result`, and the orchestrator could not call `ask_user` / `approve_plan` / `create_plan` directly.
+## Decision
+1. **Parent orchestrator** runs `/harness-plan`: parallel read-only scouts under `harness/planning/*`, parent-built `PlanPacket`, `ask_user`, `harness/planning/plan-adversary`, then parent `approve_plan` + `create_plan`.
+2. **Planning agents** live in `.pi/agents/harness/planning/` (`scout-graphify`, `scout-structure`, `scout-semantic`, `plan-adversary`). Deprecated `harness/planner` shim retained at old path for one release.
+3. **`approve_plan` and `create_plan`** are parent-session tools only; subagents cannot call them.
+4. **`classifyHarnessAgent`** treats `harness/planning/*` as read-only (planner kind).
+## Consequences
+### Positive
+- Full plan visible in parent session; editor `plan-review.md` path surfaced from parent.
+- Specialized scouts (graphify, ast-grep, ck) run in parallel with clear JSON contracts.
+- Pre-approval adversary separate from post-run `harness/adversary`.
+### Negative
+- More subagent spawns per plan (3 scouts + adversary) vs one planner.
+- Parent prompt must parse multiple JSON blocks and handle partial scout failure.
+## References
+- `.pi/prompts/harness-plan.md`
+- `.pi/agents/harness/planning/`
+- ADR 0032

package/.pi/harness/docs/adrs/0034-darwin-plan-research-pipeline.md ADDED Viewed

@@ -0,0 +1,41 @@
+# ADR 0034: Darwin plan research pipeline
+- **Status:** Accepted
+- **Date:** 2026-05-17
+## Context
+`/harness-plan` (ADR 0033) parent-orchestrated scouts and a single adversary before approval. Users need vague tasks transformed into rigorous, falsifiable hypotheses before execution plans are approved — not only codebase maps and scope bullets.
+## Decision
+1. **Always-on research chain** after parallel scouts:
+   - `harness/planning/decompose` — DeepMind-style problem decomposition (`PlanDecompositionBrief`)
+   - `harness/planning/hypothesis` — DARWIN hypothesis generation (`PlanHypothesisBrief`)
+2. **Parent maps hypothesis → PlanPacket** — `plan-packet.schema.json` unchanged; execution gating stable.
+3. **Parallel pre-approval reviews:**
+   - `harness/planning/plan-adversary` — execution risk on PlanPacket
+   - `harness/planning/hypothesis-eval` — blind self-eval (task + hypothesis only)
+4. **`approve_plan` optional `research_brief`** — rendered in `plan-review.md`; not written to `plan-packet.json`.
+5. **`--quick`** still skips semantic scout only; never skips decompose/hypothesis.
+## Consequences
+### Positive
+- Plans grounded in explicit tensions, falsifiable claims, and experiments.
+- Self-eval isolated from decomposition (reduces grade inflation).
+- Editor review shows full research narrative plus PlanPacket.
+### Negative
+- More subagent spawns per plan (scouts + decompose + hypothesis + 2 reviews; optional hypothesis revision).
+- Longer plan phase latency and token cost.
+## References
+- `.pi/prompts/harness-plan.md`
+- `.pi/harness/specs/plan-decomposition-brief.schema.json`
+- `.pi/harness/specs/plan-hypothesis-brief.schema.json`
+- `.pi/harness/specs/plan-hypothesis-eval.schema.json`
+- ADR 0033

package/.pi/harness/docs/adrs/README.md CHANGED Viewed

@@ -18,6 +18,8 @@ Team-shared ADRs for the ultimate-pi harness live under `.pi/harness/docs/adrs/`
 | [0030](0030-inhouse-vcc-compaction.md) | In-house VCC compaction (vendored pi-vcc) | Accepted |
 | [0031](0031-harness-run-context.md) | Harness active run context | Accepted |
 | [0032](0032-harness-command-orchestration.md) | Harness commands as agent orchestrators | Accepted |
+| [0033](0033-parent-orchestrated-planning.md) | Parent-orchestrated harness planning | Accepted |
+| [0034](0034-darwin-plan-research-pipeline.md) | Darwin plan research pipeline | Accepted |
 ## Template

package/.pi/harness/specs/README.md CHANGED Viewed

@@ -13,7 +13,7 @@ This directory is the canonical contract surface for Phase 1 harness artifacts.
 These schemas define the minimum machine-readable contracts for:
-- planning (`PlanPacket`)
+- planning (`PlanPacket`, `PlanDecompositionBrief`, `PlanHypothesisBrief`, `PlanHypothesisEval`, `PlanAdversaryBrief`)
 - execution telemetry (`RunTrace`, `HarnessRunRecord`)
 - PostHog harness events (`HarnessPostHogEvent`)
 - observation bus (`HarnessObservation`)

package/.pi/harness/specs/harness-spawn-context.schema.json CHANGED Viewed

@@ -14,13 +14,14 @@
 		"agent": {
 			"type": "string",
 			"minLength": 1,
-			"description": "Target subagent id, e.g. harness/planner"
+			"description": "Target subagent id, e.g. harness/planning/scout-graphify"
 		},
 		"mode": {
 			"type": "string",
 			"enum": [
 				"create",
 				"revise",
+				"plan_review",
 				"execute",
 				"benchmark",
 				"verdict",

package/.pi/harness/specs/plan-adversary-brief.schema.json ADDED Viewed

@@ -0,0 +1,45 @@
+{
+	"$schema": "https://json-schema.org/draft/2020-12/schema",
+	"$id": "https://ultimate-pi.local/.pi/harness/specs/plan-adversary-brief.schema.json",
+	"title": "PlanAdversaryBrief",
+	"description": "Pre-approval adversarial review of a draft PlanPacket (plan phase only).",
+	"type": "object",
+	"additionalProperties": false,
+	"required": [
+		"schema_version",
+		"edge_cases",
+		"failure_modes",
+		"acceptance_gaps",
+		"mitigations",
+		"recommendation"
+	],
+	"properties": {
+		"schema_version": {
+			"type": "string",
+			"const": "1.0.0"
+		},
+		"edge_cases": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"failure_modes": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"acceptance_gaps": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"mitigations": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"recommendation": {
+			"type": "string",
+			"enum": ["proceed", "revise"]
+		},
+		"human_summary": {
+			"type": "string"
+		}
+	}
+}

package/.pi/harness/specs/plan-decomposition-brief.schema.json ADDED Viewed

@@ -0,0 +1,108 @@
+{
+	"$schema": "https://json-schema.org/draft/2020-12/schema",
+	"$id": "https://ultimate-pi.local/.pi/harness/specs/plan-decomposition-brief.schema.json",
+	"title": "PlanDecompositionBrief",
+	"description": "DeepMind-style problem decomposition (harness plan phase 1).",
+	"type": "object",
+	"additionalProperties": false,
+	"required": [
+		"schema_version",
+		"problem_restatement",
+		"problem_types",
+		"scope",
+		"hard_constraints",
+		"soft_constraints",
+		"success_metrics",
+		"prior_art",
+		"tensions",
+		"core_tension"
+	],
+	"properties": {
+		"schema_version": {
+			"type": "string",
+			"const": "1.0.0"
+		},
+		"problem_restatement": {
+			"type": "string",
+			"minLength": 1,
+			"description": "Precise restatement; what solving this looks like."
+		},
+		"problem_types": {
+			"type": "array",
+			"minItems": 1,
+			"items": {
+				"type": "string",
+				"enum": [
+					"optimization",
+					"discovery",
+					"explanation",
+					"design",
+					"selection"
+				]
+			}
+		},
+		"scope": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["narrowed_focus", "excluded"],
+			"properties": {
+				"narrowed_focus": {
+					"type": "string",
+					"minLength": 1
+				},
+				"excluded": {
+					"type": "array",
+					"items": { "type": "string", "minLength": 1 }
+				}
+			}
+		},
+		"hard_constraints": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"soft_constraints": {
+			"type": "array",
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"success_metrics": {
+			"type": "array",
+			"minItems": 1,
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"prior_art": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["best_approach", "gap", "dead_ends"],
+			"properties": {
+				"best_approach": { "type": "string", "minLength": 1 },
+				"gap": { "type": "string", "minLength": 1 },
+				"dead_ends": {
+					"type": "array",
+					"items": { "type": "string", "minLength": 1 }
+				}
+			}
+		},
+		"tensions": {
+			"type": "array",
+			"minItems": 1,
+			"items": {
+				"type": "object",
+				"additionalProperties": false,
+				"required": ["claim_a", "claim_b", "why_matters"],
+				"properties": {
+					"claim_a": { "type": "string", "minLength": 1 },
+					"claim_b": { "type": "string", "minLength": 1 },
+					"why_matters": { "type": "string", "minLength": 1 }
+				}
+			}
+		},
+		"core_tension": {
+			"type": "string",
+			"minLength": 1,
+			"description": "One paragraph summarizing the tension that feeds hypothesis generation."
+		},
+		"human_summary": {
+			"type": "string"
+		}
+	}
+}

package/.pi/harness/specs/plan-hypothesis-brief.schema.json ADDED Viewed

@@ -0,0 +1,96 @@
+{
+	"$schema": "https://json-schema.org/draft/2020-12/schema",
+	"$id": "https://ultimate-pi.local/.pi/harness/specs/plan-hypothesis-brief.schema.json",
+	"title": "PlanHypothesisBrief",
+	"description": "DARWIN-style hypothesis brief (harness plan phase 2).",
+	"type": "object",
+	"additionalProperties": false,
+	"required": [
+		"schema_version",
+		"primary",
+		"dialectical_fork",
+		"alternatives",
+		"recommended_next_steps"
+	],
+	"properties": {
+		"schema_version": {
+			"type": "string",
+			"const": "1.0.0"
+		},
+		"primary": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": [
+				"claim",
+				"mechanism",
+				"prediction",
+				"experiment",
+				"tension_resolution"
+			],
+			"properties": {
+				"claim": {
+					"type": "string",
+					"minLength": 1,
+					"description": "One falsifiable sentence."
+				},
+				"mechanism": {
+					"type": "string",
+					"minLength": 1,
+					"description": "Concrete processes, algorithms, principles."
+				},
+				"prediction": {
+					"type": "string",
+					"minLength": 1,
+					"description": "Measurable outcome that confirms the hypothesis."
+				},
+				"experiment": {
+					"type": "string",
+					"minLength": 1,
+					"description": "How to test: tools, datasets, benchmarks, protocols."
+				},
+				"tension_resolution": {
+					"type": "string",
+					"minLength": 1,
+					"description": "Link back to core_tension from decomposition."
+				}
+			}
+		},
+		"dialectical_fork": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["fork", "path_a", "path_b"],
+			"properties": {
+				"fork": {
+					"type": "string",
+					"minLength": 1,
+					"description": "Key assumption that splits approaches."
+				},
+				"path_a": { "type": "string", "minLength": 1 },
+				"path_b": { "type": "string", "minLength": 1 }
+			}
+		},
+		"alternatives": {
+			"type": "array",
+			"minItems": 1,
+			"maxItems": 3,
+			"items": {
+				"type": "object",
+				"additionalProperties": false,
+				"required": ["claim", "key_bet"],
+				"properties": {
+					"claim": { "type": "string", "minLength": 1 },
+					"key_bet": { "type": "string", "minLength": 1 }
+				}
+			}
+		},
+		"recommended_next_steps": {
+			"type": "array",
+			"minItems": 1,
+			"maxItems": 5,
+			"items": { "type": "string", "minLength": 1 }
+		},
+		"human_summary": {
+			"type": "string"
+		}
+	}
+}

package/.pi/harness/specs/plan-hypothesis-eval.schema.json ADDED Viewed

@@ -0,0 +1,61 @@
+{
+	"$schema": "https://json-schema.org/draft/2020-12/schema",
+	"$id": "https://ultimate-pi.local/.pi/harness/specs/plan-hypothesis-eval.schema.json",
+	"title": "PlanHypothesisEval",
+	"description": "Blind self-evaluation of a PlanHypothesisBrief (harness plan phase).",
+	"type": "object",
+	"additionalProperties": false,
+	"required": ["schema_version", "dimensions", "relevance", "human_summary"],
+	"properties": {
+		"schema_version": {
+			"type": "string",
+			"const": "1.0.0"
+		},
+		"dimensions": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["novelty", "coherence", "testability", "impact"],
+			"properties": {
+				"novelty": { "$ref": "#/$defs/scoredDimension" },
+				"coherence": { "$ref": "#/$defs/scoredDimension" },
+				"testability": { "$ref": "#/$defs/scoredDimension" },
+				"impact": { "$ref": "#/$defs/scoredDimension" }
+			}
+		},
+		"relevance": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["passes", "rationale"],
+			"properties": {
+				"passes": { "type": "boolean" },
+				"rationale": { "type": "string", "minLength": 1 }
+			}
+		},
+		"revision_recommended": {
+			"type": "boolean",
+			"description": "True when testability < 70 or relevance fails."
+		},
+		"human_summary": {
+			"type": "string",
+			"minLength": 1
+		}
+	},
+	"$defs": {
+		"scoredDimension": {
+			"type": "object",
+			"additionalProperties": false,
+			"required": ["score", "rationale"],
+			"properties": {
+				"score": {
+					"type": "integer",
+					"minimum": 0,
+					"maximum": 100
+				},
+				"rationale": {
+					"type": "string",
+					"minLength": 1
+				}
+			}
+		}
+	}
+}