npm - ultimate-pi - Versions diffs - 0.13.0 → 0.14.0 - Mend

ultimate-pi 0.13.0 → 0.14.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

package/{.pi → .agents}/skills/ccc/SKILL.md +1 -7
package/.agents/skills/ccc/references/settings.md +126 -0
package/.agents/skills/harness-debate-plan/SKILL.md +61 -21
package/.agents/skills/harness-orchestration/SKILL.md +1 -1
package/.pi/agents/harness/planning/plan-adversary.md +2 -2
package/.pi/agents/harness/planning/plan-evaluator.md +3 -1
package/.pi/agents/harness/planning/review-integrator.md +4 -2
package/.pi/extensions/debate-orchestrator.ts +39 -435
package/.pi/extensions/harness-debate-tools.ts +519 -0
package/.pi/extensions/harness-plan-approval.ts +41 -17
package/.pi/extensions/harness-run-context.ts +18 -0
package/.pi/extensions/lib/debate-bus-core.ts +434 -0
package/.pi/extensions/lib/debate-bus-state.ts +58 -0
package/.pi/extensions/lib/harness-spawn-budget.ts +5 -25
package/.pi/extensions/lib/plan-approval/dialog.ts +33 -272
package/.pi/extensions/lib/plan-approval/format-plan.ts +12 -85
package/.pi/extensions/lib/plan-approval/plan-review.ts +6 -6
package/.pi/extensions/lib/plan-approval/render.ts +6 -0
package/.pi/extensions/lib/plan-approval/validate.ts +1 -1
package/.pi/extensions/lib/plan-debate-envelope.ts +2 -0
package/.pi/extensions/lib/plan-debate-gate.ts +155 -0
package/.pi/extensions/lib/plan-debate-id.ts +39 -0
package/.pi/extensions/lib/plan-debate-lane.ts +220 -0
package/.pi/extensions/lib/plan-debate-round-status.ts +94 -0
package/.pi/extensions/lib/plan-debate-write-guard.ts +20 -0
package/.pi/extensions/lib/plan-messenger.ts +276 -0
package/.pi/extensions/lib/plan-review-integrator-rules.ts +119 -0
package/.pi/extensions/lib/plan-scope-guard.ts +89 -0
package/.pi/harness/agents.manifest.json +7 -7
package/.pi/prompts/harness-plan.md +22 -12
package/CHANGELOG.md +18 -0
package/THIRD_PARTY_NOTICES.md +1 -1
package/package.json +3 -3
package/.agents/skills/ck-search/SKILL.md +0 -23
package/.agents/skills/cocoindex-search/SKILL.md +0 -35
package/.agents/skills/obsidian-bases/SKILL.md +0 -299
package/.agents/skills/obsidian-markdown/SKILL.md +0 -237
package/.pi/extensions/lib/plan-approval/fallback.ts +0 -50
/package/{.pi → .agents}/skills/ccc/references/management.md +0 -0

package/.pi/extensions/lib/debate-bus-core.ts ADDED Viewed

@@ -0,0 +1,434 @@
+/**
+ * Headless pi-debate-bus/v1 transport (shared by commands + harness debate tools).
+ */
+import { appendFile, mkdir, writeFile } from "node:fs/promises";
+import { join } from "node:path";
+import {
+	type DebateParticipant,
+	debatePhaseFromId,
+	isPlanDebateId,
+	PLAN_DEBATE_PARTICIPANTS,
+	POST_EXECUTE_DEBATE_PARTICIPANTS,
+} from "../../lib/debate-orchestrator-types.js";
+import {
+	type DebateState,
+	getDebateState,
+	getLastSeverity,
+	type SeverityScores,
+	setDebateState,
+	setLastSeverity,
+} from "./debate-bus-state.js";
+export type PolicyDecision =
+	| "pass"
+	| "conditional_pass"
+	| "block"
+	| "human_required";
+export interface RoundPayload {
+	participants: DebateParticipant[];
+	claims: string[];
+	rebuttals: string[];
+	evidence_refs: string[];
+	token_usage: {
+		per_agent: Record<string, number>;
+		round_total: number;
+	};
+	consensus_delta: number;
+	severity_scores?: SeverityScores;
+	review_gate_ready?: boolean;
+}
+export interface BusEnvelope<T = unknown> {
+	protocol: "pi-debate-bus/v1";
+	kind: "open" | "round" | "consensus" | "budget_exhausted";
+	correlation: {
+		run_id: string;
+		debate_id: string;
+		round_index?: number;
+		sender: DebateParticipant | "system";
+	};
+	payload: T;
+}
+const DEBATES_DIR = join(process.cwd(), ".pi", "harness", "debates");
+const WEIGHTS = {
+	claim_quality: 0.2,
+	reproducibility: 0.4,
+	agreement: 0.4,
+};
+const THRESHOLDS = {
+	correctness: 0.7,
+	security: 0.7,
+	architecture: 0.8,
+	test_integrity: 0.8,
+};
+const HARD_STOP_DEBATE_CAPS = process.env.HARNESS_DEBATE_HARD_STOP === "true";
+const PLAN_BUDGET = {
+	max_rounds: 4,
+	round_token_cap: 2000,
+	debate_global_cap: 12000,
+} as const;
+const AGGRESSIVE_BUDGET = {
+	max_rounds: 6,
+	round_token_cap: 2500,
+	debate_global_cap: 35000,
+} as const;
+function nowIso(): string {
+	return new Date().toISOString();
+}
+function toSafeFloat(value: unknown): number {
+	const n = Number(value);
+	if (Number.isNaN(n) || !Number.isFinite(n)) return 0;
+	return Math.max(0, Math.min(1, n));
+}
+export function capsForDebate(debateId: string): {
+	name: "plan" | "aggressive";
+	max_rounds: number;
+	round_token_cap: number;
+	debate_global_cap: number;
+} {
+	if (isPlanDebateId(debateId)) {
+		return { name: "plan", ...PLAN_BUDGET };
+	}
+	return { name: "aggressive", ...AGGRESSIVE_BUDGET };
+}
+function participantAllowed(
+	participant: string,
+	phase: DebateState["debate_phase"],
+): boolean {
+	if (phase === "plan") {
+		return (PLAN_DEBATE_PARTICIPANTS as readonly string[]).includes(
+			participant,
+		);
+	}
+	return (POST_EXECUTE_DEBATE_PARTICIPANTS as readonly string[]).includes(
+		participant,
+	);
+}
+async function ensureDebatesDir(): Promise<void> {
+	await mkdir(DEBATES_DIR, { recursive: true });
+}
+export async function writeDebateEvent(
+	debateId: string,
+	event: unknown,
+): Promise<void> {
+	await ensureDebatesDir();
+	const path = join(DEBATES_DIR, `${debateId}.jsonl`);
+	await appendFile(path, `${JSON.stringify(event)}\n`, "utf-8");
+}
+function decidePolicy(
+	severity: SeverityScores,
+	minEvidenceConfidence: number,
+): PolicyDecision {
+	if (
+		severity.security >= THRESHOLDS.security ||
+		severity.correctness >= THRESHOLDS.correctness ||
+		severity.architecture >= THRESHOLDS.architecture ||
+		severity.test_integrity >= THRESHOLDS.test_integrity
+	) {
+		return "block";
+	}
+	if (minEvidenceConfidence < 0.55) return "human_required";
+	if (minEvidenceConfidence < 0.75) return "conditional_pass";
+	return "pass";
+}
+export function parseRoundEnvelope(
+	raw: string,
+): BusEnvelope<RoundPayload> | null {
+	try {
+		const parsed = JSON.parse(raw) as BusEnvelope<RoundPayload>;
+		if (parsed?.protocol !== "pi-debate-bus/v1") return null;
+		if (parsed?.kind !== "round") return null;
+		return parsed;
+	} catch {
+		return null;
+	}
+}
+export interface DebateBusHooks {
+	appendEntry: (customType: string, data: unknown) => void;
+}
+export async function openDebateBus(
+	runId: string,
+	debateId: string,
+	hooks: DebateBusHooks,
+): Promise<DebateState> {
+	const caps = capsForDebate(debateId);
+	const debate_phase = debatePhaseFromId(debateId);
+	const next: DebateState = {
+		run_id: runId,
+		debate_id: debateId,
+		debate_phase,
+		round_count: 0,
+		budget_used: 0,
+		max_rounds: caps.max_rounds,
+		round_token_cap: caps.round_token_cap,
+		debate_global_cap: caps.debate_global_cap,
+		last_review_gate_ready: false,
+	};
+	setDebateState(next);
+	setLastSeverity({
+		correctness: 0,
+		security: 0,
+		architecture: 0,
+		test_integrity: 0,
+	});
+	hooks.appendEntry("harness-debate-state", next);
+	const envelope: BusEnvelope = {
+		protocol: "pi-debate-bus/v1",
+		kind: "open",
+		correlation: {
+			run_id: runId,
+			debate_id: debateId,
+			sender: "system",
+		},
+		payload: {
+			opened_at: nowIso(),
+			debate_phase,
+			budget_profile: caps.name,
+		},
+	};
+	hooks.appendEntry("harness-debate-envelope", envelope);
+	await writeDebateEvent(debateId, envelope);
+	return next;
+}
+async function emitBudgetExhausted(
+	state: DebateState,
+	reason: string,
+	hooks: DebateBusHooks,
+): Promise<void> {
+	const envelope: BusEnvelope = {
+		protocol: "pi-debate-bus/v1",
+		kind: "budget_exhausted",
+		correlation: {
+			run_id: state.run_id,
+			debate_id: state.debate_id,
+			round_index: state.round_count,
+			sender: "system",
+		},
+		payload: {
+			schema_version: "1.0.0",
+			contract_version: "1.0.0",
+			event_type: "budget_exhausted",
+			run_id: state.run_id,
+			debate_id: state.debate_id,
+			round_count: state.round_count,
+			budget_used: state.budget_used,
+			exhaustion_reason: reason,
+			caps: {
+				max_rounds: state.max_rounds,
+				round_token_cap: state.round_token_cap,
+				debate_global_cap: state.debate_global_cap,
+			},
+			minimum_evidence_confidence: 0.6,
+			default_policy_outcome: "block",
+			human_override_allowed: true,
+		},
+	};
+	hooks.appendEntry("harness-debate-envelope", envelope);
+	hooks.appendEntry("harness-budget-exhausted", envelope.payload);
+	await writeDebateEvent(state.debate_id, envelope);
+}
+export async function acceptDebateRound(
+	envelope: BusEnvelope<RoundPayload>,
+	hooks: DebateBusHooks,
+): Promise<{ ok: boolean; reason?: string; state?: DebateState }> {
+	const state = getDebateState();
+	if (!state) return { ok: false, reason: "no active debate" };
+	if (state.debate_id !== envelope.correlation.debate_id) {
+		return { ok: false, reason: "debate id mismatch" };
+	}
+	for (const p of envelope.payload.participants ?? []) {
+		if (!participantAllowed(p, state.debate_phase)) {
+			return {
+				ok: false,
+				reason: `participant ${p} invalid for debate_phase=${state.debate_phase}`,
+			};
+		}
+	}
+	const nextRound = state.round_count + 1;
+	if (nextRound > state.max_rounds) {
+		await emitBudgetExhausted(state, "max_rounds_reached", hooks);
+		if (HARD_STOP_DEBATE_CAPS) {
+			return { ok: false, reason: "max rounds reached" };
+		}
+	}
+	const perAgent = envelope.payload.token_usage?.per_agent ?? {};
+	for (const [agent, tokens] of Object.entries(perAgent)) {
+		if (Number(tokens) > state.round_token_cap) {
+			await emitBudgetExhausted(state, "round_token_cap_exceeded", hooks);
+			if (HARD_STOP_DEBATE_CAPS) {
+				return { ok: false, reason: `round cap exceeded by ${agent}` };
+			}
+		}
+	}
+	const roundTotal = Number(envelope.payload.token_usage?.round_total ?? 0);
+	if (state.budget_used + roundTotal > state.debate_global_cap) {
+		await emitBudgetExhausted(state, "debate_global_cap_exceeded", hooks);
+		if (HARD_STOP_DEBATE_CAPS) {
+			return { ok: false, reason: "global cap exceeded" };
+		}
+	}
+	state.round_count = nextRound;
+	state.budget_used += roundTotal;
+	if (envelope.payload.review_gate_ready === true) {
+		state.last_review_gate_ready = true;
+	}
+	if (envelope.payload.review_gate_ready === false) {
+		state.last_review_gate_ready = false;
+	}
+	setDebateState(state);
+	hooks.appendEntry("harness-debate-state", state);
+	if (envelope.payload.severity_scores) {
+		setLastSeverity({
+			correctness: toSafeFloat(envelope.payload.severity_scores.correctness),
+			security: toSafeFloat(envelope.payload.severity_scores.security),
+			architecture: toSafeFloat(envelope.payload.severity_scores.architecture),
+			test_integrity: toSafeFloat(
+				envelope.payload.severity_scores.test_integrity,
+			),
+		});
+	}
+	const profileName =
+		state.debate_phase === "plan" ? ("plan" as const) : ("aggressive" as const);
+	const roundRecord = {
+		schema_version: "1.0.0",
+		contract_version: "1.0.0",
+		run_id: state.run_id,
+		debate_id: state.debate_id,
+		round_index: state.round_count,
+		participants: envelope.payload.participants,
+		claims: envelope.payload.claims,
+		rebuttals: envelope.payload.rebuttals,
+		evidence_refs: envelope.payload.evidence_refs,
+		token_usage: envelope.payload.token_usage,
+		budget_profile: {
+			name: profileName,
+			max_rounds: state.max_rounds,
+			round_token_cap: state.round_token_cap,
+			debate_global_cap: state.debate_global_cap,
+		},
+		consensus_delta: Number(envelope.payload.consensus_delta ?? 0),
+		review_gate_ready: envelope.payload.review_gate_ready,
+	};
+	hooks.appendEntry("harness-round-result", roundRecord);
+	hooks.appendEntry("harness-debate-envelope", envelope);
+	await writeDebateEvent(state.debate_id, envelope);
+	return { ok: true, state };
+}
+export async function finalizeDebateConsensus(
+	rationale: string,
+	hooks: DebateBusHooks,
+): Promise<PolicyDecision | null> {
+	const state = getDebateState();
+	if (!state) return null;
+	const lastSeverity = getLastSeverity();
+	const evidenceScore = Math.max(
+		0,
+		Math.min(
+			1,
+			lastSeverity.correctness * WEIGHTS.claim_quality +
+				(1 - Math.max(lastSeverity.security, lastSeverity.test_integrity)) *
+					WEIGHTS.reproducibility +
+				Math.max(
+					0,
+					1 - Math.abs(lastSeverity.architecture - lastSeverity.correctness),
+				) *
+					WEIGHTS.agreement,
+		),
+	);
+	const decision = decidePolicy(lastSeverity, evidenceScore);
+	const planPhase = state.debate_phase === "plan";
+	const evaluatorPassed = planPhase
+		? Boolean(state.last_review_gate_ready)
+		: true;
+	const debateComplete = planPhase
+		? state.round_count >= state.max_rounds
+		: state.round_count > 0;
+	const consensus = {
+		schema_version: "1.0.0",
+		contract_version: "1.0.0",
+		run_id: state.run_id,
+		debate_id: state.debate_id,
+		debate_phase: state.debate_phase,
+		round_count: state.round_count,
+		budget_used: state.budget_used,
+		severity_scores: lastSeverity,
+		severity_thresholds: {
+			correctness_block_at: THRESHOLDS.correctness,
+			security_block_at: THRESHOLDS.security,
+			architecture_block_at: THRESHOLDS.architecture,
+			test_integrity_block_at: THRESHOLDS.test_integrity,
+		},
+		confidence_weights: WEIGHTS,
+		evidence_refs: [],
+		strict_gate_prerequisites: planPhase
+			? {
+					plan_gate_passed: false,
+					execution_completed: false,
+					evaluator_passed: evaluatorPassed,
+					adversarial_debate_completed: debateComplete,
+					severity_policy_ok: decision !== "block",
+					benchmark_delta_checks_passed: false,
+					rollback_artifacts_generated: false,
+				}
+			: {
+					plan_gate_passed: true,
+					execution_completed: true,
+					evaluator_passed: true,
+					adversarial_debate_completed: debateComplete,
+					severity_policy_ok: decision !== "block",
+					benchmark_delta_checks_passed: false,
+					rollback_artifacts_generated: false,
+				},
+		policy_decision: decision,
+		rationale,
+	};
+	const envelope: BusEnvelope = {
+		protocol: "pi-debate-bus/v1",
+		kind: "consensus",
+		correlation: {
+			run_id: state.run_id,
+			debate_id: state.debate_id,
+			round_index: state.round_count,
+			sender: "system",
+		},
+		payload: consensus,
+	};
+	await writeFile(
+		join(DEBATES_DIR, `${state.debate_id}.consensus.json`),
+		`${JSON.stringify(consensus, null, 2)}\n`,
+		"utf-8",
+	);
+	hooks.appendEntry("harness-consensus-packet", consensus);
+	hooks.appendEntry("harness-debate-envelope", envelope);
+	await writeDebateEvent(state.debate_id, envelope);
+	return decision;
+}

package/.pi/extensions/lib/debate-bus-state.ts ADDED Viewed

@@ -0,0 +1,58 @@
+/**
+ * Shared in-process debate bus state (one session per Pi process).
+ */
+import type { DebateParticipant } from "../../lib/debate-orchestrator-types.js";
+export type DebatePhase = "plan" | "post_execute";
+export interface DebateState {
+	run_id: string;
+	debate_id: string;
+	debate_phase: DebatePhase;
+	round_count: number;
+	budget_used: number;
+	max_rounds: number;
+	round_token_cap: number;
+	debate_global_cap: number;
+	last_review_gate_ready?: boolean;
+}
+export interface SeverityScores {
+	correctness: number;
+	security: number;
+	architecture: number;
+	test_integrity: number;
+}
+let state: DebateState | null = null;
+let lastSeverity: SeverityScores = {
+	correctness: 0,
+	security: 0,
+	architecture: 0,
+	test_integrity: 0,
+};
+export function getDebateState(): DebateState | null {
+	return state;
+}
+export function setDebateState(next: DebateState | null): void {
+	state = next;
+}
+export function getLastSeverity(): SeverityScores {
+	return lastSeverity;
+}
+export function setLastSeverity(next: SeverityScores): void {
+	lastSeverity = next;
+}
+export function restoreDebateStateFromEntry(data: unknown): void {
+	if (data && typeof data === "object") {
+		state = data as DebateState;
+	}
+}
+export type { DebateParticipant };

package/.pi/extensions/lib/harness-spawn-budget.ts CHANGED Viewed

@@ -1,10 +1,8 @@
 /**
- * Harness subagent spawn caps (subprocess model).
+ * Harness subagent spawn accounting (subprocess model).
+ * No session caps — parallel batches are limited only by host resources.
  */
-export const HARNESS_MAX_ACTIVE_SUBAGENTS = 8;
-export const HARNESS_MAX_SUBAGENT_SPAWNS_PER_SESSION = 12;
 export function isHarnessAgentType(type: string): boolean {
 	return type.startsWith("harness/");
 }
@@ -33,29 +31,11 @@ export function countHarnessAgentsInRequest(params: {
 	return { harnessCount: harness.length, agents: harness };
 }
+/** Always allows spawn; state is tracked for telemetry only. */
 export function checkHarnessSpawnBudget(
-	state: SpawnBudgetState,
-	incomingHarnessTasks: number,
+	_state: SpawnBudgetState,
+	_incomingHarnessTasks: number,
 ): { ok: boolean; message?: string } {
-	if (state.active + incomingHarnessTasks > HARNESS_MAX_ACTIVE_SUBAGENTS) {
-		return {
-			ok: false,
-			message:
-				`Harness subagent limit reached (${state.active} active + ${incomingHarnessTasks} requested > ${HARNESS_MAX_ACTIVE_SUBAGENTS}). ` +
-				`Wait for in-flight subagent calls to finish before spawning more.`,
-		};
-	}
-	if (
-		state.totalHarnessSpawns + incomingHarnessTasks >
-		HARNESS_MAX_SUBAGENT_SPAWNS_PER_SESSION
-	) {
-		return {
-			ok: false,
-			message:
-				`Harness subagent spawn cap reached (${state.totalHarnessSpawns + incomingHarnessTasks}/${HARNESS_MAX_SUBAGENT_SPAWNS_PER_SESSION} this session). ` +
-				`Finish the current harness phase or start a new session.`,
-		};
-	}
 	return { ok: true };
 }