npm - @chllming/wave-orchestration - Versions diffs - 0.5.4 → 0.6.1 - Mend

@chllming/wave-orchestration 0.5.4 → 0.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (126) hide show

package/CHANGELOG.md +52 -3
package/README.md +33 -5
package/docs/README.md +18 -4
package/docs/agents/wave-cont-eval-role.md +36 -0
package/docs/agents/{wave-evaluator-role.md → wave-cont-qa-role.md} +14 -11
package/docs/agents/wave-documentation-role.md +1 -1
package/docs/agents/wave-infra-role.md +1 -1
package/docs/agents/wave-integration-role.md +3 -3
package/docs/agents/wave-launcher-role.md +4 -3
package/docs/agents/wave-security-role.md +40 -0
package/docs/concepts/context7-vs-skills.md +1 -1
package/docs/concepts/what-is-a-wave.md +56 -6
package/docs/evals/README.md +166 -0
package/docs/evals/benchmark-catalog.json +663 -0
package/docs/guides/author-and-run-waves.md +135 -0
package/docs/guides/planner.md +5 -0
package/docs/guides/terminal-surfaces.md +2 -0
package/docs/plans/component-cutover-matrix.json +1 -1
package/docs/plans/component-cutover-matrix.md +1 -1
package/docs/plans/current-state.md +19 -1
package/docs/plans/examples/wave-example-live-proof.md +435 -0
package/docs/plans/migration.md +42 -0
package/docs/plans/wave-orchestrator.md +46 -7
package/docs/plans/waves/wave-0.md +4 -4
package/docs/reference/live-proof-waves.md +177 -0
package/docs/reference/migration-0.2-to-0.5.md +26 -19
package/docs/reference/npmjs-trusted-publishing.md +6 -5
package/docs/reference/runtime-config/README.md +14 -4
package/docs/reference/sample-waves.md +87 -0
package/docs/reference/skills.md +110 -42
package/docs/research/agent-context-sources.md +130 -11
package/docs/research/coordination-failure-review.md +266 -0
package/docs/roadmap.md +6 -2
package/package.json +2 -2
package/releases/manifest.json +35 -2
package/scripts/research/agent-context-archive.mjs +83 -1
package/scripts/research/manifests/agent-context-expanded-2026-03-22.mjs +811 -0
package/scripts/wave-orchestrator/adhoc.mjs +1331 -0
package/scripts/wave-orchestrator/agent-state.mjs +358 -6
package/scripts/wave-orchestrator/artifact-schemas.mjs +173 -0
package/scripts/wave-orchestrator/clarification-triage.mjs +10 -3
package/scripts/wave-orchestrator/config.mjs +48 -12
package/scripts/wave-orchestrator/context7.mjs +2 -0
package/scripts/wave-orchestrator/coord-cli.mjs +51 -19
package/scripts/wave-orchestrator/coordination-store.mjs +26 -4
package/scripts/wave-orchestrator/coordination.mjs +83 -9
package/scripts/wave-orchestrator/dashboard-state.mjs +20 -8
package/scripts/wave-orchestrator/dep-cli.mjs +5 -2
package/scripts/wave-orchestrator/docs-queue.mjs +8 -2
package/scripts/wave-orchestrator/evals.mjs +451 -0
package/scripts/wave-orchestrator/feedback.mjs +15 -1
package/scripts/wave-orchestrator/install.mjs +32 -9
package/scripts/wave-orchestrator/launcher-closure.mjs +281 -0
package/scripts/wave-orchestrator/launcher-runtime.mjs +334 -0
package/scripts/wave-orchestrator/launcher.mjs +709 -601
package/scripts/wave-orchestrator/ledger.mjs +123 -20
package/scripts/wave-orchestrator/local-executor.mjs +99 -12
package/scripts/wave-orchestrator/planner.mjs +177 -42
package/scripts/wave-orchestrator/replay.mjs +6 -3
package/scripts/wave-orchestrator/role-helpers.mjs +84 -0
package/scripts/wave-orchestrator/shared.mjs +75 -11
package/scripts/wave-orchestrator/skills.mjs +637 -106
package/scripts/wave-orchestrator/traces.mjs +71 -48
package/scripts/wave-orchestrator/wave-files.mjs +947 -101
package/scripts/wave.mjs +9 -0
package/skills/README.md +202 -0
package/skills/provider-aws/SKILL.md +111 -0
package/skills/provider-aws/adapters/claude.md +1 -0
package/skills/provider-aws/adapters/codex.md +1 -0
package/skills/provider-aws/references/service-verification.md +39 -0
package/skills/provider-aws/skill.json +50 -1
package/skills/provider-custom-deploy/SKILL.md +59 -0
package/skills/provider-custom-deploy/skill.json +46 -1
package/skills/provider-docker-compose/SKILL.md +90 -0
package/skills/provider-docker-compose/adapters/local.md +1 -0
package/skills/provider-docker-compose/skill.json +49 -1
package/skills/provider-github-release/SKILL.md +116 -1
package/skills/provider-github-release/adapters/claude.md +1 -0
package/skills/provider-github-release/adapters/codex.md +1 -0
package/skills/provider-github-release/skill.json +51 -1
package/skills/provider-kubernetes/SKILL.md +137 -0
package/skills/provider-kubernetes/adapters/claude.md +1 -0
package/skills/provider-kubernetes/adapters/codex.md +1 -0
package/skills/provider-kubernetes/references/kubectl-patterns.md +58 -0
package/skills/provider-kubernetes/skill.json +48 -1
package/skills/provider-railway/SKILL.md +118 -1
package/skills/provider-railway/references/verification-commands.md +39 -0
package/skills/provider-railway/skill.json +67 -1
package/skills/provider-ssh-manual/SKILL.md +91 -0
package/skills/provider-ssh-manual/skill.json +50 -1
package/skills/repo-coding-rules/SKILL.md +84 -0
package/skills/repo-coding-rules/skill.json +30 -1
package/skills/role-cont-eval/SKILL.md +90 -0
package/skills/role-cont-eval/adapters/codex.md +1 -0
package/skills/role-cont-eval/skill.json +36 -0
package/skills/role-cont-qa/SKILL.md +93 -0
package/skills/role-cont-qa/adapters/claude.md +1 -0
package/skills/role-cont-qa/skill.json +36 -0
package/skills/role-deploy/SKILL.md +90 -0
package/skills/role-deploy/skill.json +32 -1
package/skills/role-documentation/SKILL.md +66 -0
package/skills/role-documentation/skill.json +32 -1
package/skills/role-implementation/SKILL.md +62 -0
package/skills/role-implementation/skill.json +32 -1
package/skills/role-infra/SKILL.md +74 -0
package/skills/role-infra/skill.json +32 -1
package/skills/role-integration/SKILL.md +79 -1
package/skills/role-integration/skill.json +32 -1
package/skills/role-research/SKILL.md +58 -0
package/skills/role-research/skill.json +32 -1
package/skills/role-security/SKILL.md +60 -0
package/skills/role-security/skill.json +36 -0
package/skills/runtime-claude/SKILL.md +60 -1
package/skills/runtime-claude/skill.json +32 -1
package/skills/runtime-codex/SKILL.md +52 -1
package/skills/runtime-codex/skill.json +32 -1
package/skills/runtime-local/SKILL.md +39 -0
package/skills/runtime-local/skill.json +32 -1
package/skills/runtime-opencode/SKILL.md +51 -0
package/skills/runtime-opencode/skill.json +32 -1
package/skills/wave-core/SKILL.md +107 -0
package/skills/wave-core/references/marker-syntax.md +62 -0
package/skills/wave-core/skill.json +31 -1
package/wave.config.json +35 -6
package/skills/role-evaluator/SKILL.md +0 -6
package/skills/role-evaluator/skill.json +0 -5

package/scripts/wave-orchestrator/traces.mjs CHANGED Viewed

@@ -2,6 +2,11 @@ import fs from "node:fs";
 import path from "node:path";
 import { buildAgentExecutionSummary, validateImplementationSummary } from "./agent-state.mjs";
 import { openClarificationLinkedRequests, readCoordinationLog, serializeCoordinationState } from "./coordination-store.mjs";
+import {
+  isContEvalReportOnlyAgent,
+  isSecurityReviewAgent,
+  resolveSecurityReviewReportPath,
+} from "./role-helpers.mjs";
 import {
   REPO_ROOT,
   ensureDirectory,
@@ -12,6 +17,7 @@ import {
   writeJsonAtomic,
   writeTextAtomic,
 } from "./shared.mjs";
+import { summarizeResolvedSkills } from "./skills.mjs";
 export const TRACE_VERSION = 2;
 const LEGACY_TRACE_VERSION = 1;
@@ -109,7 +115,10 @@ function collectLaunchEventsFromMetadata(metadata) {
 }
 function collectEvaluatorStatusesFromMetadata(metadata) {
-  const statusCode = metadata?.gateSnapshot?.evaluatorGate?.statusCode || null;
+  const statusCode =
+    metadata?.gateSnapshot?.contQaGate?.statusCode ||
+    metadata?.gateSnapshot?.evaluatorGate?.statusCode ||
+    null;
   if (!statusCode) {
     return [];
   }
@@ -133,7 +142,8 @@ function collectLaunchEventsFromCurrent(agentRuns, attempt) {
 }
 function collectEvaluatorStatusesFromCurrent(gateSnapshot, attempt) {
-  const statusCode = gateSnapshot?.evaluatorGate?.statusCode || null;
+  const statusCode =
+    gateSnapshot?.contQaGate?.statusCode || gateSnapshot?.evaluatorGate?.statusCode || null;
   if (!statusCode) {
     return [];
   }
@@ -143,7 +153,7 @@ function collectEvaluatorStatusesFromCurrent(gateSnapshot, attempt) {
 function emptyHistorySnapshot() {
   return {
     launchEvents: [],
-    evaluatorStatuses: [],
+    contQaStatuses: [],
   };
 }
@@ -151,6 +161,11 @@ function normalizeHistorySnapshot(snapshot) {
   if (!snapshot || typeof snapshot !== "object") {
     return emptyHistorySnapshot();
   }
+  const rawContQaStatuses = Array.isArray(snapshot.contQaStatuses)
+    ? snapshot.contQaStatuses
+    : Array.isArray(snapshot.evaluatorStatuses)
+      ? snapshot.evaluatorStatuses
+      : [];
   return {
     launchEvents: dedupeByKey(
       Array.isArray(snapshot.launchEvents)
@@ -166,16 +181,14 @@ function normalizeHistorySnapshot(snapshot) {
         : [],
       (event) => `${event.attempt}:${event.agentId}:${event.executorId || ""}`,
     ).sort((a, b) => a.attempt - b.attempt || a.agentId.localeCompare(b.agentId)),
-    evaluatorStatuses: dedupeByKey(
-      Array.isArray(snapshot.evaluatorStatuses)
-        ? snapshot.evaluatorStatuses
-            .filter(Boolean)
-            .map((entry) => ({
-              attempt: Number.parseInt(String(entry.attempt), 10),
-              statusCode: String(entry.statusCode || "").trim() || null,
-            }))
-            .filter((entry) => Number.isFinite(entry.attempt) && entry.statusCode)
-        : [],
+    contQaStatuses: dedupeByKey(
+      rawContQaStatuses
+        .filter(Boolean)
+        .map((entry) => ({
+          attempt: Number.parseInt(String(entry.attempt), 10),
+          statusCode: String(entry.statusCode || "").trim() || null,
+        }))
+        .filter((entry) => Number.isFinite(entry.attempt) && entry.statusCode),
       (entry) => `${entry.attempt}`,
     ).sort((a, b) => a.attempt - b.attempt),
   };
@@ -196,7 +209,7 @@ function buildHistorySnapshotFromPriorMetadata(priorMetadata) {
   }
   return normalizeHistorySnapshot({
     launchEvents: (priorMetadata || []).flatMap((metadata) => collectLaunchEventsFromMetadata(metadata)),
-    evaluatorStatuses: (priorMetadata || []).flatMap((metadata) =>
+    contQaStatuses: (priorMetadata || []).flatMap((metadata) =>
       collectEvaluatorStatusesFromMetadata(metadata),
     ),
   });
@@ -207,7 +220,7 @@ function mergeHistorySnapshot(baseSnapshot, currentSnapshot) {
   const current = normalizeHistorySnapshot(currentSnapshot);
   return normalizeHistorySnapshot({
     launchEvents: [...base.launchEvents, ...current.launchEvents],
-    evaluatorStatuses: [...base.evaluatorStatuses, ...current.evaluatorStatuses],
+    contQaStatuses: [...base.contQaStatuses, ...current.contQaStatuses],
   });
 }
@@ -224,7 +237,7 @@ function buildHistorySnapshot({
   const priorSnapshot = buildHistorySnapshotFromPriorMetadata(priorMetadata);
   const currentSnapshot = {
     launchEvents: collectLaunchEventsFromCurrent(agentRuns, attempt),
-    evaluatorStatuses: collectEvaluatorStatusesFromCurrent(gateSnapshot, attempt),
+    contQaStatuses: collectEvaluatorStatusesFromCurrent(gateSnapshot, attempt),
   };
   return mergeHistorySnapshot(priorSnapshot, currentSnapshot);
 }
@@ -347,13 +360,16 @@ function computeAssignmentAndDependencyTimings(coordinationRecords, dependencySn
 }
 function computeProofCompletenessRatio(wave, summariesByAgentId) {
-  const evaluatorAgentId = wave?.evaluatorAgentId || "A0";
+  const contQaAgentId = wave?.contQaAgentId || wave?.evaluatorAgentId || "A0";
+  const contEvalAgentId = wave?.contEvalAgentId || "E0";
   const integrationAgentId = wave?.integrationAgentId || "A8";
   const documentationAgentId = wave?.documentationAgentId || "A9";
   const implementationAgents = (wave?.agents || []).filter((agent) =>
-    agent.agentId !== evaluatorAgentId &&
+    agent.agentId !== contQaAgentId &&
     agent.agentId !== integrationAgentId &&
-    agent.agentId !== documentationAgentId,
+    agent.agentId !== documentationAgentId &&
+    !isContEvalReportOnlyAgent(agent, { contEvalAgentId }) &&
+    !isSecurityReviewAgent(agent),
   );
   const contractAgents = implementationAgents.filter((agent) => agent.exitContract);
   if (contractAgents.length === 0) {
@@ -374,12 +390,13 @@ function countRuntimeFallbacks(agentRuns) {
   }, 0);
 }
-function evaluatorReversalFromHistory(historySnapshot, gateSnapshot) {
-  const currentStatus = gateSnapshot?.evaluatorGate?.statusCode || null;
+function contQaReversalFromHistory(historySnapshot, gateSnapshot) {
+  const currentStatus =
+    gateSnapshot?.contQaGate?.statusCode || gateSnapshot?.evaluatorGate?.statusCode || null;
   if (!currentStatus) {
     return false;
   }
-  const priorStatuses = normalizeHistorySnapshot(historySnapshot).evaluatorStatuses
+  const priorStatuses = normalizeHistorySnapshot(historySnapshot).contQaStatuses
     .map((entry) => entry.statusCode)
     .filter(Boolean)
     .filter((status) => status !== currentStatus);
@@ -479,7 +496,7 @@ export function buildQualityMetrics({
     helperTaskAssignmentCount: (capabilityAssignments || []).filter((assignment) => assignment.assignedAgentId).length,
     meanTimeToFirstAckMs: timings.meanTimeToFirstAckMs,
     meanTimeToBlockerResolutionMs: timings.meanTimeToBlockerResolutionMs,
-    evaluatorReversal: evaluatorReversalFromHistory(effectiveHistory, gateSnapshot),
+    contQaReversal: contQaReversalFromHistory(effectiveHistory, gateSnapshot),
     finalRecommendation: integrationSummary?.recommendation || "unknown",
   };
 }
@@ -488,7 +505,8 @@ function buildReplayContext({ lanePaths, wave }) {
   return {
     lane: lanePaths?.lane || null,
     roles: {
-      evaluatorAgentId: lanePaths?.evaluatorAgentId || wave.evaluatorAgentId || "A0",
+      contQaAgentId: lanePaths?.contQaAgentId || wave.contQaAgentId || wave.evaluatorAgentId || "A0",
+      contEvalAgentId: lanePaths?.contEvalAgentId || wave.contEvalAgentId || "E0",
       integrationAgentId: lanePaths?.integrationAgentId || wave.integrationAgentId || "A8",
       documentationAgentId: lanePaths?.documentationAgentId || wave.documentationAgentId || "A9",
     },
@@ -537,10 +555,13 @@ export function normalizeGateSnapshotForBundle(gateSnapshot, agentArtifacts) {
     "componentGate",
     "helperAssignmentBarrier",
     "dependencyBarrier",
+    "contEvalGate",
+    "securityGate",
     "integrationGate",
     "integrationBarrier",
     "documentationGate",
     "componentMatrixGate",
+    "contQaGate",
     "evaluatorGate",
     "infraGate",
   ]) {
@@ -605,9 +626,17 @@ function resolveRunSummaryPayload(wave, run) {
     return null;
   }
   const reportPath =
-    run.agent?.agentId === (wave?.evaluatorAgentId || "A0") && wave?.evaluatorReportPath
-      ? path.resolve(REPO_ROOT, wave.evaluatorReportPath)
-      : null;
+    run.agent?.agentId === (wave?.contQaAgentId || wave?.evaluatorAgentId || "A0") &&
+    (wave?.contQaReportPath || wave?.evaluatorReportPath)
+      ? path.resolve(REPO_ROOT, wave.contQaReportPath || wave.evaluatorReportPath)
+      : run.agent?.agentId === (wave?.contEvalAgentId || "E0") && wave?.contEvalReportPath
+        ? path.resolve(REPO_ROOT, wave.contEvalReportPath)
+        : isSecurityReviewAgent(run.agent)
+          ? (() => {
+              const securityReportPath = resolveSecurityReviewReportPath(run.agent);
+              return securityReportPath ? path.resolve(REPO_ROOT, securityReportPath) : null;
+            })()
+        : null;
   return buildAgentExecutionSummary({
     agent: run.agent,
     statusRecord,
@@ -673,27 +702,7 @@ function buildAgentMetadata(dir, run, attempt, artifacts) {
     },
     skills:
       run.lastSkillProjection ||
-      (run.agent?.skillsResolved
-        ? {
-            ids: run.agent.skillsResolved.ids || [],
-            role: run.agent.skillsResolved.role || null,
-            runtime: run.agent.skillsResolved.runtime || null,
-            deployKind: run.agent.skillsResolved.deployKind || null,
-            promptHash: run.agent.skillsResolved.promptHash || null,
-            bundles: Array.isArray(run.agent.skillsResolved.bundles)
-              ? run.agent.skillsResolved.bundles.map((bundle) => ({
-                  id: bundle.id,
-                  bundlePath: bundle.bundlePath,
-                  manifestPath: bundle.manifestPath,
-                  skillPath: bundle.skillPath,
-                  adapterPath: bundle.adapterPath || null,
-                  bundleHash: bundle.bundleHash || null,
-                  sourceFiles: Array.isArray(bundle.sourceFiles) ? bundle.sourceFiles.slice() : [],
-                }))
-              : [],
-            artifacts: run.agent.skillsResolved.artifacts || null,
-          }
-        : null),
+      (run.agent?.skillsResolved ? summarizeResolvedSkills(run.agent.skillsResolved) : null),
   };
 }
@@ -710,6 +719,7 @@ export function writeTraceBundle({
   docsQueue,
   capabilityAssignments = [],
   dependencySnapshot = null,
+  securitySummary = null,
   integrationSummary,
   integrationMarkdownPath,
   clarificationTriage,
@@ -763,6 +773,13 @@ export function writeTraceBundle({
     "json",
     true,
   );
+  const securityArtifact = writeArtifactDescriptor(
+    dir,
+    path.join(dir, "security.json"),
+    securitySummary || {},
+    "json",
+    true,
+  );
   const integrationArtifact = writeArtifactDescriptor(
     dir,
     path.join(dir, "integration.json"),
@@ -883,9 +900,13 @@ export function writeTraceBundle({
   const metadata = {
     traceVersion: TRACE_VERSION,
     replayMode: "hermetic",
+    runKind: lanePaths?.runKind || "roadmap",
+    runId: lanePaths?.runId || null,
     wave: wave.wave,
     lane: lanePaths?.lane || null,
     waveFile: wave.file,
+    requestPath: lanePaths?.adhocRequestPath ? relativePathOrNull(lanePaths.adhocRequestPath, REPO_ROOT) : null,
+    specPath: lanePaths?.adhocSpecPath ? relativePathOrNull(lanePaths.adhocSpecPath, REPO_ROOT) : null,
     waveFileHash: fileHashOrNull(path.resolve(REPO_ROOT, wave.file || "")),
     attempt,
     cumulativeAttemptCount: attempt,
@@ -909,6 +930,7 @@ export function writeTraceBundle({
       docsQueue: docsQueueArtifact,
       capabilityAssignments: capabilityAssignmentsArtifact,
       dependencySnapshot: dependencySnapshotArtifact,
+      security: securityArtifact,
       integration: integrationArtifact,
       integrationMarkdown: integrationMarkdownArtifact,
       componentMatrix: componentMatrixArtifact,
@@ -949,6 +971,7 @@ export function loadTraceBundle(dir) {
     docsQueue: readJsonOrNull(path.join(dir, "docs-queue.json")),
     capabilityAssignments: readJsonOrNull(path.join(dir, "capability-assignments.json")),
     dependencySnapshot: readJsonOrNull(path.join(dir, "dependency-snapshot.json")),
+    securitySummary: readJsonOrNull(path.join(dir, "security.json")),
     integrationSummary: readJsonOrNull(path.join(dir, "integration.json")),
     quality: readJsonOrNull(path.join(dir, "quality.json")),
     storedOutcome: readJsonOrNull(path.join(dir, "outcome.json")),