npm - @swarmclawai/swarmclaw - Versions diffs - 1.9.7 → 1.9.8 - Mend

@swarmclawai/swarmclaw 1.9.7 → 1.9.8

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/README.md +9 -0
package/package.json +2 -2
package/src/app/api/quality/release-readiness/route.ts +38 -0
package/src/cli/index.js +1 -0
package/src/components/quality/quality-workspace.tsx +164 -4
package/src/lib/quality/release-readiness.test.ts +129 -0
package/src/lib/quality/release-readiness.ts +187 -0

package/README.md CHANGED Viewed

@@ -399,6 +399,15 @@ Operational docs: https://swarmclaw.ai/docs/observability
 ## Releases
+### v1.9.8 Highlights
+Bundled release-readiness release: a single operator report that combines eval gates, operations blockers, approvals, and runtime readiness.
+- **Release readiness report.** `/api/quality/release-readiness` returns a scored ready/warning/blocked report built from eval regression gates and Operations Pulse evidence.
+- **Quality Center ship gate.** The Quality overview now shows readiness score, blockers, warnings, checks, and next actions before operators cut a release.
+- **CLI readiness checks.** `swarmclaw operations readiness` exposes the same report for scripts and CI.
+- **Browser coverage.** The e2e smoke now verifies the release-readiness panel on `/quality`.
 ### v1.9.7 Highlights
 Bundled eval-gate release: approved baselines, regression checks, and Quality Center release gates for repeatable eval evidence.

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@swarmclawai/swarmclaw",
-  "version": "1.9.7",
+  "version": "1.9.8",
   "description": "Build and run autonomous AI agents with OpenClaw, Hermes, multiple model providers, orchestration, delegation, memory, skills, schedules, and chat connectors.",
   "main": "electron-dist/main.js",
   "license": "MIT",
@@ -87,7 +87,7 @@
     "test:cli": "node --test src/cli/*.test.js bin/*.test.js scripts/electron-after-pack.test.mjs scripts/ensure-sandbox-browser-image.test.mjs scripts/postinstall.test.mjs scripts/run-next-build.test.mjs scripts/run-next-typegen.test.mjs",
     "test:setup": "tsx --test src/app/api/setup/check-provider/route.test.ts src/lib/server/provider-model-discovery.test.ts src/components/auth/setup-wizard/utils.test.ts src/components/auth/setup-wizard/types.test.ts src/hooks/setup-done-detection.test.ts src/lib/setup-defaults.test.ts src/lib/server/storage-auth.test.ts src/lib/server/storage-auth-docker.test.ts",
     "test:openclaw": "tsx --test src/lib/openclaw/openclaw-agent-id.test.ts src/lib/openclaw/openclaw-endpoint.test.ts src/lib/server/agents/agent-runtime-config.test.ts src/lib/server/build-llm.test.ts src/lib/server/connectors/connector-routing.test.ts src/lib/server/connectors/openclaw.test.ts src/lib/server/connectors/swarmdock.test.ts src/lib/server/gateway/protocol.test.ts src/lib/server/gateways/gateway-topology.test.ts src/lib/server/llm-response-cache.test.ts src/lib/server/mcp-conformance.test.ts src/lib/server/openclaw/agent-resolver.test.ts src/lib/server/openclaw/deploy.test.ts src/lib/server/openclaw/skills-normalize.test.ts src/lib/server/session-tools/openclaw-nodes.test.ts src/lib/server/session-tools/swarmdock.test.ts src/lib/server/tasks/task-quality-gate.test.ts src/lib/server/tasks/task-validation.test.ts src/lib/server/tool-capability-policy.test.ts src/lib/providers/openai.test.ts src/lib/providers/openclaw-exports.test.ts src/app/api/gateways/topology-route.test.ts src/app/api/openclaw/dashboard-url/route.test.ts",
-    "test:runtime": "tsx --test src/lib/a2a/agent-card.test.ts src/lib/strip-internal-metadata.test.ts src/lib/provider-sets.test.ts src/lib/providers/opencode-cli.test.ts src/lib/providers/cli-provider-metadata.test.ts src/lib/providers/cli-utils.test.ts src/lib/providers/generic-cli.test.ts src/lib/server/agents/delegation-advisory.test.ts src/lib/server/cli-provider-readiness.test.ts src/lib/server/provider-health.test.ts src/lib/server/mcp-gateway-runtime.test.ts src/lib/server/mcp-connection-pool.test.ts src/lib/server/knowledge-sources.test.ts src/lib/server/extension-managed-resources.test.ts src/lib/server/eval/baseline.test.ts src/lib/server/eval/environment-plan.test.ts src/lib/server/chat-execution/chat-execution-grounding.test.ts src/lib/server/chat-execution/chat-turn-preparation.test.ts src/lib/server/chat-execution/iteration-timers.test.ts src/lib/server/chat-execution/post-stream-finalization.test.ts src/lib/server/chat-execution/reasoning-tag-scrubber.test.ts src/lib/server/chats/clear-undo-snapshots.test.ts src/lib/server/connectors/email.test.ts src/lib/server/protocols/protocol-service.test.ts src/lib/server/runtime/run-ledger.test.ts src/lib/server/runtime/queue-retry-policy.test.ts src/lib/server/runs/run-brief.test.ts src/lib/server/operations/operation-pulse.test.ts src/lib/server/artifacts/artifact-resolver.test.ts src/lib/server/observability/otel-config.test.ts src/lib/server/safe-parse-body.test.ts src/lib/server/missions/mission-templates.test.ts src/lib/server/sharing/share-link-repository.test.ts src/lib/server/sharing/share-resolver.test.ts src/lib/server/tasks/task-execution-workspace.test.ts src/lib/server/tasks/task-service.test.ts src/lib/server/session-tools/execute.test.ts src/lib/server/session-tools/manage-tasks.test.ts src/lib/app/view-constants.test.ts src/lib/quality/quality-summary.test.ts src/app/api/approvals/route.test.ts src/app/api/agents/agents-route.test.ts src/app/api/tasks/tasks-route.test.ts src/app/api/tasks/task-workspace-route.test.ts src/app/api/chats/chat-route.test.ts src/app/api/chats/clear-route.test.ts src/app/api/chats/compact-route.test.ts src/app/api/chats/context-status-route.test.ts src/app/api/connectors/connector-doctor-route.test.ts src/app/api/extensions/managed-resources/route.test.ts src/app/api/healthz/route.test.ts src/app/api/logs/route.test.ts src/app/api/portability/export/route.test.ts src/app/api/portability/import/route.test.ts src/app/api/providers/[id]/route.test.ts src/app/api/tts/route.test.ts",
+    "test:runtime": "tsx --test src/lib/a2a/agent-card.test.ts src/lib/strip-internal-metadata.test.ts src/lib/provider-sets.test.ts src/lib/providers/opencode-cli.test.ts src/lib/providers/cli-provider-metadata.test.ts src/lib/providers/cli-utils.test.ts src/lib/providers/generic-cli.test.ts src/lib/server/agents/delegation-advisory.test.ts src/lib/server/cli-provider-readiness.test.ts src/lib/server/provider-health.test.ts src/lib/server/mcp-gateway-runtime.test.ts src/lib/server/mcp-connection-pool.test.ts src/lib/server/knowledge-sources.test.ts src/lib/server/extension-managed-resources.test.ts src/lib/server/eval/baseline.test.ts src/lib/server/eval/environment-plan.test.ts src/lib/server/chat-execution/chat-execution-grounding.test.ts src/lib/server/chat-execution/chat-turn-preparation.test.ts src/lib/server/chat-execution/iteration-timers.test.ts src/lib/server/chat-execution/post-stream-finalization.test.ts src/lib/server/chat-execution/reasoning-tag-scrubber.test.ts src/lib/server/chats/clear-undo-snapshots.test.ts src/lib/server/connectors/email.test.ts src/lib/server/protocols/protocol-service.test.ts src/lib/server/runtime/run-ledger.test.ts src/lib/server/runtime/queue-retry-policy.test.ts src/lib/server/runs/run-brief.test.ts src/lib/server/operations/operation-pulse.test.ts src/lib/quality/release-readiness.test.ts src/lib/server/artifacts/artifact-resolver.test.ts src/lib/server/observability/otel-config.test.ts src/lib/server/safe-parse-body.test.ts src/lib/server/missions/mission-templates.test.ts src/lib/server/sharing/share-link-repository.test.ts src/lib/server/sharing/share-resolver.test.ts src/lib/server/tasks/task-execution-workspace.test.ts src/lib/server/tasks/task-service.test.ts src/lib/server/session-tools/execute.test.ts src/lib/server/session-tools/manage-tasks.test.ts src/lib/app/view-constants.test.ts src/lib/quality/quality-summary.test.ts src/app/api/approvals/route.test.ts src/app/api/agents/agents-route.test.ts src/app/api/tasks/tasks-route.test.ts src/app/api/tasks/task-workspace-route.test.ts src/app/api/chats/chat-route.test.ts src/app/api/chats/clear-route.test.ts src/app/api/chats/compact-route.test.ts src/app/api/chats/context-status-route.test.ts src/app/api/connectors/connector-doctor-route.test.ts src/app/api/extensions/managed-resources/route.test.ts src/app/api/healthz/route.test.ts src/app/api/logs/route.test.ts src/app/api/portability/export/route.test.ts src/app/api/portability/import/route.test.ts src/app/api/providers/[id]/route.test.ts src/app/api/tts/route.test.ts",
     "test:builder": "tsx --test src/features/protocols/builder/utils/nodes-to-template.test.ts src/features/protocols/builder/utils/template-to-nodes.test.ts src/features/protocols/builder/validators/dag-validator.test.ts",
     "test:e2e": "node --import tsx scripts/browser-e2e-smoke.ts",
     "test:mcp:conformance": "node --import tsx ./scripts/mcp-conformance-check.ts",

package/src/app/api/quality/release-readiness/route.ts ADDED Viewed

@@ -0,0 +1,38 @@
+import { NextResponse } from 'next/server'
+import { evaluateEvalGate } from '@/lib/server/eval/baseline'
+import { getOperationPulse, normalizeOperationPulseRange } from '@/lib/server/operations/operation-pulse'
+import { buildReleaseReadinessReport } from '@/lib/quality/release-readiness'
+import { errorMessage } from '@/lib/shared-utils'
+export const dynamic = 'force-dynamic'
+function parseNumberParam(value: string | null): number | null {
+  if (value == null || value.trim() === '') return null
+  const parsed = Number(value)
+  return Number.isFinite(parsed) ? parsed : null
+}
+export async function GET(req: Request) {
+  try {
+    const { searchParams } = new URL(req.url)
+    const range = normalizeOperationPulseRange(searchParams.get('range'))
+    const agentId = searchParams.get('agentId') || ''
+    const pulse = getOperationPulse(range)
+    const evalGate = agentId
+      ? evaluateEvalGate({
+        agentId,
+        scenarioId: searchParams.get('scenarioId'),
+        suite: searchParams.get('suite'),
+        minPercent: parseNumberParam(searchParams.get('minPercent')),
+        maxRegressionPoints: parseNumberParam(searchParams.get('maxRegressionPoints')),
+      })
+      : null
+    return NextResponse.json(buildReleaseReadinessReport({ pulse, evalGate }))
+  } catch (err: unknown) {
+    return NextResponse.json(
+      { error: errorMessage(err) },
+      { status: 500 },
+    )
+  }
+}

package/src/cli/index.js CHANGED Viewed

@@ -210,6 +210,7 @@ const COMMAND_GROUPS = [
     description: 'Operator triage and readiness summaries',
     commands: [
       cmd('pulse', 'GET', '/operations/pulse', 'Get Operations Pulse summary (use --query range=24h or --query range=7d)'),
+      cmd('readiness', 'GET', '/quality/release-readiness', 'Get release readiness report (use --query agentId=... and --query suite=core for eval gate coverage)'),
     ],
   },
   {

package/src/components/quality/quality-workspace.tsx CHANGED Viewed

@@ -15,6 +15,7 @@ import {
   summarizeEvalRuns,
   summarizeRunHealth,
 } from '@/lib/quality/quality-summary'
+import type { ReleaseReadinessReport, ReleaseReadinessStatus } from '@/lib/quality/release-readiness'
 import { cn } from '@/lib/utils'
 import { useAppStore } from '@/stores/use-app-store'
 import type { EvalEnvironmentPlan, EvalGateResult, EvalRun, EvalSuiteResult } from '@/lib/server/eval/types'
@@ -129,6 +130,130 @@ function gateCheckClass(status: EvalGateResult['status']): string {
   return 'border-emerald-500/20 bg-emerald-500/[0.05] text-emerald-200'
 }
+function readinessStatusClass(status: ReleaseReadinessStatus): string {
+  if (status === 'ready') return 'border-emerald-500/25 bg-emerald-500/10 text-emerald-200'
+  if (status === 'warning') return 'border-amber-500/25 bg-amber-500/10 text-amber-200'
+  return 'border-rose-500/25 bg-rose-500/10 text-rose-200'
+}
+function readinessScoreTone(status: ReleaseReadinessStatus): string {
+  if (status === 'ready') return 'text-emerald-300'
+  if (status === 'warning') return 'text-amber-300'
+  return 'text-rose-300'
+}
+function ReleaseReadinessPanel({
+  report,
+  loading,
+  onRefresh,
+  onOpenHref,
+}: {
+  report: ReleaseReadinessReport | null
+  loading: boolean
+  onRefresh: () => void
+  onOpenHref: (href: string) => void
+}) {
+  return (
+    <section className="rounded-[16px] border border-white/[0.06] bg-white/[0.025] p-4">
+      <div className="flex flex-col gap-3 lg:flex-row lg:items-start lg:justify-between">
+        <div>
+          <div className="text-[11px] font-700 uppercase tracking-[0.12em] text-accent-bright/70">Release Readiness</div>
+          <h2 className="mt-1 font-display text-[17px] font-700 text-text">Ship gate report</h2>
+          <p className="mt-1 max-w-[680px] text-[12px] leading-relaxed text-text-3/65">
+            Combines eval regression gates, operations pulse blockers, pending approvals, active runs, budgets, connectors, and gateway readiness.
+          </p>
+        </div>
+        <button
+          type="button"
+          onClick={onRefresh}
+          disabled={loading}
+          className="shrink-0 rounded-[10px] border border-white/[0.08] bg-white/[0.04] px-3 py-2 text-[12px] font-800 text-text-2 transition-colors hover:bg-white/[0.08] disabled:opacity-40"
+        >
+          {loading ? 'Checking' : 'Refresh gate'}
+        </button>
+      </div>
+      {!report ? (
+        <div className="mt-4 rounded-[12px] border border-dashed border-white/[0.08] bg-white/[0.02] px-4 py-5 text-[12px] text-text-3/65">
+          {loading ? 'Building release readiness report...' : 'No release readiness report is available yet.'}
+        </div>
+      ) : (
+        <div className="mt-4 grid gap-4 xl:grid-cols-[260px_1fr]">
+          <div className="rounded-[14px] border border-white/[0.06] bg-white/[0.025] p-4">
+            <span className={cn('inline-flex rounded-full border px-2.5 py-1 text-[10px] font-800 uppercase tracking-[0.1em]', readinessStatusClass(report.status))}>
+              {report.status}
+            </span>
+            <div className={cn('mt-4 font-display text-[42px] font-700 tracking-[-0.04em]', readinessScoreTone(report.status))}>{report.score}</div>
+            <div className="mt-1 text-[12px] text-text-3/65">readiness score</div>
+            <div className="mt-4 grid grid-cols-2 gap-2">
+              <div className="rounded-[10px] bg-white/[0.035] px-3 py-2">
+                <div className="text-[10px] font-700 uppercase tracking-[0.1em] text-text-3/50">Blockers</div>
+                <div className="mt-1 text-[18px] font-800 text-text">{report.blockerCount}</div>
+              </div>
+              <div className="rounded-[10px] bg-white/[0.035] px-3 py-2">
+                <div className="text-[10px] font-700 uppercase tracking-[0.1em] text-text-3/50">Warnings</div>
+                <div className="mt-1 text-[18px] font-800 text-text">{report.warningCount}</div>
+              </div>
+            </div>
+          </div>
+          <div className="grid gap-3 lg:grid-cols-2">
+            <div className="rounded-[14px] border border-white/[0.06] bg-white/[0.02] p-3">
+              <div className="text-[12px] font-800 text-text">Checks</div>
+              <div className="mt-3 flex flex-col gap-2">
+                {report.checks.slice(0, 6).map((check) => (
+                  <button
+                    key={check.code}
+                    type="button"
+                    onClick={() => check.href && onOpenHref(check.href)}
+                    className={cn(
+                      'rounded-[10px] border px-3 py-2 text-left transition-colors',
+                      readinessStatusClass(check.status),
+                      check.href ? 'hover:bg-white/[0.08]' : '',
+                    )}
+                  >
+                    <div className="text-[11px] font-800 uppercase tracking-[0.08em]">{check.status}</div>
+                    <div className="mt-1 text-[12px] font-700 text-text">{check.title}</div>
+                    <div className="mt-0.5 text-[11px] leading-relaxed text-text-3/70">{check.summary}</div>
+                  </button>
+                ))}
+              </div>
+            </div>
+            <div className="rounded-[14px] border border-white/[0.06] bg-white/[0.02] p-3">
+              <div className="text-[12px] font-800 text-text">Next actions</div>
+              <div className="mt-3 flex flex-col gap-2">
+                {report.nextActions.length === 0 ? (
+                  <div className="rounded-[10px] border border-white/[0.06] bg-white/[0.025] px-3 py-4 text-[12px] text-text-3/65">
+                    No triage actions are open in the selected window.
+                  </div>
+                ) : (
+                  report.nextActions.slice(0, 5).map((action) => (
+                    <button
+                      key={action.id}
+                      type="button"
+                      onClick={() => onOpenHref(action.href)}
+                      className="rounded-[10px] border border-white/[0.06] bg-white/[0.025] px-3 py-2 text-left transition-colors hover:bg-white/[0.06]"
+                    >
+                      <div className="flex items-center justify-between gap-2">
+                        <div className="text-[12px] font-800 text-text">{action.title}</div>
+                        <span className={cn('rounded-full border px-2 py-0.5 text-[9px] font-800 uppercase tracking-[0.08em]', action.severity === 'high' ? 'border-rose-500/25 text-rose-200' : action.severity === 'medium' ? 'border-amber-500/25 text-amber-200' : 'border-emerald-500/25 text-emerald-200')}>
+                          {action.severity}
+                        </span>
+                      </div>
+                      <div className="mt-1 line-clamp-2 text-[11px] leading-relaxed text-text-3/65">{action.summary}</div>
+                    </button>
+                  ))
+                )}
+              </div>
+            </div>
+          </div>
+        </div>
+      )}
+    </section>
+  )
+}
 function EvalEnvironmentPanel({ plan, loading, onRefresh }: {
   plan: EvalEnvironmentPlan | null
   loading: boolean
@@ -344,6 +469,8 @@ export function QualityWorkspace() {
   const [evalGateScope, setEvalGateScope] = useState<'scenario' | 'suite'>('scenario')
   const [evalGateLoading, setEvalGateLoading] = useState(false)
   const [evalBaselineBusy, setEvalBaselineBusy] = useState(false)
+  const [releaseReadiness, setReleaseReadiness] = useState<ReleaseReadinessReport | null>(null)
+  const [releaseReadinessLoading, setReleaseReadinessLoading] = useState(false)
   const [approvalBusy, setApprovalBusy] = useState<string | null>(null)
   useEffect(() => {
@@ -432,6 +559,25 @@ export function QualityWorkspace() {
     }
   }, [evalGateScope, selectedAgentId, selectedScenarioId, selectedSuite])
+  const loadReleaseReadiness = useCallback(async () => {
+    const params = new URLSearchParams({ range: '7d' })
+    if (selectedAgentId) {
+      params.set('agentId', selectedAgentId)
+      if (evalGateScope === 'scenario' && selectedScenarioId) params.set('scenarioId', selectedScenarioId)
+      if (evalGateScope === 'suite') params.set('suite', selectedSuite)
+    }
+    setReleaseReadinessLoading(true)
+    try {
+      const report = await api<ReleaseReadinessReport>('GET', `/quality/release-readiness?${params.toString()}`)
+      setReleaseReadiness(report)
+    } catch (err) {
+      setReleaseReadiness(null)
+      toast.error(err instanceof Error ? err.message : 'Unable to check release readiness')
+    } finally {
+      setReleaseReadinessLoading(false)
+    }
+  }, [evalGateScope, selectedAgentId, selectedScenarioId, selectedSuite])
   useEffect(() => {
     void loadQualityData()
   }, [loadQualityData])
@@ -454,6 +600,10 @@ export function QualityWorkspace() {
     void loadEvalGate()
   }, [loadEvalGate])
+  useEffect(() => {
+    void loadReleaseReadiness()
+  }, [loadReleaseReadiness])
   useEffect(() => {
     if (!suites.some((suite) => suite.name === selectedSuite) && suites[0]) {
       setSelectedSuite(suites[0].name)
@@ -495,12 +645,13 @@ export function QualityWorkspace() {
       await loadQualityData({ silent: true })
       await loadEvalEnvironmentPlan()
       await loadEvalGate()
+      await loadReleaseReadiness()
     } catch (err) {
       toast.error(err instanceof Error ? err.message : 'Eval scenario failed')
     } finally {
       setEvalBusy(null)
     }
-  }, [evalEnvironmentPlan, loadEvalEnvironmentPlan, loadEvalGate, loadQualityData, selectedAgentId, selectedScenarioId])
+  }, [evalEnvironmentPlan, loadEvalEnvironmentPlan, loadEvalGate, loadQualityData, loadReleaseReadiness, selectedAgentId, selectedScenarioId])
   const runSuite = useCallback(async (suiteName: string) => {
     if (!selectedAgentId) {
@@ -524,12 +675,13 @@ export function QualityWorkspace() {
       await loadQualityData({ silent: true })
       await loadEvalEnvironmentPlan()
       await loadEvalGate()
+      await loadReleaseReadiness()
     } catch (err) {
       toast.error(err instanceof Error ? err.message : 'Eval suite failed')
     } finally {
       setEvalBusy(null)
     }
-  }, [evalEnvironmentPlan, loadEvalEnvironmentPlan, loadEvalGate, loadQualityData, selectedAgentId])
+  }, [evalEnvironmentPlan, loadEvalEnvironmentPlan, loadEvalGate, loadQualityData, loadReleaseReadiness, selectedAgentId])
   const setEvalBaseline = useCallback(async () => {
     if (!selectedAgentId) {
@@ -547,13 +699,14 @@ export function QualityWorkspace() {
         : { agentId: selectedAgentId, suite: selectedSuite, minPercent: evalGate?.minPercent ?? 80, maxRegressionPoints: evalGate?.maxRegressionPoints ?? 5 }
       const result = await api<{ gate: EvalGateResult }>('POST', '/eval/baselines', body)
       setEvalGate(result.gate)
+      await loadReleaseReadiness()
       toast.success('Eval baseline saved')
     } catch (err) {
       toast.error(err instanceof Error ? err.message : 'Unable to save eval baseline')
     } finally {
       setEvalBaselineBusy(false)
     }
-  }, [evalGate, evalGateScope, selectedAgentId, selectedScenarioId, selectedSuite])
+  }, [evalGate, evalGateScope, loadReleaseReadiness, selectedAgentId, selectedScenarioId, selectedSuite])
   const actOnApproval = useCallback(async (approval: ApprovalRequest, approved: boolean) => {
     setApprovalBusy(approval.id)
@@ -561,12 +714,13 @@ export function QualityWorkspace() {
       await api('POST', '/approvals', { id: approval.id, approved })
       toast.success(approved ? 'Approval granted' : 'Approval denied')
       await loadQualityData({ silent: true })
+      await loadReleaseReadiness()
     } catch (err) {
       toast.error(err instanceof Error ? err.message : 'Unable to update approval')
     } finally {
       setApprovalBusy(null)
     }
-  }, [loadQualityData])
+  }, [loadQualityData, loadReleaseReadiness])
   if (loading) {
     return (
@@ -630,6 +784,12 @@ export function QualityWorkspace() {
           {activeTab === 'overview' && (
             <div className="flex flex-col gap-6">
               <OperationsPulsePanel defaultRange="7d" compact />
+              <ReleaseReadinessPanel
+                report={releaseReadiness}
+                loading={releaseReadinessLoading}
+                onRefresh={() => void loadReleaseReadiness()}
+                onOpenHref={(href) => router.push(href)}
+              />
               <div className="grid gap-3 md:grid-cols-2 xl:grid-cols-4">
                 <StatTile

package/src/lib/quality/release-readiness.test.ts ADDED Viewed

@@ -0,0 +1,129 @@
+import assert from 'node:assert/strict'
+import { describe, it } from 'node:test'
+import { buildReleaseReadinessReport } from './release-readiness'
+import type { EvalGateResult } from '@/lib/server/eval/types'
+import type { OperationPulse } from '@/types'
+const now = 100_000
+function pulse(overrides: Partial<OperationPulse> = {}): OperationPulse {
+  return {
+    generatedAt: now,
+    range: '24h',
+    windowStart: now - 86_400_000,
+    kpis: {
+      activeMissions: 0,
+      runningRuns: 0,
+      failedRuns: 0,
+      pendingApprovals: 0,
+      connectorAttention: 0,
+      gatewayAttention: 0,
+      budgetWarnings: 0,
+    },
+    actions: [],
+    ...overrides,
+  }
+}
+function evalGate(overrides: Partial<EvalGateResult> = {}): EvalGateResult {
+  return {
+    agentId: 'agent_1',
+    scope: {
+      type: 'suite',
+      id: 'core',
+      label: 'core',
+      scenarioIds: ['coding-prime'],
+    },
+    status: 'pass',
+    generatedAt: now,
+    baseline: null,
+    latestRuns: [],
+    currentScore: 10,
+    currentMaxScore: 10,
+    currentPercent: 100,
+    regressionPoints: 0,
+    minPercent: 80,
+    maxRegressionPoints: 5,
+    checks: [{ code: 'score_threshold_met', status: 'pass', message: 'Current score meets the 80% gate.' }],
+    ...overrides,
+  }
+}
+describe('release readiness report', () => {
+  it('passes when eval gate and operations pulse are clean', () => {
+    const report = buildReleaseReadinessReport({
+      pulse: pulse(),
+      evalGate: evalGate(),
+    })
+    assert.equal(report.status, 'ready')
+    assert.equal(report.score, 100)
+    assert.equal(report.blockerCount, 0)
+    assert.equal(report.warningCount, 0)
+    assert.ok(report.checks.some((check) => check.code === 'eval_gate_passed'))
+  })
+  it('warns when no eval gate is selected', () => {
+    const report = buildReleaseReadinessReport({
+      pulse: pulse(),
+      evalGate: null,
+    })
+    assert.equal(report.status, 'warning')
+    assert.equal(report.blockerCount, 0)
+    assert.equal(report.warningCount, 1)
+    assert.ok(report.score < 100)
+    assert.ok(report.checks.some((check) => check.code === 'eval_gate_missing'))
+  })
+  it('blocks when eval regression gate fails', () => {
+    const report = buildReleaseReadinessReport({
+      pulse: pulse(),
+      evalGate: evalGate({
+        status: 'fail',
+        currentPercent: 60,
+        checks: [{ code: 'score_below_threshold', status: 'fail', message: 'Current score is below the 80% gate.' }],
+      }),
+    })
+    assert.equal(report.status, 'blocked')
+    assert.equal(report.blockerCount, 1)
+    assert.ok(report.score <= 70)
+    assert.ok(report.checks.some((check) => check.code === 'eval_gate_failed'))
+  })
+  it('blocks on failed runs and pending approvals, then surfaces pulse actions', () => {
+    const report = buildReleaseReadinessReport({
+      pulse: pulse({
+        kpis: {
+          activeMissions: 1,
+          runningRuns: 1,
+          failedRuns: 2,
+          pendingApprovals: 3,
+          connectorAttention: 1,
+          gatewayAttention: 1,
+          budgetWarnings: 1,
+        },
+        actions: [{
+          id: 'run:failed',
+          kind: 'run',
+          severity: 'high',
+          title: 'Review failed run',
+          summary: 'Run failed',
+          href: '/quality?tab=runs',
+          evidence: ['run'],
+          createdAt: now,
+        }],
+      }),
+      evalGate: evalGate(),
+    })
+    assert.equal(report.status, 'blocked')
+    assert.equal(report.blockerCount, 2)
+    assert.ok(report.warningCount >= 4)
+    assert.equal(report.nextActions[0]?.id, 'run:failed')
+    assert.ok(report.checks.some((check) => check.code === 'failed_runs_present'))
+    assert.ok(report.checks.some((check) => check.code === 'pending_approvals_present'))
+  })
+})

package/src/lib/quality/release-readiness.ts ADDED Viewed

@@ -0,0 +1,187 @@
+import type { EvalGateResult } from '@/lib/server/eval/types'
+import type { OperationPulse, OperationPulseAction, OperationPulseRange } from '@/types'
+export type ReleaseReadinessStatus = 'ready' | 'warning' | 'blocked'
+export interface ReleaseReadinessCheck {
+  code: string
+  status: ReleaseReadinessStatus
+  title: string
+  summary: string
+  href?: string
+  evidence?: string[]
+}
+export interface ReleaseReadinessReport {
+  generatedAt: number
+  range: OperationPulseRange
+  status: ReleaseReadinessStatus
+  score: number
+  blockerCount: number
+  warningCount: number
+  pulse: OperationPulse
+  evalGate: EvalGateResult | null
+  checks: ReleaseReadinessCheck[]
+  nextActions: OperationPulseAction[]
+}
+const BLOCKER_PENALTY = 30
+const WARNING_PENALTY = 10
+function readinessStatus(checks: ReleaseReadinessCheck[]): ReleaseReadinessStatus {
+  if (checks.some((check) => check.status === 'blocked')) return 'blocked'
+  if (checks.some((check) => check.status === 'warning')) return 'warning'
+  return 'ready'
+}
+function readinessScore(checks: ReleaseReadinessCheck[]): number {
+  const penalty = checks.reduce((sum, check) => {
+    if (check.status === 'blocked') return sum + BLOCKER_PENALTY
+    if (check.status === 'warning') return sum + WARNING_PENALTY
+    return sum
+  }, 0)
+  return Math.max(0, 100 - penalty)
+}
+function plural(count: number, singular: string, pluralLabel = `${singular}s`): string {
+  return `${count} ${count === 1 ? singular : pluralLabel}`
+}
+function addCheck(checks: ReleaseReadinessCheck[], check: ReleaseReadinessCheck): void {
+  checks.push(check)
+}
+export function buildReleaseReadinessReport(input: {
+  pulse: OperationPulse
+  evalGate?: EvalGateResult | null
+}): ReleaseReadinessReport {
+  const checks: ReleaseReadinessCheck[] = []
+  const evalGate = input.evalGate ?? null
+  if (!evalGate) {
+    addCheck(checks, {
+      code: 'eval_gate_missing',
+      status: 'warning',
+      title: 'Select an eval gate',
+      summary: 'No eval regression gate is included in this readiness report.',
+      href: '/quality?tab=evals',
+    })
+  } else if (evalGate.status === 'fail') {
+    addCheck(checks, {
+      code: 'eval_gate_failed',
+      status: 'blocked',
+      title: 'Eval gate failed',
+      summary: `${evalGate.scope.label} is not passing the configured eval release gate.`,
+      href: '/quality?tab=evals',
+      evidence: evalGate.checks
+        .filter((check) => check.status === 'fail')
+        .map((check) => check.message),
+    })
+  } else if (evalGate.status === 'warn') {
+    addCheck(checks, {
+      code: 'eval_gate_warning',
+      status: 'warning',
+      title: 'Eval gate needs a baseline',
+      summary: `${evalGate.scope.label} passes the score threshold but still has release-gate warnings.`,
+      href: '/quality?tab=evals',
+      evidence: evalGate.checks
+        .filter((check) => check.status === 'warn')
+        .map((check) => check.message),
+    })
+  } else {
+    addCheck(checks, {
+      code: 'eval_gate_passed',
+      status: 'ready',
+      title: 'Eval gate passed',
+      summary: `${evalGate.scope.label} meets the configured score and regression checks.`,
+      href: '/quality?tab=evals',
+      evidence: [`${evalGate.currentPercent ?? 'n/a'}% current score`],
+    })
+  }
+  if (input.pulse.kpis.failedRuns > 0) {
+    addCheck(checks, {
+      code: 'failed_runs_present',
+      status: 'blocked',
+      title: 'Failed runs need review',
+      summary: `${plural(input.pulse.kpis.failedRuns, 'failed run')} found in the ${input.pulse.range} operations window.`,
+      href: '/quality?tab=runs',
+    })
+  }
+  if (input.pulse.kpis.pendingApprovals > 0) {
+    addCheck(checks, {
+      code: 'pending_approvals_present',
+      status: 'blocked',
+      title: 'Pending approvals need decisions',
+      summary: `${plural(input.pulse.kpis.pendingApprovals, 'approval')} still waiting on an operator.`,
+      href: '/quality?tab=approvals',
+    })
+  }
+  if (input.pulse.kpis.runningRuns > 0) {
+    addCheck(checks, {
+      code: 'active_runs_present',
+      status: 'warning',
+      title: 'Runs are still active',
+      summary: `${plural(input.pulse.kpis.runningRuns, 'run')} queued or running while this report was generated.`,
+      href: '/runs',
+    })
+  }
+  if (input.pulse.kpis.connectorAttention > 0) {
+    addCheck(checks, {
+      code: 'connector_attention_present',
+      status: 'warning',
+      title: 'Connector readiness needs attention',
+      summary: `${plural(input.pulse.kpis.connectorAttention, 'connector')} reporting degraded readiness.`,
+      href: '/connectors',
+    })
+  }
+  if (input.pulse.kpis.gatewayAttention > 0) {
+    addCheck(checks, {
+      code: 'gateway_attention_present',
+      status: 'warning',
+      title: 'Gateway readiness needs attention',
+      summary: `${plural(input.pulse.kpis.gatewayAttention, 'gateway')} reporting topology or environment warnings.`,
+      href: '/providers',
+    })
+  }
+  if (input.pulse.kpis.budgetWarnings > 0) {
+    addCheck(checks, {
+      code: 'budget_warnings_present',
+      status: 'warning',
+      title: 'Mission budget pressure',
+      summary: `${plural(input.pulse.kpis.budgetWarnings, 'mission')} near a configured budget limit.`,
+      href: '/missions',
+    })
+  }
+  if (input.pulse.kpis.activeMissions > 0) {
+    addCheck(checks, {
+      code: 'active_missions_present',
+      status: 'warning',
+      title: 'Missions are still active',
+      summary: `${plural(input.pulse.kpis.activeMissions, 'mission')} running or paused in the operations window.`,
+      href: '/missions',
+    })
+  }
+  const blockerCount = checks.filter((check) => check.status === 'blocked').length
+  const warningCount = checks.filter((check) => check.status === 'warning').length
+  return {
+    generatedAt: input.pulse.generatedAt,
+    range: input.pulse.range,
+    status: readinessStatus(checks),
+    score: readinessScore(checks),
+    blockerCount,
+    warningCount,
+    pulse: input.pulse,
+    evalGate,
+    checks,
+    nextActions: input.pulse.actions.slice(0, 8),
+  }
+}