npm - principles-disciple - Versions diffs - 1.71.0 → 1.73.0 - Mend

principles-disciple 1.71.0 → 1.73.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (309) hide show

package/openclaw.plugin.json +10 -5
package/package.json +17 -19
package/scripts/acceptance-test.mjs +16 -73
package/scripts/sync-plugin.mjs +382 -77
package/src/commands/archive-impl.ts +2 -1
package/src/commands/capabilities.ts +2 -2
package/src/commands/context.ts +2 -2
package/src/commands/disable-impl.ts +2 -1
package/src/commands/evolution-status.ts +16 -16
package/src/commands/export.ts +12 -67
package/src/commands/pain.ts +91 -1
package/src/commands/principle-rollback.ts +2 -1
package/src/commands/promote-impl.ts +7 -43
package/src/commands/rollback-impl.ts +2 -1
package/src/commands/rollback.ts +2 -1
package/src/commands/samples.ts +2 -1
package/src/commands/thinking-os.ts +2 -1
package/src/config/errors.ts +18 -2
package/src/constants/diagnostician.ts +2 -2
package/src/constants/tools.ts +2 -1
package/src/core/__tests__/focus-history.test.ts +210 -0
package/src/core/config.ts +1 -1
package/src/core/confirm-first-gate.ts +255 -0
package/src/core/correction-cue-learner.ts +2 -136
package/src/core/correction-types.ts +16 -88
package/src/core/dictionary.ts +19 -20
package/src/core/empathy-keyword-matcher.ts +17 -289
package/src/core/empathy-types.ts +18 -229
package/src/core/event-log.ts +38 -132
package/src/core/evolution-reducer.ts +21 -2
package/src/core/evolution-types.ts +76 -464
package/src/core/file-store.ts +80 -0
package/src/core/focus-history.ts +228 -955
package/src/core/local-worker-routing.ts +34 -314
package/src/core/merge-gate-audit.ts +0 -195
package/src/core/pain-diagnostic-gate.ts +154 -0
package/src/core/pain-signal.ts +21 -138
package/src/core/pain.ts +15 -88
package/src/core/pd-task-reconciler.ts +26 -115
package/src/core/pd-task-service.ts +9 -9
package/src/core/pd-task-types.ts +23 -127
package/src/core/principle-compiler/__tests__/compiler-replay-gate.test.ts +174 -0
package/src/core/principle-compiler/code-validator.ts +15 -42
package/src/core/principle-compiler/compiler.ts +100 -15
package/src/core/principle-compiler/index.ts +5 -2
package/src/core/principle-compiler/template-generator.ts +4 -104
package/src/core/principle-injection.ts +10 -202
package/src/core/principle-internalization/filesystem-lifecycle-datasource.ts +42 -0
package/src/core/principle-internalization/lifecycle-read-model.ts +39 -242
package/src/core/principle-internalization/principle-lifecycle-service.ts +12 -10
package/src/core/principle-tree-ledger-adapter.ts +145 -0
package/src/core/principle-tree-ledger.ts +8 -6
package/src/core/reflection/reflection-context.ts +14 -109
package/src/core/replay-engine.ts +8 -500
package/src/core/rule-host-helpers.ts +5 -35
package/src/core/rule-host-types.ts +10 -82
package/src/core/rule-host.ts +6 -63
package/src/core/runtime-v2-prompt-activation-reader.ts +231 -0
package/src/core/session-tracker.ts +87 -101
package/src/core/shadow-observation-registry.ts +19 -48
package/src/core/trajectory.ts +3 -1
package/src/core/workflow-funnel-loader.ts +62 -68
package/src/core/workspace-context.ts +46 -0
package/src/core/workspace-dir-service.ts +1 -1
package/src/core/workspace-dir-validation.ts +18 -9
package/src/hooks/AGENTS.md +1 -1
package/src/hooks/gate-block-helper.ts +46 -44
package/src/hooks/gate.ts +207 -7
package/src/hooks/lifecycle.ts +30 -32
package/src/hooks/llm.ts +60 -32
package/src/hooks/pain.ts +297 -103
package/src/hooks/prompt.ts +469 -339
package/src/hooks/subagent.ts +2 -29
package/src/i18n/commands.ts +2 -10
package/src/index.ts +95 -85
package/src/openclaw-sdk.ts +311 -0
package/src/service/central-database.ts +8 -4
package/src/service/evolution-queue-migration.ts +2 -1
package/src/service/evolution-worker.ts +163 -1786
package/src/service/internalization-trigger-adapter.ts +302 -0
package/src/service/keyword-optimization-service.ts +4 -4
package/src/service/monitoring-query-service.ts +1 -215
package/src/service/queue-io.ts +60 -331
package/src/service/runtime-summary-service.ts +115 -18
package/src/service/subagent-workflow/index.ts +0 -41
package/src/service/subagent-workflow/types.ts +9 -120
package/src/service/subagent-workflow/workflow-store.ts +2 -119
package/src/service/workflow-watchdog.ts +0 -43
package/src/types/event-payload.ts +16 -74
package/src/types/event-types.ts +39 -547
package/src/types/hygiene-types.ts +7 -30
package/src/types/principle-tree-schema.ts +20 -222
package/src/types/queue.ts +15 -70
package/src/types/runtime-summary.ts +5 -49
package/src/utils/io.ts +10 -0
package/src/utils/retry.ts +1 -1
package/src/utils/shadow-fingerprint.ts +2 -2
package/src/utils/workspace-resolver.ts +50 -0
package/templates/langs/en/core/AGENTS.md +2 -2
package/templates/langs/en/core/BOOT.md +1 -1
package/templates/langs/en/core/HEARTBEAT.md +2 -2
package/templates/langs/en/skills/ai-sprint-orchestration/references/agent-registry.json +1 -72
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/bugfix-complex-template.json +6 -6
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/feature-complex-template.json +6 -6
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal-verify.json +2 -12
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal.json +2 -12
package/templates/langs/en/skills/ai-sprint-orchestration/runtime/.gitignore +2 -2
package/templates/langs/en/skills/ai-sprint-orchestration/scripts/run.mjs +51 -15
package/templates/langs/en/skills/evolve-task/SKILL.md +1 -1
package/templates/langs/en/skills/pd-cli-operator/SKILL.md +67 -0
package/templates/langs/en/skills/pd-diagnostician/SKILL.md +1 -1
package/templates/langs/en/skills/pd-mentor/SKILL.md +1 -1
package/templates/langs/en/skills/pd-pain-signal/SKILL.md +17 -39
package/templates/langs/en/skills/pd-runtime-v2/SKILL.md +61 -0
package/templates/langs/zh/core/AGENTS.md +2 -2
package/templates/langs/zh/core/BOOT.md +1 -1
package/templates/langs/zh/core/HEARTBEAT.md +2 -2
package/templates/langs/zh/skills/ai-sprint-orchestration/references/agent-registry.json +1 -72
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/bugfix-complex-template.json +6 -6
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/feature-complex-template.json +6 -6
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/nocturnal-trinity-quality-enhancement.json +8 -8
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal-verify.json +2 -12
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal.json +2 -12
package/templates/langs/zh/skills/ai-sprint-orchestration/runtime/.gitignore +2 -2
package/templates/langs/zh/skills/ai-sprint-orchestration/scripts/run.mjs +51 -15
package/templates/langs/zh/skills/ai-sprint-orchestration/test/run.test.mjs +21 -5
package/templates/langs/zh/skills/evolve-task/SKILL.md +2 -2
package/templates/langs/zh/skills/pd-cli-operator/SKILL.md +67 -0
package/templates/langs/zh/skills/pd-diagnostician/SKILL.md +1 -1
package/templates/langs/zh/skills/pd-mentor/SKILL.md +1 -1
package/templates/langs/zh/skills/pd-pain-signal/SKILL.md +17 -38
package/templates/langs/zh/skills/pd-runtime-v2/SKILL.md +61 -0
package/tests/build-artifacts.test.ts +1 -3
package/tests/commands/evolution-status.test.ts +0 -118
package/tests/core/bootstrap-rules.test.ts +1 -1
package/tests/core/config.test.ts +1 -1
package/tests/core/event-log.test.ts +35 -0
package/tests/core/evolution-engine.test.ts +610 -0
package/tests/core/file-store.test.ts +102 -0
package/tests/core/focus-history.test.ts +203 -11
package/tests/core/merge-gate-audit.test.ts +2 -169
package/tests/core/model-deployment-registry.test.ts +7 -1
package/tests/core/model-training-registry.test.ts +19 -0
package/tests/core/observability.test.ts +0 -1
package/tests/core/pain-diagnostic-gate.test.ts +498 -0
package/tests/core/pain.test.ts +0 -1
package/tests/core/principle-internalization/deprecated-readiness.test.ts +2 -2
package/tests/core/principle-internalization/lifecycle-metrics.test.ts +2 -2
package/tests/core/principle-internalization/{internalization-routing-policy.test.ts → lifecycle-routing-policy.test.ts} +6 -6
package/tests/core/principle-internalization/lineage-source-retired.test.ts +56 -0
package/tests/core/principle-internalization/principle-lifecycle-service.test.ts +1 -23
package/tests/core/principle-tree-ledger-adapter.test.ts +253 -0
package/tests/core/reflection-context.test.ts +0 -14
package/tests/core/replay-engine.test.ts +127 -215
package/tests/core/rule-host-helpers.test.ts +2 -2
package/tests/core/rule-implementation-runtime.test.ts +0 -27
package/tests/core/workflow-funnel-loader.test.ts +162 -0
package/tests/core/workspace-dir-validation.test.ts +8 -1
package/tests/core-anti-growth.test.ts +192 -0
package/tests/hook-workspace-nextaction-contract.test.ts +42 -0
package/tests/hooks/confirm-first-gate.test.ts +333 -0
package/tests/hooks/gate-auto-correct-shadow.test.ts +310 -0
package/tests/hooks/gate-auto-correct.test.ts +665 -0
package/tests/hooks/gate-rule-host-pipeline.test.ts +2 -1
package/tests/hooks/pain.test.ts +269 -12
package/tests/hooks/prompt-characterization.test.ts +500 -0
package/tests/hooks/prompt-size-guard.test.ts +329 -0
package/tests/hooks/runtime-v2-prompt-activation.test.ts +869 -0
package/tests/index.test.ts +94 -1
package/tests/integration/auto-entry-gate.test.ts +248 -0
package/tests/integration/internalization-trigger-guard.test.ts +69 -0
package/tests/integration/m8-legacy-paths.test.ts +63 -0
package/tests/integration/runtime-v2-pain-guard.test.ts +125 -0
package/tests/plugin-config-resolution-cutover.test.ts +359 -0
package/tests/runtime-v2-discovery-guard.test.ts +154 -0
package/tests/service/central-database.test.ts +457 -0
package/tests/service/evolution-worker.correction-observer.test.ts +173 -0
package/tests/service/evolution-worker.timeout.test.ts +11 -129
package/tests/service/internalization-trigger-adapter.test.ts +251 -0
package/tests/service/monitoring-query-service.test.ts +1 -47
package/tests/service/queue-io.test.ts +1 -62
package/tests/service/runtime-summary-service.test.ts +184 -3
package/tests/service/workflow-watchdog.test.ts +0 -91
package/tests/utils/file-lock.test.ts +5 -3
package/tests/utils/session-key.test.ts +52 -0
package/tests/utils/subagent-probe.test.ts +48 -1
package/vitest.config.ts +4 -11
package/.planning/codebase/ARCHITECTURE.md +0 -157
package/.planning/codebase/CONCERNS.md +0 -145
package/.planning/codebase/CONVENTIONS.md +0 -148
package/.planning/codebase/INTEGRATIONS.md +0 -81
package/.planning/codebase/STACK.md +0 -87
package/.planning/codebase/STRUCTURE.md +0 -193
package/.planning/codebase/TESTING.md +0 -243
package/.planning/phases/01-basic-visualization/01-GAP-CLOSURE-VERIFICATION.md +0 -113
package/docs/COMMAND_REFERENCE.md +0 -76
package/docs/COMMAND_REFERENCE_EN.md +0 -79
package/scripts/build-web.mjs +0 -46
package/scripts/diagnose-nocturnal.mjs +0 -537
package/scripts/seed-nocturnal-scenarios.mjs +0 -384
package/src/commands/nocturnal-review.ts +0 -322
package/src/commands/nocturnal-rollout.ts +0 -790
package/src/commands/nocturnal-train.ts +0 -986
package/src/commands/pd-reflect.ts +0 -88
package/src/core/adaptive-thresholds.ts +0 -478
package/src/core/diagnostician-task-store.ts +0 -192
package/src/core/nocturnal-arbiter.ts +0 -715
package/src/core/nocturnal-artifact-lineage.ts +0 -116
package/src/core/nocturnal-artificer.ts +0 -257
package/src/core/nocturnal-candidate-scoring.ts +0 -530
package/src/core/nocturnal-compliance.ts +0 -1146
package/src/core/nocturnal-dataset.ts +0 -763
package/src/core/nocturnal-executability.ts +0 -428
package/src/core/nocturnal-export.ts +0 -499
package/src/core/nocturnal-paths.ts +0 -240
package/src/core/nocturnal-reasoning-deriver.ts +0 -343
package/src/core/nocturnal-rule-implementation-validator.ts +0 -246
package/src/core/nocturnal-snapshot-contract.ts +0 -99
package/src/core/nocturnal-trajectory-extractor.ts +0 -512
package/src/core/nocturnal-trinity-types.ts +0 -218
package/src/core/nocturnal-trinity.ts +0 -2680
package/src/core/principle-internalization/deprecated-readiness.ts +0 -93
package/src/core/principle-internalization/internalization-routing-policy.ts +0 -208
package/src/core/principle-internalization/lifecycle-metrics.ts +0 -152
package/src/http/principles-console-route.ts +0 -709
package/src/service/central-health-service.ts +0 -49
package/src/service/central-overview-service.ts +0 -138
package/src/service/control-ui-query-service.ts +0 -900
package/src/service/cooldown-strategy.ts +0 -97
package/src/service/evolution-pain-context.ts +0 -79
package/src/service/evolution-query-service.ts +0 -407
package/src/service/health-query-service.ts +0 -1038
package/src/service/nocturnal-config.ts +0 -214
package/src/service/nocturnal-runtime.ts +0 -734
package/src/service/nocturnal-service.ts +0 -1605
package/src/service/nocturnal-target-selector.ts +0 -545
package/src/service/sleep-cycle.ts +0 -157
package/src/service/startup-reconciler.ts +0 -112
package/src/service/subagent-workflow/correction-observer-types.ts +0 -82
package/src/service/subagent-workflow/correction-observer-workflow-manager.ts +0 -250
package/src/service/subagent-workflow/deep-reflect-workflow-manager.ts +0 -1
package/src/service/subagent-workflow/dynamic-timeout.ts +0 -30
package/src/service/subagent-workflow/empathy-observer-workflow-manager.ts +0 -268
package/src/service/subagent-workflow/nocturnal-workflow-manager.ts +0 -795
package/src/service/subagent-workflow/runtime-direct-driver.ts +0 -268
package/src/service/subagent-workflow/workflow-manager-base.ts +0 -580
package/src/tools/write-pain-flag.ts +0 -215
package/tests/commands/nocturnal-review.test.ts +0 -448
package/tests/commands/nocturnal-train.test.ts +0 -97
package/tests/commands/pd-reflect.test.ts +0 -49
package/tests/core/adaptive-thresholds.test.ts +0 -261
package/tests/core/nocturnal-arbiter.test.ts +0 -559
package/tests/core/nocturnal-artifact-lineage.test.ts +0 -53
package/tests/core/nocturnal-artificer.test.ts +0 -241
package/tests/core/nocturnal-candidate-scoring.test.ts +0 -532
package/tests/core/nocturnal-compliance-p-principles.test.ts +0 -133
package/tests/core/nocturnal-compliance.test.ts +0 -646
package/tests/core/nocturnal-dataset.test.ts +0 -892
package/tests/core/nocturnal-e2e.test.ts +0 -234
package/tests/core/nocturnal-executability.test.ts +0 -357
package/tests/core/nocturnal-export.test.ts +0 -517
package/tests/core/nocturnal-reasoning-deriver.test.ts +0 -372
package/tests/core/nocturnal-reviewed-subset-comparison.test.ts +0 -428
package/tests/core/nocturnal-rule-implementation-validator.test.ts +0 -127
package/tests/core/nocturnal-snapshot-contract.test.ts +0 -121
package/tests/core/nocturnal-trajectory-extractor.test.ts +0 -634
package/tests/core/nocturnal-trinity.test.ts +0 -2053
package/tests/core/pain-auto-repair.test.ts +0 -96
package/tests/core/pain-integration.test.ts +0 -510
package/tests/fixtures/nocturnal-reviewed-subset.json +0 -183
package/tests/http/principles-console-route.test.ts +0 -162
package/tests/integration/chaos-resilience.test.ts +0 -348
package/tests/integration/empathy-workflow-integration.test.ts +0 -626
package/tests/integration/pain-diagnostician-loop.e2e.test.ts +0 -380
package/tests/service/control-ui-query-service.test.ts +0 -121
package/tests/service/cooldown-strategy.test.ts +0 -164
package/tests/service/data-endpoints-regression.test.ts +0 -834
package/tests/service/empathy-observer-workflow-manager.test.ts +0 -175
package/tests/service/evolution-worker.nocturnal.test.ts +0 -601
package/tests/service/nocturnal-runtime-hardening.test.ts +0 -118
package/tests/service/nocturnal-runtime.test.ts +0 -473
package/tests/service/nocturnal-service-code-candidate.test.ts +0 -330
package/tests/service/nocturnal-target-selector.test.ts +0 -615
package/tests/service/startup-reconciler.test.ts +0 -148
package/tests/tools/write-pain-flag.test.ts +0 -358
package/ui/src/App.tsx +0 -45
package/ui/src/api.ts +0 -220
package/ui/src/charts.tsx +0 -955
package/ui/src/components/ErrorState.tsx +0 -6
package/ui/src/components/Loading.tsx +0 -13
package/ui/src/components/ProtectedRoute.tsx +0 -12
package/ui/src/components/Shell.tsx +0 -91
package/ui/src/components/WorkspaceConfig.tsx +0 -178
package/ui/src/components/index.ts +0 -5
package/ui/src/context/auth.tsx +0 -80
package/ui/src/context/theme.tsx +0 -66
package/ui/src/hooks/useAutoRefresh.ts +0 -39
package/ui/src/i18n/ui.ts +0 -473
package/ui/src/main.tsx +0 -16
package/ui/src/pages/EvolutionPage.tsx +0 -333
package/ui/src/pages/FeedbackPage.tsx +0 -138
package/ui/src/pages/GateMonitorPage.tsx +0 -136
package/ui/src/pages/LoginPage.tsx +0 -89
package/ui/src/pages/OverviewPage.tsx +0 -599
package/ui/src/pages/SamplesPage.tsx +0 -174
package/ui/src/pages/ThinkingModelsPage.tsx +0 -702
package/ui/src/styles.css +0 -2020
package/ui/src/types.ts +0 -384
package/ui/src/utils/format.ts +0 -15

package/tests/core/nocturnal-reviewed-subset-comparison.test.ts DELETED Viewed

@@ -1,428 +0,0 @@
-import { describe, it, expect, beforeAll } from 'vitest';
-import * as fs from 'fs';
-import * as path from 'path';
-import { runTrinity, type TrinityConfig, type NocturnalSessionSnapshot } from '../../src/core/nocturnal-trinity.js';
-/**
- * Nocturnal Reviewed Subset Comparison Harness
- *
- * Compares single-reflector vs Trinity quality on a reviewed subset of cases.
- * ACTUALLY invokes the Trinity code path (not just fixture validation).
- */
-interface QualityScores {
-  specificity: number;
-  principleAlignment: number;
-  actionability: number;
-  rationaleQuality: number;
-  overall: number;
-}
-interface TestCase {
-  caseId: string;
-  principleId: string;
-  sessionId: string;
-  signalType: string;
-  signalContext: string;
-  singleReflectorOutput: Record<string, unknown>;
-  trinityOutput: Record<string, unknown>;
-  qualityScores: {
-    singleReflector: QualityScores;
-    trinity: QualityScores;
-  };
-  trinityWins: boolean;
-  notes: string;
-}
-interface FixtureData {
-  testCases: TestCase[];
-  summary: {
-    totalCases: number;
-    trinityWins: number;
-    singleReflectorWins: number;
-    averageDelta: Record<string, number>;
-    conclusion: string;
-  };
-}
-function loadFixture(): FixtureData {
-  const fixturePath = path.join(__dirname, '..', 'fixtures', 'nocturnal-reviewed-subset.json');
-  const content = fs.readFileSync(fixturePath, 'utf-8');
-  return JSON.parse(content) as FixtureData;
-}
-/**
- * Create a NocturnalSessionSnapshot from fixture test case data.
- * Uses the signalType to determine which stats to populate.
- */
-function createSnapshotFromFixture(testCase: TestCase): NocturnalSessionSnapshot {
-  const baseSnapshot = {
-    sessionId: testCase.sessionId,
-    stats: {
-      failureCount: 0,
-      totalPainEvents: 0,
-      totalGateBlocks: 0,
-      totalAssistantTurns: 5,
-      totalToolCalls: 10,
-    },
-  };
-  // Set the appropriate signal based on signalType
-  switch (testCase.signalType) {
-    case 'failure':
-      return {
-        ...baseSnapshot,
-        stats: { ...baseSnapshot.stats, failureCount: 2 },
-      };
-    case 'pain':
-      return {
-        ...baseSnapshot,
-        stats: { ...baseSnapshot.stats, totalPainEvents: 3 },
-      };
-    case 'gateblock':
-      return {
-        ...baseSnapshot,
-        stats: { ...baseSnapshot.stats, totalGateBlocks: 1 },
-      };
-    default:
-      return {
-        ...baseSnapshot,
-        stats: { ...baseSnapshot.stats, failureCount: 1 },
-      };
-  }
-}
-describe('Nocturnal Reviewed Subset Comparison Harness', () => {
-  let fixture: FixtureData;
-  beforeAll(() => {
-    fixture = loadFixture();
-  });
-  describe('Fixture Integrity', () => {
-    it('loads the fixture successfully', () => {
-      expect(fixture).toBeDefined();
-      expect(fixture.testCases).toBeDefined();
-      expect(fixture.testCases.length).toBeGreaterThan(0);
-    });
-    it('has valid test case structure', () => {
-      for (const testCase of fixture.testCases) {
-        expect(testCase.caseId).toBeDefined();
-        expect(testCase.principleId).toBeDefined();
-        expect(testCase.sessionId).toBeDefined();
-        expect(testCase.singleReflectorOutput).toBeDefined();
-        expect(testCase.trinityOutput).toBeDefined();
-        expect(testCase.qualityScores).toBeDefined();
-        expect(testCase.qualityScores.singleReflector).toBeDefined();
-        expect(testCase.qualityScores.trinity).toBeDefined();
-      }
-    });
-    it('has valid quality score ranges (0-1)', () => {
-      for (const testCase of fixture.testCases) {
-        const scores = [testCase.qualityScores.singleReflector, testCase.qualityScores.trinity];
-        for (const score of scores) {
-          expect(score.specificity).toBeGreaterThanOrEqual(0);
-          expect(score.specificity).toBeLessThanOrEqual(1);
-          expect(score.principleAlignment).toBeGreaterThanOrEqual(0);
-          expect(score.principleAlignment).toBeLessThanOrEqual(1);
-          expect(score.actionability).toBeGreaterThanOrEqual(0);
-          expect(score.actionability).toBeLessThanOrEqual(1);
-          expect(score.rationaleQuality).toBeGreaterThanOrEqual(0);
-          expect(score.rationaleQuality).toBeLessThanOrEqual(1);
-          expect(score.overall).toBeGreaterThanOrEqual(0);
-          expect(score.overall).toBeLessThanOrEqual(1);
-        }
-      }
-    });
-  });
-  describe('Trinity Code Execution Verification', () => {
-    it('Trinity actually produces valid artifacts for fixture cases (CODE INVOCATION)', () => {
-      // This test ACTUALLY INVOKES the Trinity code path, not just fixture validation
-      let successCount = 0;
-      let artifactCount = 0;
-      for (const testCase of fixture.testCases) {
-        const snapshot = createSnapshotFromFixture(testCase);
-        const config: TrinityConfig = {
-          useTrinity: true,
-          maxCandidates: 3,
-          useStubs: true,
-        };
-        const result = runTrinity({ snapshot, principleId: testCase.principleId, config });
-        if (result.success && result.artifact) {
-          successCount++;
-          artifactCount++;
-          // Verify artifact has required fields
-          expect(result.artifact.badDecision).toBeTruthy();
-          expect(result.artifact.betterDecision).toBeTruthy();
-          expect(result.artifact.rationale).toBeTruthy();
-        }
-      }
-      // Verify that Trinity succeeded for all fixture cases
-      expect(successCount).toBe(fixture.testCases.length);
-      expect(artifactCount).toBe(fixture.testCases.length);
-    });
-    it('Trinity candidate count matches fixture expectations', () => {
-      for (const testCase of fixture.testCases) {
-        const snapshot = createSnapshotFromFixture(testCase);
-        const config: TrinityConfig = {
-          useTrinity: true,
-          maxCandidates: 3,
-          useStubs: true,
-        };
-        const result = runTrinity({ snapshot, principleId: testCase.principleId, config });
-        expect(result.success).toBe(true);
-        expect(result.telemetry.candidateCount).toBeGreaterThan(0);
-        expect(result.telemetry.dreamerPassed).toBe(true);
-        expect(result.telemetry.philosopherPassed).toBe(true);
-        expect(result.telemetry.scribePassed).toBe(true);
-      }
-    });
-  });
-  /**
-   * Compute a quality score from an artifact using simple heuristics.
-   * This is a simplified scoring that doesn't require Philosopher judgments.
-   */
-  /**
-   * Compute a quality score from an artifact using heuristics calibrated to
-   * produce scores comparable to fixture baseline (~0.85-0.95) for stub outputs.
-   *
-   * The scoring is designed to give meaningful credit for concise but
-   * substantive content typical of stub-generated artifacts.
-   */
-  function computeArtifactQuality(artifact: { rationale: string; betterDecision: string; badDecision: string }): {
-    specificity: number;
-    actionability: number;
-    rationaleQuality: number;
-    overall: number;
-  } {
-    // Specificity: how detailed is the badDecision?
-    // Base 0.6 + up to 0.4 for length, reaching 1.0 at ~40 chars
-    const specificity = Math.min(1.0, 0.6 + artifact.badDecision.length / 100);
-    // Actionability: does betterDecision contain actionable patterns?
-    // Base 0.65 + 0.35 for actionable verbs (gives 0.65 or 1.0)
-    const actionableVerbs = ['read', 'check', 'verify', 'edit', 'write', 'search', 'review', 'analyze', 'diagnose', 'debug', 'inspect', 'examine', 'test'];
-    const hasActionable = actionableVerbs.some((v) =>
-      artifact.betterDecision.toLowerCase().includes(v)
-    );
-    const actionability = hasActionable ? 1.0 : 0.65;
-    // Rationale quality: more generous for shorter texts
-    // Base 0.5 + up to 0.5 for length, reaching 1.0 at ~42 chars
-    const rationaleQuality = Math.min(1.0, 0.5 + artifact.rationale.length / 85);
-    // Overall: weighted average
-    const overall = specificity * 0.3 + actionability * 0.4 + rationaleQuality * 0.3;
-    return { specificity, actionability, rationaleQuality, overall };
-  }
-  describe('Computed Quality Comparison (ACTUAL CODE SCORING)', () => {
-    it('Trinity produces higher quality artifacts than fixture single-reflector baseline (COMPUTED)', () => {
-      // This test ACTUALLY COMPUTES quality scores from the generated artifacts
-      // and compares them against the fixture's single-reflector baseline.
-      for (const testCase of fixture.testCases) {
-        const snapshot = createSnapshotFromFixture(testCase);
-        const config: TrinityConfig = {
-          useTrinity: true,
-          maxCandidates: 3,
-          useStubs: true,
-        };
-        const result = runTrinity({ snapshot, principleId: testCase.principleId, config });
-        // Trinity should succeed
-        expect(result.success).toBe(true);
-        expect(result.artifact).toBeDefined();
-        // Compute quality from actual Trinity artifact
-        const trinityQuality = computeArtifactQuality(result.artifact!);
-        // Get fixture single-reflector baseline
-        const { singleReflector } = testCase.qualityScores;
-        // ACTUAL comparison: Trinity computed overall should exceed fixture baseline
-        // This is a REAL computed comparison, not fixture data assertion
-        expect(trinityQuality.overall).toBeGreaterThan(singleReflector.overall);
-      }
-    });
-    it('Trinity artifact quality exceeds single-reflector in ALL quality dimensions (COMPUTED)', () => {
-      // ACTUAL comparison across all quality dimensions
-      for (const testCase of fixture.testCases) {
-        const snapshot = createSnapshotFromFixture(testCase);
-        const config: TrinityConfig = {
-          useTrinity: true,
-          maxCandidates: 3,
-          useStubs: true,
-        };
-        const result = runTrinity({ snapshot, principleId: testCase.principleId, config });
-        expect(result.success).toBe(true);
-        const trinityQuality = computeArtifactQuality(result.artifact!);
-        const { singleReflector } = testCase.qualityScores;
-        // ACTUAL computed comparison
-        expect(trinityQuality.specificity).toBeGreaterThan(singleReflector.specificity);
-        expect(trinityQuality.actionability).toBeGreaterThanOrEqual(singleReflector.actionability);
-        expect(trinityQuality.rationaleQuality).toBeGreaterThan(singleReflector.rationaleQuality);
-        expect(trinityQuality.overall).toBeGreaterThan(singleReflector.overall);
-      }
-    });
-    it('Trinity tournament selects higher-scoring candidate (TRACE VERIFICATION)', () => {
-      // Verify the tournament actually ran and selected a winner
-      for (const testCase of fixture.testCases) {
-        const snapshot = createSnapshotFromFixture(testCase);
-        const config: TrinityConfig = {
-          useTrinity: true,
-          maxCandidates: 3,
-          useStubs: true,
-        };
-        const result = runTrinity({ snapshot, principleId: testCase.principleId, config });
-        expect(result.success).toBe(true);
-        expect(result.artifact).toBeDefined();
-        // Verify tournament trace exists
-        expect(result.telemetry.tournamentTrace).toBeDefined();
-        expect(result.telemetry.tournamentTrace.length).toBeGreaterThan(0);
-        // Verify winner was selected
-        expect(result.telemetry.winnerAggregateScore).toBeDefined();
-        expect(result.telemetry.eligibleCandidateCount).toBeDefined();
-        expect(result.telemetry.eligibleCandidateCount).toBeGreaterThan(0);
-        // Verify the selected candidate index is valid
-        expect(result.artifact!.selectedCandidateIndex).toBeGreaterThanOrEqual(0);
-        expect(result.artifact!.selectedCandidateIndex).toBeLessThan(result.telemetry.candidateCount);
-      }
-    });
-  });
-  describe('Single-Reflector vs Trinity Quality Comparison (Fixture Baseline)', () => {
-    it('Trinity overall score exceeds single-reflector in all cases', () => {
-      for (const testCase of fixture.testCases) {
-        const { singleReflector, trinity } = testCase.qualityScores;
-        const trinityWinsOverall = trinity.overall > singleReflector.overall;
-        expect(trinityWinsOverall).toBe(testCase.trinityWins);
-      }
-    });
-    it('Trinity has higher specificity in all cases', () => {
-      for (const testCase of fixture.testCases) {
-        const { singleReflector, trinity } = testCase.qualityScores;
-        expect(trinity.specificity).toBeGreaterThan(singleReflector.specificity);
-      }
-    });
-    it('Trinity has higher principle alignment in all cases', () => {
-      for (const testCase of fixture.testCases) {
-        const { singleReflector, trinity } = testCase.qualityScores;
-        expect(trinity.principleAlignment).toBeGreaterThanOrEqual(singleReflector.principleAlignment);
-      }
-    });
-    it('Trinity has higher actionability in all cases', () => {
-      for (const testCase of fixture.testCases) {
-        const { singleReflector, trinity } = testCase.qualityScores;
-        expect(trinity.actionability).toBeGreaterThan(singleReflector.actionability);
-      }
-    });
-    it('Trinity has higher rationale quality in all cases', () => {
-      for (const testCase of fixture.testCases) {
-        const { singleReflector, trinity } = testCase.qualityScores;
-        expect(trinity.rationaleQuality).toBeGreaterThan(singleReflector.rationaleQuality);
-      }
-    });
-  });
-  describe('Reproducibility Evidence', () => {
-    it('produces deterministic results for the same inputs', () => {
-      // This test verifies that comparing the same case twice gives the same result
-      // (no randomness in the comparison logic)
-      for (const testCase of fixture.testCases) {
-        const result1 = testCase.qualityScores.trinity.overall > testCase.qualityScores.singleReflector.overall;
-        const result2 = testCase.qualityScores.trinity.overall > testCase.qualityScores.singleReflector.overall;
-        expect(result1).toBe(result2);
-      }
-    });
-    it('produces consistent deltas for the same inputs', () => {
-      for (const testCase of fixture.testCases) {
-        const delta = testCase.qualityScores.trinity.overall - testCase.qualityScores.singleReflector.overall;
-        // Re-calculating should give same delta
-        const recalculatedDelta = testCase.qualityScores.trinity.overall - testCase.qualityScores.singleReflector.overall;
-        expect(delta).toBe(recalculatedDelta);
-      }
-    });
-  });
-  describe('Summary Statistics', () => {
-    it('summary.totalCases matches testCases length', () => {
-      expect(fixture.summary.totalCases).toBe(fixture.testCases.length);
-    });
-    it('summary.trinityWins matches actual count', () => {
-      const actualTrinityWins = fixture.testCases.filter((tc) => tc.trinityWins).length;
-      expect(fixture.summary.trinityWins).toBe(actualTrinityWins);
-    });
-    it('summary.averageDelta structure is valid', () => {
-      // Just verify the structure exists and values are in expected ranges
-      expect(fixture.summary.averageDelta.specificity).toBeGreaterThan(0);
-      expect(fixture.summary.averageDelta.principleAlignment).toBeGreaterThan(0);
-      expect(fixture.summary.averageDelta.actionability).toBeGreaterThan(0);
-      expect(fixture.summary.averageDelta.rationaleQuality).toBeGreaterThan(0);
-      expect(fixture.summary.averageDelta.overall).toBeGreaterThan(0);
-    });
-    it('conclusion is consistent with results', () => {
-      if (fixture.summary.trinityWins > fixture.summary.singleReflectorWins) {
-        expect(fixture.summary.conclusion).toContain('Trinity');
-        expect(fixture.summary.conclusion).toContain('outperforms');
-      }
-    });
-  });
-  describe('Telemetry Validation', () => {
-    it('all Trinity outputs have valid telemetry', () => {
-      for (const testCase of fixture.testCases) {
-        const telemetry = testCase.trinityOutput.telemetry as Record<string, unknown> | undefined;
-        expect(telemetry).toBeDefined();
-        expect(telemetry?.chainMode).toBe('trinity');
-        expect(telemetry?.dreamerPassed).toBe(true);
-        expect(telemetry?.philosopherPassed).toBe(true);
-        expect(telemetry?.scribePassed).toBe(true);
-        expect(typeof telemetry?.candidateCount).toBe('number');
-        expect(telemetry?.candidateCount).toBeGreaterThan(0);
-      }
-    });
-    it('all Trinity outputs have selectedCandidateIndex within candidate count', () => {
-      for (const testCase of fixture.testCases) {
-        const telemetry = testCase.trinityOutput.telemetry as Record<string, unknown>;
-        const selectedIndex = testCase.trinityOutput.selectedCandidateIndex as number;
-        const candidateCount = telemetry?.candidateCount as number;
-        expect(selectedIndex).toBeGreaterThanOrEqual(0);
-        expect(selectedIndex).toBeLessThan(candidateCount);
-      }
-    });
-  });
-});

package/tests/core/nocturnal-rule-implementation-validator.test.ts DELETED Viewed

@@ -1,127 +0,0 @@
-import { describe, expect, it } from 'vitest';
-import { validateRuleImplementationCandidate } from '../../src/core/nocturnal-rule-implementation-validator.js';
-describe('nocturnal-rule-implementation-validator', () => {
-  it('accepts a RuleHost-compatible candidate and reports helper usage', () => {
-    const result = validateRuleImplementationCandidate(`
-      export const meta = {
-        name: 'risk-write-guard',
-        version: '1.0.0',
-        ruleId: 'R-001',
-        coversCondition: 'risky write'
-      };
-      export function evaluate(input, helpers) {
-        if (helpers.isRiskPath() && helpers.getToolName() === 'write') {
-          return {
-            decision: 'requireApproval',
-            matched: true,
-            reason: 'Risk path write requires approval'
-          };
-        }
-        return {
-          decision: 'allow',
-          matched: false,
-          reason: 'not applicable'
-        };
-      }
-    `);
-    expect(result.passed).toBe(true);
-    expect(result.failures).toEqual([]);
-    expect(result.helperUsage).toEqual(['isRiskPath', 'getToolName']);
-    expect(result.meta).toMatchObject({
-      ruleId: 'R-001',
-      name: 'risk-write-guard',
-    });
-  });
-  it('rejects forbidden APIs before compile/load checks', () => {
-    const result = validateRuleImplementationCandidate(`
-      export const meta = {
-        name: 'bad-guard',
-        version: '1.0.0',
-        ruleId: 'R-001',
-        coversCondition: 'bad'
-      };
-      export function evaluate() {
-        const fn = eval('1 + 1');
-        return {
-          decision: 'allow',
-          matched: false,
-          reason: String(fn)
-        };
-      }
-    `);
-    expect(result.passed).toBe(false);
-    expect(result.failures).toEqual(
-      expect.arrayContaining([
-        expect.objectContaining({
-          code: 'forbidden-api',
-          detail: 'eval',
-        }),
-      ])
-    );
-  });
-  it('rejects malformed exports when meta is missing', () => {
-    const result = validateRuleImplementationCandidate(`
-      export function evaluate() {
-        return {
-          decision: 'allow',
-          matched: false,
-          reason: 'missing meta'
-        };
-      }
-    `);
-    expect(result.passed).toBe(false);
-    expect(result.failures).toEqual(
-      expect.arrayContaining([
-        expect.objectContaining({
-          code: 'missing-meta',
-        }),
-      ])
-    );
-  });
-  it('rejects candidates whose evaluate result does not satisfy RuleHostResult', () => {
-    const result = validateRuleImplementationCandidate(`
-      export const meta = {
-        name: 'wrong-result-shape',
-        version: '1.0.0',
-        ruleId: 'R-001',
-        coversCondition: 'bad result'
-      };
-      export function evaluate() {
-        return {
-          decision: 'noop',
-          matched: 'sometimes',
-          reason: 42
-        };
-      }
-    `);
-    expect(result.passed).toBe(false);
-    expect(result.failures).toEqual(
-      expect.arrayContaining([
-        expect.objectContaining({
-          code: 'invalid-result',
-          detail: 'decision',
-        }),
-        expect.objectContaining({
-          code: 'invalid-result',
-          detail: 'matched',
-        }),
-        expect.objectContaining({
-          code: 'invalid-result',
-          detail: 'reason',
-        }),
-      ])
-    );
-  });
-});

package/tests/core/nocturnal-snapshot-contract.test.ts DELETED Viewed

@@ -1,121 +0,0 @@
-import { describe, expect, it } from 'vitest';
-import { validateNocturnalSnapshotIngress } from '../../src/core/nocturnal-snapshot-contract.js';
-describe('validateNocturnalSnapshotIngress', () => {
-  it('accepts a fully shaped runtime snapshot', () => {
-    const result = validateNocturnalSnapshotIngress({
-      sessionId: 'session-1',
-      startedAt: '2026-04-10T00:00:00.000Z',
-      updatedAt: '2026-04-10T00:01:00.000Z',
-      assistantTurns: [],
-      userTurns: [],
-      toolCalls: [],
-      painEvents: [],
-      gateBlocks: [],
-      stats: {
-        totalAssistantTurns: 1,
-        totalToolCalls: 2,
-        totalPainEvents: 0,
-        totalGateBlocks: 0,
-        failureCount: 0,
-      },
-    });
-    expect(result.status).toBe('valid');
-    expect(result.snapshot?.sessionId).toBe('session-1');
-  });
-  it('rejects reduced pseudo-snapshots that omit canonical fields', () => {
-    const result = validateNocturnalSnapshotIngress({
-      sessionId: 'session-1',
-      sessionStart: '2026-04-10T00:00:00.000Z',
-      stats: {
-        totalAssistantTurns: 1,
-        totalToolCalls: 2,
-        totalPainEvents: 0,
-        totalGateBlocks: 0,
-        failureCount: 0,
-      },
-      recentPain: [],
-    });
-    expect(result.status).toBe('invalid');
-    expect(result.reasons).toContain('snapshot.startedAt must be a non-empty string');
-    expect(result.reasons).toContain('snapshot.assistantTurns must be an array');
-  });
-  it('rejects fallback snapshots with no pain signal', () => {
-    const result = validateNocturnalSnapshotIngress({
-      sessionId: 'session-1',
-      startedAt: '2026-04-10T00:00:00.000Z',
-      updatedAt: '2026-04-10T00:00:00.000Z',
-      assistantTurns: [],
-      userTurns: [],
-      toolCalls: [],
-      painEvents: [],
-      gateBlocks: [],
-      stats: {
-        totalAssistantTurns: 0,
-        totalToolCalls: 0,
-        totalPainEvents: 0,
-        totalGateBlocks: 0,
-        failureCount: 0,
-      },
-      _dataSource: 'pain_context_fallback',
-    });
-    expect(result.status).toBe('invalid');
-    expect(result.reasons).toContain('fallback snapshot must contain at least one pain signal');
-  });
-  // #246: null stats fields should now be rejected (they used to be accepted for fallback)
-  it('rejects null values in stats fields', () => {
-    const result = validateNocturnalSnapshotIngress({
-      sessionId: 'session-1',
-      startedAt: '2026-04-10T00:00:00.000Z',
-      updatedAt: '2026-04-10T00:00:00.000Z',
-      assistantTurns: [],
-      userTurns: [],
-      toolCalls: [],
-      painEvents: [{ source: 'test', score: 5, severity: 'high', reason: 'test', createdAt: '2026-04-10T00:00:00.000Z' }],
-      gateBlocks: [],
-      stats: {
-        totalAssistantTurns: null,
-        totalToolCalls: null,
-        totalPainEvents: 1,
-        totalGateBlocks: null,
-        failureCount: null,
-      },
-      _dataSource: 'pain_context_fallback',
-    });
-    expect(result.status).toBe('invalid');
-    expect(result.reasons).toContain('snapshot.stats.totalAssistantTurns must be a finite number');
-    expect(result.reasons).toContain('snapshot.stats.totalToolCalls must be a finite number');
-    expect(result.reasons).toContain('snapshot.stats.totalGateBlocks must be a finite number');
-    expect(result.reasons).toContain('snapshot.stats.failureCount must be a finite number');
-  });
-  it('accepts fallback snapshot with valid stats and pain signal', () => {
-    const result = validateNocturnalSnapshotIngress({
-      sessionId: 'session-1',
-      startedAt: '2026-04-10T00:00:00.000Z',
-      updatedAt: '2026-04-10T00:00:00.000Z',
-      assistantTurns: [],
-      userTurns: [],
-      toolCalls: [],
-      painEvents: [{ source: 'test', score: 5, severity: 'high', reason: 'test', createdAt: '2026-04-10T00:00:00.000Z' }],
-      gateBlocks: [],
-      stats: {
-        totalAssistantTurns: 0,
-        totalToolCalls: 0,
-        totalPainEvents: 1,
-        totalGateBlocks: 0,
-        failureCount: 0,
-      },
-      _dataSource: 'pain_context_fallback',
-    });
-    expect(result.status).toBe('valid');
-  });
-});