npm - principles-disciple - Versions diffs - 1.72.0 → 1.74.0 - Mend

principles-disciple 1.72.0 → 1.74.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (319) hide show

package/INSTALL.md +1 -3
package/openclaw.plugin.json +10 -5
package/package.json +17 -19
package/scripts/acceptance-test.mjs +16 -73
package/scripts/sync-plugin.mjs +382 -77
package/src/commands/archive-impl.ts +2 -1
package/src/commands/capabilities.ts +2 -2
package/src/commands/context.ts +2 -2
package/src/commands/disable-impl.ts +2 -1
package/src/commands/evolution-status.ts +16 -16
package/src/commands/export.ts +12 -67
package/src/commands/pain.ts +91 -1
package/src/commands/principle-rollback.ts +2 -1
package/src/commands/promote-impl.ts +7 -43
package/src/commands/rollback-impl.ts +2 -1
package/src/commands/rollback.ts +2 -1
package/src/commands/samples.ts +2 -1
package/src/commands/thinking-os.ts +2 -1
package/src/config/errors.ts +18 -2
package/src/constants/diagnostician.ts +2 -2
package/src/constants/tools.ts +2 -1
package/src/core/__tests__/focus-history.test.ts +210 -0
package/src/core/config.ts +1 -1
package/src/core/correction-cue-learner.ts +2 -136
package/src/core/correction-types.ts +16 -88
package/src/core/dictionary.ts +19 -20
package/src/core/empathy-keyword-matcher.ts +17 -289
package/src/core/empathy-types.ts +18 -229
package/src/core/event-log.ts +29 -132
package/src/core/evolution-reducer.ts +21 -2
package/src/core/evolution-types.ts +76 -464
package/src/core/file-store.ts +80 -0
package/src/core/focus-history.ts +228 -955
package/src/core/local-worker-routing.ts +34 -314
package/src/core/merge-gate-audit.ts +0 -195
package/src/core/migration.ts +0 -1
package/src/core/pain-diagnostic-gate.ts +154 -0
package/src/core/pain-signal.ts +21 -138
package/src/core/pain.ts +15 -88
package/src/core/path-resolver.ts +0 -1
package/src/core/paths.ts +0 -1
package/src/core/pd-task-reconciler.ts +26 -115
package/src/core/pd-task-service.ts +9 -9
package/src/core/pd-task-types.ts +23 -127
package/src/core/principle-compiler/__tests__/compiler-replay-gate.test.ts +174 -0
package/src/core/principle-compiler/code-validator.ts +15 -42
package/src/core/principle-compiler/compiler.ts +100 -15
package/src/core/principle-compiler/index.ts +5 -2
package/src/core/principle-compiler/template-generator.ts +4 -104
package/src/core/principle-injection.ts +10 -202
package/src/core/principle-internalization/filesystem-lifecycle-datasource.ts +42 -0
package/src/core/principle-internalization/lifecycle-read-model.ts +39 -242
package/src/core/principle-internalization/principle-lifecycle-service.ts +12 -10
package/src/core/principle-tree-ledger-adapter.ts +145 -0
package/src/core/principle-tree-ledger.ts +8 -6
package/src/core/reflection/reflection-context.ts +14 -109
package/src/core/replay-engine.ts +8 -500
package/src/core/rule-host-helpers.ts +5 -35
package/src/core/rule-host-types.ts +10 -82
package/src/core/rule-host.ts +6 -63
package/src/core/runtime-v2-prompt-activation-reader.ts +231 -0
package/src/core/session-tracker.ts +87 -101
package/src/core/shadow-observation-registry.ts +19 -48
package/src/core/trajectory.ts +3 -1
package/src/core/workflow-funnel-loader.ts +62 -68
package/src/core/workspace-context.ts +46 -0
package/src/core/workspace-dir-service.ts +1 -1
package/src/core/workspace-dir-validation.ts +18 -9
package/src/hooks/AGENTS.md +1 -1
package/src/hooks/gate-block-helper.ts +71 -64
package/src/hooks/gate.ts +183 -31
package/src/hooks/lifecycle.ts +30 -32
package/src/hooks/llm.ts +60 -32
package/src/hooks/pain.ts +297 -103
package/src/hooks/prompt.ts +400 -440
package/src/hooks/subagent.ts +2 -29
package/src/i18n/commands.ts +2 -10
package/src/index.ts +95 -85
package/src/openclaw-sdk.ts +311 -0
package/src/service/central-database.ts +8 -4
package/src/service/evolution-queue-migration.ts +2 -1
package/src/service/evolution-worker.ts +163 -1786
package/src/service/internalization-trigger-adapter.ts +302 -0
package/src/service/keyword-optimization-service.ts +4 -4
package/src/service/monitoring-query-service.ts +1 -215
package/src/service/queue-io.ts +60 -331
package/src/service/runtime-summary-service.ts +59 -16
package/src/service/subagent-workflow/index.ts +0 -41
package/src/service/subagent-workflow/types.ts +9 -120
package/src/service/subagent-workflow/workflow-store.ts +2 -119
package/src/service/workflow-watchdog.ts +0 -43
package/src/types/event-payload.ts +16 -74
package/src/types/event-types.ts +38 -547
package/src/types/hygiene-types.ts +7 -30
package/src/types/principle-tree-schema.ts +20 -222
package/src/types/queue.ts +15 -70
package/src/types/runtime-summary.ts +5 -49
package/src/utils/io.ts +8 -20
package/src/utils/retry.ts +1 -1
package/src/utils/shadow-fingerprint.ts +2 -2
package/src/utils/workspace-resolver.ts +50 -0
package/templates/langs/en/core/AGENTS.md +7 -7
package/templates/langs/en/core/BOOT.md +1 -1
package/templates/langs/en/core/HEARTBEAT.md +2 -2
package/templates/langs/en/principles/THINKING_OS.md +3 -2
package/templates/langs/en/skills/ai-sprint-orchestration/references/agent-registry.json +1 -72
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/bugfix-complex-template.json +6 -6
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/feature-complex-template.json +6 -6
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal-verify.json +2 -12
package/templates/langs/en/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal.json +2 -12
package/templates/langs/en/skills/ai-sprint-orchestration/scripts/run.mjs +51 -15
package/templates/langs/en/skills/evolve-task/SKILL.md +3 -3
package/templates/langs/en/skills/pd-cli-operator/SKILL.md +67 -0
package/templates/langs/en/skills/pd-diagnostician/SKILL.md +1 -1
package/templates/langs/en/skills/pd-mentor/SKILL.md +2 -3
package/templates/langs/en/skills/pd-pain-signal/SKILL.md +17 -39
package/templates/langs/en/skills/pd-runtime-v2/SKILL.md +61 -0
package/templates/langs/zh/core/AGENTS.md +7 -7
package/templates/langs/zh/core/BOOT.md +1 -1
package/templates/langs/zh/core/HEARTBEAT.md +2 -2
package/templates/langs/zh/principles/THINKING_OS.md +3 -2
package/templates/langs/zh/skills/ai-sprint-orchestration/references/agent-registry.json +1 -72
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/bugfix-complex-template.json +6 -6
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/feature-complex-template.json +6 -6
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/nocturnal-trinity-quality-enhancement.json +8 -8
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal-verify.json +2 -12
package/templates/langs/zh/skills/ai-sprint-orchestration/references/specs/workflow-validation-minimal.json +2 -12
package/templates/langs/zh/skills/ai-sprint-orchestration/scripts/run.mjs +51 -15
package/templates/langs/zh/skills/ai-sprint-orchestration/test/run.test.mjs +21 -5
package/templates/langs/zh/skills/evolve-task/SKILL.md +4 -4
package/templates/langs/zh/skills/pd-cli-operator/SKILL.md +67 -0
package/templates/langs/zh/skills/pd-diagnostician/SKILL.md +1 -1
package/templates/langs/zh/skills/pd-mentor/SKILL.md +2 -3
package/templates/langs/zh/skills/pd-pain-signal/SKILL.md +17 -38
package/templates/langs/zh/skills/pd-runtime-v2/SKILL.md +61 -0
package/tests/build-artifacts.test.ts +1 -3
package/tests/commands/evolution-status.test.ts +0 -118
package/tests/core/bootstrap-rules.test.ts +1 -1
package/tests/core/config.test.ts +1 -1
package/tests/core/event-log.test.ts +35 -0
package/tests/core/evolution-engine.test.ts +610 -0
package/tests/core/file-store.test.ts +102 -0
package/tests/core/focus-history.test.ts +203 -11
package/tests/core/merge-gate-audit.test.ts +2 -169
package/tests/core/migration.test.ts +7 -7
package/tests/core/model-deployment-registry.test.ts +7 -1
package/tests/core/model-training-registry.test.ts +19 -0
package/tests/core/observability.test.ts +0 -1
package/tests/core/pain-diagnostic-gate.test.ts +498 -0
package/tests/core/pain.test.ts +0 -1
package/tests/core/path-resolver.test.ts +1 -1
package/tests/core/paths-refactor.test.ts +0 -22
package/tests/core/principle-internalization/deprecated-readiness.test.ts +2 -2
package/tests/core/principle-internalization/lifecycle-metrics.test.ts +2 -2
package/tests/core/principle-internalization/{internalization-routing-policy.test.ts → lifecycle-routing-policy.test.ts} +6 -6
package/tests/core/principle-internalization/lineage-source-retired.test.ts +56 -0
package/tests/core/principle-internalization/principle-lifecycle-service.test.ts +1 -23
package/tests/core/principle-tree-ledger-adapter.test.ts +253 -0
package/tests/core/reflection-context.test.ts +0 -14
package/tests/core/replay-engine.test.ts +127 -215
package/tests/core/rule-host-helpers.test.ts +2 -2
package/tests/core/rule-implementation-runtime.test.ts +0 -27
package/tests/core/workflow-funnel-loader.test.ts +162 -0
package/tests/core/workspace-context.test.ts +2 -2
package/tests/core/workspace-dir-validation.test.ts +8 -1
package/tests/core-anti-growth.test.ts +191 -0
package/tests/hook-workspace-nextaction-contract.test.ts +42 -0
package/tests/hooks/confirm-first-removal.test.ts +188 -0
package/tests/hooks/gate-auto-correct-shadow.test.ts +310 -0
package/tests/hooks/gate-auto-correct.test.ts +665 -0
package/tests/hooks/gate-no-path-write-tool.test.ts +172 -0
package/tests/hooks/gate-rule-host-pipeline.test.ts +2 -1
package/tests/hooks/pain.test.ts +269 -12
package/tests/hooks/prompt-characterization.test.ts +500 -0
package/tests/hooks/prompt-size-guard.test.ts +32 -17
package/tests/hooks/runtime-v2-prompt-activation.test.ts +869 -0
package/tests/index.test.ts +94 -1
package/tests/integration/auto-entry-gate.test.ts +248 -0
package/tests/integration/internalization-trigger-guard.test.ts +69 -0
package/tests/integration/m8-legacy-paths.test.ts +63 -0
package/tests/integration/runtime-v2-pain-guard.test.ts +125 -0
package/tests/plugin-config-resolution-cutover.test.ts +359 -0
package/tests/runtime-v2-discovery-guard.test.ts +154 -0
package/tests/service/central-database.test.ts +457 -0
package/tests/service/evolution-worker.correction-observer.test.ts +173 -0
package/tests/service/evolution-worker.timeout.test.ts +11 -129
package/tests/service/internalization-trigger-adapter.test.ts +251 -0
package/tests/service/monitoring-query-service.test.ts +1 -47
package/tests/service/queue-io.test.ts +1 -62
package/tests/service/runtime-summary-service.test.ts +3 -1
package/tests/service/workflow-watchdog.test.ts +0 -91
package/tests/utils/file-lock.test.ts +5 -3
package/tests/utils/session-key.test.ts +52 -0
package/tests/utils/subagent-probe.test.ts +48 -1
package/vitest.config.ts +4 -11
package/.planning/codebase/ARCHITECTURE.md +0 -157
package/.planning/codebase/CONCERNS.md +0 -145
package/.planning/codebase/CONVENTIONS.md +0 -148
package/.planning/codebase/INTEGRATIONS.md +0 -81
package/.planning/codebase/STACK.md +0 -87
package/.planning/codebase/STRUCTURE.md +0 -193
package/.planning/codebase/TESTING.md +0 -243
package/.planning/phases/01-basic-visualization/01-GAP-CLOSURE-VERIFICATION.md +0 -113
package/docs/COMMAND_REFERENCE.md +0 -76
package/docs/COMMAND_REFERENCE_EN.md +0 -79
package/scripts/build-web.mjs +0 -46
package/scripts/diagnose-nocturnal.mjs +0 -537
package/scripts/seed-nocturnal-scenarios.mjs +0 -384
package/src/commands/nocturnal-review.ts +0 -322
package/src/commands/nocturnal-rollout.ts +0 -790
package/src/commands/nocturnal-train.ts +0 -986
package/src/commands/pd-reflect.ts +0 -88
package/src/core/adaptive-thresholds.ts +0 -478
package/src/core/diagnostician-task-store.ts +0 -192
package/src/core/nocturnal-arbiter.ts +0 -715
package/src/core/nocturnal-artifact-lineage.ts +0 -116
package/src/core/nocturnal-artificer.ts +0 -257
package/src/core/nocturnal-candidate-scoring.ts +0 -530
package/src/core/nocturnal-compliance.ts +0 -1146
package/src/core/nocturnal-dataset.ts +0 -763
package/src/core/nocturnal-executability.ts +0 -428
package/src/core/nocturnal-export.ts +0 -499
package/src/core/nocturnal-paths.ts +0 -240
package/src/core/nocturnal-reasoning-deriver.ts +0 -343
package/src/core/nocturnal-rule-implementation-validator.ts +0 -246
package/src/core/nocturnal-snapshot-contract.ts +0 -99
package/src/core/nocturnal-trajectory-extractor.ts +0 -512
package/src/core/nocturnal-trinity-types.ts +0 -218
package/src/core/nocturnal-trinity.ts +0 -2680
package/src/core/principle-internalization/deprecated-readiness.ts +0 -93
package/src/core/principle-internalization/internalization-routing-policy.ts +0 -208
package/src/core/principle-internalization/lifecycle-metrics.ts +0 -152
package/src/http/principles-console-route.ts +0 -709
package/src/service/central-health-service.ts +0 -49
package/src/service/central-overview-service.ts +0 -138
package/src/service/control-ui-query-service.ts +0 -900
package/src/service/cooldown-strategy.ts +0 -97
package/src/service/evolution-pain-context.ts +0 -79
package/src/service/evolution-query-service.ts +0 -407
package/src/service/health-query-service.ts +0 -1038
package/src/service/nocturnal-config.ts +0 -214
package/src/service/nocturnal-runtime.ts +0 -734
package/src/service/nocturnal-service.ts +0 -1605
package/src/service/nocturnal-target-selector.ts +0 -545
package/src/service/sleep-cycle.ts +0 -157
package/src/service/startup-reconciler.ts +0 -112
package/src/service/subagent-workflow/correction-observer-types.ts +0 -82
package/src/service/subagent-workflow/correction-observer-workflow-manager.ts +0 -250
package/src/service/subagent-workflow/deep-reflect-workflow-manager.ts +0 -1
package/src/service/subagent-workflow/dynamic-timeout.ts +0 -30
package/src/service/subagent-workflow/empathy-observer-workflow-manager.ts +0 -268
package/src/service/subagent-workflow/nocturnal-workflow-manager.ts +0 -795
package/src/service/subagent-workflow/runtime-direct-driver.ts +0 -268
package/src/service/subagent-workflow/workflow-manager-base.ts +0 -580
package/src/tools/write-pain-flag.ts +0 -215
package/templates/langs/en/skills/plan-script/SKILL.md +0 -32
package/templates/langs/zh/skills/plan-script/SKILL.md +0 -32
package/tests/commands/nocturnal-review.test.ts +0 -448
package/tests/commands/nocturnal-train.test.ts +0 -97
package/tests/commands/pd-reflect.test.ts +0 -49
package/tests/core/adaptive-thresholds.test.ts +0 -261
package/tests/core/nocturnal-arbiter.test.ts +0 -559
package/tests/core/nocturnal-artifact-lineage.test.ts +0 -53
package/tests/core/nocturnal-artificer.test.ts +0 -241
package/tests/core/nocturnal-candidate-scoring.test.ts +0 -532
package/tests/core/nocturnal-compliance-p-principles.test.ts +0 -133
package/tests/core/nocturnal-compliance.test.ts +0 -646
package/tests/core/nocturnal-dataset.test.ts +0 -892
package/tests/core/nocturnal-e2e.test.ts +0 -234
package/tests/core/nocturnal-executability.test.ts +0 -357
package/tests/core/nocturnal-export.test.ts +0 -517
package/tests/core/nocturnal-reasoning-deriver.test.ts +0 -372
package/tests/core/nocturnal-reviewed-subset-comparison.test.ts +0 -428
package/tests/core/nocturnal-rule-implementation-validator.test.ts +0 -127
package/tests/core/nocturnal-snapshot-contract.test.ts +0 -121
package/tests/core/nocturnal-trajectory-extractor.test.ts +0 -634
package/tests/core/nocturnal-trinity.test.ts +0 -2053
package/tests/core/pain-auto-repair.test.ts +0 -96
package/tests/core/pain-integration.test.ts +0 -510
package/tests/fixtures/nocturnal-reviewed-subset.json +0 -183
package/tests/http/principles-console-route.test.ts +0 -162
package/tests/integration/chaos-resilience.test.ts +0 -348
package/tests/integration/empathy-workflow-integration.test.ts +0 -626
package/tests/integration/pain-diagnostician-loop.e2e.test.ts +0 -380
package/tests/service/control-ui-query-service.test.ts +0 -121
package/tests/service/cooldown-strategy.test.ts +0 -164
package/tests/service/data-endpoints-regression.test.ts +0 -834
package/tests/service/empathy-observer-workflow-manager.test.ts +0 -175
package/tests/service/evolution-worker.nocturnal.test.ts +0 -601
package/tests/service/nocturnal-runtime-hardening.test.ts +0 -118
package/tests/service/nocturnal-runtime.test.ts +0 -473
package/tests/service/nocturnal-service-code-candidate.test.ts +0 -330
package/tests/service/nocturnal-target-selector.test.ts +0 -615
package/tests/service/startup-reconciler.test.ts +0 -148
package/tests/tools/write-pain-flag.test.ts +0 -358
package/ui/src/App.tsx +0 -45
package/ui/src/api.ts +0 -220
package/ui/src/charts.tsx +0 -955
package/ui/src/components/ErrorState.tsx +0 -6
package/ui/src/components/Loading.tsx +0 -13
package/ui/src/components/ProtectedRoute.tsx +0 -12
package/ui/src/components/Shell.tsx +0 -91
package/ui/src/components/WorkspaceConfig.tsx +0 -178
package/ui/src/components/index.ts +0 -5
package/ui/src/context/auth.tsx +0 -80
package/ui/src/context/theme.tsx +0 -66
package/ui/src/hooks/useAutoRefresh.ts +0 -39
package/ui/src/i18n/ui.ts +0 -473
package/ui/src/main.tsx +0 -16
package/ui/src/pages/EvolutionPage.tsx +0 -333
package/ui/src/pages/FeedbackPage.tsx +0 -138
package/ui/src/pages/GateMonitorPage.tsx +0 -136
package/ui/src/pages/LoginPage.tsx +0 -89
package/ui/src/pages/OverviewPage.tsx +0 -599
package/ui/src/pages/SamplesPage.tsx +0 -174
package/ui/src/pages/ThinkingModelsPage.tsx +0 -702
package/ui/src/styles.css +0 -2020
package/ui/src/types.ts +0 -384
package/ui/src/utils/format.ts +0 -15

package/tests/core/model-training-registry.test.ts CHANGED Viewed

@@ -67,6 +67,7 @@ describe('ModelTrainingRegistry registerTrainingRun', () => {
   it('registers a new training run', () => {
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc123',
       exportId: 'export-001',
@@ -87,6 +88,7 @@ describe('ModelTrainingRegistry registerTrainingRun', () => {
   it('persists the run to disk', () => {
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'claude-3',
       datasetFingerprint: 'sha256-def456',
       exportId: 'export-002',
@@ -102,6 +104,7 @@ describe('ModelTrainingRegistry registerTrainingRun', () => {
   it('generates unique trainRunIds', () => {
     const run1 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'e1',
@@ -109,6 +112,7 @@ describe('ModelTrainingRegistry registerTrainingRun', () => {
       configFingerprint: 'c1',
     });
     const run2 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-def',
       exportId: 'e2',
@@ -130,6 +134,7 @@ describe('ModelTrainingRegistry run status transitions', () => {
   beforeEach(() => {
     tmpDir = makeTmpDir();
     runId = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -186,6 +191,7 @@ describe('ModelTrainingRegistry run status transitions', () => {
     // BeforeEach already created runId as pending
     // Create run2 (also pending by default)
     const run2 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-def',
       exportId: 'exp-2',
@@ -208,6 +214,7 @@ describe('ModelTrainingRegistry run status transitions', () => {
   it('listTrainingRuns filters by targetModelFamily', () => {
     // Register gpt-4 and claude-3 runs using the tmpDir from beforeEach
     const gpt4Run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-a',
       exportId: 'e1',
@@ -215,6 +222,7 @@ describe('ModelTrainingRegistry run status transitions', () => {
       configFingerprint: 'c1',
     });
     registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'claude-3',
       datasetFingerprint: 'sha256-b',
       exportId: 'e2',
@@ -244,6 +252,7 @@ describe('ModelTrainingRegistry registerCheckpoint', () => {
   beforeEach(() => {
     tmpDir = makeTmpDir();
     runId = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -345,6 +354,7 @@ describe('ModelTrainingRegistry attachEvalSummary', () => {
   beforeEach(() => {
     tmpDir = makeTmpDir();
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -464,6 +474,7 @@ describe('ModelTrainingRegistry deployability gating', () => {
   beforeEach(() => {
     tmpDir = makeTmpDir();
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -614,6 +625,7 @@ describe('ModelTrainingRegistry deployability gating', () => {
   it('listDeployableCheckpoints returns only deployable checkpoints', () => {
     // Create another run and checkpoint
     const run2 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-def',
       exportId: 'exp-2',
@@ -661,6 +673,7 @@ describe('ModelTrainingRegistry lineage tracing', () => {
   beforeEach(() => {
     tmpDir = makeTmpDir();
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-full',
       exportId: 'exp-full',
@@ -743,6 +756,7 @@ describe('ModelTrainingRegistry stats', () => {
   it('counts runs in each status', () => {
     const run1 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-a',
       exportId: 'e1',
@@ -750,6 +764,7 @@ describe('ModelTrainingRegistry stats', () => {
       configFingerprint: 'c1',
     });
     const run2 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-b',
       exportId: 'e2',
@@ -757,6 +772,7 @@ describe('ModelTrainingRegistry stats', () => {
       configFingerprint: 'c1',
     });
     const run3 = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-c',
       exportId: 'e3',
@@ -779,6 +795,7 @@ describe('ModelTrainingRegistry stats', () => {
   it('counts passing vs failing evals', () => {
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -838,6 +855,7 @@ describe('ModelTrainingRegistry persistence', () => {
   it('getFullRegistry returns all record types', () => {
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',
@@ -870,6 +888,7 @@ describe('ModelTrainingRegistry persistence', () => {
   it('registry persists across module re-invocations', () => {
     // This test verifies the registry is written to disk
     const run = registerTrainingRun(tmpDir, {
+      experimentId: 'mock-experiment-id',
       targetModelFamily: 'gpt-4',
       datasetFingerprint: 'sha256-abc',
       exportId: 'exp-1',

package/tests/core/observability.test.ts CHANGED Viewed

@@ -187,7 +187,6 @@ describe('calculateBaselines', () => {
     // Create a trajectory DB with pain events
     const dbPath = path.join(tmpDir, 'trajectory.db');
-    // eslint-disable-next-line @typescript-eslint/no-require-imports
     const Database = require('better-sqlite3');
     const db = new Database(dbPath);
     db.exec(`

package/tests/core/pain-diagnostic-gate.test.ts ADDED Viewed

@@ -0,0 +1,498 @@
+import { beforeEach, describe, expect, it } from 'vitest';
+import { evaluatePainDiagnosticGate, resetPainDiagnosticGateForTest } from '../../src/core/pain-diagnostic-gate.js';
+describe('PainDiagnosticGate', () => {
+  beforeEach(() => {
+    resetPainDiagnosticGateForTest();
+  });
+  it('lets manual pain bypass automatic thresholds', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'manual',
+      score: 1,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'manual',
+    });
+  });
+  it('does not diagnose ordinary low-signal tool failures', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 15,
+      consecutiveErrors: 1,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('diagnoses repeated same failures', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 50,
+      consecutiveErrors: 4,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'repeated_failure',
+    });
+  });
+  it('diagnoses high GFI episodes', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 72,
+      consecutiveErrors: 2,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'high_gfi',
+    });
+  });
+  it('requires stronger score for generic semantic pain', () => {
+    const low = evaluatePainDiagnosticGate({
+      source: 'semantic',
+      score: 45,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    const high = evaluatePainDiagnosticGate({
+      source: 'semantic',
+      score: 60,
+      currentGfi: 0,
+      sessionId: 's2',
+    });
+    expect(low.shouldDiagnose).toBe(false);
+    expect(high).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'semantic_pain',
+    });
+  });
+  it('deduplicates repeated diagnosis within cooldown', () => {
+    const input = {
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 72,
+      sessionId: 's1',
+      errorHash: 'same',
+      nowMs: 1_000,
+    };
+    expect(evaluatePainDiagnosticGate(input).shouldDiagnose).toBe(true);
+    expect(evaluatePainDiagnosticGate({ ...input, nowMs: 2_000 })).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'cooldown',
+    });
+  });
+  it('diagnoses subagent_error when score >= painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'subagent_error',
+      score: 40,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'subagent_error',
+    });
+  });
+  it('skips subagent_error when score < painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'subagent_error',
+      score: 39,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('diagnoses llm_paralysis when score >= painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'llm_paralysis',
+      score: 40,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'llm_paralysis',
+    });
+  });
+  it('diagnoses risky_high_score when isRisky=true and score >= highSeverity', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 70,
+      currentGfi: 0,
+      isRisky: true,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'risky_high_score',
+    });
+  });
+  it('skips risky_high_score when isRisky=true but score < highSeverity', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 69,
+      currentGfi: 0,
+      isRisky: true,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('diagnoses user_empathy when score >= semanticPain threshold', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'user_empathy',
+      score: 60,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'semantic_pain',
+    });
+  });
+  it('uses custom threshold overrides', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 60,
+      consecutiveErrors: 2,
+      sessionId: 's1',
+      thresholds: {
+        painTrigger: 40,
+        highSeverity: 70,
+        highGfi: 55,
+        repeatedFailure: 4,
+        semanticPain: 60,
+      },
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'high_gfi',
+    });
+  });
+  it('handles exact threshold boundary (score === painTrigger)', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'subagent_error',
+      score: 40,
+      currentGfi: 0,
+      sessionId: 's1',
+      thresholds: { painTrigger: 40 },
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'subagent_error',
+    });
+  });
+  it('normalizes llm_ prefixed sources (non-paralysis) to semantic', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'llm_confusion',
+      score: 60,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'semantic_pain',
+    });
+  });
+  it('llm_paralysis is NOT normalized to semantic', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'llm_paralysis',
+      score: 40,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'llm_paralysis',
+    });
+  });
+  it('skips llm_paralysis when score < painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'llm_paralysis',
+      score: 39,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('diagnoses llm_paralysis with score 45 (new config default, PRI-274)', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'llm_paralysis',
+      score: 45,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'llm_paralysis',
+    });
+  });
+  it('cooldownMs=0 disables cooldown (allows re-diagnosis)', () => {
+    const input = {
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 72,
+      sessionId: 's1',
+      errorHash: 'same',
+      nowMs: 1_000,
+      cooldownMs: 0,
+    };
+    expect(evaluatePainDiagnosticGate(input).shouldDiagnose).toBe(true);
+    expect(evaluatePainDiagnosticGate({ ...input, nowMs: 2_000 }).shouldDiagnose).toBe(true);
+  });
+  it('treats NaN score as 0 (below gate)', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: NaN,
+      currentGfi: 72,
+      consecutiveErrors: 4,
+      sessionId: 's1',
+    });
+    expect(decision.shouldDiagnose).toBe(true);
+    expect(decision.reason).toBe('repeated_failure');
+  });
+  it('treats NaN currentGfi as 0', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: NaN,
+      consecutiveErrors: 1,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('treats Infinity score as finite for gate evaluation', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: Infinity,
+      currentGfi: 0,
+      isRisky: true,
+      sessionId: 's1',
+    });
+    expect(decision.shouldDiagnose).toBe(false);
+  });
+  it('treats NaN consecutiveErrors as 0', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 50,
+      consecutiveErrors: NaN,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('episodeKey includes sessionId, source, and errorHash', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'manual',
+      score: 1,
+      currentGfi: 0,
+      sessionId: 's-ep',
+      errorHash: 'hash-abc',
+    });
+    expect(decision.episodeKey).toContain('s-ep');
+    expect(decision.episodeKey).toContain('manual');
+    expect(decision.episodeKey).toContain('hash-abc');
+  });
+  it('episodeKey uses "unknown" when sessionId missing', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'manual',
+      score: 1,
+      currentGfi: 0,
+    });
+    expect(decision.episodeKey).toContain('unknown');
+  });
+  it('episodeKey uses "no-hash" when errorHash missing', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'manual',
+      score: 1,
+      currentGfi: 0,
+      sessionId: 's1',
+    });
+    expect(decision.episodeKey).toContain('no-hash');
+  });
+  it('manual pain is still subject to cooldown', () => {
+    const input = {
+      source: 'manual',
+      score: 100,
+      currentGfi: 0,
+      sessionId: 's1',
+      nowMs: 1_000,
+    };
+    const first = evaluatePainDiagnosticGate(input);
+    expect(first.shouldDiagnose).toBe(true);
+    const second = evaluatePainDiagnosticGate({ ...input, nowMs: 2_000 });
+    expect(second).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'cooldown',
+    });
+  });
+  it('different errorHash produces different episodeKey (no cooldown cross-contamination)', () => {
+    const base = {
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 72,
+      sessionId: 's1',
+      nowMs: 1_000,
+    };
+    expect(evaluatePainDiagnosticGate({ ...base, errorHash: 'hash-a' }).shouldDiagnose).toBe(true);
+    expect(evaluatePainDiagnosticGate({ ...base, errorHash: 'hash-b', nowMs: 2_000 }).shouldDiagnose).toBe(true);
+  });
+  it('highGfi defaults to max(highSeverity, painTrigger+30)', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'tool_failure',
+      score: 50,
+      currentGfi: 72,
+      consecutiveErrors: 1,
+      sessionId: 's1',
+      thresholds: {
+        painTrigger: 40,
+        highSeverity: 70,
+      },
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'high_gfi',
+    });
+  });
+  it('gate_block source falls through to below_gate when score below painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'gate_blocked',
+      score: 10,
+      currentGfi: 5,
+      consecutiveErrors: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('diagnoses gate_blocked when score >= painTrigger (PRI-274)', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'gate_blocked',
+      score: 45,
+      currentGfi: 0,
+      consecutiveErrors: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: true,
+      reason: 'gate_blocked',
+    });
+  });
+  it('skips gate_blocked when score < painTrigger', () => {
+    const decision = evaluatePainDiagnosticGate({
+      source: 'gate_blocked',
+      score: 39,
+      currentGfi: 0,
+      consecutiveErrors: 0,
+      sessionId: 's1',
+    });
+    expect(decision).toMatchObject({
+      shouldDiagnose: false,
+      reason: 'below_gate',
+    });
+  });
+  it('returns detail string in every decision', () => {
+    const cases = [
+      { source: 'manual' as const, score: 1, currentGfi: 0 },
+      { source: 'tool_failure' as const, score: 10, currentGfi: 5, consecutiveErrors: 0 },
+    ];
+    for (const input of cases) {
+      const decision = evaluatePainDiagnosticGate({ ...input, sessionId: 's1' });
+      expect(typeof decision.detail).toBe('string');
+      expect(decision.detail.length).toBeGreaterThan(0);
+    }
+  });
+});

package/tests/core/pain.test.ts CHANGED Viewed

@@ -4,7 +4,6 @@ import * as path from 'path';
 import {
   computePainScore,
   painSeverityLabel,
-  writePainFlag,
   readPainFlagData,
   buildPainFlag,
   validatePainFlag,

package/tests/core/path-resolver.test.ts CHANGED Viewed

@@ -20,7 +20,7 @@ describe('PathResolver', () => {
         const { PathResolver } = await import('../../src/core/path-resolver.js');
         const resolver = new PathResolver({ workspaceDir: '/test/workspace' });
-        const requiredKeys = ['PROFILE', 'PLAN', 'AGENT_SCORECARD', 'PAIN_FLAG', 'EVOLUTION_QUEUE', 'THINKING_OS', 'THINKING_OS_USAGE', 'THINKING_OS_CANDIDATES'];
+        const requiredKeys = ['PROFILE', 'AGENT_SCORECARD', 'PAIN_FLAG', 'EVOLUTION_QUEUE', 'THINKING_OS', 'THINKING_OS_USAGE', 'THINKING_OS_CANDIDATES'];
         for (const key of requiredKeys) {
             expect(() => resolver.resolve(key)).not.toThrow();

package/tests/core/paths-refactor.test.ts CHANGED Viewed

@@ -1,9 +1,5 @@
 import { describe, it, expect, vi, beforeEach } from 'vitest';
-import { planStatus } from '../../src/utils/io.js';
 import { resolvePdPath } from '../../src/core/paths.js';
-import * as fs from 'fs';
-vi.mock('fs');
 describe('Path Anchoring Integration', () => {
     const workspaceDir = '/mock/workspace';
@@ -17,26 +13,8 @@ describe('Path Anchoring Integration', () => {
         expect(resolvePdPath(workspaceDir, 'PROFILE')).toBe(expected);
     });
-    it('should resolve PLAN.md at the project root', () => {
-        const expected = '/mock/workspace/PLAN.md';
-        expect(resolvePdPath(workspaceDir, 'PLAN')).toBe(expected);
-    });
     it('should resolve AGENT_SCORECARD.json inside .state/', () => {
         const expected = '/mock/workspace/.state/AGENT_SCORECARD.json';
         expect(resolvePdPath(workspaceDir, 'AGENT_SCORECARD')).toBe(expected);
     });
-    it('planStatus should look for PLAN.md in the root', () => {
-        const rootPlanPath = '/mock/workspace/PLAN.md';
-        vi.mocked(fs.existsSync).mockImplementation((p) => p === rootPlanPath);
-        vi.mocked(fs.readFileSync).mockReturnValue('STATUS: READY');
-        const status = planStatus(workspaceDir);
-        expect(status).toBe('READY');
-        expect(fs.existsSync).toHaveBeenCalledWith(rootPlanPath);
-        // Verify it does NOT look in docs/
-        expect(fs.existsSync).not.toHaveBeenCalledWith(expect.stringContaining('docs/PLAN.md'));
-    });
 });