npm - cognitive-core - Versions diffs - 0.2.0 → 0.2.2 - Mend

cognitive-core 0.2.0 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (397) hide show

package/.claude/settings.json +111 -2
package/.sessionlog/settings.json +4 -0
package/dist/atlas.d.ts +10 -0
package/dist/atlas.d.ts.map +1 -1
package/dist/atlas.js +65 -0
package/dist/atlas.js.map +1 -1
package/dist/index.d.ts +1 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +5 -1
package/dist/index.js.map +1 -1
package/dist/learning/index.d.ts +1 -1
package/dist/learning/index.d.ts.map +1 -1
package/dist/learning/index.js.map +1 -1
package/dist/learning/pipeline.d.ts +4 -31
package/dist/learning/pipeline.d.ts.map +1 -1
package/dist/learning/pipeline.js +12 -64
package/dist/learning/pipeline.js.map +1 -1
package/dist/learning/unified-pipeline.d.ts +30 -0
package/dist/learning/unified-pipeline.d.ts.map +1 -1
package/dist/learning/unified-pipeline.js +207 -0
package/dist/learning/unified-pipeline.js.map +1 -1
package/dist/memory/candidate-retrieval.d.ts.map +1 -1
package/dist/memory/candidate-retrieval.js +3 -1
package/dist/memory/candidate-retrieval.js.map +1 -1
package/dist/memory/curated-loader.d.ts +21 -4
package/dist/memory/curated-loader.d.ts.map +1 -1
package/dist/memory/curated-loader.js +53 -16
package/dist/memory/curated-loader.js.map +1 -1
package/dist/memory/index.d.ts +2 -1
package/dist/memory/index.d.ts.map +1 -1
package/dist/memory/index.js +3 -1
package/dist/memory/index.js.map +1 -1
package/dist/memory/playbook.d.ts +6 -0
package/dist/memory/playbook.d.ts.map +1 -1
package/dist/memory/playbook.js +15 -0
package/dist/memory/playbook.js.map +1 -1
package/dist/memory/source-resolver.d.ts +120 -0
package/dist/memory/source-resolver.d.ts.map +1 -0
package/dist/memory/source-resolver.js +300 -0
package/dist/memory/source-resolver.js.map +1 -0
package/dist/types/config.d.ts +141 -0
package/dist/types/config.d.ts.map +1 -1
package/dist/types/config.js +40 -0
package/dist/types/config.js.map +1 -1
package/dist/types/index.d.ts +1 -1
package/dist/types/index.d.ts.map +1 -1
package/dist/types/index.js +1 -1
package/dist/types/index.js.map +1 -1
package/dist/utils/error-classifier.js +8 -8
package/dist/utils/error-classifier.js.map +1 -1
package/dist/workspace/efficacy-toolkit.d.ts +164 -0
package/dist/workspace/efficacy-toolkit.d.ts.map +1 -0
package/dist/workspace/efficacy-toolkit.js +281 -0
package/dist/workspace/efficacy-toolkit.js.map +1 -0
package/dist/workspace/index.d.ts +2 -1
package/dist/workspace/index.d.ts.map +1 -1
package/dist/workspace/index.js +3 -1
package/dist/workspace/index.js.map +1 -1
package/dist/workspace/templates/index.d.ts +3 -0
package/dist/workspace/templates/index.d.ts.map +1 -1
package/dist/workspace/templates/index.js +6 -0
package/dist/workspace/templates/index.js.map +1 -1
package/dist/workspace/templates/playbook-decay-detection.d.ts +46 -0
package/dist/workspace/templates/playbook-decay-detection.d.ts.map +1 -0
package/dist/workspace/templates/playbook-decay-detection.js +197 -0
package/dist/workspace/templates/playbook-decay-detection.js.map +1 -0
package/dist/workspace/templates/playbook-efficacy-audit.d.ts +46 -0
package/dist/workspace/templates/playbook-efficacy-audit.d.ts.map +1 -0
package/dist/workspace/templates/playbook-efficacy-audit.js +160 -0
package/dist/workspace/templates/playbook-efficacy-audit.js.map +1 -0
package/dist/workspace/templates/playbook-lifecycle-review.d.ts +51 -0
package/dist/workspace/templates/playbook-lifecycle-review.d.ts.map +1 -0
package/dist/workspace/templates/playbook-lifecycle-review.js +187 -0
package/dist/workspace/templates/playbook-lifecycle-review.js.map +1 -0
package/dist/workspace/types.d.ts +12 -54
package/dist/workspace/types.d.ts.map +1 -1
package/dist/workspace/types.js.map +1 -1
package/package.json +8 -2
package/playbooks/compound-engineering/adversarial-review.json +51 -0
package/playbooks/compound-engineering/agent-native-architecture.json +59 -0
package/playbooks/compound-engineering/agent-native-review.json +54 -0
package/playbooks/compound-engineering/api-contract-review.json +52 -0
package/playbooks/compound-engineering/brainstorm-requirements.json +55 -0
package/playbooks/compound-engineering/bug-reproduction.json +62 -0
package/playbooks/compound-engineering/confidence-calibration.json +49 -0
package/playbooks/compound-engineering/correctness-review.json +49 -0
package/playbooks/compound-engineering/data-migration-safety.json +59 -0
package/playbooks/compound-engineering/deployment-verification.json +63 -0
package/playbooks/compound-engineering/error-recovery-patterns.json +53 -0
package/playbooks/compound-engineering/implementation-planning.json +64 -0
package/playbooks/compound-engineering/issue-pattern-analysis.json +53 -0
package/playbooks/compound-engineering/knowledge-compounding.json +63 -0
package/playbooks/compound-engineering/learnings-research.json +54 -0
package/playbooks/compound-engineering/maintainability-review.json +49 -0
package/playbooks/compound-engineering/performance-review.json +54 -0
package/playbooks/compound-engineering/plan-adversarial-review.json +56 -0
package/playbooks/compound-engineering/plan-feasibility-review.json +56 -0
package/playbooks/compound-engineering/project-standards-review.json +52 -0
package/playbooks/compound-engineering/reliability-review.json +53 -0
package/playbooks/compound-engineering/review-orchestration.json +64 -0
package/playbooks/compound-engineering/security-review.json +54 -0
package/playbooks/compound-engineering/systematic-execution.json +64 -0
package/playbooks/compound-engineering/testing-review.json +50 -0
package/src/atlas.ts +96 -0
package/src/index.ts +27 -0
package/src/learning/index.ts +1 -0
package/src/learning/unified-pipeline.ts +271 -1
package/src/memory/candidate-retrieval.ts +2 -1
package/src/memory/curated-loader.ts +69 -16
package/src/memory/index.ts +16 -0
package/src/memory/playbook.ts +19 -0
package/src/memory/source-resolver.ts +422 -0
package/src/types/config.ts +46 -0
package/src/types/index.ts +4 -0
package/src/utils/error-classifier.ts +8 -8
package/src/workspace/efficacy-toolkit.ts +496 -0
package/src/workspace/index.ts +29 -0
package/src/workspace/templates/index.ts +24 -0
package/src/workspace/templates/playbook-decay-detection.ts +272 -0
package/src/workspace/templates/playbook-efficacy-audit.ts +246 -0
package/src/workspace/templates/playbook-lifecycle-review.ts +274 -0
package/src/workspace/types.ts +22 -78
package/tests/fixtures/behavioral-trajectories.ts +210 -0
package/tests/integration/curated-sources-e2e.test.ts +502 -0
package/tests/integration/pipeline-data-correctness.test.ts +794 -0
package/tests/learning/meta-learner.test.ts +418 -0
package/tests/learning/pipeline-memory-updates.test.ts +721 -0
package/tests/learning/unified-pipeline-efficacy.test.ts +232 -0
package/tests/memory/candidate-retrieval.test.ts +167 -0
package/tests/memory/compound-engineering-seed.test.ts +338 -0
package/tests/memory/curated-loader-extended.test.ts +225 -0
package/tests/memory/meta.test.ts +399 -0
package/tests/memory/playbook-quality-validation.test.ts +430 -0
package/tests/memory/source-resolver.test.ts +700 -0
package/tests/search/evaluator.test.ts +257 -0
package/tests/search/verification-runner.test.ts +357 -0
package/tests/utils/error-classifier.test.ts +149 -0
package/tests/utils/trajectory-helpers.test.ts +163 -0
package/tests/workspace/efficacy-toolkit.test.ts +404 -0
package/tests/workspace/templates/playbook-efficacy.test.ts +377 -0
package/.claude/settings.local.json +0 -11
package/dist/learning/llm-extractor.d.ts +0 -88
package/dist/learning/llm-extractor.d.ts.map +0 -1
package/dist/learning/llm-extractor.js +0 -372
package/dist/learning/llm-extractor.js.map +0 -1
package/dist/learning/loop-coordinator.d.ts +0 -61
package/dist/learning/loop-coordinator.d.ts.map +0 -1
package/dist/learning/loop-coordinator.js +0 -96
package/dist/learning/loop-coordinator.js.map +0 -1
package/references/agent-workspace/CLAUDE.md +0 -74
package/references/agent-workspace/README.md +0 -587
package/references/agent-workspace/media/banner.png +0 -0
package/references/agent-workspace/package-lock.json +0 -2061
package/references/agent-workspace/package.json +0 -54
package/references/agent-workspace/src/handle.ts +0 -122
package/references/agent-workspace/src/index.ts +0 -32
package/references/agent-workspace/src/manager.ts +0 -102
package/references/agent-workspace/src/readers/json.ts +0 -71
package/references/agent-workspace/src/readers/markdown.ts +0 -37
package/references/agent-workspace/src/readers/raw.ts +0 -27
package/references/agent-workspace/src/types.ts +0 -68
package/references/agent-workspace/src/validation.ts +0 -93
package/references/agent-workspace/src/writers/json.ts +0 -17
package/references/agent-workspace/src/writers/markdown.ts +0 -27
package/references/agent-workspace/src/writers/raw.ts +0 -22
package/references/agent-workspace/tests/errors.test.ts +0 -652
package/references/agent-workspace/tests/handle.test.ts +0 -144
package/references/agent-workspace/tests/manager.test.ts +0 -124
package/references/agent-workspace/tests/readers.test.ts +0 -205
package/references/agent-workspace/tests/validation.test.ts +0 -196
package/references/agent-workspace/tests/writers.test.ts +0 -108
package/references/agent-workspace/tsconfig.json +0 -20
package/references/agent-workspace/tsup.config.ts +0 -9
package/references/minimem/.claude/settings.json +0 -7
package/references/minimem/.sudocode/issues.jsonl +0 -18
package/references/minimem/.sudocode/specs.jsonl +0 -1
package/references/minimem/CLAUDE.md +0 -310
package/references/minimem/README.md +0 -556
package/references/minimem/claude-plugin/.claude-plugin/plugin.json +0 -10
package/references/minimem/claude-plugin/.mcp.json +0 -7
package/references/minimem/claude-plugin/README.md +0 -158
package/references/minimem/claude-plugin/commands/recall.md +0 -47
package/references/minimem/claude-plugin/commands/remember.md +0 -41
package/references/minimem/claude-plugin/hooks/__tests__/hooks.test.ts +0 -272
package/references/minimem/claude-plugin/hooks/hooks.json +0 -27
package/references/minimem/claude-plugin/hooks/session-end.sh +0 -86
package/references/minimem/claude-plugin/hooks/session-start.sh +0 -85
package/references/minimem/claude-plugin/skills/memory/SKILL.md +0 -108
package/references/minimem/package-lock.json +0 -5373
package/references/minimem/package.json +0 -60
package/references/minimem/scripts/postbuild.js +0 -35
package/references/minimem/src/__tests__/edge-cases.test.ts +0 -371
package/references/minimem/src/__tests__/errors.test.ts +0 -265
package/references/minimem/src/__tests__/helpers.ts +0 -199
package/references/minimem/src/__tests__/internal.test.ts +0 -407
package/references/minimem/src/__tests__/knowledge.test.ts +0 -287
package/references/minimem/src/__tests__/minimem.integration.test.ts +0 -1127
package/references/minimem/src/__tests__/session.test.ts +0 -190
package/references/minimem/src/cli/__tests__/commands.test.ts +0 -759
package/references/minimem/src/cli/commands/__tests__/conflicts.test.ts +0 -141
package/references/minimem/src/cli/commands/append.ts +0 -76
package/references/minimem/src/cli/commands/config.ts +0 -262
package/references/minimem/src/cli/commands/conflicts.ts +0 -413
package/references/minimem/src/cli/commands/daemon.ts +0 -169
package/references/minimem/src/cli/commands/index.ts +0 -12
package/references/minimem/src/cli/commands/init.ts +0 -88
package/references/minimem/src/cli/commands/mcp.ts +0 -177
package/references/minimem/src/cli/commands/push-pull.ts +0 -213
package/references/minimem/src/cli/commands/search.ts +0 -158
package/references/minimem/src/cli/commands/status.ts +0 -84
package/references/minimem/src/cli/commands/sync-init.ts +0 -290
package/references/minimem/src/cli/commands/sync.ts +0 -70
package/references/minimem/src/cli/commands/upsert.ts +0 -197
package/references/minimem/src/cli/config.ts +0 -584
package/references/minimem/src/cli/index.ts +0 -264
package/references/minimem/src/cli/shared.ts +0 -161
package/references/minimem/src/cli/sync/__tests__/central.test.ts +0 -152
package/references/minimem/src/cli/sync/__tests__/conflicts.test.ts +0 -209
package/references/minimem/src/cli/sync/__tests__/daemon.test.ts +0 -118
package/references/minimem/src/cli/sync/__tests__/detection.test.ts +0 -207
package/references/minimem/src/cli/sync/__tests__/integration.test.ts +0 -476
package/references/minimem/src/cli/sync/__tests__/registry.test.ts +0 -363
package/references/minimem/src/cli/sync/__tests__/state.test.ts +0 -255
package/references/minimem/src/cli/sync/__tests__/validation.test.ts +0 -193
package/references/minimem/src/cli/sync/__tests__/watcher.test.ts +0 -178
package/references/minimem/src/cli/sync/central.ts +0 -292
package/references/minimem/src/cli/sync/conflicts.ts +0 -204
package/references/minimem/src/cli/sync/daemon.ts +0 -407
package/references/minimem/src/cli/sync/detection.ts +0 -138
package/references/minimem/src/cli/sync/index.ts +0 -107
package/references/minimem/src/cli/sync/operations.ts +0 -373
package/references/minimem/src/cli/sync/registry.ts +0 -279
package/references/minimem/src/cli/sync/state.ts +0 -355
package/references/minimem/src/cli/sync/validation.ts +0 -206
package/references/minimem/src/cli/sync/watcher.ts +0 -234
package/references/minimem/src/cli/version.ts +0 -34
package/references/minimem/src/core/index.ts +0 -9
package/references/minimem/src/core/indexer.ts +0 -628
package/references/minimem/src/core/searcher.ts +0 -221
package/references/minimem/src/db/schema.ts +0 -183
package/references/minimem/src/db/sqlite-vec.ts +0 -24
package/references/minimem/src/embeddings/__tests__/embeddings.test.ts +0 -431
package/references/minimem/src/embeddings/batch-gemini.ts +0 -392
package/references/minimem/src/embeddings/batch-openai.ts +0 -409
package/references/minimem/src/embeddings/embeddings.ts +0 -434
package/references/minimem/src/index.ts +0 -109
package/references/minimem/src/internal.ts +0 -299
package/references/minimem/src/minimem.ts +0 -1276
package/references/minimem/src/search/__tests__/hybrid.test.ts +0 -247
package/references/minimem/src/search/graph.ts +0 -234
package/references/minimem/src/search/hybrid.ts +0 -151
package/references/minimem/src/search/search.ts +0 -256
package/references/minimem/src/server/__tests__/mcp.test.ts +0 -341
package/references/minimem/src/server/__tests__/tools.test.ts +0 -364
package/references/minimem/src/server/mcp.ts +0 -326
package/references/minimem/src/server/tools.ts +0 -720
package/references/minimem/src/session.ts +0 -460
package/references/minimem/tsconfig.json +0 -19
package/references/minimem/tsup.config.ts +0 -26
package/references/minimem/vitest.config.ts +0 -24
package/references/sessionlog/.husky/pre-commit +0 -1
package/references/sessionlog/.lintstagedrc.json +0 -4
package/references/sessionlog/.prettierignore +0 -4
package/references/sessionlog/.prettierrc.json +0 -11
package/references/sessionlog/LICENSE +0 -21
package/references/sessionlog/README.md +0 -453
package/references/sessionlog/eslint.config.js +0 -58
package/references/sessionlog/package-lock.json +0 -3672
package/references/sessionlog/package.json +0 -65
package/references/sessionlog/src/__tests__/agent-hooks.test.ts +0 -570
package/references/sessionlog/src/__tests__/agent-registry.test.ts +0 -127
package/references/sessionlog/src/__tests__/claude-code-hooks.test.ts +0 -225
package/references/sessionlog/src/__tests__/claude-generator.test.ts +0 -46
package/references/sessionlog/src/__tests__/commit-msg.test.ts +0 -86
package/references/sessionlog/src/__tests__/cursor-agent.test.ts +0 -224
package/references/sessionlog/src/__tests__/e2e-live.test.ts +0 -890
package/references/sessionlog/src/__tests__/event-log.test.ts +0 -183
package/references/sessionlog/src/__tests__/flush-sentinel.test.ts +0 -105
package/references/sessionlog/src/__tests__/gemini-agent.test.ts +0 -375
package/references/sessionlog/src/__tests__/git-hooks.test.ts +0 -78
package/references/sessionlog/src/__tests__/hook-managers.test.ts +0 -121
package/references/sessionlog/src/__tests__/lifecycle-tasks.test.ts +0 -759
package/references/sessionlog/src/__tests__/opencode-agent.test.ts +0 -338
package/references/sessionlog/src/__tests__/redaction.test.ts +0 -136
package/references/sessionlog/src/__tests__/session-repo.test.ts +0 -353
package/references/sessionlog/src/__tests__/session-store.test.ts +0 -166
package/references/sessionlog/src/__tests__/setup-ccweb.test.ts +0 -466
package/references/sessionlog/src/__tests__/skill-live.test.ts +0 -461
package/references/sessionlog/src/__tests__/summarize.test.ts +0 -348
package/references/sessionlog/src/__tests__/task-plan-e2e.test.ts +0 -610
package/references/sessionlog/src/__tests__/task-plan-live.test.ts +0 -632
package/references/sessionlog/src/__tests__/transcript-timestamp.test.ts +0 -121
package/references/sessionlog/src/__tests__/types.test.ts +0 -166
package/references/sessionlog/src/__tests__/utils.test.ts +0 -333
package/references/sessionlog/src/__tests__/validation.test.ts +0 -103
package/references/sessionlog/src/__tests__/worktree.test.ts +0 -57
package/references/sessionlog/src/agent/agents/claude-code.ts +0 -1089
package/references/sessionlog/src/agent/agents/cursor.ts +0 -361
package/references/sessionlog/src/agent/agents/gemini-cli.ts +0 -632
package/references/sessionlog/src/agent/agents/opencode.ts +0 -540
package/references/sessionlog/src/agent/registry.ts +0 -143
package/references/sessionlog/src/agent/session-types.ts +0 -113
package/references/sessionlog/src/agent/types.ts +0 -220
package/references/sessionlog/src/cli.ts +0 -597
package/references/sessionlog/src/commands/clean.ts +0 -133
package/references/sessionlog/src/commands/disable.ts +0 -84
package/references/sessionlog/src/commands/doctor.ts +0 -145
package/references/sessionlog/src/commands/enable.ts +0 -202
package/references/sessionlog/src/commands/explain.ts +0 -261
package/references/sessionlog/src/commands/reset.ts +0 -105
package/references/sessionlog/src/commands/resume.ts +0 -180
package/references/sessionlog/src/commands/rewind.ts +0 -195
package/references/sessionlog/src/commands/setup-ccweb.ts +0 -275
package/references/sessionlog/src/commands/status.ts +0 -172
package/references/sessionlog/src/config.ts +0 -165
package/references/sessionlog/src/events/event-log.ts +0 -126
package/references/sessionlog/src/git-operations.ts +0 -558
package/references/sessionlog/src/hooks/git-hooks.ts +0 -165
package/references/sessionlog/src/hooks/lifecycle.ts +0 -391
package/references/sessionlog/src/index.ts +0 -650
package/references/sessionlog/src/security/redaction.ts +0 -283
package/references/sessionlog/src/session/state-machine.ts +0 -452
package/references/sessionlog/src/store/checkpoint-store.ts +0 -509
package/references/sessionlog/src/store/native-store.ts +0 -173
package/references/sessionlog/src/store/provider-types.ts +0 -99
package/references/sessionlog/src/store/session-store.ts +0 -266
package/references/sessionlog/src/strategy/attribution.ts +0 -296
package/references/sessionlog/src/strategy/common.ts +0 -207
package/references/sessionlog/src/strategy/content-overlap.ts +0 -228
package/references/sessionlog/src/strategy/manual-commit.ts +0 -988
package/references/sessionlog/src/strategy/types.ts +0 -279
package/references/sessionlog/src/summarize/claude-generator.ts +0 -115
package/references/sessionlog/src/summarize/summarize.ts +0 -432
package/references/sessionlog/src/types.ts +0 -508
package/references/sessionlog/src/utils/chunk-files.ts +0 -49
package/references/sessionlog/src/utils/commit-message.ts +0 -65
package/references/sessionlog/src/utils/detect-agent.ts +0 -36
package/references/sessionlog/src/utils/hook-managers.ts +0 -125
package/references/sessionlog/src/utils/ide-tags.ts +0 -32
package/references/sessionlog/src/utils/paths.ts +0 -79
package/references/sessionlog/src/utils/preview-rewind.ts +0 -80
package/references/sessionlog/src/utils/rewind-conflict.ts +0 -121
package/references/sessionlog/src/utils/shadow-branch.ts +0 -109
package/references/sessionlog/src/utils/string-utils.ts +0 -46
package/references/sessionlog/src/utils/todo-extract.ts +0 -188
package/references/sessionlog/src/utils/trailers.ts +0 -187
package/references/sessionlog/src/utils/transcript-parse.ts +0 -177
package/references/sessionlog/src/utils/transcript-timestamp.ts +0 -59
package/references/sessionlog/src/utils/tree-ops.ts +0 -219
package/references/sessionlog/src/utils/tty.ts +0 -72
package/references/sessionlog/src/utils/validation.ts +0 -65
package/references/sessionlog/src/utils/worktree.ts +0 -58
package/references/sessionlog/src/wire-types.ts +0 -59
package/references/sessionlog/templates/setup-env.sh +0 -153
package/references/sessionlog/tsconfig.json +0 -18
package/references/sessionlog/vitest.config.ts +0 -12
package/references/skill-tree/.claude/settings.json +0 -6
package/references/skill-tree/.sudocode/issues.jsonl +0 -19
package/references/skill-tree/.sudocode/specs.jsonl +0 -3
package/references/skill-tree/CLAUDE.md +0 -126
package/references/skill-tree/README.md +0 -372
package/references/skill-tree/docs/GAPS_v1.md +0 -221
package/references/skill-tree/docs/INTEGRATION_PLAN.md +0 -467
package/references/skill-tree/docs/TODOS.md +0 -91
package/references/skill-tree/docs/anthropic_skill_guide.md +0 -1364
package/references/skill-tree/docs/design/federated-skill-trees.md +0 -524
package/references/skill-tree/docs/design/multi-agent-sync.md +0 -759
package/references/skill-tree/docs/scraper/BRAINSTORM.md +0 -583
package/references/skill-tree/docs/scraper/POC_PLAN.md +0 -420
package/references/skill-tree/docs/scraper/README.md +0 -170
package/references/skill-tree/examples/basic-usage.ts +0 -164
package/references/skill-tree/package-lock.json +0 -1852
package/references/skill-tree/package.json +0 -66
package/references/skill-tree/scraper/README.md +0 -123
package/references/skill-tree/scraper/docs/DESIGN.md +0 -683
package/references/skill-tree/scraper/docs/PLAN.md +0 -336
package/references/skill-tree/scraper/drizzle.config.ts +0 -10
package/references/skill-tree/scraper/package-lock.json +0 -6329
package/references/skill-tree/scraper/package.json +0 -68
package/references/skill-tree/scraper/test/fixtures/invalid-skill/missing-description.md +0 -7
package/references/skill-tree/scraper/test/fixtures/invalid-skill/missing-name.md +0 -7
package/references/skill-tree/scraper/test/fixtures/minimal-skill/SKILL.md +0 -27
package/references/skill-tree/scraper/test/fixtures/skill-json/SKILL.json +0 -21
package/references/skill-tree/scraper/test/fixtures/skill-with-meta/SKILL.md +0 -54
package/references/skill-tree/scraper/test/fixtures/skill-with-meta/_meta.json +0 -24
package/references/skill-tree/scraper/test/fixtures/valid-skill/SKILL.md +0 -93
package/references/skill-tree/scraper/test/fixtures/valid-skill/_meta.json +0 -22
package/references/skill-tree/scraper/tsup.config.ts +0 -14
package/references/skill-tree/scraper/vitest.config.ts +0 -17
package/references/skill-tree/scripts/convert-to-vitest.ts +0 -166
package/references/skill-tree/skills/skill-writer/SKILL.md +0 -339
package/references/skill-tree/skills/skill-writer/references/examples.md +0 -326
package/references/skill-tree/skills/skill-writer/references/patterns.md +0 -210
package/references/skill-tree/skills/skill-writer/references/quality-checklist.md +0 -123
package/references/skill-tree/test/run-all.ts +0 -106
package/references/skill-tree/test/utils.ts +0 -128
package/references/skill-tree/vitest.config.ts +0 -16

package/tests/search/evaluator.test.ts ADDED Viewed

@@ -0,0 +1,257 @@
+import { describe, it, expect, beforeEach } from 'vitest';
+import {
+  SolutionEvaluator,
+  createSolutionEvaluator,
+  type VerificationResult,
+} from '../../src/search/evaluator.js';
+import { createTrajectory } from '../../src/types/trajectory.js';
+import { createTask } from '../../src/types/task.js';
+import { createStep } from '../../src/types/step.js';
+import { successOutcome, failureOutcome } from '../../src/types/outcome.js';
+import type { Trajectory } from '../../src/types/trajectory.js';
+import type { Task } from '../../src/types/task.js';
+function makeTask(overrides?: Partial<Task>): Task {
+  return createTask({
+    domain: 'code',
+    description: 'fix a bug in the login module',
+    ...overrides,
+  });
+}
+function makeTrajectory(opts?: {
+  success?: boolean;
+  stepCount?: number;
+  errorSteps?: number;
+  withAttribution?: boolean;
+}): Trajectory {
+  const steps = [];
+  const count = opts?.stepCount ?? 3;
+  const errorCount = opts?.errorSteps ?? 0;
+  for (let i = 0; i < count; i++) {
+    steps.push(
+      createStep({
+        action: `Step ${i + 1}`,
+        observation: i < errorCount ? 'error: something failed' : 'ok',
+        attributionScore: opts?.withAttribution ? 0.2 : undefined,
+      })
+    );
+  }
+  return createTrajectory({
+    task: makeTask(),
+    steps,
+    outcome: (opts?.success ?? true) ? successOutcome('done') : failureOutcome('failed'),
+    agentId: 'agent-1',
+  });
+}
+describe('SolutionEvaluator', () => {
+  let evaluator: SolutionEvaluator;
+  beforeEach(() => {
+    evaluator = createSolutionEvaluator(null);
+  });
+  describe('heuristic evaluation (fallback)', () => {
+    it('should rate successful trajectory with few steps well', async () => {
+      const result = await evaluator.evaluate(
+        makeTrajectory({ success: true, stepCount: 3 }),
+        makeTask()
+      );
+      expect(result.method).toBe('heuristic');
+      expect(result.score).toBeGreaterThanOrEqual(0.7);
+      expect(result.acceptable).toBe(true);
+      expect(result.issues).toHaveLength(0);
+    });
+    it('should penalize failed trajectory', async () => {
+      const result = await evaluator.evaluate(
+        makeTrajectory({ success: false }),
+        makeTask()
+      );
+      expect(result.score).toBeLessThan(0.6);
+      expect(result.acceptable).toBe(false);
+      expect(result.issues.length).toBeGreaterThan(0);
+      expect(result.issues[0].type).toBe('error');
+    });
+    it('should penalize empty trajectory', async () => {
+      const trajectory = createTrajectory({
+        task: makeTask(),
+        steps: [],
+        outcome: failureOutcome('no steps taken'),
+        agentId: 'a',
+      });
+      const result = await evaluator.evaluate(trajectory, makeTask());
+      expect(result.score).toBeLessThan(0.3);
+      expect(result.issues.some((i) => i.type === 'incomplete')).toBe(true);
+    });
+    it('should penalize very long trajectories', async () => {
+      const result = await evaluator.evaluate(
+        makeTrajectory({ success: true, stepCount: 25 }),
+        makeTask()
+      );
+      expect(result.issues.some((i) => i.type === 'inefficient')).toBe(true);
+    });
+    it('should penalize trajectories with error steps', async () => {
+      const result = await evaluator.evaluate(
+        makeTrajectory({ success: true, stepCount: 5, errorSteps: 3 }),
+        makeTask()
+      );
+      expect(result.score).toBeLessThan(
+        // Compare with clean trajectory
+        (await evaluator.evaluate(makeTrajectory({ success: true, stepCount: 5 }), makeTask())).score
+      );
+    });
+    it('should boost score for steps with high attribution', async () => {
+      const withAttr = await evaluator.evaluate(
+        makeTrajectory({ success: true, withAttribution: true }),
+        makeTask()
+      );
+      const withoutAttr = await evaluator.evaluate(
+        makeTrajectory({ success: true }),
+        makeTask()
+      );
+      expect(withAttr.score).toBeGreaterThanOrEqual(withoutAttr.score);
+    });
+    it('should clamp score between 0 and 1', async () => {
+      // Very bad: failed + empty + errors
+      const trajectory = createTrajectory({
+        task: makeTask(),
+        steps: [],
+        outcome: failureOutcome('total failure'),
+        agentId: 'a',
+      });
+      const result = await evaluator.evaluate(trajectory, makeTask());
+      expect(result.score).toBeGreaterThanOrEqual(0);
+      expect(result.score).toBeLessThanOrEqual(1);
+    });
+  });
+  describe('verification-based evaluation', () => {
+    it('should use registered verifier for matching domain', async () => {
+      const verifier = async (_t: Trajectory, _task: Task): Promise<VerificationResult> => ({
+        passed: true,
+        confidence: 0.95,
+        issues: [],
+        details: 'all tests pass',
+      });
+      evaluator.registerVerifier('code', verifier);
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('verification');
+      expect(result.acceptable).toBe(true);
+      expect(result.score).toBeGreaterThanOrEqual(0.7);
+    });
+    it('should fall through to heuristic when verification confidence too low', async () => {
+      const verifier = async (): Promise<VerificationResult> => ({
+        passed: true,
+        confidence: 0.3, // Below default threshold of 0.8
+      });
+      evaluator.registerVerifier('code', verifier);
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('heuristic');
+    });
+    it('should fall through when verifier throws', async () => {
+      const verifier = async (): Promise<VerificationResult> => {
+        throw new Error('verification crashed');
+      };
+      evaluator.registerVerifier('code', verifier);
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('heuristic');
+    });
+    it('should handle failed verification with issues', async () => {
+      const verifier = async (): Promise<VerificationResult> => ({
+        passed: false,
+        confidence: 0.9,
+        issues: [
+          { type: 'incorrect', description: 'test failed: should return 42', severity: 'major' },
+        ],
+      });
+      evaluator.registerVerifier('code', verifier);
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('verification');
+      expect(result.acceptable).toBe(false);
+      expect(result.score).toBeLessThan(0.5);
+      expect(result.issues).toHaveLength(1);
+    });
+    it('should not use verifier for wrong domain', async () => {
+      const verifier = async (): Promise<VerificationResult> => ({
+        passed: true,
+        confidence: 0.95,
+      });
+      evaluator.registerVerifier('python', verifier);
+      // Task domain is 'code', not 'python'
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('heuristic');
+    });
+  });
+  describe('alwaysUseAgent config', () => {
+    it('should skip verification shortcut when alwaysUseAgent=true', async () => {
+      const alwaysAgentEval = createSolutionEvaluator(null, { alwaysUseAgent: true });
+      const verifier = async (): Promise<VerificationResult> => ({
+        passed: true,
+        confidence: 0.99,
+      });
+      alwaysAgentEval.registerVerifier('code', verifier);
+      // With no agent or taskRunner, falls through to heuristic
+      const result = await alwaysAgentEval.evaluate(makeTrajectory(), makeTask({ domain: 'code' }));
+      expect(result.method).toBe('heuristic');
+    });
+  });
+  describe('parseQuality edge cases', () => {
+    // Test through parseAgentEvaluation indirectly using mock agent
+    it('should handle unknown quality strings gracefully', async () => {
+      // Falls through to heuristic since no agent available
+      const result = await evaluator.evaluate(makeTrajectory(), makeTask());
+      expect(['excellent', 'good', 'needs_work', 'poor']).toContain(result.quality);
+    });
+  });
+});
+describe('scoreToQuality (used by evaluator)', () => {
+  it('should map scores to correct quality levels', async () => {
+    const { scoreToQuality } = await import('../../src/search/refinement-types.js');
+    expect(scoreToQuality(0.9)).toBe('excellent');
+    expect(scoreToQuality(0.85)).toBe('excellent');
+    expect(scoreToQuality(0.75)).toBe('good');
+    expect(scoreToQuality(0.7)).toBe('good');
+    expect(scoreToQuality(0.5)).toBe('needs_work');
+    expect(scoreToQuality(0.4)).toBe('needs_work');
+    expect(scoreToQuality(0.3)).toBe('poor');
+    expect(scoreToQuality(0.0)).toBe('poor');
+  });
+});

package/tests/search/verification-runner.test.ts ADDED Viewed

@@ -0,0 +1,357 @@
+import { describe, it, expect, beforeEach } from 'vitest';
+import {
+  VerificationRunner,
+  createVerificationRunner,
+  TestRunners,
+  type CommandVerificationConfig,
+} from '../../src/search/verification-runner.js';
+import { createTrajectory } from '../../src/types/trajectory.js';
+import { createTask } from '../../src/types/task.js';
+import { createStep } from '../../src/types/step.js';
+import { successOutcome } from '../../src/types/outcome.js';
+import type { Trajectory } from '../../src/types/trajectory.js';
+import type { Task } from '../../src/types/task.js';
+function makeTask(): Task {
+  return createTask({
+    domain: 'test-domain',
+    description: 'test task',
+  });
+}
+function makeTrajectory(): Trajectory {
+  return createTrajectory({
+    task: makeTask(),
+    steps: [createStep({ action: 'echo hello', observation: 'hello' })],
+    outcome: successOutcome('hello world'),
+    agentId: 'agent',
+  });
+}
+describe('VerificationRunner', () => {
+  let runner: VerificationRunner;
+  beforeEach(() => {
+    runner = createVerificationRunner({ cwd: '/tmp', timeout: 5000 });
+  });
+  describe('runCommand', () => {
+    it('should execute a simple command and capture stdout', async () => {
+      const result = await runner.runCommand('echo hello', {});
+      expect(result.stdout.trim()).toBe('hello');
+      expect(result.exitCode).toBe(0);
+      expect(result.timedOut).toBe(false);
+    });
+    it('should capture stderr', async () => {
+      const result = await runner.runCommand('echo error >&2', {});
+      expect(result.stderr.trim()).toBe('error');
+    });
+    it('should return non-zero exit code for failing commands', async () => {
+      const result = await runner.runCommand('exit 42', {});
+      expect(result.exitCode).toBe(42);
+    });
+    it('should handle command timeout', { timeout: 20000 }, async () => {
+      // Use a bash loop that responds to SIGTERM better than plain sleep
+      const result = await runner.runCommand('while true; do sleep 0.1; done', { timeout: 500 });
+      expect(result.timedOut).toBe(true);
+    });
+    it('should handle command not found', async () => {
+      const result = await runner.runCommand('nonexistent_command_xyz_12345', {});
+      expect(result.exitCode).not.toBe(0);
+    });
+    it('should pass environment variables', async () => {
+      const result = await runner.runCommand('echo $MY_TEST_VAR', {
+        env: { MY_TEST_VAR: 'hello123' },
+      });
+      expect(result.stdout.trim()).toBe('hello123');
+    });
+    it('should use specified working directory', async () => {
+      const result = await runner.runCommand('pwd', { cwd: '/tmp' });
+      expect(result.stdout.trim()).toMatch(/\/tmp/);
+    });
+  });
+  describe('runCommandSync', () => {
+    it('should execute command synchronously', () => {
+      const result = runner.runCommandSync('echo sync-test');
+      expect(result.stdout.trim()).toBe('sync-test');
+      expect(result.exitCode).toBe(0);
+    });
+    it('should handle sync command failure', () => {
+      const result = runner.runCommandSync('exit 1');
+      expect(result.exitCode).toBe(1);
+    });
+    it('should detect sync command failure on timeout', () => {
+      const result = runner.runCommandSync('sleep 30', { timeout: 500 });
+      // execSync throws on timeout; killed + SIGTERM detection may vary by platform
+      // The important thing is that the command does not succeed
+      expect(result.exitCode).not.toBe(0);
+    });
+  });
+  describe('createVerifier', () => {
+    it('should create verifier that passes on exit code 0', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "all tests pass"',
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(true);
+      expect(result.confidence).toBe(0.7); // No pattern/extractor → 0.7
+    });
+    it('should create verifier that fails on non-zero exit', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'exit 1',
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(false);
+      expect(result.issues!.length).toBeGreaterThan(0);
+    });
+    it('should check success pattern when provided', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "Tests: 5 passed, 0 failed"',
+        successPattern: /\d+ passed, 0 failed/,
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(true);
+      expect(result.confidence).toBe(0.9); // Has successPattern → 0.9
+    });
+    it('should check failure pattern when provided', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "FAIL test_login"',
+        failurePattern: /FAIL/,
+        successOnZeroExit: false,
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(false);
+    });
+    it('should use custom issue extractor', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "ERROR: missing return"',
+        timeout: 5000,
+        successOnZeroExit: false,
+        issueExtractor: (output) => {
+          const match = output.match(/ERROR:\s*(.+)/);
+          return match
+            ? [{ type: 'error' as const, description: match[1], severity: 'critical' as const }]
+            : [];
+        },
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.confidence).toBe(0.9); // Has issueExtractor
+    });
+    it('should handle timeout in verifier', { timeout: 20000 }, async () => {
+      const config: CommandVerificationConfig = {
+        command: 'while true; do sleep 0.1; done',
+        timeout: 500,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(false);
+      expect(result.confidence).toBe(0.5); // Timeout → 0.5
+      expect(result.details).toContain('timed out');
+    });
+    it('should interpolate {{taskId}} and {{trajectoryId}} in command', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "task={{taskId}} traj={{trajectoryId}}"',
+        timeout: 5000,
+      };
+      const trajectory = makeTrajectory();
+      const task = makeTask();
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(trajectory, task);
+      expect(result.details).toContain(`task=${task.id}`);
+      expect(result.details).toContain(`traj=${trajectory.id}`);
+    });
+  });
+  describe('createCompositeVerifier', () => {
+    it('should pass when all verifiers pass', async () => {
+      const composite = runner.createCompositeVerifier([
+        { command: 'echo pass1', timeout: 5000 },
+        { command: 'echo pass2', timeout: 5000 },
+      ]);
+      const result = await composite(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(true);
+    });
+    it('should fail when any verifier fails', async () => {
+      const composite = runner.createCompositeVerifier([
+        { command: 'echo pass', timeout: 5000 },
+        { command: 'exit 1', timeout: 5000 },
+      ]);
+      const result = await composite(makeTrajectory(), makeTask());
+      expect(result.passed).toBe(false);
+    });
+    it('should aggregate issues from all verifiers', async () => {
+      const composite = runner.createCompositeVerifier([
+        { command: 'exit 1', timeout: 5000 },
+        { command: 'exit 2', timeout: 5000 },
+      ]);
+      const result = await composite(makeTrajectory(), makeTask());
+      expect(result.issues!.length).toBeGreaterThanOrEqual(1);
+    });
+    it('should fail fast on critical issues', async () => {
+      let secondRan = false;
+      const configs: CommandVerificationConfig[] = [
+        {
+          command: 'exit 1',
+          timeout: 5000,
+          issueExtractor: () => [
+            { type: 'error', description: 'critical failure', severity: 'critical' },
+          ],
+        },
+        {
+          command: 'echo should-not-run',
+          timeout: 5000,
+          issueExtractor: () => {
+            secondRan = true;
+            return [];
+          },
+        },
+      ];
+      const composite = runner.createCompositeVerifier(configs);
+      await composite(makeTrajectory(), makeTask());
+      // Second verifier should not have run due to fail-fast
+      expect(secondRan).toBe(false);
+    });
+    it('should average confidence across verifiers', async () => {
+      const composite = runner.createCompositeVerifier([
+        { command: 'echo pass', timeout: 5000 }, // confidence 0.7
+        { command: 'echo pass', timeout: 5000 }, // confidence 0.7
+      ]);
+      const result = await composite(makeTrajectory(), makeTask());
+      expect(result.confidence).toBeCloseTo(0.7, 1);
+    });
+  });
+  describe('TestRunners presets', () => {
+    it('should create vitest configuration', () => {
+      const config = TestRunners.vitest('tests/foo.test.ts');
+      expect(config.command).toContain('vitest');
+      expect(config.command).toContain('tests/foo.test.ts');
+      expect(config.timeout).toBe(60000);
+      expect(config.issueExtractor).toBeDefined();
+    });
+    it('should create jest configuration', () => {
+      const config = TestRunners.jest();
+      expect(config.command).toContain('jest');
+      expect(config.issueExtractor).toBeDefined();
+    });
+    it('should create typescript configuration', () => {
+      const config = TestRunners.typescript();
+      expect(config.command).toContain('tsc --noEmit');
+      expect(config.issueExtractor).toBeDefined();
+    });
+    it('should create eslint configuration', () => {
+      const config = TestRunners.eslint('src/');
+      expect(config.command).toContain('eslint');
+      expect(config.command).toContain('src/');
+    });
+    it('should create pytest configuration', () => {
+      const config = TestRunners.pytest();
+      expect(config.command).toContain('pytest');
+      expect(config.failurePattern).toBeDefined();
+    });
+    it('should create go test configuration', () => {
+      const config = TestRunners.goTest();
+      expect(config.command).toContain('go test');
+    });
+    it('should create cargo test configuration', () => {
+      const config = TestRunners.cargoTest();
+      expect(config.command).toContain('cargo test');
+      expect(config.timeout).toBe(120000);
+    });
+  });
+  describe('default issue extraction', () => {
+    it('should extract error messages from output', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "Error: cannot read file" && exit 1',
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.issues!.length).toBeGreaterThan(0);
+      expect(result.issues![0].description).toContain('cannot read file');
+    });
+    it('should extract fail messages from output', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'echo "Fail: test_login" && exit 1',
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.issues!.length).toBeGreaterThan(0);
+    });
+    it('should generate generic issue when no pattern matches', async () => {
+      const config: CommandVerificationConfig = {
+        command: 'exit 99',
+        timeout: 5000,
+      };
+      const verifier = runner.createVerifier(config);
+      const result = await verifier(makeTrajectory(), makeTask());
+      expect(result.issues!.length).toBeGreaterThan(0);
+      expect(result.issues![0].description).toContain('exit code 99');
+    });
+  });
+});