npm - autonomous-coding-toolkit - Versions diffs - 1.0.0 - Mend

autonomous-coding-toolkit 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (324) hide show

package/.claude-plugin/marketplace.json +22 -0
package/.claude-plugin/plugin.json +13 -0
package/LICENSE +21 -0
package/Makefile +21 -0
package/README.md +140 -0
package/SECURITY.md +28 -0
package/agents/bash-expert.md +113 -0
package/agents/dependency-auditor.md +138 -0
package/agents/integration-tester.md +120 -0
package/agents/lesson-scanner.md +149 -0
package/agents/python-expert.md +179 -0
package/agents/service-monitor.md +141 -0
package/agents/shell-expert.md +147 -0
package/benchmarks/runner.sh +147 -0
package/benchmarks/tasks/01-rest-endpoint/rubric.sh +29 -0
package/benchmarks/tasks/01-rest-endpoint/task.md +17 -0
package/benchmarks/tasks/02-refactor-module/task.md +8 -0
package/benchmarks/tasks/03-fix-integration-bug/task.md +8 -0
package/benchmarks/tasks/04-add-test-coverage/task.md +8 -0
package/benchmarks/tasks/05-multi-file-feature/task.md +8 -0
package/bin/act.js +238 -0
package/commands/autocode.md +6 -0
package/commands/cancel-ralph.md +18 -0
package/commands/code-factory.md +53 -0
package/commands/create-prd.md +55 -0
package/commands/ralph-loop.md +18 -0
package/commands/run-plan.md +117 -0
package/commands/submit-lesson.md +122 -0
package/docs/ARCHITECTURE.md +630 -0
package/docs/CONTRIBUTING.md +125 -0
package/docs/lessons/0001-bare-exception-swallowing.md +34 -0
package/docs/lessons/0002-async-def-without-await.md +28 -0
package/docs/lessons/0003-create-task-without-callback.md +28 -0
package/docs/lessons/0004-hardcoded-test-counts.md +28 -0
package/docs/lessons/0005-sqlite-without-closing.md +33 -0
package/docs/lessons/0006-venv-pip-path.md +27 -0
package/docs/lessons/0007-runner-state-self-rejection.md +35 -0
package/docs/lessons/0008-quality-gate-blind-spot.md +33 -0
package/docs/lessons/0009-parser-overcount-empty-batches.md +36 -0
package/docs/lessons/0010-local-outside-function-bash.md +33 -0
package/docs/lessons/0011-batch-tests-for-unimplemented-code.md +36 -0
package/docs/lessons/0012-api-markdown-unescaped-chars.md +33 -0
package/docs/lessons/0013-export-prefix-env-parsing.md +33 -0
package/docs/lessons/0014-decorator-registry-import-side-effect.md +43 -0
package/docs/lessons/0015-frontend-backend-schema-drift.md +43 -0
package/docs/lessons/0016-event-driven-cold-start-seeding.md +44 -0
package/docs/lessons/0017-copy-paste-logic-diverges.md +43 -0
package/docs/lessons/0018-layer-passes-pipeline-broken.md +45 -0
package/docs/lessons/0019-systemd-envfile-ignores-export.md +41 -0
package/docs/lessons/0020-persist-state-incrementally.md +44 -0
package/docs/lessons/0021-dual-axis-testing.md +48 -0
package/docs/lessons/0022-jsx-factory-shadowing.md +43 -0
package/docs/lessons/0023-static-analysis-spiral.md +51 -0
package/docs/lessons/0024-shared-pipeline-implementation.md +55 -0
package/docs/lessons/0025-defense-in-depth-all-entry-points.md +65 -0
package/docs/lessons/0026-linter-no-rules-false-enforcement.md +54 -0
package/docs/lessons/0027-jsx-silent-prop-drop.md +64 -0
package/docs/lessons/0028-no-infrastructure-in-client-code.md +49 -0
package/docs/lessons/0029-never-write-secrets-to-files.md +61 -0
package/docs/lessons/0030-cache-merge-not-replace.md +62 -0
package/docs/lessons/0031-verify-units-at-boundaries.md +66 -0
package/docs/lessons/0032-module-lifecycle-subscribe-unsubscribe.md +89 -0
package/docs/lessons/0033-async-iteration-mutable-snapshot.md +72 -0
package/docs/lessons/0034-caller-missing-await-silent-discard.md +65 -0
package/docs/lessons/0035-duplicate-registration-silent-overwrite.md +85 -0
package/docs/lessons/0036-websocket-dirty-disconnect.md +33 -0
package/docs/lessons/0037-parallel-agents-worktree-corruption.md +31 -0
package/docs/lessons/0038-subscribe-no-stored-ref.md +36 -0
package/docs/lessons/0039-fallback-or-default-hides-bugs.md +34 -0
package/docs/lessons/0040-event-firehose-filter-first.md +36 -0
package/docs/lessons/0041-ambiguous-base-dir-path-nesting.md +32 -0
package/docs/lessons/0042-spec-compliance-insufficient.md +36 -0
package/docs/lessons/0043-exact-count-extensible-collections.md +32 -0
package/docs/lessons/0044-relative-file-deps-worktree.md +39 -0
package/docs/lessons/0045-iterative-design-improvement.md +33 -0
package/docs/lessons/0046-plan-assertion-math-bugs.md +38 -0
package/docs/lessons/0047-pytest-single-threaded-default.md +37 -0
package/docs/lessons/0048-integration-wiring-batch.md +40 -0
package/docs/lessons/0049-ab-verification.md +41 -0
package/docs/lessons/0050-editing-sourced-files-during-execution.md +33 -0
package/docs/lessons/0051-infrastructure-fixes-cant-self-heal.md +30 -0
package/docs/lessons/0052-uncommitted-changes-poison-quality-gates.md +31 -0
package/docs/lessons/0053-jq-compact-flag-inconsistency.md +31 -0
package/docs/lessons/0054-parser-matches-inside-code-blocks.md +30 -0
package/docs/lessons/0055-agents-compensate-for-garbled-prompts.md +31 -0
package/docs/lessons/0056-grep-count-exit-code-on-zero.md +42 -0
package/docs/lessons/0057-new-artifacts-break-git-clean-gates.md +42 -0
package/docs/lessons/0058-dead-config-keys-never-consumed.md +49 -0
package/docs/lessons/0059-contract-test-shared-structures.md +53 -0
package/docs/lessons/0060-set-e-silent-death-in-runners.md +53 -0
package/docs/lessons/0061-context-injection-dirty-state.md +50 -0
package/docs/lessons/0062-sibling-bug-neighborhood-scan.md +29 -0
package/docs/lessons/0063-one-flag-two-lifetimes.md +31 -0
package/docs/lessons/0064-test-passes-wrong-reason.md +31 -0
package/docs/lessons/0065-pipefail-grep-count-double-output.md +39 -0
package/docs/lessons/0066-local-keyword-outside-function.md +37 -0
package/docs/lessons/0067-stdin-hang-non-interactive-shell.md +36 -0
package/docs/lessons/0068-agent-builds-wrong-thing-correctly.md +31 -0
package/docs/lessons/0069-plan-quality-dominates-execution.md +30 -0
package/docs/lessons/0070-spec-echo-back-prevents-drift.md +31 -0
package/docs/lessons/0071-positive-instructions-outperform-negative.md +30 -0
package/docs/lessons/0072-lost-in-the-middle-context-placement.md +30 -0
package/docs/lessons/0073-unscoped-lessons-cause-false-positives.md +30 -0
package/docs/lessons/0074-stale-context-injection-wrong-batch.md +32 -0
package/docs/lessons/0075-research-artifacts-must-persist.md +32 -0
package/docs/lessons/0076-wrong-decomposition-contaminates-downstream.md +30 -0
package/docs/lessons/0077-cherry-pick-merges-need-manual-resolution.md +30 -0
package/docs/lessons/0078-static-review-without-live-test.md +30 -0
package/docs/lessons/0079-integration-wiring-batch-required.md +32 -0
package/docs/lessons/FRAMEWORK.md +161 -0
package/docs/lessons/SUMMARY.md +201 -0
package/docs/lessons/TEMPLATE.md +85 -0
package/docs/plans/2026-02-21-code-factory-v2-design.md +204 -0
package/docs/plans/2026-02-21-code-factory-v2-implementation-plan.md +2189 -0
package/docs/plans/2026-02-21-code-factory-v2-phase4-design.md +537 -0
package/docs/plans/2026-02-21-code-factory-v2-phase4-implementation-plan.md +2012 -0
package/docs/plans/2026-02-21-hardening-pass-design.md +108 -0
package/docs/plans/2026-02-21-hardening-pass-plan.md +1378 -0
package/docs/plans/2026-02-21-mab-research-report.md +406 -0
package/docs/plans/2026-02-21-marketplace-restructure-design.md +240 -0
package/docs/plans/2026-02-21-marketplace-restructure-plan.md +832 -0
package/docs/plans/2026-02-21-phase4-completion-plan.md +697 -0
package/docs/plans/2026-02-21-validator-suite-design.md +148 -0
package/docs/plans/2026-02-21-validator-suite-plan.md +540 -0
package/docs/plans/2026-02-22-mab-research-round2.md +556 -0
package/docs/plans/2026-02-22-mab-run-design.md +462 -0
package/docs/plans/2026-02-22-mab-run-plan.md +2046 -0
package/docs/plans/2026-02-22-operations-design-methodology-research.md +681 -0
package/docs/plans/2026-02-22-research-agent-failure-taxonomy.md +532 -0
package/docs/plans/2026-02-22-research-code-guideline-policies.md +886 -0
package/docs/plans/2026-02-22-research-codebase-audit-refactoring.md +908 -0
package/docs/plans/2026-02-22-research-coding-standards-documentation.md +541 -0
package/docs/plans/2026-02-22-research-competitive-landscape.md +687 -0
package/docs/plans/2026-02-22-research-comprehensive-testing.md +1076 -0
package/docs/plans/2026-02-22-research-context-utilization.md +459 -0
package/docs/plans/2026-02-22-research-cost-quality-tradeoff.md +548 -0
package/docs/plans/2026-02-22-research-lesson-transferability.md +508 -0
package/docs/plans/2026-02-22-research-multi-agent-coordination.md +312 -0
package/docs/plans/2026-02-22-research-phase-integration.md +602 -0
package/docs/plans/2026-02-22-research-plan-quality.md +428 -0
package/docs/plans/2026-02-22-research-prompt-engineering.md +558 -0
package/docs/plans/2026-02-22-research-unconventional-perspectives.md +528 -0
package/docs/plans/2026-02-22-research-user-adoption.md +638 -0
package/docs/plans/2026-02-22-research-verification-effectiveness.md +433 -0
package/docs/plans/2026-02-23-agent-suite-design.md +299 -0
package/docs/plans/2026-02-23-agent-suite-plan.md +578 -0
package/docs/plans/2026-02-23-phase3-cost-infrastructure-design.md +148 -0
package/docs/plans/2026-02-23-phase3-cost-infrastructure-plan.md +1062 -0
package/docs/plans/2026-02-23-research-bash-expert-agent.md +543 -0
package/docs/plans/2026-02-23-research-dependency-auditor-agent.md +564 -0
package/docs/plans/2026-02-23-research-improving-existing-agents.md +503 -0
package/docs/plans/2026-02-23-research-integration-tester-agent.md +454 -0
package/docs/plans/2026-02-23-research-python-expert-agent.md +429 -0
package/docs/plans/2026-02-23-research-service-monitor-agent.md +425 -0
package/docs/plans/2026-02-23-research-shell-expert-agent.md +533 -0
package/docs/plans/2026-02-23-roadmap-to-completion.md +530 -0
package/docs/plans/2026-02-24-headless-module-split-design.md +98 -0
package/docs/plans/2026-02-24-headless-module-split.md +443 -0
package/docs/plans/2026-02-24-lesson-scope-metadata-design.md +228 -0
package/docs/plans/2026-02-24-lesson-scope-metadata-plan.md +968 -0
package/docs/plans/2026-02-24-npm-packaging-design.md +841 -0
package/docs/plans/2026-02-24-npm-packaging-plan.md +1965 -0
package/docs/plans/audit-findings.md +186 -0
package/docs/telegram-notification-format.md +98 -0
package/examples/example-plan.md +51 -0
package/examples/example-prd.json +72 -0
package/examples/example-roadmap.md +33 -0
package/examples/quickstart-plan.md +63 -0
package/hooks/hooks.json +26 -0
package/hooks/setup-symlinks.sh +48 -0
package/hooks/stop-hook.sh +135 -0
package/package.json +47 -0
package/policies/bash.md +71 -0
package/policies/python.md +71 -0
package/policies/testing.md +61 -0
package/policies/universal.md +60 -0
package/scripts/analyze-report.sh +97 -0
package/scripts/architecture-map.sh +145 -0
package/scripts/auto-compound.sh +273 -0
package/scripts/batch-audit.sh +42 -0
package/scripts/batch-test.sh +101 -0
package/scripts/entropy-audit.sh +221 -0
package/scripts/failure-digest.sh +51 -0
package/scripts/generate-ast-rules.sh +96 -0
package/scripts/init.sh +112 -0
package/scripts/lesson-check.sh +428 -0
package/scripts/lib/common.sh +61 -0
package/scripts/lib/cost-tracking.sh +153 -0
package/scripts/lib/ollama.sh +60 -0
package/scripts/lib/progress-writer.sh +128 -0
package/scripts/lib/run-plan-context.sh +215 -0
package/scripts/lib/run-plan-echo-back.sh +231 -0
package/scripts/lib/run-plan-headless.sh +396 -0
package/scripts/lib/run-plan-notify.sh +57 -0
package/scripts/lib/run-plan-parser.sh +81 -0
package/scripts/lib/run-plan-prompt.sh +215 -0
package/scripts/lib/run-plan-quality-gate.sh +132 -0
package/scripts/lib/run-plan-routing.sh +315 -0
package/scripts/lib/run-plan-sampling.sh +170 -0
package/scripts/lib/run-plan-scoring.sh +146 -0
package/scripts/lib/run-plan-state.sh +142 -0
package/scripts/lib/run-plan-team.sh +199 -0
package/scripts/lib/telegram.sh +54 -0
package/scripts/lib/thompson-sampling.sh +176 -0
package/scripts/license-check.sh +74 -0
package/scripts/mab-run.sh +575 -0
package/scripts/module-size-check.sh +146 -0
package/scripts/patterns/async-no-await.yml +5 -0
package/scripts/patterns/bare-except.yml +6 -0
package/scripts/patterns/empty-catch.yml +6 -0
package/scripts/patterns/hardcoded-localhost.yml +9 -0
package/scripts/patterns/retry-loop-no-backoff.yml +12 -0
package/scripts/pipeline-status.sh +197 -0
package/scripts/policy-check.sh +226 -0
package/scripts/prior-art-search.sh +133 -0
package/scripts/promote-mab-lessons.sh +126 -0
package/scripts/prompts/agent-a-superpowers.md +29 -0
package/scripts/prompts/agent-b-ralph.md +29 -0
package/scripts/prompts/judge-agent.md +61 -0
package/scripts/prompts/planner-agent.md +44 -0
package/scripts/pull-community-lessons.sh +90 -0
package/scripts/quality-gate.sh +266 -0
package/scripts/research-gate.sh +90 -0
package/scripts/run-plan.sh +329 -0
package/scripts/scope-infer.sh +159 -0
package/scripts/setup-ralph-loop.sh +155 -0
package/scripts/telemetry.sh +230 -0
package/scripts/tests/run-all-tests.sh +52 -0
package/scripts/tests/test-act-cli.sh +46 -0
package/scripts/tests/test-agents-md.sh +87 -0
package/scripts/tests/test-analyze-report.sh +114 -0
package/scripts/tests/test-architecture-map.sh +89 -0
package/scripts/tests/test-auto-compound.sh +169 -0
package/scripts/tests/test-batch-test.sh +65 -0
package/scripts/tests/test-benchmark-runner.sh +25 -0
package/scripts/tests/test-common.sh +168 -0
package/scripts/tests/test-cost-tracking.sh +158 -0
package/scripts/tests/test-echo-back.sh +180 -0
package/scripts/tests/test-entropy-audit.sh +146 -0
package/scripts/tests/test-failure-digest.sh +66 -0
package/scripts/tests/test-generate-ast-rules.sh +145 -0
package/scripts/tests/test-helpers.sh +82 -0
package/scripts/tests/test-init.sh +47 -0
package/scripts/tests/test-lesson-check.sh +278 -0
package/scripts/tests/test-lesson-local.sh +55 -0
package/scripts/tests/test-license-check.sh +109 -0
package/scripts/tests/test-mab-run.sh +182 -0
package/scripts/tests/test-ollama-lib.sh +49 -0
package/scripts/tests/test-ollama.sh +60 -0
package/scripts/tests/test-pipeline-status.sh +198 -0
package/scripts/tests/test-policy-check.sh +124 -0
package/scripts/tests/test-prior-art-search.sh +96 -0
package/scripts/tests/test-progress-writer.sh +140 -0
package/scripts/tests/test-promote-mab-lessons.sh +110 -0
package/scripts/tests/test-pull-community-lessons.sh +149 -0
package/scripts/tests/test-quality-gate.sh +241 -0
package/scripts/tests/test-research-gate.sh +132 -0
package/scripts/tests/test-run-plan-cli.sh +86 -0
package/scripts/tests/test-run-plan-context.sh +305 -0
package/scripts/tests/test-run-plan-e2e.sh +153 -0
package/scripts/tests/test-run-plan-headless.sh +424 -0
package/scripts/tests/test-run-plan-notify.sh +124 -0
package/scripts/tests/test-run-plan-parser.sh +217 -0
package/scripts/tests/test-run-plan-prompt.sh +254 -0
package/scripts/tests/test-run-plan-quality-gate.sh +222 -0
package/scripts/tests/test-run-plan-routing.sh +178 -0
package/scripts/tests/test-run-plan-scoring.sh +148 -0
package/scripts/tests/test-run-plan-state.sh +261 -0
package/scripts/tests/test-run-plan-team.sh +157 -0
package/scripts/tests/test-scope-infer.sh +150 -0
package/scripts/tests/test-setup-ralph-loop.sh +63 -0
package/scripts/tests/test-telegram-env.sh +38 -0
package/scripts/tests/test-telegram.sh +121 -0
package/scripts/tests/test-telemetry.sh +46 -0
package/scripts/tests/test-thompson-sampling.sh +139 -0
package/scripts/tests/test-validate-all.sh +60 -0
package/scripts/tests/test-validate-commands.sh +89 -0
package/scripts/tests/test-validate-hooks.sh +98 -0
package/scripts/tests/test-validate-lessons.sh +150 -0
package/scripts/tests/test-validate-plan-quality.sh +235 -0
package/scripts/tests/test-validate-plans.sh +187 -0
package/scripts/tests/test-validate-plugin.sh +106 -0
package/scripts/tests/test-validate-prd.sh +184 -0
package/scripts/tests/test-validate-skills.sh +134 -0
package/scripts/validate-all.sh +57 -0
package/scripts/validate-commands.sh +67 -0
package/scripts/validate-hooks.sh +89 -0
package/scripts/validate-lessons.sh +98 -0
package/scripts/validate-plan-quality.sh +369 -0
package/scripts/validate-plans.sh +120 -0
package/scripts/validate-plugin.sh +86 -0
package/scripts/validate-policies.sh +42 -0
package/scripts/validate-prd.sh +118 -0
package/scripts/validate-skills.sh +96 -0
package/skills/autocode/SKILL.md +285 -0
package/skills/autocode/ab-verification.md +51 -0
package/skills/autocode/code-quality-standards.md +37 -0
package/skills/autocode/competitive-mode.md +364 -0
package/skills/brainstorming/SKILL.md +97 -0
package/skills/capture-lesson/SKILL.md +187 -0
package/skills/check-lessons/SKILL.md +116 -0
package/skills/dispatching-parallel-agents/SKILL.md +110 -0
package/skills/executing-plans/SKILL.md +85 -0
package/skills/finishing-a-development-branch/SKILL.md +201 -0
package/skills/receiving-code-review/SKILL.md +72 -0
package/skills/requesting-code-review/SKILL.md +59 -0
package/skills/requesting-code-review/code-reviewer.md +82 -0
package/skills/research/SKILL.md +145 -0
package/skills/roadmap/SKILL.md +115 -0
package/skills/subagent-driven-development/SKILL.md +98 -0
package/skills/subagent-driven-development/code-quality-reviewer-prompt.md +18 -0
package/skills/subagent-driven-development/implementer-prompt.md +73 -0
package/skills/subagent-driven-development/spec-reviewer-prompt.md +57 -0
package/skills/systematic-debugging/SKILL.md +134 -0
package/skills/systematic-debugging/condition-based-waiting.md +64 -0
package/skills/systematic-debugging/defense-in-depth.md +32 -0
package/skills/systematic-debugging/root-cause-tracing.md +55 -0
package/skills/test-driven-development/SKILL.md +167 -0
package/skills/using-git-worktrees/SKILL.md +219 -0
package/skills/using-superpowers/SKILL.md +54 -0
package/skills/verification-before-completion/SKILL.md +140 -0
package/skills/verify/SKILL.md +82 -0
package/skills/writing-plans/SKILL.md +128 -0
package/skills/writing-skills/SKILL.md +93 -0

package/scripts/tests/test-validate-plan-quality.sh ADDED Viewed

@@ -0,0 +1,235 @@
+#!/usr/bin/env bash
+# Test plan quality scorecard
+set -euo pipefail
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+VALIDATE="$SCRIPT_DIR/../validate-plan-quality.sh"
+FAILURES=0
+TESTS=0
+assert_eq() {
+    local desc="$1" expected="$2" actual="$3"
+    TESTS=$((TESTS + 1))
+    if [[ "$expected" != "$actual" ]]; then
+        echo "FAIL: $desc (expected: $expected, got: $actual)"
+        FAILURES=$((FAILURES + 1))
+    else
+        echo "PASS: $desc"
+    fi
+}
+assert_contains() {
+    local desc="$1" needle="$2" haystack="$3"
+    TESTS=$((TESTS + 1))
+    if [[ "$haystack" != *"$needle"* ]]; then
+        echo "FAIL: $desc"
+        echo "  expected to contain: $needle"
+        FAILURES=$((FAILURES + 1))
+    else
+        echo "PASS: $desc"
+    fi
+}
+TMPDIR_ROOT=$(mktemp -d)
+trap 'rm -rf "$TMPDIR_ROOT"' EXIT
+# =============================================================================
+# High-quality plan (should score >= 60)
+# =============================================================================
+HIGH_QUALITY="$TMPDIR_ROOT/high-quality.md"
+cat > "$HIGH_QUALITY" << 'EOF'
+# High Quality Plan
+## Batch 1: Setup (Tasks 1-2)
+### Task 1: Create Data Model
+**Files:**
+- Create: `src/models.py`
+- Test: `tests/test_models.py`
+**Step 1: Write the failing test**
+Write `tests/test_models.py` with assertions that verify Model class works.
+**Step 2: Implement**
+Create `src/models.py` with the Model class.
+### Task 2: Add Validation
+**Files:**
+- Modify: `src/models.py`
+Add validation. Write test first, then implement. Should reject invalid input.
+## Batch 2: Integration (Tasks 3-4)
+### Task 3: Wire Components
+**Files:**
+- Create: `src/pipeline.py`
+- Test: `tests/test_pipeline.py`
+Connect parser to transformer. Verify end-to-end with test that checks output format.
+### Task 4: CLI Entry Point
+**Files:**
+- Create: `src/cli.py`
+- Test: `tests/test_cli.py`
+Add CLI. Test argument parsing. Should handle missing file gracefully.
+EOF
+output=$(bash "$VALIDATE" "$HIGH_QUALITY" 2>&1)
+exit_code=$?
+assert_eq "high quality plan passes" "0" "$exit_code"
+assert_contains "high quality shows PASSED" "PASSED" "$output"
+# =============================================================================
+# Low-quality plan (should score < 60 with low min-score threshold)
+# =============================================================================
+LOW_QUALITY="$TMPDIR_ROOT/low-quality.md"
+cat > "$LOW_QUALITY" << 'EOF'
+# Low Quality Plan
+## Batch 1: Do Everything
+Build the whole thing. Make it work. Deploy it.
+## Batch 2: More Stuff
+Do more stuff. Fix what broke in batch 1.
+Depends on batch 3 being done first.
+## Batch 3: Final Things
+Finish everything. Clean up.
+EOF
+output=$(bash "$VALIDATE" "$LOW_QUALITY" 2>&1 || true)
+# Low quality: no tasks, no files, no tests, forward ref in batch 2 → batch 3
+assert_contains "low quality shows scores" "Scorecard" "$output"
+# With min-score=90 this should definitely fail
+exit_code=0
+bash "$VALIDATE" "$LOW_QUALITY" --min-score 90 >/dev/null 2>&1 || exit_code=$?
+assert_eq "low quality fails at min-score 90" "1" "$exit_code"
+# =============================================================================
+# JSON output mode
+# =============================================================================
+json_output=$(bash "$VALIDATE" "$HIGH_QUALITY" --json 2>&1)
+assert_contains "json has score field" '"score"' "$json_output"
+assert_contains "json has dimensions" '"dimensions"' "$json_output"
+assert_contains "json has passed field" '"passed"' "$json_output"
+assert_contains "json has task_granularity" '"task_granularity"' "$json_output"
+assert_contains "json has weight" '"weight"' "$json_output"
+# =============================================================================
+# Error cases
+# =============================================================================
+# No file
+exit_code=0
+bash "$VALIDATE" 2>/dev/null || exit_code=$?
+assert_eq "no file arg exits 1" "1" "$exit_code"
+# Missing file
+exit_code=0
+bash "$VALIDATE" "$TMPDIR_ROOT/nonexistent.md" 2>/dev/null || exit_code=$?
+assert_eq "missing file exits 1" "1" "$exit_code"
+# File with no batches
+NO_BATCHES="$TMPDIR_ROOT/no-batches.md"
+echo "# Just a title" > "$NO_BATCHES"
+exit_code=0
+bash "$VALIDATE" "$NO_BATCHES" 2>/dev/null || exit_code=$?
+assert_eq "no batches exits 1" "1" "$exit_code"
+# =============================================================================
+# Custom min-score
+# =============================================================================
+# High quality with min-score=101 should fail (max score is 100)
+exit_code=0
+bash "$VALIDATE" "$HIGH_QUALITY" --min-score 101 >/dev/null 2>&1 || exit_code=$?
+assert_eq "min-score 101 is impossible to pass" "1" "$exit_code"
+# High quality with min-score=1 should pass
+exit_code=0
+bash "$VALIDATE" "$HIGH_QUALITY" --min-score 1 >/dev/null 2>&1 || exit_code=$?
+assert_eq "min-score 1 is easy to pass" "0" "$exit_code"
+# =============================================================================
+# Dimension-specific tests
+# =============================================================================
+# Forward dependency reference
+FORWARD_REF="$TMPDIR_ROOT/forward-ref.md"
+cat > "$FORWARD_REF" << 'EOF'
+# Forward Reference Plan
+## Batch 1: First
+### Task 1: Setup
+**Files:**
+- Create: `src/setup.py`
+This task needs batch 2 to be done first. Check tests pass.
+## Batch 2: Second
+### Task 2: Build
+**Files:**
+- Create: `src/build.py`
+Build the thing. Verify it works.
+EOF
+json=$(bash "$VALIDATE" "$FORWARD_REF" --json 2>&1)
+dep_score=$(echo "$json" | python3 -c "import sys,json; d=json.load(sys.stdin); print(d['dimensions']['dependency_ordering']['score'])")
+assert_eq "forward ref lowers dependency score" "50" "$dep_score"
+# Oversized batch (> 5 tasks)
+BIG_BATCH="$TMPDIR_ROOT/big-batch.md"
+cat > "$BIG_BATCH" << 'EOF'
+# Big Batch Plan
+## Batch 1: Everything
+### Task 1: A
+Do A. Check it works.
+### Task 2: B
+Do B. Verify output.
+### Task 3: C
+Do C. Test the result.
+### Task 4: D
+Do D. Assert correctness.
+### Task 5: E
+Do E. Should pass all tests.
+### Task 6: F
+Do F. Confirm it works.
+### Task 7: G
+Do G. Must be correct.
+EOF
+json=$(bash "$VALIDATE" "$BIG_BATCH" --json 2>&1)
+size_score=$(echo "$json" | python3 -c "import sys,json; d=json.load(sys.stdin); print(d['dimensions']['batch_size']['score'])")
+assert_eq "oversized batch gets 0 on batch_size" "0" "$size_score"
+echo ""
+echo "Results: $((TESTS - FAILURES))/$TESTS passed"
+if [[ $FAILURES -gt 0 ]]; then
+    echo "FAILURES: $FAILURES"
+    exit 1
+fi
+echo "ALL PASSED"

package/scripts/tests/test-validate-plans.sh ADDED Viewed

@@ -0,0 +1,187 @@
+#!/usr/bin/env bash
+# Test validate-plans.sh
+set -euo pipefail
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+source "$SCRIPT_DIR/test-helpers.sh"
+VALIDATOR="$SCRIPT_DIR/../validate-plans.sh"
+WORK=$(mktemp -d)
+trap 'rm -rf "$WORK"' EXIT
+# Helper: create a plan file
+create_plan() {
+    local name="$1" content="$2"
+    mkdir -p "$WORK/plans"
+    printf '%s\n' "$content" > "$WORK/plans/$name"
+}
+# Helper: run validator against temp plans dir
+run_validator() {
+    local exit_code=0
+    PLANS_DIR="$WORK/plans" bash "$VALIDATOR" "$@" 2>&1 || exit_code=$?
+    echo "EXIT:$exit_code"
+}
+# === Test: Valid plan passes ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-test-plan.md" '# Test Plan
+## Batch 1: Setup
+### Task 1: Do thing one
+Some content.
+### Task 2: Do thing two
+More content.
+## Batch 2: Implementation
+### Task 3: Do thing three
+Final content.'
+output=$(run_validator)
+assert_contains "valid plan: PASS" "validate-plans: PASS" "$output"
+assert_contains "valid plan: exit 0" "EXIT:0" "$output"
+# === Test: No batches fails (explicit file) ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-no-batches.md" '# A Plan
+This plan has no batch headers at all.
+Just some text.'
+exit_code=0
+output=$(bash "$VALIDATOR" "$WORK/plans/2026-01-01-no-batches.md" 2>&1) || exit_code=$?
+output="${output}
+EXIT:${exit_code}"
+assert_contains "no batches: reports violation" "No batches found" "$output"
+assert_contains "no batches: exit 1" "EXIT:1" "$output"
+# === Test: Empty batch (no tasks) fails ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-empty-batch.md" '# Plan
+## Batch 1: Setup
+### Task 1: Do something
+Content.
+## Batch 2: Empty
+No tasks here.
+## Batch 3: More
+### Task 2: Do another thing
+Content.'
+output=$(run_validator)
+assert_contains "empty batch: reports violation" "has no tasks" "$output"
+assert_contains "empty batch: exit 1" "EXIT:1" "$output"
+# === Test: Non-sequential batch numbers fails ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-nonseq.md" '# Plan
+## Batch 1: First
+### Task 1: Do thing
+Content.
+## Batch 3: Skipped Two
+### Task 2: Do another
+Content.'
+output=$(run_validator)
+assert_contains "non-sequential: reports violation" "expected Batch 2" "$output"
+assert_contains "non-sequential: exit 1" "EXIT:1" "$output"
+# === Test: Design docs (no Batch headers) are skipped ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-design.md" '# Design Doc
+This is a design document, not a plan. No Batch headers.'
+create_plan "2026-01-01-plan.md" '# Plan
+## Batch 1: Setup
+### Task 1: Do thing
+Content.'
+output=$(run_validator)
+assert_contains "design doc skipped: PASS" "validate-plans: PASS" "$output"
+assert_contains "design doc skipped: exit 0" "EXIT:0" "$output"
+# === Test: Single file argument validates just that file ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-good.md" '# Plan
+## Batch 1: Setup
+### Task 1: Do thing
+Content.'
+exit_code=0
+output=$(bash "$VALIDATOR" "$WORK/plans/2026-01-01-good.md" 2>&1) || exit_code=$?
+output="${output}
+EXIT:${exit_code}"
+assert_contains "single file arg: PASS" "validate-plans: PASS" "$output"
+assert_contains "single file arg: exit 0" "EXIT:0" "$output"
+# === Test: --warn exits 0 even with violations ===
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-bad.md" '# Plan
+## Batch 1: Setup
+No tasks here.'
+output=$(run_validator --warn)
+assert_contains "--warn: still reports violation" "has no tasks" "$output"
+assert_contains "--warn: exits 0" "EXIT:0" "$output"
+# === Test: --help exits 0 ===
+output=$(run_validator --help)
+assert_contains "--help: shows usage" "Usage:" "$output"
+assert_contains "--help: exits 0" "EXIT:0" "$output"
+# === Test: Task on next batch header line not counted for previous batch (#26) ===
+# This tests the sed range fix — when a "### Task" line is the first line of
+# the next batch (immediately after "## Batch N"), it must not be counted for
+# the previous batch.
+rm -rf "$WORK/plans"
+create_plan "2026-01-01-adjacent.md" '# Plan
+## Batch 1: Setup
+Some content but no tasks here.
+## Batch 2: Implementation
+### Task 1: The only task
+Content.'
+output=$(run_validator)
+assert_contains "adjacent batch: batch 1 has no tasks" "Batch 1 has no tasks" "$output"
+assert_contains "adjacent batch: FAIL" "FAIL" "$output"
+# === Test: Missing plans directory fails ===
+rm -rf "$WORK/plans"
+output=$(PLANS_DIR="$WORK/nonexistent" bash "$VALIDATOR" 2>&1 || echo "EXIT:$?")
+assert_contains "missing dir: error message" "plans directory not found" "$output"
+assert_contains "missing dir: exit 1" "EXIT:1" "$output"
+report_results

package/scripts/tests/test-validate-plugin.sh ADDED Viewed

@@ -0,0 +1,106 @@
+#!/usr/bin/env bash
+# Test validate-plugin.sh
+set -euo pipefail
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+source "$SCRIPT_DIR/test-helpers.sh"
+VALIDATOR="$SCRIPT_DIR/../validate-plugin.sh"
+WORK=$(mktemp -d)
+trap 'rm -rf "$WORK"' EXIT
+# Helper: create plugin files
+create_plugin() {
+    local plugin_json="$1" marketplace_json="$2"
+    mkdir -p "$WORK/.claude-plugin"
+    echo "$plugin_json" > "$WORK/.claude-plugin/plugin.json"
+    echo "$marketplace_json" > "$WORK/.claude-plugin/marketplace.json"
+}
+# Helper: run validator against temp dir
+run_validator() {
+    local exit_code=0
+    PLUGIN_DIR="$WORK/.claude-plugin" bash "$VALIDATOR" "$@" 2>&1 || exit_code=$?
+    echo "EXIT:$exit_code"
+}
+# === Test: Matching name and version passes ===
+create_plugin \
+    '{"name":"my-toolkit","version":"1.0.0","description":"Test"}' \
+    '{"name":"my-toolkit","plugins":[{"name":"my-toolkit","version":"1.0.0"}]}'
+output=$(run_validator)
+assert_contains "matching: PASS" "validate-plugin: PASS" "$output"
+assert_contains "matching: exit 0" "EXIT:0" "$output"
+# === Test: Mismatched name fails ===
+create_plugin \
+    '{"name":"toolkit-a","version":"1.0.0","description":"Test"}' \
+    '{"name":"toolkit-b","plugins":[{"name":"toolkit-b","version":"1.0.0"}]}'
+output=$(run_validator)
+assert_contains "name mismatch: reports violation" "name mismatch" "$output"
+assert_contains "name mismatch: exit 1" "EXIT:1" "$output"
+# === Test: Mismatched version fails ===
+create_plugin \
+    '{"name":"my-toolkit","version":"1.0.0","description":"Test"}' \
+    '{"name":"my-toolkit","plugins":[{"name":"my-toolkit","version":"2.0.0"}]}'
+output=$(run_validator)
+assert_contains "version mismatch: reports violation" "version mismatch" "$output"
+assert_contains "version mismatch: exit 1" "EXIT:1" "$output"
+# === Test: Missing plugin.json fails ===
+rm -rf "$WORK/.claude-plugin"
+mkdir -p "$WORK/.claude-plugin"
+echo '{"name":"x","plugins":[{"name":"x","version":"1.0.0"}]}' > "$WORK/.claude-plugin/marketplace.json"
+output=$(run_validator)
+assert_contains "missing plugin.json: error" "plugin.json not found" "$output"
+assert_contains "missing plugin.json: exit 1" "EXIT:1" "$output"
+# === Test: Missing marketplace.json fails ===
+rm -rf "$WORK/.claude-plugin"
+mkdir -p "$WORK/.claude-plugin"
+echo '{"name":"x","version":"1.0.0"}' > "$WORK/.claude-plugin/plugin.json"
+output=$(run_validator)
+assert_contains "missing marketplace.json: error" "marketplace.json not found" "$output"
+assert_contains "missing marketplace.json: exit 1" "EXIT:1" "$output"
+# === Test: Invalid JSON in plugin.json fails ===
+create_plugin '{invalid json' '{"name":"x","plugins":[{"name":"x","version":"1.0.0"}]}'
+output=$(run_validator)
+assert_contains "invalid plugin.json: error" "plugin.json is not valid JSON" "$output"
+assert_contains "invalid plugin.json: exit 1" "EXIT:1" "$output"
+# === Test: Invalid JSON in marketplace.json fails ===
+create_plugin '{"name":"x","version":"1.0.0"}' '{invalid json'
+output=$(run_validator)
+assert_contains "invalid marketplace.json: error" "marketplace.json is not valid JSON" "$output"
+assert_contains "invalid marketplace.json: exit 1" "EXIT:1" "$output"
+# === Test: --warn exits 0 even with violations ===
+create_plugin \
+    '{"name":"a","version":"1.0.0"}' \
+    '{"name":"b","plugins":[{"name":"b","version":"1.0.0"}]}'
+output=$(run_validator --warn)
+assert_contains "--warn: still reports violation" "name mismatch" "$output"
+assert_contains "--warn: exits 0" "EXIT:0" "$output"
+# === Test: --help exits 0 ===
+output=$(run_validator --help)
+assert_contains "--help: shows usage" "Usage:" "$output"
+assert_contains "--help: exits 0" "EXIT:0" "$output"
+# === Test: Missing plugin directory fails ===
+rm -rf "$WORK/.claude-plugin"
+output=$(PLUGIN_DIR="$WORK/nonexistent" bash "$VALIDATOR" 2>&1 || echo "EXIT:$?")
+assert_contains "missing dir: error message" "plugin directory not found" "$output"
+assert_contains "missing dir: exit 1" "EXIT:1" "$output"
+report_results