npm - @sanity/ailf - Versions diffs - 2.0.0 → 2.0.2 - Mend

@sanity/ailf 2.0.0 → 2.0.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (444) hide show

package/canonical/grader-references/README.md +2 -2
package/canonical/reference-solutions/content-lake/mutations.ts +160 -0
package/canonical/reference-solutions/content-lake/realtime.ts +187 -0
package/canonical/reference-solutions/image-handling/asset-pipeline.tsx +166 -0
package/canonical/reference-solutions/portable-text/custom-blocks.ts +204 -0
package/canonical/reference-solutions/portable-text/rendering.tsx +163 -0
package/config/features.ts +1 -1
package/config/models.ts +28 -23
package/config/sources.ts +1 -1
package/config/thresholds.ts +1 -1
package/dist/_vendor/ailf-core/__tests__/comparison-formatters.test.d.ts +10 -0
package/dist/_vendor/ailf-core/__tests__/comparison-formatters.test.js +185 -0
package/dist/_vendor/ailf-core/artifact-capture/__tests__/noop-collector.test.d.ts +6 -0
package/dist/_vendor/ailf-core/artifact-capture/__tests__/noop-collector.test.js +42 -0
package/dist/_vendor/ailf-core/artifact-capture/noop-collector.d.ts +14 -0
package/dist/_vendor/ailf-core/artifact-capture/noop-collector.js +25 -0
package/dist/_vendor/ailf-core/config-helpers.d.ts +6 -0
package/dist/_vendor/ailf-core/config-helpers.js +29 -0
package/dist/_vendor/ailf-core/examples/index.d.ts +164 -94
package/dist/_vendor/ailf-core/examples/index.js +208 -114
package/dist/_vendor/ailf-core/index.d.ts +1 -0
package/dist/_vendor/ailf-core/index.js +1 -0
package/dist/_vendor/ailf-core/ports/artifact-collector.d.ts +94 -0
package/dist/_vendor/ailf-core/ports/artifact-collector.js +13 -0
package/dist/_vendor/ailf-core/ports/capture-comparator.d.ts +138 -0
package/dist/_vendor/ailf-core/ports/capture-comparator.js +10 -0
package/dist/_vendor/ailf-core/ports/context.d.ts +20 -1
package/dist/_vendor/ailf-core/ports/eval-runner.d.ts +6 -0
package/dist/_vendor/ailf-core/ports/index.d.ts +2 -0
package/dist/_vendor/ailf-core/ports/pipeline-step.d.ts +11 -0
package/dist/_vendor/ailf-core/ports/task-source.d.ts +3 -3
package/dist/_vendor/ailf-core/ports/task-source.js +3 -3
package/dist/_vendor/ailf-core/schemas/pipeline-request.d.ts +6 -1
package/dist/_vendor/ailf-core/schemas/pipeline-request.js +14 -2
package/dist/_vendor/ailf-core/services/config-helpers.d.ts +16 -1
package/dist/_vendor/ailf-core/services/config-helpers.js +21 -0
package/dist/_vendor/ailf-core/services/index.d.ts +1 -1
package/dist/_vendor/ailf-core/services/index.js +1 -1
package/dist/_vendor/ailf-core/services/scoring.js +9 -0
package/dist/_vendor/ailf-core/types/generalized-task.d.ts +12 -1
package/dist/_vendor/ailf-core/types/generalized-task.js +1 -1
package/dist/_vendor/ailf-core/types/index.d.ts +47 -4
package/dist/_vendor/ailf-core/types/plugin-registry.d.ts +27 -0
package/dist/_vendor/ailf-shared/eval-modes.d.ts +15 -0
package/dist/_vendor/ailf-shared/eval-modes.js +18 -0
package/dist/_vendor/ailf-tasks/cli.d.ts +8 -0
package/dist/_vendor/ailf-tasks/cli.js +61 -0
package/dist/_vendor/ailf-tasks/index.d.ts +13 -0
package/dist/_vendor/ailf-tasks/index.js +16 -0
package/dist/_vendor/ailf-tasks/parser.d.ts +27 -0
package/dist/_vendor/ailf-tasks/parser.js +73 -0
package/dist/_vendor/ailf-tasks/schemas.d.ts +198 -0
package/dist/_vendor/ailf-tasks/schemas.js +180 -0
package/dist/_vendor/ailf-tasks/validation.d.ts +47 -0
package/dist/_vendor/ailf-tasks/validation.js +162 -0
package/dist/adapters/api-client/remediation.js +2 -2
package/dist/adapters/config-sources/file-config-adapter.js +6 -1
package/dist/adapters/eval-runners/promptfoo-eval-adapter.js +8 -2
package/dist/adapters/index.d.ts +0 -1
package/dist/adapters/index.js +0 -1
package/dist/adapters/task-sources/composite-task-source.d.ts +1 -1
package/dist/adapters/task-sources/composite-task-source.js +1 -1
package/dist/adapters/task-sources/content-lake-task-source.d.ts +4 -6
package/dist/adapters/task-sources/content-lake-task-source.js +4 -6
package/dist/adapters/task-sources/index.d.ts +1 -2
package/dist/adapters/task-sources/index.js +1 -2
package/dist/adapters/task-sources/repo-schemas.d.ts +1 -1
package/dist/adapters/task-sources/repo-schemas.js +2 -2
package/dist/adapters/task-sources/repo-task-source.js +1 -1
package/dist/adapters/task-sources/repo-trigger.d.ts +1 -1
package/dist/adapters/task-sources/repo-trigger.js +1 -1
package/dist/adapters/task-sources/task-file-loader.d.ts +9 -6
package/dist/adapters/task-sources/task-file-loader.js +20 -6
package/dist/agent-observer/test-imports.d.ts +7 -0
package/dist/agent-observer/test-imports.js +185 -0
package/dist/artifact-capture/comparator.d.ts +22 -0
package/dist/artifact-capture/comparator.js +493 -0
package/dist/artifact-capture/filesystem-collector.d.ts +42 -0
package/dist/artifact-capture/filesystem-collector.js +237 -0
package/dist/artifact-capture/redact-artifact.d.ts +20 -0
package/dist/artifact-capture/redact-artifact.js +115 -0
package/dist/assertions/source-isolation.d.ts +1 -1
package/dist/assertions/source-isolation.js +1 -1
package/dist/cli.js +4 -0
package/dist/commands/calculate-scores.js +1 -0
package/dist/commands/capture-compare.d.ts +15 -0
package/dist/commands/capture-compare.js +253 -0
package/dist/commands/capture-list.d.ts +12 -0
package/dist/commands/capture-list.js +147 -0
package/dist/commands/capture.d.ts +9 -0
package/dist/commands/capture.js +16 -0
package/dist/commands/chronic-failures.d.ts +8 -0
package/dist/commands/chronic-failures.js +33 -0
package/dist/commands/explain-handler.d.ts +1 -1
package/dist/commands/explain-handler.js +37 -8
package/dist/commands/fetch-docs.js +1 -0
package/dist/commands/generate-configs.d.ts +3 -3
package/dist/commands/generate-configs.js +20 -8
package/dist/commands/init.d.ts +2 -3
package/dist/commands/init.js +56 -170
package/dist/commands/pipeline-action.d.ts +7 -1
package/dist/commands/pipeline-action.js +43 -19
package/dist/commands/pipeline.d.ts +6 -1
package/dist/commands/pipeline.js +7 -2
package/dist/commands/pr-comment.js +1 -0
package/dist/commands/publish.js +1 -0
package/dist/commands/shared/help.js +2 -2
package/dist/commands/update-quality-scores.d.ts +5 -0
package/dist/commands/update-quality-scores.js +20 -0
package/dist/composition-root.d.ts +2 -3
package/dist/composition-root.js +27 -14
package/dist/config/features.ts +23 -0
package/dist/config/models.ts +100 -0
package/dist/config/prompts.ts +16 -0
package/dist/config/rubrics.ts +225 -0
package/dist/config/schedules.ts +47 -0
package/dist/config/sinks.ts +37 -0
package/dist/config/sources.ts +21 -0
package/dist/config/thresholds.ts +61 -0
package/dist/lib/agent-behavior-report.d.ts +8 -0
package/dist/lib/agent-behavior-report.js +185 -0
package/dist/lib/baseline.d.ts +19 -0
package/dist/lib/baseline.js +153 -0
package/dist/lib/calculate-scores.d.ts +23 -0
package/dist/lib/calculate-scores.js +42 -0
package/dist/lib/compare.d.ts +18 -0
package/dist/lib/compare.js +170 -0
package/dist/lib/coverage-audit.d.ts +4 -0
package/dist/lib/coverage-audit.js +42 -0
package/dist/lib/discovery-report.d.ts +13 -0
package/dist/lib/discovery-report.js +57 -0
package/dist/lib/fetch-docs.d.ts +30 -0
package/dist/lib/fetch-docs.js +171 -0
package/dist/lib/generate-configs.d.ts +25 -0
package/dist/lib/generate-configs.js +42 -0
package/dist/lib/grader-api.d.ts +21 -0
package/dist/lib/grader-api.js +34 -0
package/dist/lib/grader-compare.d.ts +19 -0
package/dist/lib/grader-compare.js +91 -0
package/dist/lib/grader-consistency.d.ts +27 -0
package/dist/lib/grader-consistency.js +79 -0
package/dist/lib/grader-sensitivity.d.ts +19 -0
package/dist/lib/grader-sensitivity.js +75 -0
package/dist/lib/grader-validate.d.ts +19 -0
package/dist/lib/grader-validate.js +78 -0
package/dist/lib/measure-retrieval.d.ts +14 -0
package/dist/lib/measure-retrieval.js +71 -0
package/dist/lib/pr-comment.d.ts +16 -0
package/dist/lib/pr-comment.js +28 -0
package/dist/lib/readiness-report.d.ts +13 -0
package/dist/lib/readiness-report.js +108 -0
package/dist/lib/webhook-server.d.ts +11 -0
package/dist/lib/webhook-server.js +24 -0
package/dist/lib/weekly-digest.d.ts +24 -0
package/dist/lib/weekly-digest.js +148 -0
package/dist/orchestration/build-app-context.js +13 -0
package/dist/orchestration/cache-context.d.ts +23 -0
package/dist/orchestration/cache-context.js +43 -0
package/dist/orchestration/env-bridge.d.ts +21 -0
package/dist/orchestration/env-bridge.js +66 -0
package/dist/orchestration/load-pipeline-tasks.d.ts +34 -0
package/dist/orchestration/load-pipeline-tasks.js +52 -0
package/dist/orchestration/pipeline-orchestrator.js +75 -5
package/dist/orchestration/step-runner.js +5 -1
package/dist/orchestration/steps/calculate-scores-step.d.ts +1 -0
package/dist/orchestration/steps/calculate-scores-step.js +13 -0
package/dist/orchestration/steps/callback-step.js +10 -1
package/dist/orchestration/steps/compare-step.js +6 -3
package/dist/orchestration/steps/discovery-report-step.js +6 -2
package/dist/orchestration/steps/fetch-docs-shell.d.ts +17 -0
package/dist/orchestration/steps/fetch-docs-shell.js +30 -0
package/dist/orchestration/steps/fetch-docs-step.d.ts +1 -0
package/dist/orchestration/steps/fetch-docs-step.js +30 -16
package/dist/orchestration/steps/gap-analysis-step.js +13 -2
package/dist/orchestration/steps/generate-configs-step.d.ts +1 -0
package/dist/orchestration/steps/generate-configs-step.js +50 -15
package/dist/orchestration/steps/mirror-repo-tasks-step.d.ts +1 -1
package/dist/orchestration/steps/mirror-repo-tasks-step.js +1 -1
package/dist/orchestration/steps/publish-report-step.js +19 -0
package/dist/orchestration/steps/readiness-step.js +8 -3
package/dist/orchestration/steps/report-step.js +17 -4
package/dist/orchestration/steps/run-eval-step.d.ts +1 -0
package/dist/orchestration/steps/run-eval-step.js +52 -32
package/dist/pipeline/agent-behavior-report.js +6 -0
package/dist/pipeline/attribution.d.ts +1 -1
package/dist/pipeline/attribution.js +1 -1
package/dist/pipeline/cache.js +29 -15
package/dist/pipeline/calculate-scores.d.ts +2 -0
package/dist/pipeline/calculate-scores.js +70 -33
package/dist/pipeline/checks.d.ts +8 -3
package/dist/pipeline/checks.js +23 -3
package/dist/pipeline/chronic-failures.d.ts +55 -0
package/dist/pipeline/chronic-failures.js +110 -0
package/dist/pipeline/compiler/__tests__/mcp-server-handler.test.js +33 -0
package/dist/pipeline/compiler/__tests__/promptfoo-compiler.test.js +2 -3
package/dist/pipeline/compiler/__tests__/task-bridge.test.d.ts +9 -0
package/dist/pipeline/compiler/__tests__/task-bridge.test.js +339 -0
package/dist/pipeline/compiler/__tests__/tool-loop-openai.test.d.ts +10 -0
package/dist/pipeline/compiler/__tests__/tool-loop-openai.test.js +509 -0
package/dist/pipeline/compiler/assertion-mapper.d.ts +1 -1
package/dist/pipeline/compiler/assertion-mapper.js +1 -1
package/dist/pipeline/compiler/compiler-to-yaml.d.ts +2 -7
package/dist/pipeline/compiler/compiler-to-yaml.js +2 -7
package/dist/pipeline/compiler/config-loader.d.ts +14 -0
package/dist/pipeline/compiler/config-loader.js +42 -2
package/dist/pipeline/compiler/fixture-resolver.d.ts +1 -1
package/dist/pipeline/compiler/fixture-resolver.js +1 -1
package/dist/pipeline/compiler/ignore-fields.d.ts +1 -1
package/dist/pipeline/compiler/ignore-fields.js +1 -1
package/dist/pipeline/compiler/index.d.ts +2 -5
package/dist/pipeline/compiler/index.js +2 -5
package/dist/pipeline/compiler/literacy-bridge.d.ts +1 -1
package/dist/pipeline/compiler/literacy-bridge.js +1 -1
package/dist/pipeline/compiler/mode-bases/agent-harness.d.ts +1 -1
package/dist/pipeline/compiler/mode-bases/agent-harness.js +1 -1
package/dist/pipeline/compiler/mode-bases/knowledge-probe.d.ts +1 -1
package/dist/pipeline/compiler/mode-bases/knowledge-probe.js +1 -1
package/dist/pipeline/compiler/mode-bases/literacy.d.ts +13 -2
package/dist/pipeline/compiler/mode-bases/literacy.js +55 -1
package/dist/pipeline/compiler/mode-bases/mcp-server.d.ts +1 -1
package/dist/pipeline/compiler/mode-bases/mcp-server.js +1 -1
package/dist/pipeline/compiler/mode-handlers/agent-harness/index.d.ts +1 -1
package/dist/pipeline/compiler/mode-handlers/agent-harness/index.js +1 -1
package/dist/pipeline/compiler/mode-handlers/agent-harness-handler.d.ts +70 -0
package/dist/pipeline/compiler/mode-handlers/agent-harness-handler.js +485 -0
package/dist/pipeline/compiler/mode-handlers/index.d.ts +2 -2
package/dist/pipeline/compiler/mode-handlers/index.js +2 -2
package/dist/pipeline/compiler/mode-handlers/knowledge-probe/index.d.ts +1 -1
package/dist/pipeline/compiler/mode-handlers/knowledge-probe/index.js +1 -1
package/dist/pipeline/compiler/mode-handlers/knowledge-probe-handler.d.ts +76 -0
package/dist/pipeline/compiler/mode-handlers/knowledge-probe-handler.js +245 -0
package/dist/pipeline/compiler/mode-handlers/literacy/index.d.ts +1 -1
package/dist/pipeline/compiler/mode-handlers/literacy/index.js +1 -1
package/dist/pipeline/compiler/mode-handlers/literacy-handler.d.ts +89 -0
package/dist/pipeline/compiler/mode-handlers/literacy-handler.js +379 -0
package/dist/pipeline/compiler/mode-handlers/mcp-assertions.d.ts +50 -0
package/dist/pipeline/compiler/mode-handlers/mcp-assertions.js +334 -0
package/dist/pipeline/compiler/mode-handlers/mcp-server/assertions.d.ts +1 -1
package/dist/pipeline/compiler/mode-handlers/mcp-server/assertions.js +1 -1
package/dist/pipeline/compiler/mode-handlers/mcp-server/index.d.ts +1 -1
package/dist/pipeline/compiler/mode-handlers/mcp-server/index.js +1 -1
package/dist/pipeline/compiler/mode-handlers/mcp-server/provider-config.js +4 -0
package/dist/pipeline/compiler/mode-handlers/mcp-server-handler.d.ts +69 -0
package/dist/pipeline/compiler/mode-handlers/mcp-server-handler.js +307 -0
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider/index.js +22 -5
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider/mcp-connection.js +6 -0
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider/tool-loop-openai.d.ts +10 -5
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider/tool-loop-openai.js +314 -7
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider/types.d.ts +10 -0
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider.d.ts +65 -0
package/dist/pipeline/compiler/mode-handlers/mcp-tool-provider.js +368 -0
package/dist/pipeline/compiler/presets/sanity-literacy.d.ts +1 -1
package/dist/pipeline/compiler/presets/sanity-literacy.js +1 -1
package/dist/pipeline/compiler/promptfoo-compiler.d.ts +1 -4
package/dist/pipeline/compiler/promptfoo-compiler.js +3 -12
package/dist/pipeline/compiler/provider-assembler.js +13 -7
package/dist/pipeline/compiler/sandbox/docker-sandbox.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/docker-sandbox.js +1 -1
package/dist/pipeline/compiler/sandbox/fixture-provisioner.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/fixture-provisioner.js +1 -1
package/dist/pipeline/compiler/sandbox/git-worktree-sandbox.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/git-worktree-sandbox.js +1 -1
package/dist/pipeline/compiler/sandbox/index.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/index.js +1 -1
package/dist/pipeline/compiler/sandbox/sandbox-selector.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/sandbox-selector.js +1 -1
package/dist/pipeline/compiler/sandbox/sandbox-strategy.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/sandbox-strategy.js +1 -1
package/dist/pipeline/compiler/sandbox/tempdir-sandbox.d.ts +1 -1
package/dist/pipeline/compiler/sandbox/tempdir-sandbox.js +1 -1
package/dist/pipeline/compiler/scoring-bridge.d.ts +1 -1
package/dist/pipeline/compiler/scoring-bridge.js +1 -1
package/dist/pipeline/compiler/task-bridge.d.ts +41 -0
package/dist/pipeline/compiler/task-bridge.js +92 -0
package/dist/pipeline/compiler/task-graph-builder.d.ts +1 -4
package/dist/pipeline/compiler/task-graph-builder.js +1 -4
package/dist/pipeline/compiler/telemetry/index.d.ts +1 -1
package/dist/pipeline/compiler/telemetry/index.js +1 -1
package/dist/pipeline/compiler/variable-resolver.d.ts +1 -1
package/dist/pipeline/compiler/variable-resolver.js +1 -1
package/dist/pipeline/coverage-audit.d.ts +1 -1
package/dist/pipeline/coverage-audit.js +1 -1
package/dist/pipeline/degradations.d.ts +1 -1
package/dist/pipeline/degradations.js +1 -1
package/dist/pipeline/failure-modes.d.ts +1 -1
package/dist/pipeline/failure-modes.js +13 -1
package/dist/pipeline/gap-analysis.d.ts +1 -1
package/dist/pipeline/gap-analysis.js +3 -1
package/dist/pipeline/generate-configs.d.ts +2 -2
package/dist/pipeline/generate-configs.js +15 -8
package/dist/pipeline/grader-compare-runner.d.ts +1 -1
package/dist/pipeline/grader-compare-runner.js +7 -1
package/dist/pipeline/grader-comparison.d.ts +1 -1
package/dist/pipeline/grader-comparison.js +1 -1
package/dist/pipeline/grader-consistency-runner.d.ts +1 -1
package/dist/pipeline/grader-consistency-runner.js +7 -1
package/dist/pipeline/grader-consistency.d.ts +1 -1
package/dist/pipeline/grader-consistency.js +1 -1
package/dist/pipeline/grader-sensitivity-runner.d.ts +1 -1
package/dist/pipeline/grader-sensitivity-runner.js +1 -1
package/dist/pipeline/grader-sensitivity.d.ts +1 -1
package/dist/pipeline/grader-sensitivity.js +1 -1
package/dist/pipeline/grader-validate-runner.d.ts +1 -1
package/dist/pipeline/grader-validate-runner.js +2 -2
package/dist/pipeline/grader-validation.d.ts +1 -1
package/dist/pipeline/grader-validation.js +1 -1
package/dist/pipeline/map-request-to-config.js +15 -2
package/dist/pipeline/mirror-repo-tasks.d.ts +1 -1
package/dist/pipeline/mirror-repo-tasks.js +1 -1
package/dist/pipeline/plan-format.d.ts +1 -1
package/dist/pipeline/plan-format.js +1 -1
package/dist/pipeline/plan.d.ts +1 -1
package/dist/pipeline/plan.js +67 -29
package/dist/pipeline/probe.d.ts +1 -1
package/dist/pipeline/probe.js +1 -1
package/dist/pipeline/readiness-report.d.ts +2 -2
package/dist/pipeline/readiness-report.js +2 -2
package/dist/pipeline/release-classification.d.ts +1 -1
package/dist/pipeline/release-classification.js +1 -1
package/dist/pipeline/release-report.d.ts +1 -1
package/dist/pipeline/release-report.js +1 -1
package/dist/pipeline/repo-eval-comment.d.ts +1 -1
package/dist/pipeline/repo-eval-comment.js +1 -1
package/dist/pipeline/repo-threshold-evaluator.d.ts +1 -1
package/dist/pipeline/repo-threshold-evaluator.js +1 -1
package/dist/pipeline/resolve-mappings.d.ts +6 -6
package/dist/pipeline/resolve-mappings.js +44 -44
package/dist/pipeline/retrieval-metrics.d.ts +3 -3
package/dist/pipeline/retrieval-metrics.js +28 -20
package/dist/pipeline/steps/calculate-scores-step.d.ts +11 -0
package/dist/pipeline/steps/calculate-scores-step.js +89 -0
package/dist/pipeline/steps/compare-step.d.ts +18 -0
package/dist/pipeline/steps/compare-step.js +90 -0
package/dist/pipeline/steps/eval-step.d.ts +53 -0
package/dist/pipeline/steps/eval-step.js +347 -0
package/dist/pipeline/steps/fetch-docs-step.d.ts +11 -0
package/dist/pipeline/steps/fetch-docs-step.js +84 -0
package/dist/pipeline/steps/generate-configs-step.d.ts +11 -0
package/dist/pipeline/steps/generate-configs-step.js +98 -0
package/dist/pipeline/steps/grader-consistency-step.d.ts +21 -0
package/dist/pipeline/steps/grader-consistency-step.js +74 -0
package/dist/pipeline/steps/publish-report-step.d.ts +57 -0
package/dist/pipeline/steps/publish-report-step.js +243 -0
package/dist/pipeline/steps/report-step.d.ts +13 -0
package/dist/pipeline/steps/report-step.js +56 -0
package/dist/pipeline/steps/update-scores-step.d.ts +11 -0
package/dist/pipeline/steps/update-scores-step.js +42 -0
package/dist/pipeline/targeted-loo.d.ts +1 -1
package/dist/pipeline/targeted-loo.js +1 -1
package/dist/pipeline/thresholds.d.ts +1 -1
package/dist/pipeline/thresholds.js +1 -1
package/dist/pipeline/validate.js +13 -0
package/dist/report-store.d.ts +17 -0
package/dist/report-store.js +24 -0
package/dist/scripts/agent-behavior-report.d.ts +19 -0
package/dist/scripts/agent-behavior-report.js +315 -0
package/dist/scripts/baseline.d.ts +43 -0
package/dist/scripts/baseline.js +267 -0
package/dist/scripts/calculate-scores.d.ts +166 -0
package/dist/scripts/calculate-scores.js +1296 -0
package/dist/scripts/compare.d.ts +22 -0
package/dist/scripts/compare.js +334 -0
package/dist/scripts/coverage-audit.d.ts +44 -0
package/dist/scripts/coverage-audit.js +209 -0
package/dist/scripts/debug-eval.d.ts +19 -0
package/dist/scripts/debug-eval.js +73 -0
package/dist/scripts/discovery-report.d.ts +58 -0
package/dist/scripts/discovery-report.js +250 -0
package/dist/scripts/fetch-docs.d.ts +35 -0
package/dist/scripts/fetch-docs.js +472 -0
package/dist/scripts/generate-configs.d.ts +66 -0
package/dist/scripts/generate-configs.js +459 -0
package/dist/scripts/grader-api.d.ts +27 -0
package/dist/scripts/grader-api.js +206 -0
package/dist/scripts/grader-compare.d.ts +22 -0
package/dist/scripts/grader-compare.js +368 -0
package/dist/scripts/grader-consistency.d.ts +20 -0
package/dist/scripts/grader-consistency.js +313 -0
package/dist/scripts/grader-sensitivity.d.ts +22 -0
package/dist/scripts/grader-sensitivity.js +354 -0
package/dist/scripts/grader-validate.d.ts +19 -0
package/dist/scripts/grader-validate.js +267 -0
package/dist/scripts/measure-retrieval.d.ts +10 -0
package/dist/scripts/measure-retrieval.js +145 -0
package/dist/scripts/migrate-task-mode.d.ts +1 -1
package/dist/scripts/migrate-task-mode.js +1 -1
package/dist/scripts/migrate-tasks-to-content-lake.d.ts +1 -1
package/dist/scripts/migrate-tasks-to-content-lake.js +1 -1
package/dist/scripts/pipeline.d.ts +76 -0
package/dist/scripts/pipeline.js +1031 -0
package/dist/scripts/pr-comment.d.ts +10 -0
package/dist/scripts/pr-comment.js +510 -0
package/dist/scripts/readiness-report.d.ts +88 -0
package/dist/scripts/readiness-report.js +342 -0
package/dist/scripts/update-quality-scores.d.ts +15 -0
package/dist/scripts/update-quality-scores.js +184 -0
package/dist/scripts/validate-task-sources.d.ts +1 -1
package/dist/scripts/validate-task-sources.js +1 -1
package/dist/scripts/validate.d.ts +13 -0
package/dist/scripts/validate.js +79 -0
package/dist/scripts/webhook-server.d.ts +26 -0
package/dist/scripts/webhook-server.js +147 -0
package/dist/scripts/weekly-digest.d.ts +24 -0
package/dist/scripts/weekly-digest.js +144 -0
package/dist/sinks/format-slack.d.ts +64 -0
package/dist/sinks/format-slack.js +306 -0
package/dist/sinks/slack-sink.d.ts +27 -0
package/dist/sinks/slack-sink.js +78 -0
package/dist/sinks/types.d.ts +1 -1
package/dist/sinks/types.js +1 -1
package/dist/sinks/webhook-sink.d.ts +19 -0
package/dist/sinks/webhook-sink.js +50 -0
package/dist/tasks/knowledge-probe/define-type-api.task.ts +66 -0
package/dist/tasks/knowledge-probe/groq-projections.task.ts +62 -0
package/dist/tasks/literacy/content-lake.task.ts +181 -0
package/dist/tasks/literacy/frameworks.task.ts +129 -0
package/dist/tasks/literacy/functions.task.ts +70 -0
package/dist/tasks/literacy/groq.task.ts +259 -0
package/dist/tasks/literacy/image-handling.task.ts +95 -0
package/dist/tasks/literacy/nextjs-live.task.ts +76 -0
package/dist/tasks/literacy/portable-text.task.ts +169 -0
package/dist/tasks/literacy/studio-setup.task.ts +134 -0
package/dist/tasks/literacy/visual-editing.task.ts +147 -0
package/package.json +25 -25
package/tasks/.expanded.agentic.yaml +280 -0
package/tasks/.expanded.yaml +565 -0
package/tasks/knowledge-probe/define-type-api.task.ts +11 -0
package/tasks/knowledge-probe/groq-projections.task.ts +3 -0
package/tasks/literacy/content-lake.task.ts +181 -0
package/tasks/literacy/frameworks.task.ts +1 -0
package/tasks/literacy/functions.task.ts +1 -0
package/tasks/literacy/groq.task.ts +1 -0
package/tasks/literacy/image-handling.task.ts +95 -0
package/tasks/literacy/nextjs-live.task.ts +2 -1
package/tasks/literacy/portable-text.task.ts +169 -0
package/tasks/literacy/studio-setup.task.ts +5 -2
package/tasks/literacy/visual-editing.task.ts +1 -0
package/LICENSE +0 -21
package/tasks/frameworks.yaml +0 -98
package/tasks/functions.yaml +0 -51
package/tasks/groq.yaml +0 -216
package/tasks/nextjs-live.yaml +0 -62
package/tasks/studio-setup.yaml +0 -111
package/tasks/visual-editing.yaml +0 -120

package/dist/pipeline/grader-validation.js CHANGED Viewed

@@ -11,7 +11,7 @@
  *
  * This module has NO side effects — no file I/O, no API calls.
  *
- * @see docs/exec-plans/grader-reliability.md — Phase 2
+ * @see docs/archive/exec-plans/grader-reliability.md — Phase 2
  */
 // ---------------------------------------------------------------------------
 // Pure computation

package/dist/pipeline/map-request-to-config.js CHANGED Viewed

@@ -1,3 +1,4 @@
+import { resolve } from "node:path";
 import { normalizeMode } from "./normalize-mode.js";
 /**
  * Map a PipelineRequest to a ResolvedConfig.
@@ -19,13 +20,20 @@ import { normalizeMode } from "./normalize-mode.js";
 export function mapRequestToConfig(request, rootDir) {
     // Normalize mode so downstream pipeline code only sees canonical names.
     // The API may receive legacy names ("baseline", "full") from older clients.
-    const { mode, variant } = normalizeMode(request.mode ?? "full");
+    const { mode, variant: normalizedVariant } = normalizeMode(request.mode ?? "full");
+    // Explicit variant from request takes precedence over one derived from
+    // legacy mode normalization. This supports the canonical form:
+    //   { mode: "literacy", variant: "baseline" }
+    // while preserving backward compatibility with:
+    //   { mode: "baseline" } → normalizeMode → { mode: "literacy", variant: "baseline" }
+    const variant = request.variant ?? normalizedVariant;
     // API-triggered evaluations (identified by jobId) default to publish: true.
     // Without this, the job's reportId is always null and GET /v1/reports/:id
     // has nothing to return.
     const publishDefault = !!request.jobId;
     return {
         rootDir,
+        outputDir: resolve(rootDir, "results", "latest"),
         mode,
         variant,
         debug: mapDebug(request.debug),
@@ -66,6 +74,10 @@ export function mapRequestToConfig(request, rootDir) {
         callerGit: request.callerGit,
         callback: request.callback,
         jobId: request.jobId,
+        captureEnabled: false,
+        captureDir: undefined,
+        captureCompress: true,
+        captureExtras: true,
         remote: false,
         apiUrl: "https://ailf-api.sanity.build",
         presets: request.presets,
@@ -84,12 +96,13 @@ function mapDebug(debug) {
     };
 }
 function mapTaskSourceType(taskMode) {
-    if (taskMode === "content-lake" || taskMode === "yaml")
+    if (taskMode === "content-lake")
         return taskMode;
     // "inline" means the caller sent inline tasks that will be materialized
     // to a temp directory and loaded via --repo-tasks-path. Use "repo" to
     // ensure ONLY those tasks are used (no Content Lake merge).
     if (taskMode === "inline")
         return "repo";
+    // "yaml" was removed — treat it as default (Content Lake)
     return undefined;
 }

package/dist/pipeline/mirror-repo-tasks.d.ts CHANGED Viewed

@@ -10,7 +10,7 @@
  * means unchanged tasks are skipped. Changed tasks are upserted via
  * createOrReplace.
  *
- * @see docs/exec-plans/tasks-as-content/phase-5-content-lake-mirroring.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-5-content-lake-mirroring.md
  */
 import type { SanityClient } from "@sanity/client";
 import { type LiteracyTaskDefinition, type Logger } from "../_vendor/ailf-core/index.d.ts";

package/dist/pipeline/mirror-repo-tasks.js CHANGED Viewed

@@ -10,7 +10,7 @@
  * means unchanged tasks are skipped. Changed tasks are upserted via
  * createOrReplace.
  *
- * @see docs/exec-plans/tasks-as-content/phase-5-content-lake-mirroring.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-5-content-lake-mirroring.md
  */
 import { createHash } from "crypto";
 import { readFileSync } from "fs";

package/dist/pipeline/plan-format.d.ts CHANGED Viewed

@@ -7,7 +7,7 @@
  * emoji markers, alignment, and color-coding (via unicode markers).
  * The JSON formatter produces machine-readable output for CI/CD.
  *
- * @see docs/exec-plans/execution-preview.md
+ * @see docs/archive/exec-plans/execution-preview.md
  */
 import type { ExecutionPlan } from "./plan.js";
 /**

package/dist/pipeline/plan-format.js CHANGED Viewed

@@ -7,7 +7,7 @@
  * emoji markers, alignment, and color-coding (via unicode markers).
  * The JSON formatter produces machine-readable output for CI/CD.
  *
- * @see docs/exec-plans/execution-preview.md
+ * @see docs/archive/exec-plans/execution-preview.md
  */
 import { formatCost } from "../agent-observer/pricing.js";
 // ---------------------------------------------------------------------------

package/dist/pipeline/plan.d.ts CHANGED Viewed

@@ -7,7 +7,7 @@
  * anything. Calls existing pure functions (task expansion, model loading,
  * cache hashing, pricing) and composes them into an `ExecutionPlan`.
  *
- * @see docs/exec-plans/execution-preview.md
+ * @see docs/archive/exec-plans/execution-preview.md
  */
 import type { DebugOptions, EvalMode } from "./types.js";
 import { LiteracyVariant } from "./normalize-mode.js";

package/dist/pipeline/plan.js CHANGED Viewed

@@ -7,16 +7,17 @@
  * anything. Calls existing pure functions (task expansion, model loading,
  * cache hashing, pricing) and composes them into an `ExecutionPlan`.
  *
- * @see docs/exec-plans/execution-preview.md
+ * @see docs/archive/exec-plans/execution-preview.md
  */
 import { existsSync, readdirSync, statSync } from "fs";
 import { resolve } from "path";
+import { createLiteracyModeBase, modelMatchesLiteracyVariant, } from "./compiler/mode-bases/literacy.js";
 import { lookupPricing } from "../agent-observer/pricing.js";
 import { RepoTaskSource } from "../adapters/task-sources/repo-task-source.js";
 import { loadAllTsTaskFiles } from "../adapters/task-sources/task-file-loader.js";
 import { lookupCache } from "./cache.js";
 import { compileLiteracyTasks } from "./compiler/literacy-bridge.js";
-import { tryLoadConfigFile } from "./compiler/config-loader.js";
+import { resolveVendoredSubdir, tryLoadConfigFile, } from "./compiler/config-loader.js";
 import { LiteracyVariant } from "./normalize-mode.js";
 import { validateConfiguration } from "./validate.js";
 /**
@@ -44,33 +45,35 @@ function loadModelsFile(rootDir) {
     const result = tryLoadConfigFile("models", rootDir);
     return result?.data ?? null;
 }
+const _literacyBase = createLiteracyModeBase();
 /**
- * Map eval mode + variant to the model "modes" array values from models config.
+ * Check whether a model participates in a given eval mode + optional variant.
  *
- * Literacy mode uses the variant to determine which model sub-modes match.
- * Non-literacy modes accept all models by default (filtering is done
- * elsewhere for those modes).
+ * For literacy mode, checks both mode enrollment and variant participation
+ * via the shared `modelMatchesLiteracyVariant` helper. For non-literacy
+ * modes, checks mode enrollment only.
  */
-function modeMatchesModelModes(mode, modelModes, variant) {
-    if (!modelModes || modelModes.length === 0)
-        return true;
-    if (mode === "literacy") {
+function modeMatchesModel(mode, model, variant) {
+    // Check basic mode enrollment
+    if (model.modes &&
+        model.modes.length > 0 &&
+        !model.modes.includes(mode)) {
+        return false;
+    }
+    // For literacy mode with a variant, check variant participation
+    if (mode === "literacy" && variant) {
         switch (variant) {
             case LiteracyVariant.AGENTIC:
-                return (modelModes.includes("agentic-naive") ||
-                    modelModes.includes("agentic-optimized"));
-            case LiteracyVariant.OBSERVED:
-                return modelModes.includes(LiteracyVariant.OBSERVED);
+                return (modelMatchesLiteracyVariant(model, "agentic-naive") ||
+                    modelMatchesLiteracyVariant(model, "agentic-optimized"));
             case LiteracyVariant.FULL:
-                return (modelModes.includes(LiteracyVariant.STANDARD) ||
-                    modelModes.includes("agentic-naive") ||
-                    modelModes.includes("agentic-optimized"));
-            case LiteracyVariant.STANDARD:
+                return (modelMatchesLiteracyVariant(model, "baseline") ||
+                    modelMatchesLiteracyVariant(model, "agentic-naive") ||
+                    modelMatchesLiteracyVariant(model, "agentic-optimized"));
             default:
-                return modelModes.includes(LiteracyVariant.STANDARD);
+                return modelMatchesLiteracyVariant(model, variant);
         }
     }
-    // Non-literacy modes accept all models by default
     return true;
 }
 // ---------------------------------------------------------------------------
@@ -139,8 +142,8 @@ export async function buildPipelinePlan(opts, rootDir) {
         const modelsForCompile = loadModelsFile(rootDir);
         const graderProvider = modelsForCompile?.grader?.id ?? "openai:chat:gpt-4o";
         const modelEntries = (modelsForCompile?.models ?? []).map((m) => ({ id: m.id, label: m.label }));
-        // Load *.task.ts files from tasks/<mode>/
-        const modeTasksDir = resolve(rootDir, "tasks", opts.mode);
+        // Load *.task.ts files from tasks/<mode>/ (or dist/tasks/<mode>/ when vendored)
+        const modeTasksDir = resolveVendoredSubdir(rootDir, `tasks/${opts.mode}`);
         if (existsSync(modeTasksDir)) {
             const rawTasks = await loadAllTsTaskFiles(modeTasksDir);
             if (rawTasks.length > 0) {
@@ -148,9 +151,16 @@ export async function buildPipelinePlan(opts, rootDir) {
                 const handlerModulePath = `./compiler/mode-handlers/${opts.mode}/index.js`;
                 const mod = await import(handlerModulePath);
                 const handler = mod.handler;
+                const skippedByMode = new Map();
                 for (const rawFile of rawTasks) {
                     for (const taskDef of rawFile.tasks) {
                         const task = taskDef;
+                        // Filter to matching mode (skip tasks from other modes in same dir)
+                        if ("mode" in task && task.mode !== opts.mode) {
+                            const taskMode = task.mode ?? "unknown";
+                            skippedByMode.set(taskMode, (skippedByMode.get(taskMode) ?? 0) + 1);
+                            continue;
+                        }
                         // Apply area/task/tag filter
                         if (filter) {
                             if (filter.areas?.length &&
@@ -192,6 +202,13 @@ export async function buildPipelinePlan(opts, rootDir) {
                         }
                     }
                 }
+                if (skippedByMode.size > 0) {
+                    const summary = [...skippedByMode.entries()]
+                        .map(([m, n]) => `${n} ${m}`)
+                        .join(", ");
+                    const total = [...skippedByMode.values()].reduce((a, b) => a + b, 0);
+                    warnings.push(`Skipped ${total} task(s) with non-matching mode (${summary}). Current pipeline mode: ${opts.mode}. Run with --mode <mode> to include them.`);
+                }
             }
         }
     }
@@ -203,13 +220,29 @@ export async function buildPipelinePlan(opts, rootDir) {
     if (opts.repoTasksPath) {
         try {
             const repoSource = new RepoTaskSource(opts.repoTasksPath);
-            // Type-narrow to literacy tasks — compileLiteracyTasks accepts LiteracyTaskDefinition[]
-            const repoTasks = (await repoSource.loadTasks(filter)).filter((t) => t.mode === "literacy");
+            const allRepoTasks = await repoSource.loadTasks(filter);
+            // Filter to current mode tasks
+            const repoTasks = allRepoTasks.filter((t) => t.mode === opts.mode);
+            const skippedRepoTasks = allRepoTasks.length - repoTasks.length;
+            if (skippedRepoTasks > 0) {
+                const skippedModes = new Map();
+                for (const t of allRepoTasks) {
+                    if (t.mode !== opts.mode) {
+                        skippedModes.set(t.mode, (skippedModes.get(t.mode) ?? 0) + 1);
+                    }
+                }
+                const summary = [...skippedModes.entries()]
+                    .map(([m, n]) => `${n} ${m}`)
+                    .join(", ");
+                warnings.push(`Skipped ${skippedRepoTasks} repo task(s) with non-matching mode (${summary}). Current pipeline mode: ${opts.mode}. Run with --mode <mode> to include them.`);
+            }
             repoTaskCount = repoTasks.length;
-            if (repoTaskCount > 0) {
+            if (repoTaskCount > 0 && opts.mode === "literacy") {
+                // Literacy-specific compilation for repo tasks (detailed test expansion)
+                const literacyRepoTasks = repoTasks.filter((t) => t.mode === "literacy");
                 const modelsForCompile = loadModelsFile(rootDir);
                 const graderProvider = modelsForCompile?.grader?.id ?? "openai:chat:gpt-4o";
-                const compileResult = compileLiteracyTasks(repoTasks, {
+                const compileResult = compileLiteracyTasks(literacyRepoTasks, {
                     rootDir,
                     evalMode: opts.variant === LiteracyVariant.AGENTIC
                         ? LiteracyVariant.AGENTIC
@@ -231,6 +264,11 @@ export async function buildPipelinePlan(opts, rootDir) {
                     }
                 }
             }
+            else if (repoTaskCount > 0) {
+                // Non-literacy modes: approximate 1 test per task (compilation not
+                // supported for non-literacy repo tasks in the explain preview yet)
+                totalTests += repoTaskCount;
+            }
         }
         catch {
             warnings.push(`Failed to scan repo tasks at ${opts.repoTasksPath} — count may be underestimated`);
@@ -244,19 +282,19 @@ export async function buildPipelinePlan(opts, rootDir) {
     const models = [];
     let graderModelName = "";
     if (modelsFile) {
-        const activeModels = modelsFile.models.filter((m) => modeMatchesModelModes(opts.mode, m.modes, opts.variant));
+        const activeModels = modelsFile.models.filter((m) => modeMatchesModel(opts.mode, m, opts.variant));
         // For agentic mode, each model appears twice (naive + optimized)
         for (const m of activeModels) {
             const modelName = extractModelName(m.id);
             if (opts.variant === LiteracyVariant.AGENTIC) {
-                if (m.modes?.includes("agentic-naive")) {
+                if (modelMatchesLiteracyVariant(m, "agentic-naive")) {
                     models.push({
                         id: m.id,
                         label: `${m.label} (Naive)`,
                         modelName,
                     });
                 }
-                if (m.modes?.includes("agentic-optimized")) {
+                if (modelMatchesLiteracyVariant(m, "agentic-optimized")) {
                     models.push({
                         id: m.id,
                         label: `${m.label} (Optimized)`,

package/dist/pipeline/probe.d.ts CHANGED Viewed

@@ -14,7 +14,7 @@
  * not "are these docs good enough?" The output is always labeled as
  * directional and never displayed on the same scale as scored evaluations.
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 import type { ProbeResult } from "./types.js";
 /** Generic probe prompt template */

package/dist/pipeline/probe.js CHANGED Viewed

@@ -14,7 +14,7 @@
  * not "are these docs good enough?" The output is always labeled as
  * directional and never displayed on the same scale as scored evaluations.
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 // ---------------------------------------------------------------------------
 // Constants

package/dist/pipeline/readiness-report.d.ts CHANGED Viewed

@@ -13,8 +13,8 @@
  *   - generateReadinessReport()  — builds the structured report
  *   - formatReadinessMarkdown()  — renders the report as markdown
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-5-readiness-thresholds.md
- * @see docs/exec-plans/eliminate-lib-layer.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-5-readiness-thresholds.md
+ * @see docs/archive/exec-plans/eliminate-lib-layer.md
  */
 import type { ThresholdConfig } from "./schemas.js";
 import type { GapAnalysisReport, GapEstimate, ScoreSummary, ThresholdEvaluation, ThresholdViolation } from "./types.js";

package/dist/pipeline/readiness-report.js CHANGED Viewed

@@ -13,8 +13,8 @@
  *   - generateReadinessReport()  — builds the structured report
  *   - formatReadinessMarkdown()  — renders the report as markdown
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-5-readiness-thresholds.md
- * @see docs/exec-plans/eliminate-lib-layer.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-5-readiness-thresholds.md
+ * @see docs/archive/exec-plans/eliminate-lib-layer.md
  */
 import { evaluateThresholds } from "./thresholds.js";
 // ---------------------------------------------------------------------------

package/dist/pipeline/release-classification.d.ts CHANGED Viewed

@@ -15,7 +15,7 @@
  * - **not-applicable**: Updated, removed, or unchanged documents (these
  *   follow the standard before/after comparison flow from Phase 2).
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 import type { ClassifiedReleaseDocument, ProductFeature, ReleaseClassification } from "./types.js";
 import type { ReverseMapping } from "./reverse-mapping.js";

package/dist/pipeline/release-classification.js CHANGED Viewed

@@ -15,7 +15,7 @@
  * - **not-applicable**: Updated, removed, or unchanged documents (these
  *   follow the standard before/after comparison flow from Phase 2).
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 // ---------------------------------------------------------------------------
 // Public API

package/dist/pipeline/release-report.d.ts CHANGED Viewed

@@ -10,7 +10,7 @@
  * attribution (2c), and probe results (4b) into the document × area × task
  * impact matrix specified by Scenario 2.4.
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 import type { AttributionReport, ComparisonReport, ProbeResult, ReleaseClassification, ReleaseImpactReport } from "./types.js";
 /**

package/dist/pipeline/release-report.js CHANGED Viewed

@@ -10,7 +10,7 @@
  * attribution (2c), and probe results (4b) into the document × area × task
  * impact matrix specified by Scenario 2.4.
  *
- * @see docs/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
+ * @see docs/archive/exec-plans/scenario-matrix-implementation/phase-4-content-release-integration.md
  */
 // ---------------------------------------------------------------------------
 // Public API

package/dist/pipeline/repo-eval-comment.d.ts CHANGED Viewed

@@ -12,7 +12,7 @@
  * - Clear "what does this mean?" context
  * - skip-ailf bypass instructions
  *
- * @see docs/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
  * @see packages/eval/src/pipeline/repo-threshold-evaluator.ts
  */
 import type { ComparisonReport, ScoreSummary } from "./types.js";

package/dist/pipeline/repo-eval-comment.js CHANGED Viewed

@@ -12,7 +12,7 @@
  * - Clear "what does this mean?" context
  * - skip-ailf bypass instructions
  *
- * @see docs/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
  * @see packages/eval/src/pipeline/repo-threshold-evaluator.ts
  */
 // ---------------------------------------------------------------------------

package/dist/pipeline/repo-threshold-evaluator.d.ts CHANGED Viewed

@@ -10,7 +10,7 @@
  * thresholds are per-area, defined by the AILF team, and drive
  * readiness reports.
  *
- * @see docs/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
  * @see packages/eval/src/adapters/task-sources/repo-schemas.ts
  */
 import type { ScoreSummary } from "./types.js";

package/dist/pipeline/repo-threshold-evaluator.js CHANGED Viewed

@@ -10,7 +10,7 @@
  * thresholds are per-area, defined by the AILF team, and drive
  * readiness reports.
  *
- * @see docs/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
+ * @see docs/archive/exec-plans/tasks-as-content/phase-6-pr-quality-gates.md
  * @see packages/eval/src/adapters/task-sources/repo-schemas.ts
  */
 // ---------------------------------------------------------------------------

package/dist/pipeline/resolve-mappings.d.ts CHANGED Viewed

@@ -1,9 +1,9 @@
 /**
  * pipeline/resolve-mappings.ts
  *
- * Extracts canonical mappings from inline task YAML definitions.
- * Each task file contains canonical_docs and reference_solution fields
- * directly — there is no separate mappings.yaml file.
+ * Extracts canonical mappings from task definitions (*.task.ts files).
+ * Each task contains context.docs and referenceSolution fields
+ * directly — there is no separate mappings file.
  *
  * The output shape matches what downstream consumers expect so
  * fetch-docs, validate, and calculate-scores work without changes.
@@ -24,12 +24,12 @@ export interface ResolvedMappings {
     }>;
 }
 /**
- * Extract inline canonical mappings from task YAML files.
- * Only tasks with both an id and canonical_docs fields are included.
+ * Extract canonical mappings from *.task.ts files in tasks/literacy/.
+ * Only tasks with context.docs and referenceSolution are included.
  */
 export declare function extractInlineMappings(rootDir: string): ResolvedMappings;
 /**
- * Resolve canonical mappings from inline task YAML definitions.
+ * Resolve canonical mappings from task definitions.
  * This is the single source of truth — there is no external mappings file.
  */
 export declare function resolveMappings(rootDir: string): ResolvedMappings;

package/dist/pipeline/resolve-mappings.js CHANGED Viewed

@@ -1,72 +1,72 @@
 /**
  * pipeline/resolve-mappings.ts
  *
- * Extracts canonical mappings from inline task YAML definitions.
- * Each task file contains canonical_docs and reference_solution fields
- * directly — there is no separate mappings.yaml file.
+ * Extracts canonical mappings from task definitions (*.task.ts files).
+ * Each task contains context.docs and referenceSolution fields
+ * directly — there is no separate mappings file.
  *
  * The output shape matches what downstream consumers expect so
  * fetch-docs, validate, and calculate-scores work without changes.
  */
-import { existsSync, readFileSync, readdirSync } from "fs";
-import { resolve } from "path";
-import { load } from "js-yaml";
+import { existsSync } from "fs";
+import { discoverTsTaskFiles, loadTsTaskFileSync, } from "../adapters/task-sources/task-file-loader.js";
+import { resolveVendoredSubdir } from "./compiler/config-loader.js";
 // ---------------------------------------------------------------------------
 // Resolution
 // ---------------------------------------------------------------------------
 /**
- * Extract inline canonical mappings from task YAML files.
- * Only tasks with both an id and canonical_docs fields are included.
+ * Extract canonical mappings from *.task.ts files in tasks/literacy/.
+ * Only tasks with context.docs and referenceSolution are included.
  */
 export function extractInlineMappings(rootDir) {
-    const tasksDir = resolve(rootDir, "tasks");
+    const tasksDir = resolveVendoredSubdir(rootDir, "tasks/literacy");
     const result = { feature_areas: {} };
     if (!existsSync(tasksDir))
         return result;
-    const yamlFiles = readdirSync(tasksDir)
-        .filter((f) => (f.endsWith(".yaml") || f.endsWith(".yml")) && !f.startsWith("."))
-        .sort();
-    for (const file of yamlFiles) {
-        const featureArea = file.replace(/\.(yaml|yml)$/, "");
-        const filePath = resolve(tasksDir, file);
-        const raw = readFileSync(filePath, "utf-8");
-        const parsed = load(raw);
-        if (!Array.isArray(parsed))
-            continue;
-        const tasks = [];
-        for (const entry of parsed) {
-            if (!isInlineTaskWithMappings(entry))
+    const files = discoverTsTaskFiles(tasksDir);
+    for (const file of files) {
+        const loaded = loadTsTaskFileSync(file);
+        for (const task of loaded.tasks) {
+            const t = task;
+            const area = typeof t.area === "string" ? t.area : undefined;
+            const id = typeof t.id === "string" ? t.id : undefined;
+            const title = typeof t.title === "string" ? t.title : "";
+            const referenceSolution = typeof t.referenceSolution === "string" ? t.referenceSolution : "";
+            if (!area || !id)
                 continue;
-            tasks.push({
-                canonical_docs: entry.canonical_docs,
-                description: entry.description,
-                id: entry.id,
-                reference_solution: entry.reference_solution,
+            // Extract docs from context.docs (GeneralizedDocRef[])
+            const context = t.context;
+            const docs = [];
+            if (context?.docs && Array.isArray(context.docs)) {
+                for (const doc of context.docs) {
+                    const d = doc;
+                    if (typeof d.slug === "string") {
+                        docs.push({
+                            slug: d.slug,
+                            reason: typeof d.reason === "string" ? d.reason : "",
+                        });
+                    }
+                }
+            }
+            if (docs.length === 0 || !referenceSolution)
+                continue;
+            if (!result.feature_areas[area]) {
+                result.feature_areas[area] = { tasks: [] };
+            }
+            result.feature_areas[area].tasks.push({
+                canonical_docs: docs,
+                description: title,
+                id,
+                reference_solution: referenceSolution,
             });
         }
-        if (tasks.length > 0) {
-            result.feature_areas[featureArea] = { tasks };
-        }
     }
     return result;
 }
 /**
- * Resolve canonical mappings from inline task YAML definitions.
+ * Resolve canonical mappings from task definitions.
  * This is the single source of truth — there is no external mappings file.
  */
 export function resolveMappings(rootDir) {
     return extractInlineMappings(rootDir);
 }
-// ---------------------------------------------------------------------------
-// Helpers
-// ---------------------------------------------------------------------------
-function isInlineTaskWithMappings(entry) {
-    if (typeof entry !== "object" || entry === null)
-        return false;
-    const e = entry;
-    return (typeof e.id === "string" &&
-        typeof e.description === "string" &&
-        Array.isArray(e.canonical_docs) &&
-        e.canonical_docs.length > 0 &&
-        typeof e.reference_solution === "string");
-}

package/dist/pipeline/retrieval-metrics.d.ts CHANGED Viewed

@@ -2,9 +2,9 @@
  * pipeline/retrieval-metrics.ts
  *
  * Computes retrieval precision and recall by comparing agent-retrieved
- * doc slugs against canonical_docs defined in task YAML files.
+ * doc slugs against canonical_docs defined in task definitions.
  *
- * This is a pure computation module — no file I/O beyond reading task YAMLs.
+ * This is a pure computation module — no file I/O beyond reading task files.
  */
 import type { RetrievalMetrics, TaskRetrievalMetrics } from "./types.js";
 export interface AgenticBehaviorData {
@@ -30,7 +30,7 @@ export declare function computeRetrievalMetrics(rootDir: string, behaviors: Agen
  */
 export declare function computeTaskMetrics(taskId: string, area: string, retrieved: string[], canonical: Set<string>): TaskRetrievalMetrics;
 /**
- * Load canonical_docs from all task YAML files.
+ * Load canonical docs from *.task.ts files in tasks/literacy/.
  * Returns a map of taskId → { slugs: Set<string>, area: string }.
  */
 export declare function loadCanonicalDocs(rootDir: string): Map<string, {