npm - @kontourai/flow-agents - Versions diffs - 0.1.1 - Mend

@kontourai/flow-agents 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (418) hide show

package/.githooks/pre-push +11 -0
package/.github/workflows/ci.yml +210 -0
package/.github/workflows/docs-pages.yml +52 -0
package/.github/workflows/publish-npm.yml +104 -0
package/AGENTS.md +26 -0
package/CHANGELOG.md +66 -0
package/CODE_OF_CONDUCT.md +25 -0
package/CONTEXT.md +300 -0
package/CONTRIBUTING.md +44 -0
package/LICENSE +201 -0
package/README.md +129 -0
package/SECURITY.md +33 -0
package/agent-cards/dev.json +19 -0
package/agents/dev.json +127 -0
package/agents/tool-code-reviewer.json +61 -0
package/agents/tool-dependencies-updater.json +118 -0
package/agents/tool-explore-config.json +92 -0
package/agents/tool-explore-deps.json +92 -0
package/agents/tool-explore-entry.json +92 -0
package/agents/tool-explore-patterns.json +92 -0
package/agents/tool-explore-structure.json +92 -0
package/agents/tool-explore-tests.json +92 -0
package/agents/tool-planner.json +57 -0
package/agents/tool-playwright.json +145 -0
package/agents/tool-security-reviewer.json +56 -0
package/agents/tool-verifier.json +61 -0
package/agents/tool-worker.json +58 -0
package/build/src/cli/console-learning-projection.js +123 -0
package/build/src/cli/docs-preview.js +39 -0
package/build/src/cli/effective-backlog-settings.js +102 -0
package/build/src/cli/export-bookmarks.js +38 -0
package/build/src/cli/fixture-retirement-audit.js +140 -0
package/build/src/cli/flow-kit.js +138 -0
package/build/src/cli/import-bookmarks.js +50 -0
package/build/src/cli/init.js +239 -0
package/build/src/cli/instinct-cli.js +93 -0
package/build/src/cli/promote-workflow-artifact.js +63 -0
package/build/src/cli/publish-change-helper.js +154 -0
package/build/src/cli/pull-work-provider.js +469 -0
package/build/src/cli/runtime-adapter.js +23 -0
package/build/src/cli/telemetry-doctor.js +221 -0
package/build/src/cli/usage-feedback.js +443 -0
package/build/src/cli/validate-hook-influence.js +152 -0
package/build/src/cli/validate-source-tree.js +31 -0
package/build/src/cli/validate-workflow-artifacts.js +486 -0
package/build/src/cli/veritas-governance.js +262 -0
package/build/src/cli/workflow-artifact-cleanup-audit.js +272 -0
package/build/src/cli/workflow-sidecar.js +816 -0
package/build/src/cli.js +89 -0
package/build/src/flow-kit/validate.js +75 -0
package/build/src/lib/args.js +45 -0
package/build/src/lib/fs.js +62 -0
package/build/src/lib/workflow-learning-projection.js +334 -0
package/build/src/runtime-adapters.js +146 -0
package/build/src/tools/build-universal-bundles.js +397 -0
package/build/src/tools/common.js +56 -0
package/build/src/tools/filter-installed-packs.js +132 -0
package/build/src/tools/generate-context-map.js +198 -0
package/build/src/tools/validate-package.js +64 -0
package/build/src/tools/validate-source-tree.js +622 -0
package/console.telemetry.json +176 -0
package/context/base-rules.md +17 -0
package/context/code-review-standards.md +62 -0
package/context/coding-standards.md +42 -0
package/context/common/orchestrators.md +12 -0
package/context/common/subagents.md +28 -0
package/context/contracts/artifact-contract.md +182 -0
package/context/contracts/builder-kit-workflow-state-contract.md +319 -0
package/context/contracts/delivery-contract.md +69 -0
package/context/contracts/execution-contract.md +53 -0
package/context/contracts/governance-adapter-contract.md +67 -0
package/context/contracts/planning-contract.md +85 -0
package/context/contracts/review-contract.md +104 -0
package/context/contracts/sandbox-policy.md +52 -0
package/context/contracts/verification-contract.md +134 -0
package/context/contracts/work-item-contract.md +215 -0
package/context/deferred/demo-mode.md +33 -0
package/context/deferred/languages/go.md +31 -0
package/context/deferred/languages/python.md +31 -0
package/context/deferred/languages/typescript.md +34 -0
package/context/deferred/parallelization.md +35 -0
package/context/deferred/worktree-isolation.md +24 -0
package/context/development-workflow.md +50 -0
package/context/scripts/context-budget/budget-scan.sh +166 -0
package/context/scripts/detect-tools.sh +3 -0
package/context/scripts/discover-agents.sh +28 -0
package/context/scripts/git-status.sh +49 -0
package/context/scripts/hooks/config-protection.js +79 -0
package/context/scripts/hooks/desktop-notify.sh +39 -0
package/context/scripts/hooks/governance-audit.sh +135 -0
package/context/scripts/hooks/lib/audit-transport.sh +40 -0
package/context/scripts/hooks/lib/hook-flags.js +49 -0
package/context/scripts/hooks/lib/patterns.sh +57 -0
package/context/scripts/hooks/lib/resolve-formatter.js +80 -0
package/context/scripts/hooks/post-edit-accumulator.js +66 -0
package/context/scripts/hooks/pre-commit-quality.js +194 -0
package/context/scripts/hooks/quality-gate.js +93 -0
package/context/scripts/hooks/report-only-guard.js +21 -0
package/context/scripts/hooks/run-hook.js +136 -0
package/context/scripts/hooks/stop-format-typecheck.js +141 -0
package/context/scripts/hooks/stop-goal-fit.js +337 -0
package/context/scripts/hooks/workflow-steering.js +250 -0
package/context/scripts/telemetry/console-presets.sh +14 -0
package/context/scripts/telemetry/install-console-config.sh +214 -0
package/context/scripts/telemetry/lib/config.sh +85 -0
package/context/scripts/telemetry/lib/enrich.sh +115 -0
package/context/scripts/telemetry/lib/redact.sh +22 -0
package/context/scripts/telemetry/lib/session.sh +63 -0
package/context/scripts/telemetry/lib/transport.sh +183 -0
package/context/scripts/telemetry/lib/usage.sh +29 -0
package/context/scripts/telemetry/sync-agents.sh +173 -0
package/context/scripts/telemetry/telemetry.conf +23 -0
package/context/scripts/telemetry/telemetry.sh +387 -0
package/context/scripts/validate-package.sh +89 -0
package/context/settings/backlog-provider-settings.json +54 -0
package/context/templates/core/identity.md +26 -0
package/context/templates/core/user.md +15 -0
package/docs/_config.yml +15 -0
package/docs/_layouts/default.html +87 -0
package/docs/adr/0001-flow-agents-consumes-flow.md +77 -0
package/docs/adr/0002-flow-kits-as-extension-unit.md +13 -0
package/docs/adr/0003-flow-agents-coordinates-kits-and-adapters.md +13 -0
package/docs/adr/0004-gates-expect-surface-claims.md +15 -0
package/docs/adr/0005-kubernetes-inspired-resource-contracts.md +48 -0
package/docs/adr/0006-typescript-first-source-policy.md +98 -0
package/docs/agent-system-guidebook.md +391 -0
package/docs/agent-usage-feedback-loop.md +351 -0
package/docs/assets/favicon.svg +13 -0
package/docs/assets/og-image.png +0 -0
package/docs/assets/site.css +774 -0
package/docs/assets/site.js +139 -0
package/docs/configurable-workflow-routing.md +174 -0
package/docs/context-map.md +145 -0
package/docs/developer-architecture.md +145 -0
package/docs/developer-hook-setup.md +61 -0
package/docs/fixture-ownership.md +44 -0
package/docs/flow-kit-repository-contract.md +180 -0
package/docs/index.md +129 -0
package/docs/kontour-resource-contract.md +358 -0
package/docs/migrations.md +64 -0
package/docs/north-star.md +322 -0
package/docs/operating-layers.md +110 -0
package/docs/repository-structure.md +132 -0
package/docs/sandbox-policy.md +56 -0
package/docs/skills-map.md +203 -0
package/docs/standards-register.md +96 -0
package/docs/veritas-integration.md +165 -0
package/docs/work-item-adapters.md +72 -0
package/docs/workflow-artifact-lifecycle.md +141 -0
package/docs/workflow-eval-strategy.md +295 -0
package/docs/workflow-shared-contracts.md +51 -0
package/docs/workflow-usage-guide.md +443 -0
package/evals/ARCHITECTURE.md +143 -0
package/evals/CONVENTIONS.md +58 -0
package/evals/README.md +128 -0
package/evals/acceptance/run.sh +29 -0
package/evals/acceptance/test_claude_harness.sh +242 -0
package/evals/acceptance/test_codex_harness.sh +108 -0
package/evals/acceptance/test_kiro_harness.sh +128 -0
package/evals/cases/dev/404.html +97 -0
package/evals/cases/dev/code-review.yaml +44 -0
package/evals/cases/dev/dashboard.html +300 -0
package/evals/cases/dev/deliver.yaml +66 -0
package/evals/cases/dev/dependency-update.yaml +16 -0
package/evals/cases/dev/explore.yaml +20 -0
package/evals/cases/dev/index.html +370 -0
package/evals/cases/dev/package-lock.json +28 -0
package/evals/cases/dev/package.json +16 -0
package/evals/cases/dev/plan-work.yaml +20 -0
package/evals/cases/dev/promptfooconfig.yaml +666 -0
package/evals/cases/dev/search-first.yaml +20 -0
package/evals/cases/dev/tdd-workflow.yaml +48 -0
package/evals/cases/dev/verify-work.yaml +44 -0
package/evals/cases/dev/workflow.yaml +34 -0
package/evals/ci/run-baseline.sh +283 -0
package/evals/fixtures/backlog-provider-settings/global-default.json +44 -0
package/evals/fixtures/backlog-provider-settings/project-override.json +53 -0
package/evals/fixtures/builder-kit-workflow-state/baseline-freshness-resolution-hint.json +139 -0
package/evals/fixtures/builder-kit-workflow-state/direct-primitive-stop.json +59 -0
package/evals/fixtures/builder-kit-workflow-state/empty-board-route-shape.json +55 -0
package/evals/fixtures/builder-kit-workflow-state/happy-path.json +71 -0
package/evals/fixtures/builder-kit-workflow-state/mid-work-resume.json +80 -0
package/evals/fixtures/builder-kit-workflow-state/missing-prestep-recovery.json +65 -0
package/evals/fixtures/builder-kit-workflow-state/product-build-chaining.json +60 -0
package/evals/fixtures/builder-kit-workflow-state/stale-continuation-requires-new-probe.json +57 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-correction/learning.json +50 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-open-route/learning.json +41 -0
package/evals/fixtures/flow-kit-repository/invalid-absolute-path/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/kit.json +11 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/kit.json +9 -0
package/evals/fixtures/flow-kit-repository/invalid-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-id/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-malformed-json/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-flow/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-name/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-name/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-traversal/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/adapters/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/assets/example.txt +1 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/flows/runtime.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-evals/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-skills/mixed/SKILL.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit.json +44 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/flows/review.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/kit.json +20 -0
package/evals/fixtures/hook-influence/cases.json +336 -0
package/evals/fixtures/pull-work-provider/github-issues.json +170 -0
package/evals/fixtures/pull-work-wip-shepherding/global-wip-informs.json +43 -0
package/evals/fixtures/pull-work-wip-shepherding/personal-wip-blocks.json +42 -0
package/evals/fixtures/surface-trust/accepted-claim-trust-report.json +31 -0
package/evals/fixtures/surface-trust/artifact-absent.json +19 -0
package/evals/fixtures/surface-trust/integrity-mismatch-trust-report.json +32 -0
package/evals/fixtures/surface-trust/missing-authority-trust-report.json +27 -0
package/evals/fixtures/surface-trust/provider-absent.json +19 -0
package/evals/fixtures/surface-trust/rejected-claim-trust-report.json +30 -0
package/evals/fixtures/surface-trust/stale-claim-trust-snapshot.json +31 -0
package/evals/fixtures/usage-feedback/sample-full.jsonl +11 -0
package/evals/fixtures/usage-feedback/sample-outcomes.jsonl +1 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-pass.sh +18 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-secret-fail.sh +10 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-unconfigured.sh +4 -0
package/evals/integration/test_bundle_install.sh +541 -0
package/evals/integration/test_console_learning_projection.sh +192 -0
package/evals/integration/test_context_map.sh +65 -0
package/evals/integration/test_effective_backlog_settings.sh +58 -0
package/evals/integration/test_fixture_retirement_audit.sh +58 -0
package/evals/integration/test_flow_agents_statusline.sh +93 -0
package/evals/integration/test_flow_kit_repository.sh +90 -0
package/evals/integration/test_goal_fit_hook.sh +482 -0
package/evals/integration/test_hook_category_behaviors.sh +190 -0
package/evals/integration/test_hook_influence_cases.sh +69 -0
package/evals/integration/test_local_flow_kit_install.sh +145 -0
package/evals/integration/test_publish_change_helper.sh +176 -0
package/evals/integration/test_pull_work_provider.sh +140 -0
package/evals/integration/test_runtime_adapter_activation.sh +106 -0
package/evals/integration/test_telemetry.sh +485 -0
package/evals/integration/test_telemetry_doctor.sh +193 -0
package/evals/integration/test_usage_feedback_dashboard.sh +169 -0
package/evals/integration/test_usage_feedback_global.sh +117 -0
package/evals/integration/test_usage_feedback_import.sh +227 -0
package/evals/integration/test_usage_feedback_outcomes.sh +165 -0
package/evals/integration/test_usage_feedback_report.sh +263 -0
package/evals/integration/test_veritas_governance_adapter.sh +235 -0
package/evals/integration/test_workflow_artifact_cleanup_audit.sh +287 -0
package/evals/integration/test_workflow_artifacts.sh +1247 -0
package/evals/integration/test_workflow_sidecar_writer.sh +2112 -0
package/evals/integration/test_workflow_steering_hook.sh +337 -0
package/evals/lib/assertions/delegated-to.js +40 -0
package/evals/lib/assertions/max-tool-calls.js +15 -0
package/evals/lib/assertions/no-write-tools.js +27 -0
package/evals/lib/assertions/pass-at-k.js +39 -0
package/evals/lib/assertions/telemetry-utils.js +105 -0
package/evals/lib/assertions/tool-called.js +39 -0
package/evals/lib/assertions/verify-after-fix.js +61 -0
package/evals/lib/claude-judge.sh +40 -0
package/evals/lib/claude-provider.sh +74 -0
package/evals/lib/codex-judge.sh +39 -0
package/evals/lib/codex-provider.sh +81 -0
package/evals/lib/eval-dev.sh +5 -0
package/evals/lib/eval-judge.sh +22 -0
package/evals/lib/eval-provider.sh +26 -0
package/evals/lib/eval-report.sh +73 -0
package/evals/lib/kiro-dev.sh +4 -0
package/evals/lib/kiro-judge.sh +17 -0
package/evals/lib/kiro-provider.sh +62 -0
package/evals/lib/node.sh +111 -0
package/evals/promptfooconfig.yaml +70 -0
package/evals/run.sh +309 -0
package/evals/static/test_evidence_refs.sh +141 -0
package/evals/static/test_package.sh +407 -0
package/evals/static/test_repo_hooks.sh +68 -0
package/evals/static/test_universal_bundles.sh +274 -0
package/evals/static/test_workflow_skills.sh +1207 -0
package/install.sh +64 -0
package/integrations/veritas/flow-agents.adapter.json +138 -0
package/integrations/veritas/flow-agents.authority-settings.json +26 -0
package/integrations/veritas/flow-agents.repo-standards.json +82 -0
package/kits/builder/flows/build.flow.json +218 -0
package/kits/builder/flows/shape.flow.json +127 -0
package/kits/builder/kit.json +19 -0
package/kits/catalog.json +11 -0
package/package.json +130 -0
package/packaging/README.md +60 -0
package/packaging/manifest.json +173 -0
package/packaging/packs.json +69 -0
package/powers/dependency-checker/POWER.md +20 -0
package/powers/dependency-checker/mcp.json +20 -0
package/powers/playwright/POWER.md +25 -0
package/powers/playwright/mcp.json +12 -0
package/prompts/code-audit.md +123 -0
package/prompts/kcommit.md +88 -0
package/schemas/backlog-provider-settings.schema.json +138 -0
package/schemas/workflow-acceptance.schema.json +216 -0
package/schemas/workflow-critique.schema.json +113 -0
package/schemas/workflow-evidence.schema.json +357 -0
package/schemas/workflow-handoff.schema.json +52 -0
package/schemas/workflow-learning.schema.json +223 -0
package/schemas/workflow-release.schema.json +172 -0
package/schemas/workflow-state.schema.json +80 -0
package/scripts/README.md +111 -0
package/scripts/build-universal-bundles.js +3 -0
package/scripts/check-content-boundary.cjs +99 -0
package/scripts/context-budget/budget-scan.sh +166 -0
package/scripts/detect-tools.sh +3 -0
package/scripts/discover-agents.sh +28 -0
package/scripts/effective-backlog-settings.js +2 -0
package/scripts/filter-installed-packs.js +2 -0
package/scripts/flow-kit.js +2 -0
package/scripts/generate-context-map.js +2 -0
package/scripts/git-status.sh +49 -0
package/scripts/hooks/claude-hook-adapter.js +174 -0
package/scripts/hooks/claude-telemetry-hook.js +115 -0
package/scripts/hooks/codex-hook-adapter.js +176 -0
package/scripts/hooks/codex-telemetry-hook.js +95 -0
package/scripts/hooks/config-protection.js +79 -0
package/scripts/hooks/desktop-notify.sh +39 -0
package/scripts/hooks/governance-audit.sh +135 -0
package/scripts/hooks/lib/audit-transport.sh +40 -0
package/scripts/hooks/lib/hook-flags.js +49 -0
package/scripts/hooks/lib/patterns.sh +57 -0
package/scripts/hooks/lib/resolve-formatter.js +80 -0
package/scripts/hooks/post-edit-accumulator.js +66 -0
package/scripts/hooks/pre-commit-quality.js +194 -0
package/scripts/hooks/quality-gate.js +93 -0
package/scripts/hooks/report-only-guard.js +21 -0
package/scripts/hooks/run-hook.js +136 -0
package/scripts/hooks/stop-format-typecheck.js +141 -0
package/scripts/hooks/stop-goal-fit.js +337 -0
package/scripts/hooks/workflow-steering.js +250 -0
package/scripts/install-codex-home.sh +106 -0
package/scripts/package.json +3 -0
package/scripts/promote-workflow-artifact.js +2 -0
package/scripts/publish-change-helper.js +2 -0
package/scripts/pull-work-provider.js +2 -0
package/scripts/setup-repo-hooks.sh +8 -0
package/scripts/statusline/flow-agents-statusline.js +157 -0
package/scripts/telemetry/console-presets.sh +14 -0
package/scripts/telemetry/install-console-config.sh +214 -0
package/scripts/telemetry/lib/config.sh +85 -0
package/scripts/telemetry/lib/enrich.sh +115 -0
package/scripts/telemetry/lib/redact.sh +22 -0
package/scripts/telemetry/lib/session.sh +63 -0
package/scripts/telemetry/lib/transport.sh +183 -0
package/scripts/telemetry/lib/usage.sh +29 -0
package/scripts/telemetry/sync-agents.sh +173 -0
package/scripts/telemetry/telemetry.conf +23 -0
package/scripts/telemetry/telemetry.sh +387 -0
package/scripts/usage-feedback.js +2 -0
package/scripts/validate-hook-influence-cases.js +2 -0
package/scripts/validate-package.sh +89 -0
package/scripts/validate-source-tree.js +9 -0
package/skills/agentic-engineering/SKILL.md +62 -0
package/skills/browser-test/SKILL.md +51 -0
package/skills/builder-shape/SKILL.md +76 -0
package/skills/context-budget/SKILL.md +40 -0
package/skills/deliver/SKILL.md +241 -0
package/skills/dependency-update/SKILL.md +68 -0
package/skills/design-probe/SKILL.md +107 -0
package/skills/eval-rebuild/SKILL.md +39 -0
package/skills/evidence-gate/SKILL.md +186 -0
package/skills/execute-plan/SKILL.md +110 -0
package/skills/explore/SKILL.md +137 -0
package/skills/feedback-loop/SKILL.md +87 -0
package/skills/fix-bug/SKILL.md +133 -0
package/skills/frontend-design/SKILL.md +80 -0
package/skills/github-cli/SKILL.md +63 -0
package/skills/idea-to-backlog/SKILL.md +267 -0
package/skills/knowledge-capture/SKILL.md +55 -0
package/skills/learning-review/SKILL.md +115 -0
package/skills/pickup-probe/SKILL.md +114 -0
package/skills/plan-work/SKILL.md +176 -0
package/skills/pull-work/SKILL.md +309 -0
package/skills/release-readiness/SKILL.md +121 -0
package/skills/review-work/SKILL.md +161 -0
package/skills/search-first/SKILL.md +66 -0
package/skills/tdd-workflow/SKILL.md +140 -0
package/skills/verify-work/SKILL.md +109 -0
package/src/cli/console-learning-projection.ts +140 -0
package/src/cli/effective-backlog-settings.ts +99 -0
package/src/cli/fixture-retirement-audit.ts +154 -0
package/src/cli/flow-kit.ts +139 -0
package/src/cli/init.ts +248 -0
package/src/cli/promote-workflow-artifact.ts +64 -0
package/src/cli/publish-change-helper.ts +143 -0
package/src/cli/pull-work-provider.ts +481 -0
package/src/cli/runtime-adapter.ts +24 -0
package/src/cli/telemetry-doctor.ts +243 -0
package/src/cli/usage-feedback.ts +418 -0
package/src/cli/validate-hook-influence.ts +119 -0
package/src/cli/validate-source-tree.ts +30 -0
package/src/cli/validate-workflow-artifacts.ts +411 -0
package/src/cli/veritas-governance.ts +322 -0
package/src/cli/workflow-artifact-cleanup-audit.ts +281 -0
package/src/cli/workflow-sidecar.ts +676 -0
package/src/cli.ts +95 -0
package/src/flow-kit/validate.ts +74 -0
package/src/lib/args.ts +43 -0
package/src/lib/fs.ts +62 -0
package/src/lib/workflow-learning-projection.ts +491 -0
package/src/runtime-adapters.ts +154 -0
package/src/tools/build-universal-bundles.ts +366 -0
package/src/tools/common.ts +61 -0
package/src/tools/filter-installed-packs.ts +129 -0
package/src/tools/generate-context-map.ts +199 -0
package/src/tools/validate-package.ts +57 -0
package/src/tools/validate-source-tree.ts +488 -0
package/tsconfig.json +19 -0
package/veritas.claims.json +6 -0

package/evals/integration/test_usage_feedback_import.sh ADDED Viewed

@@ -0,0 +1,227 @@
+#!/usr/bin/env bash
+# test_usage_feedback_import.sh - Layer 2: Usage feedback Codex import validation
+set -uo pipefail
+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+source "$ROOT_DIR/evals/lib/node.sh"
+USAGE_FEEDBACK="$ROOT_DIR/scripts/usage-feedback.js"
+FIXTURE_FULL="$ROOT_DIR/evals/fixtures/usage-feedback/sample-full.jsonl"
+TMPDIR_EVAL=$(mktemp -d /tmp/eval-usage-feedback-import.XXXXXX)
+pass=0; fail=0
+cleanup() { rm -rf "$TMPDIR_EVAL"; }
+trap cleanup EXIT
+_pass() { echo "  ✓ $1"; pass=$((pass + 1)); }
+_fail() { echo "  ✗ $1"; fail=$((fail + 1)); }
+_sessions_file() {
+  local dir="$1"
+  if [[ -f "$dir/sessions.jsonl" ]]; then
+    echo "$dir/sessions.jsonl"
+  elif [[ -f "$dir/normalized-sessions.jsonl" ]]; then
+    echo "$dir/normalized-sessions.jsonl"
+  else
+    find "$dir" -maxdepth 2 -type f \( -name 'sessions.jsonl' -o -name 'normalized-sessions.jsonl' \) 2>/dev/null | head -1
+  fi
+}
+echo "=== Layer 2: Usage Feedback Runtime Import Validation ==="
+echo ""
+echo "--- Script Existence ---"
+if [[ -f "$USAGE_FEEDBACK" ]]; then
+  _pass "usage-feedback.js exists"
+else
+  _fail "usage-feedback.js not found at $USAGE_FEEDBACK"
+  echo ""
+  echo "Result: $pass passed, $fail failed"
+  exit 1
+fi
+echo ""
+echo "--- Fixtures ---"
+if [[ -f "$FIXTURE_FULL" ]]; then
+  _pass "sample Codex full.jsonl fixture exists"
+else
+  _fail "sample Codex full.jsonl fixture missing"
+fi
+src_claude="$TMPDIR_EVAL/src-claude"
+dst_claude="$TMPDIR_EVAL/dst-claude"
+mkdir -p "$src_claude" "$dst_claude"
+cat > "$src_claude/full.jsonl" <<'JSONL'
+{"schema_version":"0.3.0","timestamp":"2026-05-04T12:00:00Z","session_id":"claude-session-1","event_id":"evt-1","event_type":"turn.user","agent":{"name":"dev","runtime":"claude-code"},"turn":{"prompt_text":"hello","prompt_length":5}}
+{"schema_version":"0.3.0","timestamp":"2026-05-04T12:00:05Z","session_id":"claude-session-1","event_id":"evt-2","event_type":"tool.invoke","agent":{"name":"dev","runtime":"claude-code"},"tool":{"name":"Agent","normalized_name":"delegate to a specialist agent","input":{"subagent_type":"tool-planner"}}}
+{"schema_version":"0.3.0","timestamp":"2026-05-04T12:00:05Z","session_id":"claude-session-1","event_id":"evt-2-delegate","event_type":"agent.delegate","agent":{"name":"dev","runtime":"claude-code"},"delegation":{"targets":["tool-planner"]}}
+{"schema_version":"0.3.0","timestamp":"2026-05-04T12:01:00Z","session_id":"claude-session-1","event_id":"evt-3","event_type":"session.usage","agent":{"name":"dev","runtime":"claude-code"},"usage":{"model":"opus","duration_s":60,"tool_invocations":1,"delegations":1,"input_tokens":null,"output_tokens":null,"estimated_cost_usd":null}}
+JSONL
+src="$TMPDIR_EVAL/src"
+dst_a="$TMPDIR_EVAL/dst-a"
+dst_b="$TMPDIR_EVAL/dst-b"
+mkdir -p "$src" "$dst_a" "$dst_b"
+cp "$FIXTURE_FULL" "$src/full.jsonl"
+echo ""
+echo "--- Import Command ---"
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-telemetry-dir "$src" \
+  --telemetry-dir "$dst_a" \
+  --source-id "repo-a" \
+  --repo "repo-a" \
+  --repo-root "/tmp/repo-a" \
+  --profile-id "codex-default" \
+  --prompt-id "deliver-v1" \
+  --skill-id "deliver" >/dev/null 2>"$TMPDIR_EVAL/import-a.err"; then
+  _pass "import-codex imports from input telemetry dir"
+else
+  _fail "import-codex failed for input dir: $(cat "$TMPDIR_EVAL/import-a.err" 2>/dev/null)"
+fi
+sessions_a="$(_sessions_file "$dst_a")"
+if [[ -n "$sessions_a" && -f "$sessions_a" ]]; then
+  _pass "import-codex writes normalized session data"
+else
+  _fail "import-codex did not write sessions.jsonl or normalized-sessions.jsonl"
+fi
+session_count=$(jq -s 'length' "$sessions_a" 2>/dev/null)
+source_id=$(jq -r 'select(.session_id == "codex-session-1") | .source_id' "$sessions_a" 2>/dev/null | head -1)
+repo=$(jq -r 'select(.session_id == "codex-session-1") | .repo' "$sessions_a" 2>/dev/null | head -1)
+profile=$(jq -r 'select(.session_id == "codex-session-1") | .profile_id' "$sessions_a" 2>/dev/null | head -1)
+prompt=$(jq -r 'select(.session_id == "codex-session-1") | .prompt_id' "$sessions_a" 2>/dev/null | head -1)
+skill=$(jq -r 'select(.session_id == "codex-session-1") | .skill_ids[0]' "$sessions_a" 2>/dev/null | head -1)
+if [[ "$session_count" -ge 2 && "$source_id" == "repo-a" && "$repo" == "repo-a" && "$profile" == "codex-default" && "$prompt" == "deliver-v1" && "$skill" == "deliver" ]]; then
+  _pass "normalized sessions include source/repo/profile/prompt/skill identifiers"
+else
+  _fail "normalized identifiers mismatch: count='$session_count' source='$source_id' repo='$repo' profile='$profile' prompt='$prompt' skill='$skill'"
+fi
+turns=$(jq -r 'select(.session_id == "codex-session-1") | .turns' "$sessions_a" 2>/dev/null | head -1)
+tools=$(jq -r 'select(.session_id == "codex-session-1") | .tool_invocations' "$sessions_a" 2>/dev/null | head -1)
+delegations=$(jq -r 'select(.session_id == "codex-session-1") | .delegations' "$sessions_a" 2>/dev/null | head -1)
+permissions=$(jq -r 'select(.session_id == "codex-session-1") | .permission_requests' "$sessions_a" 2>/dev/null | head -1)
+if [[ "$turns" == "1" && "$tools" == "2" && "$delegations" == "1" && "$permissions" == "1" ]]; then
+  _pass "normalized sessions preserve Codex usage counts"
+else
+  _fail "usage counts mismatch: turns='$turns' tools='$tools' delegations='$delegations' permissions='$permissions'"
+fi
+if flow_agents_node "$USAGE_FEEDBACK" import-telemetry \
+  --runtime claude-code \
+  --input-telemetry-dir "$src_claude" \
+  --telemetry-dir "$dst_claude" \
+  --source-id "repo-claude" \
+  --repo "repo-claude" \
+  --profile-id "claude-dev" \
+  --prompt-id "deliver-v1" \
+  --skill-id "deliver" >/dev/null 2>"$TMPDIR_EVAL/import-claude.err"; then
+  _pass "import-telemetry imports Claude Code full.jsonl"
+else
+  _fail "import-telemetry failed for Claude Code: $(cat "$TMPDIR_EVAL/import-claude.err" 2>/dev/null)"
+fi
+sessions_claude="$(_sessions_file "$dst_claude")"
+claude_runtime=$(jq -r 'select(.session_id == "claude-session-1") | .runtime' "$sessions_claude" 2>/dev/null | head -1)
+claude_tools=$(jq -r 'select(.session_id == "claude-session-1") | .tool_invocations' "$sessions_claude" 2>/dev/null | head -1)
+claude_delegations=$(jq -r 'select(.session_id == "claude-session-1") | .delegations' "$sessions_claude" 2>/dev/null | head -1)
+if [[ "$claude_runtime" == "claude-code" && "$claude_tools" == "1" && "$claude_delegations" == "1" ]]; then
+  _pass "normalized sessions preserve Claude Code runtime and usage counts"
+else
+  _fail "Claude import mismatch: runtime='$claude_runtime' tools='$claude_tools' delegations='$claude_delegations'"
+fi
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-full-jsonl "$src/full.jsonl" \
+  --telemetry-dir "$dst_b" \
+  --source-id "repo-b" \
+  --repo "repo-b" \
+  --profile-id "codex-experimental" \
+  --prompt-id "deliver-v2" \
+  --skill-id "deliver" >/dev/null 2>"$TMPDIR_EVAL/import-b.err"; then
+  _pass "import-codex imports from explicit full.jsonl"
+else
+  _fail "import-codex failed for explicit full.jsonl: $(cat "$TMPDIR_EVAL/import-b.err" 2>/dev/null)"
+fi
+sessions_b="$(_sessions_file "$dst_b")"
+source_b=$(jq -r 'select(.session_id == "codex-session-1") | .source_id' "$sessions_b" 2>/dev/null | head -1)
+if [[ "$source_b" == "repo-b" ]]; then
+  _pass "same fixture can import with a distinct source_id"
+else
+  _fail "second import source_id mismatch: '$source_b'"
+fi
+dst_fallback="$TMPDIR_EVAL/dst-fallback"
+mkdir -p "$dst_fallback"
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-full-jsonl "$src/full.jsonl" \
+  --telemetry-dir "$dst_fallback" >/dev/null 2>"$TMPDIR_EVAL/import-fallback.err"; then
+  sessions_fallback="$(_sessions_file "$dst_fallback")"
+  source_fallback=$(jq -r 'select(.session_id == "codex-session-1") | .source_id' "$sessions_fallback" 2>/dev/null | head -1)
+  if [[ "$source_fallback" == "flow-agents" ]]; then
+    _pass "import-codex preserves raw repo source fallback when source-id is omitted"
+  else
+    _fail "omitted source-id fallback mismatch: '$source_fallback'"
+  fi
+else
+  _fail "import-codex failed without source-id: $(cat "$TMPDIR_EVAL/import-fallback.err" 2>/dev/null)"
+fi
+src_no_metadata="$TMPDIR_EVAL/src-no-metadata"
+dst_no_metadata="$TMPDIR_EVAL/dst-no-metadata"
+mkdir -p "$src_no_metadata" "$dst_no_metadata"
+cat > "$src_no_metadata/full.jsonl" <<'JSONL'
+{"session_id":"no-metadata-session","event_type":"turn.user","timestamp":"2026-05-04T12:00:00Z"}
+JSONL
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-telemetry-dir "$src_no_metadata" \
+  --telemetry-dir "$dst_no_metadata" >/dev/null 2>"$TMPDIR_EVAL/import-no-metadata.err"; then
+  sessions_no_metadata="$(_sessions_file "$dst_no_metadata")"
+  source_no_metadata=$(jq -r 'select(.session_id == "no-metadata-session") | .source_id' "$sessions_no_metadata" 2>/dev/null | head -1)
+  if [[ "$source_no_metadata" == "src-no-metadata" ]]; then
+    _pass "import-codex uses input telemetry dir name when source metadata is absent"
+  else
+    _fail "input telemetry dir source fallback mismatch: '$source_no_metadata'"
+  fi
+else
+  _fail "import-codex failed for metadata-free input dir: $(cat "$TMPDIR_EVAL/import-no-metadata.err" 2>/dev/null)"
+fi
+ln -s "$TMPDIR_EVAL/symlink-target" "$TMPDIR_EVAL/symlink-dst"
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-full-jsonl "$src/full.jsonl" \
+  --telemetry-dir "$TMPDIR_EVAL/symlink-dst" >/dev/null 2>"$TMPDIR_EVAL/import-symlink.err"; then
+  _fail "import-codex accepted symlinked target telemetry dir"
+else
+  _pass "import-codex rejects symlinked target telemetry dir"
+fi
+mkdir -p "$TMPDIR_EVAL/import-intermediate-target"
+ln -s "$TMPDIR_EVAL/import-intermediate-target" "$TMPDIR_EVAL/import-intermediate-link"
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-full-jsonl "$src/full.jsonl" \
+  --telemetry-dir "$TMPDIR_EVAL/import-intermediate-link/nested" >/dev/null 2>"$TMPDIR_EVAL/import-symlink-parent.err"; then
+  _fail "import-codex accepted target telemetry dir with symlinked parent"
+else
+  if [[ ! -e "$TMPDIR_EVAL/import-intermediate-target/nested/normalized-sessions.jsonl" ]]; then
+    _pass "import-codex rejects symlinked target telemetry parent before creating nested dirs"
+  else
+    _fail "import-codex wrote through symlinked target telemetry parent"
+  fi
+fi
+if flow_agents_node "$USAGE_FEEDBACK" import-codex \
+  --input-telemetry-dir "$TMPDIR_EVAL/missing" \
+  --telemetry-dir "$TMPDIR_EVAL/missing-dst" \
+  --source-id "missing" \
+  --repo "missing" >/dev/null 2>"$TMPDIR_EVAL/missing.err"; then
+  _fail "import-codex accepted missing input telemetry"
+else
+  _pass "import-codex rejects missing input telemetry"
+fi
+echo ""
+echo "Result: $pass passed, $fail failed"
+[[ $fail -eq 0 ]]

package/evals/integration/test_usage_feedback_outcomes.sh ADDED Viewed

@@ -0,0 +1,165 @@
+#!/usr/bin/env bash
+# test_usage_feedback_outcomes.sh - Layer 2: Usage feedback outcome validation
+set -uo pipefail
+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+source "$ROOT_DIR/evals/lib/node.sh"
+USAGE_FEEDBACK="$ROOT_DIR/scripts/usage-feedback.js"
+TMPDIR_EVAL=$(mktemp -d /tmp/eval-usage-feedback-outcomes.XXXXXX)
+pass=0; fail=0
+cleanup() { rm -rf "$TMPDIR_EVAL"; }
+trap cleanup EXIT
+_pass() { echo "  ✓ $1"; pass=$((pass + 1)); }
+_fail() { echo "  ✗ $1"; fail=$((fail + 1)); }
+echo "=== Layer 2: Usage Feedback Outcome Validation ==="
+echo ""
+echo "--- Script Existence ---"
+if [[ -f "$USAGE_FEEDBACK" ]]; then
+  _pass "usage-feedback.js exists"
+else
+  _fail "usage-feedback.js not found at $USAGE_FEEDBACK"
+  echo ""
+  echo "Result: $pass passed, $fail failed"
+  exit 1
+fi
+echo ""
+echo "--- Outcome Recording ---"
+if TELEMETRY_DATA_DIR="$TMPDIR_EVAL" flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --session-id "session-success" \
+  --runtime "codex" \
+  --repo "flow-agents" \
+  --agent "dev" \
+  --profile-id "codex-default" \
+  --prompt-id "deliver-v1" \
+  --skill-id "deliver" \
+  --result "success" \
+  --quality-score 5 \
+  --task-type "deliver" \
+  --task-slug "usage-feedback-success" \
+  --human-minutes-saved 12 \
+  --evidence ".flow-agents/agent-usage-feedback-loop/agent-usage-feedback-loop--deliver.md" >/dev/null 2>"$TMPDIR_EVAL/success.err"; then
+  _pass "record-outcome accepts success with profile/prompt/skill ids"
+else
+  _fail "record-outcome rejected success: $(cat "$TMPDIR_EVAL/success.err" 2>/dev/null)"
+fi
+if TELEMETRY_DATA_DIR="$TMPDIR_EVAL" flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --session-id "session-failure" \
+  --runtime "codex" \
+  --repo "flow-agents-docs" \
+  --agent "dev" \
+  --profile-id "codex-experimental" \
+  --prompt-id "deliver-v2" \
+  --skill-id "deliver" \
+  --skill-id "verify-work" \
+  --result "failure" \
+  --quality-score 2 \
+  --task-type "verify" \
+  --task-slug "usage-feedback-failure" \
+  --rework-required \
+  --notes "Fixture failure" >/dev/null 2>"$TMPDIR_EVAL/failure.err"; then
+  _pass "record-outcome accepts failure with multiple skill ids"
+else
+  _fail "record-outcome rejected failure: $(cat "$TMPDIR_EVAL/failure.err" 2>/dev/null)"
+fi
+OUTCOMES="$TMPDIR_EVAL/outcomes.jsonl"
+line_count=$(wc -l < "$OUTCOMES" 2>/dev/null | tr -d ' ')
+if [[ "$line_count" == "2" ]]; then
+  _pass "record-outcome appends two outcome records"
+else
+  _fail "expected 2 outcome records, found ${line_count:-0}"
+fi
+success_profile=$(jq -r 'select(.session_id == "session-success") | .profile_id' "$OUTCOMES" 2>/dev/null)
+success_prompt=$(jq -r 'select(.session_id == "session-success") | .prompt_id' "$OUTCOMES" 2>/dev/null)
+success_skill=$(jq -r 'select(.session_id == "session-success") | .skill_ids[0]' "$OUTCOMES" 2>/dev/null)
+if [[ "$success_profile" == "codex-default" && "$success_prompt" == "deliver-v1" && "$success_skill" == "deliver" ]]; then
+  _pass "success outcome preserves profile, prompt, and skill ids"
+else
+  _fail "success identifiers mismatch: profile='$success_profile' prompt='$success_prompt' skill='$success_skill'"
+fi
+failure_rework=$(jq -r 'select(.session_id == "session-failure") | .rework_required' "$OUTCOMES" 2>/dev/null)
+failure_skill_count=$(jq -r 'select(.session_id == "session-failure") | .skill_ids | length' "$OUTCOMES" 2>/dev/null)
+if [[ "$failure_rework" == "true" && "$failure_skill_count" == "2" ]]; then
+  _pass "failure outcome preserves rework flag and multiple skill ids"
+else
+  _fail "failure fields mismatch: rework='$failure_rework' skill_count='$failure_skill_count'"
+fi
+before_invalid=$(wc -l < "$OUTCOMES" 2>/dev/null | tr -d ' ')
+if TELEMETRY_DATA_DIR="$TMPDIR_EVAL" flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --session-id "session-invalid" \
+  --runtime "codex" \
+  --repo "flow-agents" \
+  --agent "dev" \
+  --profile-id "codex-default" \
+  --prompt-id "deliver-v1" \
+  --skill-id "deliver" \
+  --result "excellent" >/dev/null 2>"$TMPDIR_EVAL/invalid-result.err"; then
+  _fail "record-outcome accepted invalid result"
+else
+  after_invalid=$(wc -l < "$OUTCOMES" 2>/dev/null | tr -d ' ')
+  if [[ "$after_invalid" == "$before_invalid" ]]; then
+    _pass "record-outcome rejects invalid result without appending"
+  else
+    _fail "invalid result changed outcomes.jsonl line count from $before_invalid to $after_invalid"
+  fi
+fi
+if TELEMETRY_DATA_DIR="$TMPDIR_EVAL" flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --runtime "codex" \
+  --repo "flow-agents" \
+  --agent "dev" \
+  --result "success" >/dev/null 2>"$TMPDIR_EVAL/missing-session.err"; then
+  _fail "record-outcome accepted missing session_id"
+else
+  _pass "record-outcome rejects missing session_id"
+fi
+ln -s "$TMPDIR_EVAL/symlink-target" "$TMPDIR_EVAL/symlink-telemetry"
+if flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --telemetry-dir "$TMPDIR_EVAL/symlink-telemetry" \
+  --session-id "session-symlink-dir" \
+  --result "success" >/dev/null 2>"$TMPDIR_EVAL/symlink-dir.err"; then
+  _fail "record-outcome accepted symlinked telemetry dir"
+else
+  _pass "record-outcome rejects symlinked telemetry dir"
+fi
+mkdir -p "$TMPDIR_EVAL/intermediate-target"
+ln -s "$TMPDIR_EVAL/intermediate-target" "$TMPDIR_EVAL/intermediate-link"
+if flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --telemetry-dir "$TMPDIR_EVAL/intermediate-link/nested" \
+  --session-id "session-symlink-parent" \
+  --result "success" >/dev/null 2>"$TMPDIR_EVAL/symlink-parent.err"; then
+  _fail "record-outcome accepted telemetry dir with symlinked parent"
+else
+  if [[ ! -e "$TMPDIR_EVAL/intermediate-target/nested/outcomes.jsonl" ]]; then
+    _pass "record-outcome rejects symlinked telemetry parent before creating nested dirs"
+  else
+    _fail "record-outcome wrote through symlinked telemetry parent"
+  fi
+fi
+target_file_dir="$TMPDIR_EVAL/symlink-file-telemetry"
+mkdir -p "$target_file_dir"
+ln -s "$TMPDIR_EVAL/symlink-outcomes-target.jsonl" "$target_file_dir/outcomes.jsonl"
+if flow_agents_node "$USAGE_FEEDBACK" record-outcome \
+  --telemetry-dir "$target_file_dir" \
+  --session-id "session-symlink-file" \
+  --result "success" >/dev/null 2>"$TMPDIR_EVAL/symlink-file.err"; then
+  _fail "record-outcome accepted symlinked outcomes target"
+else
+  _pass "record-outcome rejects symlinked outcomes target"
+fi
+echo ""
+echo "Result: $pass passed, $fail failed"
+[[ $fail -eq 0 ]]

package/evals/integration/test_usage_feedback_report.sh ADDED Viewed

@@ -0,0 +1,263 @@
+#!/usr/bin/env bash
+# test_usage_feedback_report.sh - Layer 2: Usage feedback report validation
+set -uo pipefail
+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+source "$ROOT_DIR/evals/lib/node.sh"
+USAGE_FEEDBACK="$ROOT_DIR/scripts/usage-feedback.js"
+FIXTURE_DIR="$ROOT_DIR/evals/fixtures/usage-feedback"
+TMPDIR_EVAL=$(mktemp -d /tmp/eval-usage-feedback-report.XXXXXX)
+pass=0; fail=0
+cleanup() { rm -rf "$TMPDIR_EVAL"; }
+trap cleanup EXIT
+_pass() { echo "  ✓ $1"; pass=$((pass + 1)); }
+_fail() { echo "  ✗ $1"; fail=$((fail + 1)); }
+echo "=== Layer 2: Usage Feedback Report Validation ==="
+echo ""
+echo "--- Script Existence ---"
+if [[ -f "$USAGE_FEEDBACK" ]]; then
+  _pass "usage-feedback.js exists"
+else
+  _fail "usage-feedback.js not found at $USAGE_FEEDBACK"
+  echo ""
+  echo "Result: $pass passed, $fail failed"
+  exit 1
+fi
+echo ""
+tmp_a="$TMPDIR_EVAL/repo-a"
+tmp_b="$TMPDIR_EVAL/repo-b"
+mkdir -p "$tmp_a" "$tmp_b"
+cp "$FIXTURE_DIR/sample-full.jsonl" "$tmp_a/full.jsonl"
+cp "$FIXTURE_DIR/sample-outcomes.jsonl" "$tmp_a/outcomes.jsonl"
+cp "$FIXTURE_DIR/sample-full.jsonl" "$tmp_b/full.jsonl"
+cat > "$tmp_b/outcomes.jsonl" <<'JSONL'
+{"schema_version":"1","outcome_id":"outcome-2","recorded_at":"2026-05-04T11:30:00Z","session_id":"codex-session-2","runtime":"codex","repo":"repo-b","agent":"dev","profile_id":"codex-experimental","prompt_id":"deliver-v2","prompt_variant":"concise","skill_ids":["deliver","verify-work"],"task_type":"verify","task_slug":"usage-feedback-report","result":"failure","quality_score":2,"human_minutes_saved":0,"rework_required":true,"notes":"Fixture failure outcome","evidence":["evals/integration/test_usage_feedback_report.sh"]}
+JSONL
+echo "--- JSON Report ---"
+json_report="$TMPDIR_EVAL/report.json"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --telemetry-dir "$tmp_b" \
+  --format json \
+  --group-by repo >"$json_report" 2>"$TMPDIR_EVAL/report-json.err"; then
+  _pass "report emits JSON for multiple telemetry dirs"
+else
+  _fail "JSON report failed: $(cat "$TMPDIR_EVAL/report-json.err" 2>/dev/null)"
+fi
+if jq -e '.summary.sessions >= 4 and .summary.sessions_with_outcomes >= 2 and (.summary.success_rate != null) and (.sources | length >= 2)' "$json_report" >/dev/null 2>&1; then
+  _pass "JSON report includes summary sessions, outcomes, success rate, and sources"
+else
+  _fail "JSON report missing expected summary/source fields"
+fi
+if jq -e '.groups[]? | select((.key == "flow-agents") or (.group == "flow-agents") or (.name == "flow-agents"))' "$json_report" >/dev/null 2>&1; then
+  _pass "JSON report groups by repo"
+else
+  _fail "JSON report did not include repo group"
+fi
+if jq -e '.summary.sessions > .summary.sessions_with_outcomes' "$json_report" >/dev/null 2>&1; then
+  _pass "report includes sessions without outcomes in usage totals"
+else
+  _fail "report did not distinguish sessions without outcomes"
+fi
+echo ""
+echo "--- Markdown Report ---"
+markdown_report="$tmp_a/reports/usage.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by profile_id \
+  --output "$markdown_report" >/dev/null 2>"$TMPDIR_EVAL/report-md.err"; then
+  _pass "report writes Markdown output file"
+else
+  _fail "Markdown report failed: $(cat "$TMPDIR_EVAL/report-md.err" 2>/dev/null)"
+fi
+if [[ -f "$markdown_report" ]]; then
+  _pass "Markdown report output file exists"
+else
+  _fail "Markdown report output file missing"
+fi
+if grep -q "# Agent Usage Feedback Report" "$markdown_report" && \
+   grep -q "Success rate" "$markdown_report" && \
+   grep -q "Avg tool invocations" "$markdown_report" && \
+   grep -q "Rework rate" "$markdown_report" && \
+   grep -q "codex-default" "$markdown_report"; then
+  _pass "Markdown report includes required headings, metrics, and profile group"
+else
+  _fail "Markdown report missing required content"
+fi
+relative_report="$tmp_a/reports/relative.md"
+if (cd "$TMPDIR_EVAL" && flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by profile_id \
+  --output reports/relative.md >/dev/null 2>"$TMPDIR_EVAL/report-relative.err") && [[ -f "$relative_report" ]]; then
+  _pass "report writes reports/name.md relative to telemetry reports directory"
+else
+  _fail "relative reports/name.md output failed: $(cat "$TMPDIR_EVAL/report-relative.err" 2>/dev/null)"
+fi
+nested_guard_report="$tmp_a/reports/usage-feedback.md"
+if (cd "$TMPDIR_EVAL" && flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by profile_id \
+  --output "$(basename "$tmp_a")/reports/usage-feedback.md" >/dev/null 2>"$TMPDIR_EVAL/report-nested-guard.err") && \
+   [[ -f "$nested_guard_report" && ! -e "$tmp_a/reports/$(basename "$tmp_a")/reports/usage-feedback.md" ]]; then
+  _pass "report prevents nested telemetry reports duplication for relative output"
+else
+  _fail "nested report output guard failed: $(cat "$TMPDIR_EVAL/report-nested-guard.err" 2>/dev/null)"
+fi
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by profile_id \
+  --output "$markdown_report" >/dev/null 2>"$TMPDIR_EVAL/report-overwrite.err"; then
+  _fail "report overwrote existing output without --force"
+else
+  _pass "report rejects existing output without --force"
+fi
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by profile_id \
+  --output "$markdown_report" \
+  --force >/dev/null 2>"$TMPDIR_EVAL/report-force.err"; then
+  _pass "report overwrites existing output with --force"
+else
+  _fail "report --force failed: $(cat "$TMPDIR_EVAL/report-force.err" 2>/dev/null)"
+fi
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --output "$TMPDIR_EVAL/outside.md" >/dev/null 2>"$TMPDIR_EVAL/report-outside.err"; then
+  _fail "report accepted output outside telemetry reports directory"
+else
+  _pass "report rejects output outside telemetry reports directory"
+fi
+ln -s "$TMPDIR_EVAL/symlink-report-target.md" "$tmp_a/reports/symlink.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --output "$tmp_a/reports/symlink.md" \
+  --force >/dev/null 2>"$TMPDIR_EVAL/report-symlink.err"; then
+  _fail "report accepted symlinked output target"
+else
+  _pass "report rejects symlinked output target"
+fi
+tmp_symlink_reports="$TMPDIR_EVAL/symlink-reports"
+mkdir -p "$tmp_symlink_reports"
+cp "$FIXTURE_DIR/sample-full.jsonl" "$tmp_symlink_reports/full.jsonl"
+ln -s "$TMPDIR_EVAL/report-parent-target" "$tmp_symlink_reports/reports"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_symlink_reports" \
+  --output usage.md >/dev/null 2>"$TMPDIR_EVAL/report-symlink-parent.err"; then
+  _fail "report accepted symlinked reports directory"
+else
+  _pass "report rejects symlinked reports directory"
+fi
+mkdir -p "$TMPDIR_EVAL/report-intermediate-target"
+ln -s "$TMPDIR_EVAL/report-intermediate-target" "$TMPDIR_EVAL/report-intermediate-link"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$TMPDIR_EVAL/report-intermediate-link/nested" \
+  --output usage.md >/dev/null 2>"$TMPDIR_EVAL/report-symlink-telemetry-parent.err"; then
+  _fail "report accepted telemetry dir with symlinked parent"
+else
+  if [[ ! -e "$TMPDIR_EVAL/report-intermediate-target/nested/reports/usage.md" ]]; then
+    _pass "report rejects symlinked telemetry parent before creating report dirs"
+  else
+    _fail "report wrote through symlinked telemetry parent"
+  fi
+fi
+tmp_raw="$TMPDIR_EVAL/raw-source-name"
+mkdir -p "$tmp_raw"
+cat > "$tmp_raw/full.jsonl" <<'JSONL'
+{"session_id":"raw-session","event_type":"turn.user","timestamp":"2026-05-04T12:00:00Z"}
+JSONL
+raw_report="$TMPDIR_EVAL/raw-report.json"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_raw" \
+  --format json >"$raw_report" 2>"$TMPDIR_EVAL/report-raw.err" && \
+   jq -e '.sources == ["raw-source-name"]' "$raw_report" >/dev/null 2>&1; then
+  _pass "raw telemetry without source metadata groups by telemetry directory name"
+else
+  _fail "raw telemetry source fallback failed: $(cat "$TMPDIR_EVAL/report-raw.err" 2>/dev/null)"
+fi
+tmp_escape="$TMPDIR_EVAL/escape-source"
+mkdir -p "$tmp_escape"
+cat > "$tmp_escape/normalized-sessions.jsonl" <<'JSONL'
+{"schema_version":"1","source_id":"escape-source","runtime":"codex","session_id":"escape-session","profile_id":"alpha|beta\nbreak <tag> & value","skill_ids":[],"turns":0,"tool_invocations":0,"delegations":0,"permission_requests":0}
+JSONL
+escape_report="$TMPDIR_EVAL/escape.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_escape" \
+  --group-by profile_id >"$escape_report" 2>"$TMPDIR_EVAL/report-escape.err" && \
+   grep -q 'alpha\\|beta break &lt;tag&gt; &amp; value' "$escape_report"; then
+  _pass "Markdown report escapes table labels, HTML chars, and strips newlines"
+else
+  _fail "Markdown report label escaping failed: $(cat "$TMPDIR_EVAL/report-escape.err" 2>/dev/null)"
+fi
+escape_html="$tmp_escape/reports/escape.html"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_escape" \
+  --group-by profile_id \
+  --format html \
+  --output "$escape_html" >"$TMPDIR_EVAL/report-html-escape.out" 2>"$TMPDIR_EVAL/report-html-escape.err" && \
+   grep -q '&lt;tag&gt; &amp; value' "$escape_html" && \
+   ! grep -q '<tag>' "$escape_html"; then
+  _pass "HTML report escapes local telemetry labels"
+else
+  _fail "HTML report escaping failed: $(cat "$TMPDIR_EVAL/report-html-escape.err" 2>/dev/null)"
+fi
+echo ""
+echo "--- Fixture Report Smoke ---"
+fixture_report="$TMPDIR_EVAL/fixture-runtime.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$tmp_a" \
+  --group-by runtime >"$fixture_report" 2>"$TMPDIR_EVAL/fixture.err"; then
+  _pass "report works against copied fixture telemetry"
+else
+  _fail "fixture report failed: $(cat "$TMPDIR_EVAL/fixture.err" 2>/dev/null)"
+fi
+direct_fixture_report="$TMPDIR_EVAL/direct-fixture-repo.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$FIXTURE_DIR" \
+  --group-by repo >"$direct_fixture_report" 2>"$TMPDIR_EVAL/direct-fixture-repo.err" && \
+   grep -q "Sessions: 2" "$direct_fixture_report" && \
+   grep -q "flow-agents-docs" "$direct_fixture_report"; then
+  _pass "report reads sample fixture names directly for repo groups"
+else
+  _fail "direct fixture repo report failed: $(cat "$TMPDIR_EVAL/direct-fixture-repo.err" 2>/dev/null)"
+fi
+direct_profile_report="$TMPDIR_EVAL/direct-fixture-profile.md"
+if flow_agents_node "$USAGE_FEEDBACK" report \
+  --telemetry-dir "$FIXTURE_DIR" \
+  --group-by profile_id >"$direct_profile_report" 2>"$TMPDIR_EVAL/direct-fixture-profile.err" && \
+   grep -q "Sessions: 2" "$direct_profile_report" && \
+   grep -q "codex-default" "$direct_profile_report" && \
+   grep -q "codex-experimental" "$direct_profile_report"; then
+  _pass "report reads sample fixture names directly for profile groups"
+else
+  _fail "direct fixture profile report failed: $(cat "$TMPDIR_EVAL/direct-fixture-profile.err" 2>/dev/null)"
+fi
+echo ""
+echo "Result: $pass passed, $fail failed"
+[[ $fail -eq 0 ]]