npm - @kontourai/flow-agents - Versions diffs - 0.1.1 - Mend

@kontourai/flow-agents 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (418) hide show

package/.githooks/pre-push +11 -0
package/.github/workflows/ci.yml +210 -0
package/.github/workflows/docs-pages.yml +52 -0
package/.github/workflows/publish-npm.yml +104 -0
package/AGENTS.md +26 -0
package/CHANGELOG.md +66 -0
package/CODE_OF_CONDUCT.md +25 -0
package/CONTEXT.md +300 -0
package/CONTRIBUTING.md +44 -0
package/LICENSE +201 -0
package/README.md +129 -0
package/SECURITY.md +33 -0
package/agent-cards/dev.json +19 -0
package/agents/dev.json +127 -0
package/agents/tool-code-reviewer.json +61 -0
package/agents/tool-dependencies-updater.json +118 -0
package/agents/tool-explore-config.json +92 -0
package/agents/tool-explore-deps.json +92 -0
package/agents/tool-explore-entry.json +92 -0
package/agents/tool-explore-patterns.json +92 -0
package/agents/tool-explore-structure.json +92 -0
package/agents/tool-explore-tests.json +92 -0
package/agents/tool-planner.json +57 -0
package/agents/tool-playwright.json +145 -0
package/agents/tool-security-reviewer.json +56 -0
package/agents/tool-verifier.json +61 -0
package/agents/tool-worker.json +58 -0
package/build/src/cli/console-learning-projection.js +123 -0
package/build/src/cli/docs-preview.js +39 -0
package/build/src/cli/effective-backlog-settings.js +102 -0
package/build/src/cli/export-bookmarks.js +38 -0
package/build/src/cli/fixture-retirement-audit.js +140 -0
package/build/src/cli/flow-kit.js +138 -0
package/build/src/cli/import-bookmarks.js +50 -0
package/build/src/cli/init.js +239 -0
package/build/src/cli/instinct-cli.js +93 -0
package/build/src/cli/promote-workflow-artifact.js +63 -0
package/build/src/cli/publish-change-helper.js +154 -0
package/build/src/cli/pull-work-provider.js +469 -0
package/build/src/cli/runtime-adapter.js +23 -0
package/build/src/cli/telemetry-doctor.js +221 -0
package/build/src/cli/usage-feedback.js +443 -0
package/build/src/cli/validate-hook-influence.js +152 -0
package/build/src/cli/validate-source-tree.js +31 -0
package/build/src/cli/validate-workflow-artifacts.js +486 -0
package/build/src/cli/veritas-governance.js +262 -0
package/build/src/cli/workflow-artifact-cleanup-audit.js +272 -0
package/build/src/cli/workflow-sidecar.js +816 -0
package/build/src/cli.js +89 -0
package/build/src/flow-kit/validate.js +75 -0
package/build/src/lib/args.js +45 -0
package/build/src/lib/fs.js +62 -0
package/build/src/lib/workflow-learning-projection.js +334 -0
package/build/src/runtime-adapters.js +146 -0
package/build/src/tools/build-universal-bundles.js +397 -0
package/build/src/tools/common.js +56 -0
package/build/src/tools/filter-installed-packs.js +132 -0
package/build/src/tools/generate-context-map.js +198 -0
package/build/src/tools/validate-package.js +64 -0
package/build/src/tools/validate-source-tree.js +622 -0
package/console.telemetry.json +176 -0
package/context/base-rules.md +17 -0
package/context/code-review-standards.md +62 -0
package/context/coding-standards.md +42 -0
package/context/common/orchestrators.md +12 -0
package/context/common/subagents.md +28 -0
package/context/contracts/artifact-contract.md +182 -0
package/context/contracts/builder-kit-workflow-state-contract.md +319 -0
package/context/contracts/delivery-contract.md +69 -0
package/context/contracts/execution-contract.md +53 -0
package/context/contracts/governance-adapter-contract.md +67 -0
package/context/contracts/planning-contract.md +85 -0
package/context/contracts/review-contract.md +104 -0
package/context/contracts/sandbox-policy.md +52 -0
package/context/contracts/verification-contract.md +134 -0
package/context/contracts/work-item-contract.md +215 -0
package/context/deferred/demo-mode.md +33 -0
package/context/deferred/languages/go.md +31 -0
package/context/deferred/languages/python.md +31 -0
package/context/deferred/languages/typescript.md +34 -0
package/context/deferred/parallelization.md +35 -0
package/context/deferred/worktree-isolation.md +24 -0
package/context/development-workflow.md +50 -0
package/context/scripts/context-budget/budget-scan.sh +166 -0
package/context/scripts/detect-tools.sh +3 -0
package/context/scripts/discover-agents.sh +28 -0
package/context/scripts/git-status.sh +49 -0
package/context/scripts/hooks/config-protection.js +79 -0
package/context/scripts/hooks/desktop-notify.sh +39 -0
package/context/scripts/hooks/governance-audit.sh +135 -0
package/context/scripts/hooks/lib/audit-transport.sh +40 -0
package/context/scripts/hooks/lib/hook-flags.js +49 -0
package/context/scripts/hooks/lib/patterns.sh +57 -0
package/context/scripts/hooks/lib/resolve-formatter.js +80 -0
package/context/scripts/hooks/post-edit-accumulator.js +66 -0
package/context/scripts/hooks/pre-commit-quality.js +194 -0
package/context/scripts/hooks/quality-gate.js +93 -0
package/context/scripts/hooks/report-only-guard.js +21 -0
package/context/scripts/hooks/run-hook.js +136 -0
package/context/scripts/hooks/stop-format-typecheck.js +141 -0
package/context/scripts/hooks/stop-goal-fit.js +337 -0
package/context/scripts/hooks/workflow-steering.js +250 -0
package/context/scripts/telemetry/console-presets.sh +14 -0
package/context/scripts/telemetry/install-console-config.sh +214 -0
package/context/scripts/telemetry/lib/config.sh +85 -0
package/context/scripts/telemetry/lib/enrich.sh +115 -0
package/context/scripts/telemetry/lib/redact.sh +22 -0
package/context/scripts/telemetry/lib/session.sh +63 -0
package/context/scripts/telemetry/lib/transport.sh +183 -0
package/context/scripts/telemetry/lib/usage.sh +29 -0
package/context/scripts/telemetry/sync-agents.sh +173 -0
package/context/scripts/telemetry/telemetry.conf +23 -0
package/context/scripts/telemetry/telemetry.sh +387 -0
package/context/scripts/validate-package.sh +89 -0
package/context/settings/backlog-provider-settings.json +54 -0
package/context/templates/core/identity.md +26 -0
package/context/templates/core/user.md +15 -0
package/docs/_config.yml +15 -0
package/docs/_layouts/default.html +87 -0
package/docs/adr/0001-flow-agents-consumes-flow.md +77 -0
package/docs/adr/0002-flow-kits-as-extension-unit.md +13 -0
package/docs/adr/0003-flow-agents-coordinates-kits-and-adapters.md +13 -0
package/docs/adr/0004-gates-expect-surface-claims.md +15 -0
package/docs/adr/0005-kubernetes-inspired-resource-contracts.md +48 -0
package/docs/adr/0006-typescript-first-source-policy.md +98 -0
package/docs/agent-system-guidebook.md +391 -0
package/docs/agent-usage-feedback-loop.md +351 -0
package/docs/assets/favicon.svg +13 -0
package/docs/assets/og-image.png +0 -0
package/docs/assets/site.css +774 -0
package/docs/assets/site.js +139 -0
package/docs/configurable-workflow-routing.md +174 -0
package/docs/context-map.md +145 -0
package/docs/developer-architecture.md +145 -0
package/docs/developer-hook-setup.md +61 -0
package/docs/fixture-ownership.md +44 -0
package/docs/flow-kit-repository-contract.md +180 -0
package/docs/index.md +129 -0
package/docs/kontour-resource-contract.md +358 -0
package/docs/migrations.md +64 -0
package/docs/north-star.md +322 -0
package/docs/operating-layers.md +110 -0
package/docs/repository-structure.md +132 -0
package/docs/sandbox-policy.md +56 -0
package/docs/skills-map.md +203 -0
package/docs/standards-register.md +96 -0
package/docs/veritas-integration.md +165 -0
package/docs/work-item-adapters.md +72 -0
package/docs/workflow-artifact-lifecycle.md +141 -0
package/docs/workflow-eval-strategy.md +295 -0
package/docs/workflow-shared-contracts.md +51 -0
package/docs/workflow-usage-guide.md +443 -0
package/evals/ARCHITECTURE.md +143 -0
package/evals/CONVENTIONS.md +58 -0
package/evals/README.md +128 -0
package/evals/acceptance/run.sh +29 -0
package/evals/acceptance/test_claude_harness.sh +242 -0
package/evals/acceptance/test_codex_harness.sh +108 -0
package/evals/acceptance/test_kiro_harness.sh +128 -0
package/evals/cases/dev/404.html +97 -0
package/evals/cases/dev/code-review.yaml +44 -0
package/evals/cases/dev/dashboard.html +300 -0
package/evals/cases/dev/deliver.yaml +66 -0
package/evals/cases/dev/dependency-update.yaml +16 -0
package/evals/cases/dev/explore.yaml +20 -0
package/evals/cases/dev/index.html +370 -0
package/evals/cases/dev/package-lock.json +28 -0
package/evals/cases/dev/package.json +16 -0
package/evals/cases/dev/plan-work.yaml +20 -0
package/evals/cases/dev/promptfooconfig.yaml +666 -0
package/evals/cases/dev/search-first.yaml +20 -0
package/evals/cases/dev/tdd-workflow.yaml +48 -0
package/evals/cases/dev/verify-work.yaml +44 -0
package/evals/cases/dev/workflow.yaml +34 -0
package/evals/ci/run-baseline.sh +283 -0
package/evals/fixtures/backlog-provider-settings/global-default.json +44 -0
package/evals/fixtures/backlog-provider-settings/project-override.json +53 -0
package/evals/fixtures/builder-kit-workflow-state/baseline-freshness-resolution-hint.json +139 -0
package/evals/fixtures/builder-kit-workflow-state/direct-primitive-stop.json +59 -0
package/evals/fixtures/builder-kit-workflow-state/empty-board-route-shape.json +55 -0
package/evals/fixtures/builder-kit-workflow-state/happy-path.json +71 -0
package/evals/fixtures/builder-kit-workflow-state/mid-work-resume.json +80 -0
package/evals/fixtures/builder-kit-workflow-state/missing-prestep-recovery.json +65 -0
package/evals/fixtures/builder-kit-workflow-state/product-build-chaining.json +60 -0
package/evals/fixtures/builder-kit-workflow-state/stale-continuation-requires-new-probe.json +57 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-correction/learning.json +50 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-open-route/learning.json +41 -0
package/evals/fixtures/flow-kit-repository/invalid-absolute-path/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/kit.json +11 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/kit.json +9 -0
package/evals/fixtures/flow-kit-repository/invalid-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-id/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-malformed-json/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-flow/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-name/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-name/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-traversal/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/adapters/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/assets/example.txt +1 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/flows/runtime.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-evals/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-skills/mixed/SKILL.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit.json +44 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/flows/review.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/kit.json +20 -0
package/evals/fixtures/hook-influence/cases.json +336 -0
package/evals/fixtures/pull-work-provider/github-issues.json +170 -0
package/evals/fixtures/pull-work-wip-shepherding/global-wip-informs.json +43 -0
package/evals/fixtures/pull-work-wip-shepherding/personal-wip-blocks.json +42 -0
package/evals/fixtures/surface-trust/accepted-claim-trust-report.json +31 -0
package/evals/fixtures/surface-trust/artifact-absent.json +19 -0
package/evals/fixtures/surface-trust/integrity-mismatch-trust-report.json +32 -0
package/evals/fixtures/surface-trust/missing-authority-trust-report.json +27 -0
package/evals/fixtures/surface-trust/provider-absent.json +19 -0
package/evals/fixtures/surface-trust/rejected-claim-trust-report.json +30 -0
package/evals/fixtures/surface-trust/stale-claim-trust-snapshot.json +31 -0
package/evals/fixtures/usage-feedback/sample-full.jsonl +11 -0
package/evals/fixtures/usage-feedback/sample-outcomes.jsonl +1 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-pass.sh +18 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-secret-fail.sh +10 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-unconfigured.sh +4 -0
package/evals/integration/test_bundle_install.sh +541 -0
package/evals/integration/test_console_learning_projection.sh +192 -0
package/evals/integration/test_context_map.sh +65 -0
package/evals/integration/test_effective_backlog_settings.sh +58 -0
package/evals/integration/test_fixture_retirement_audit.sh +58 -0
package/evals/integration/test_flow_agents_statusline.sh +93 -0
package/evals/integration/test_flow_kit_repository.sh +90 -0
package/evals/integration/test_goal_fit_hook.sh +482 -0
package/evals/integration/test_hook_category_behaviors.sh +190 -0
package/evals/integration/test_hook_influence_cases.sh +69 -0
package/evals/integration/test_local_flow_kit_install.sh +145 -0
package/evals/integration/test_publish_change_helper.sh +176 -0
package/evals/integration/test_pull_work_provider.sh +140 -0
package/evals/integration/test_runtime_adapter_activation.sh +106 -0
package/evals/integration/test_telemetry.sh +485 -0
package/evals/integration/test_telemetry_doctor.sh +193 -0
package/evals/integration/test_usage_feedback_dashboard.sh +169 -0
package/evals/integration/test_usage_feedback_global.sh +117 -0
package/evals/integration/test_usage_feedback_import.sh +227 -0
package/evals/integration/test_usage_feedback_outcomes.sh +165 -0
package/evals/integration/test_usage_feedback_report.sh +263 -0
package/evals/integration/test_veritas_governance_adapter.sh +235 -0
package/evals/integration/test_workflow_artifact_cleanup_audit.sh +287 -0
package/evals/integration/test_workflow_artifacts.sh +1247 -0
package/evals/integration/test_workflow_sidecar_writer.sh +2112 -0
package/evals/integration/test_workflow_steering_hook.sh +337 -0
package/evals/lib/assertions/delegated-to.js +40 -0
package/evals/lib/assertions/max-tool-calls.js +15 -0
package/evals/lib/assertions/no-write-tools.js +27 -0
package/evals/lib/assertions/pass-at-k.js +39 -0
package/evals/lib/assertions/telemetry-utils.js +105 -0
package/evals/lib/assertions/tool-called.js +39 -0
package/evals/lib/assertions/verify-after-fix.js +61 -0
package/evals/lib/claude-judge.sh +40 -0
package/evals/lib/claude-provider.sh +74 -0
package/evals/lib/codex-judge.sh +39 -0
package/evals/lib/codex-provider.sh +81 -0
package/evals/lib/eval-dev.sh +5 -0
package/evals/lib/eval-judge.sh +22 -0
package/evals/lib/eval-provider.sh +26 -0
package/evals/lib/eval-report.sh +73 -0
package/evals/lib/kiro-dev.sh +4 -0
package/evals/lib/kiro-judge.sh +17 -0
package/evals/lib/kiro-provider.sh +62 -0
package/evals/lib/node.sh +111 -0
package/evals/promptfooconfig.yaml +70 -0
package/evals/run.sh +309 -0
package/evals/static/test_evidence_refs.sh +141 -0
package/evals/static/test_package.sh +407 -0
package/evals/static/test_repo_hooks.sh +68 -0
package/evals/static/test_universal_bundles.sh +274 -0
package/evals/static/test_workflow_skills.sh +1207 -0
package/install.sh +64 -0
package/integrations/veritas/flow-agents.adapter.json +138 -0
package/integrations/veritas/flow-agents.authority-settings.json +26 -0
package/integrations/veritas/flow-agents.repo-standards.json +82 -0
package/kits/builder/flows/build.flow.json +218 -0
package/kits/builder/flows/shape.flow.json +127 -0
package/kits/builder/kit.json +19 -0
package/kits/catalog.json +11 -0
package/package.json +130 -0
package/packaging/README.md +60 -0
package/packaging/manifest.json +173 -0
package/packaging/packs.json +69 -0
package/powers/dependency-checker/POWER.md +20 -0
package/powers/dependency-checker/mcp.json +20 -0
package/powers/playwright/POWER.md +25 -0
package/powers/playwright/mcp.json +12 -0
package/prompts/code-audit.md +123 -0
package/prompts/kcommit.md +88 -0
package/schemas/backlog-provider-settings.schema.json +138 -0
package/schemas/workflow-acceptance.schema.json +216 -0
package/schemas/workflow-critique.schema.json +113 -0
package/schemas/workflow-evidence.schema.json +357 -0
package/schemas/workflow-handoff.schema.json +52 -0
package/schemas/workflow-learning.schema.json +223 -0
package/schemas/workflow-release.schema.json +172 -0
package/schemas/workflow-state.schema.json +80 -0
package/scripts/README.md +111 -0
package/scripts/build-universal-bundles.js +3 -0
package/scripts/check-content-boundary.cjs +99 -0
package/scripts/context-budget/budget-scan.sh +166 -0
package/scripts/detect-tools.sh +3 -0
package/scripts/discover-agents.sh +28 -0
package/scripts/effective-backlog-settings.js +2 -0
package/scripts/filter-installed-packs.js +2 -0
package/scripts/flow-kit.js +2 -0
package/scripts/generate-context-map.js +2 -0
package/scripts/git-status.sh +49 -0
package/scripts/hooks/claude-hook-adapter.js +174 -0
package/scripts/hooks/claude-telemetry-hook.js +115 -0
package/scripts/hooks/codex-hook-adapter.js +176 -0
package/scripts/hooks/codex-telemetry-hook.js +95 -0
package/scripts/hooks/config-protection.js +79 -0
package/scripts/hooks/desktop-notify.sh +39 -0
package/scripts/hooks/governance-audit.sh +135 -0
package/scripts/hooks/lib/audit-transport.sh +40 -0
package/scripts/hooks/lib/hook-flags.js +49 -0
package/scripts/hooks/lib/patterns.sh +57 -0
package/scripts/hooks/lib/resolve-formatter.js +80 -0
package/scripts/hooks/post-edit-accumulator.js +66 -0
package/scripts/hooks/pre-commit-quality.js +194 -0
package/scripts/hooks/quality-gate.js +93 -0
package/scripts/hooks/report-only-guard.js +21 -0
package/scripts/hooks/run-hook.js +136 -0
package/scripts/hooks/stop-format-typecheck.js +141 -0
package/scripts/hooks/stop-goal-fit.js +337 -0
package/scripts/hooks/workflow-steering.js +250 -0
package/scripts/install-codex-home.sh +106 -0
package/scripts/package.json +3 -0
package/scripts/promote-workflow-artifact.js +2 -0
package/scripts/publish-change-helper.js +2 -0
package/scripts/pull-work-provider.js +2 -0
package/scripts/setup-repo-hooks.sh +8 -0
package/scripts/statusline/flow-agents-statusline.js +157 -0
package/scripts/telemetry/console-presets.sh +14 -0
package/scripts/telemetry/install-console-config.sh +214 -0
package/scripts/telemetry/lib/config.sh +85 -0
package/scripts/telemetry/lib/enrich.sh +115 -0
package/scripts/telemetry/lib/redact.sh +22 -0
package/scripts/telemetry/lib/session.sh +63 -0
package/scripts/telemetry/lib/transport.sh +183 -0
package/scripts/telemetry/lib/usage.sh +29 -0
package/scripts/telemetry/sync-agents.sh +173 -0
package/scripts/telemetry/telemetry.conf +23 -0
package/scripts/telemetry/telemetry.sh +387 -0
package/scripts/usage-feedback.js +2 -0
package/scripts/validate-hook-influence-cases.js +2 -0
package/scripts/validate-package.sh +89 -0
package/scripts/validate-source-tree.js +9 -0
package/skills/agentic-engineering/SKILL.md +62 -0
package/skills/browser-test/SKILL.md +51 -0
package/skills/builder-shape/SKILL.md +76 -0
package/skills/context-budget/SKILL.md +40 -0
package/skills/deliver/SKILL.md +241 -0
package/skills/dependency-update/SKILL.md +68 -0
package/skills/design-probe/SKILL.md +107 -0
package/skills/eval-rebuild/SKILL.md +39 -0
package/skills/evidence-gate/SKILL.md +186 -0
package/skills/execute-plan/SKILL.md +110 -0
package/skills/explore/SKILL.md +137 -0
package/skills/feedback-loop/SKILL.md +87 -0
package/skills/fix-bug/SKILL.md +133 -0
package/skills/frontend-design/SKILL.md +80 -0
package/skills/github-cli/SKILL.md +63 -0
package/skills/idea-to-backlog/SKILL.md +267 -0
package/skills/knowledge-capture/SKILL.md +55 -0
package/skills/learning-review/SKILL.md +115 -0
package/skills/pickup-probe/SKILL.md +114 -0
package/skills/plan-work/SKILL.md +176 -0
package/skills/pull-work/SKILL.md +309 -0
package/skills/release-readiness/SKILL.md +121 -0
package/skills/review-work/SKILL.md +161 -0
package/skills/search-first/SKILL.md +66 -0
package/skills/tdd-workflow/SKILL.md +140 -0
package/skills/verify-work/SKILL.md +109 -0
package/src/cli/console-learning-projection.ts +140 -0
package/src/cli/effective-backlog-settings.ts +99 -0
package/src/cli/fixture-retirement-audit.ts +154 -0
package/src/cli/flow-kit.ts +139 -0
package/src/cli/init.ts +248 -0
package/src/cli/promote-workflow-artifact.ts +64 -0
package/src/cli/publish-change-helper.ts +143 -0
package/src/cli/pull-work-provider.ts +481 -0
package/src/cli/runtime-adapter.ts +24 -0
package/src/cli/telemetry-doctor.ts +243 -0
package/src/cli/usage-feedback.ts +418 -0
package/src/cli/validate-hook-influence.ts +119 -0
package/src/cli/validate-source-tree.ts +30 -0
package/src/cli/validate-workflow-artifacts.ts +411 -0
package/src/cli/veritas-governance.ts +322 -0
package/src/cli/workflow-artifact-cleanup-audit.ts +281 -0
package/src/cli/workflow-sidecar.ts +676 -0
package/src/cli.ts +95 -0
package/src/flow-kit/validate.ts +74 -0
package/src/lib/args.ts +43 -0
package/src/lib/fs.ts +62 -0
package/src/lib/workflow-learning-projection.ts +491 -0
package/src/runtime-adapters.ts +154 -0
package/src/tools/build-universal-bundles.ts +366 -0
package/src/tools/common.ts +61 -0
package/src/tools/filter-installed-packs.ts +129 -0
package/src/tools/generate-context-map.ts +199 -0
package/src/tools/validate-package.ts +57 -0
package/src/tools/validate-source-tree.ts +488 -0
package/tsconfig.json +19 -0
package/veritas.claims.json +6 -0

package/evals/integration/test_runtime_adapter_activation.sh ADDED Viewed

@@ -0,0 +1,106 @@
+#!/usr/bin/env bash
+# test_runtime_adapter_activation.sh - Exercise local runtime adapter activation.
+set -uo pipefail
+ROOT="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+source "$ROOT/evals/lib/node.sh"
+errors=0
+TMP_DIR="$(mktemp -d)"
+trap 'rm -rf "$TMP_DIR"' EXIT
+pass() { echo "  ✓ $1"; }
+fail() { echo "  ✗ $1"; errors=$((errors + 1)); }
+CLI="$ROOT/scripts/flow-kit.js"
+DEST="$TMP_DIR/runtime-dest"
+MIXED_SRC="$ROOT/evals/fixtures/flow-kit-repository/mixed-runtime-kit"
+OUT="$TMP_DIR/activation.json"
+UNKNOWN_OUT="$TMP_DIR/unknown.json"
+CATALOG_HASH_BEFORE="$(shasum -a 256 "$ROOT/kits/catalog.json" | awk '{print $1}')"
+mkdir -p "$DEST"
+echo "=== Runtime Adapter Activation Checks ==="
+if flow_agents_node "$CLI" install-local "$MIXED_SRC" --dest "$DEST" >"$TMP_DIR/install.out" 2>&1; then
+  pass "mixed local kit installs into temp destination"
+else
+  fail "mixed local kit install failed"
+  sed -n '1,160p' "$TMP_DIR/install.out"
+fi
+if flow_agents_node "$CLI" activate --dest "$DEST" --source-root "$ROOT" --format json >"$OUT" 2>&1; then
+  pass "activation succeeds with default adapter"
+else
+  fail "activation failed"
+  sed -n '1,220p' "$OUT"
+fi
+if node - "$OUT" "$DEST" "$ROOT/kits/catalog.json" <<'NODE'
+const fs = require("node:fs");
+const path = require("node:path");
+const data = JSON.parse(fs.readFileSync(process.argv[2], "utf8"));
+const dest = process.argv[3];
+const catalog = process.argv[4];
+if (data.selected_adapter !== "codex-local") throw new Error(`unexpected selected_adapter: ${data.selected_adapter}`);
+if (JSON.stringify(data.supported_asset_classes) !== JSON.stringify(["flows"])) throw new Error(`unexpected supported_asset_classes: ${data.supported_asset_classes}`);
+const ids = new Set(data.generated_runtime_files.map((item) => item.asset_id));
+for (const expected of ["builder.shape", "builder.build", "mixed.runtime", "codex-local.activation"]) {
+  if (!ids.has(expected)) throw new Error(`missing generated asset: ${expected}`);
+}
+for (const item of data.generated_runtime_files) {
+  const generatedPath = path.join(dest, item.path);
+  if (!fs.existsSync(generatedPath)) throw new Error(`generated file missing: ${generatedPath}`);
+  if (path.resolve(catalog) === path.resolve(generatedPath)) throw new Error("activation generated over kits/catalog.json");
+}
+const classes = new Set(data.skipped_assets.map((item) => item.asset_class));
+for (const expected of ["skills", "docs", "adapters", "evals", "assets"]) {
+  if (!classes.has(expected)) throw new Error(`missing skipped asset class: ${expected}`);
+}
+for (const item of data.skipped_assets) {
+  for (const key of ["asset_class", "path", "kit_id", "asset_id", "reason"]) {
+    if (!(key in item)) throw new Error(`skipped asset missing ${key}: ${JSON.stringify(item)}`);
+  }
+  if (!item.reason.includes("diagnostic-only")) throw new Error(`unexpected skip reason: ${item.reason}`);
+}
+if (!fs.existsSync(path.join(dest, ".flow-agents/runtime/codex/activation.json"))) throw new Error("runtime activation manifest missing");
+console.log("ok");
+NODE
+then
+  pass "diagnostics report default adapter, generated files, and skipped unsupported assets"
+else
+  fail "activation diagnostics are incomplete"
+  sed -n '1,220p' "$OUT"
+fi
+if [[ "$CATALOG_HASH_BEFORE" == "$(shasum -a 256 "$ROOT/kits/catalog.json" | awk '{print $1}')" ]]; then
+  pass "activation does not mutate source kits/catalog.json"
+else
+  fail "source kits/catalog.json changed during activation"
+fi
+if flow_agents_node "$CLI" activate --dest "$DEST" --source-root "$ROOT" --adapter unknown --format json >"$UNKNOWN_OUT" 2>&1; then
+  fail "unknown adapter should fail"
+  sed -n '1,120p' "$UNKNOWN_OUT"
+elif node - "$UNKNOWN_OUT" <<'NODE'
+const fs = require("node:fs");
+const data = JSON.parse(fs.readFileSync(process.argv[2], "utf8"));
+if (!data.available_adapters?.includes("codex-local")) throw new Error("available adapters missing codex-local");
+if (!data.errors?.length) throw new Error("unknown adapter did not report errors");
+console.log("ok");
+NODE
+then
+  pass "unknown adapter reports available adapters"
+else
+  fail "unknown adapter diagnostics missing"
+  sed -n '1,120p' "$UNKNOWN_OUT"
+fi
+echo ""
+if [[ "$errors" -eq 0 ]]; then
+  echo "Runtime adapter activation checks passed."
+  exit 0
+fi
+echo "Runtime adapter activation checks failed: $errors issue(s)."
+exit 1

package/evals/integration/test_telemetry.sh ADDED Viewed

@@ -0,0 +1,485 @@
+#!/usr/bin/env bash
+# test_telemetry.sh — Layer 2: Telemetry contract validation
+# Tests that the telemetry pipeline produces correct event schemas
+#
+# NOTE: telemetry.sh runs fire-and-forget (backgrounds main + disown) so stdout
+# capture doesn't work. All tests write to a temp log file and read from there,
+# with a short sleep to let the background process finish.
+set -uo pipefail
+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+if [[ -d "$ROOT_DIR/context/scripts/telemetry" ]]; then
+  TELEMETRY_DIR="$ROOT_DIR/context/scripts/telemetry"
+  DISCOVER_SCRIPT="$ROOT_DIR/context/scripts/discover-agents.sh"
+else
+  TELEMETRY_DIR="$HOME/.flow-agents/context/scripts/telemetry"
+  DISCOVER_SCRIPT="$HOME/.flow-agents/context/scripts/discover-agents.sh"
+fi
+TELEMETRY_SH="${TELEMETRY_DIR}/telemetry.sh"
+TMPDIR_EVAL=$(mktemp -d /tmp/eval-telemetry-test.XXXXXX)
+TMPLOG="${TMPDIR_EVAL}/test-output.jsonl"
+pass=0; fail=0
+_pass() { echo "  ✓ $1"; pass=$((pass + 1)); }
+_fail() { echo "  ✗ $1"; fail=$((fail + 1)); }
+# Run telemetry.sh and wait for async output to land in the temp log file
+_run_telemetry() {
+  local hook_type="$1" agent="$2" input="$3" channels="${4:-full}" redact="${5:-none}"
+  local channel_upper
+  channel_upper=$(echo "$channels" | tr '[:lower:]' '[:upper:]')
+  local before_lines=0
+  touch "$TMPLOG"
+  before_lines=$(wc -l < "$TMPLOG" | tr -d ' ')
+  local env_vars=(
+    TELEMETRY_ENABLED=true
+    TELEMETRY_CHANNELS="$channels"
+    "TELEMETRY_CHANNEL_${channel_upper}_LOG_FILE=$TMPLOG"
+    "TELEMETRY_CHANNEL_${channel_upper}_REDACT=$redact"
+    FLOW_AGENTS_TELEMETRY_CAPTURE_RAW_HOOK_INPUT=true
+    FLOW_AGENTS_TELEMETRY_FOREGROUND=true
+    TELEMETRY_CONFIG_FILE="$TMPDIR_EVAL/telemetry.conf"
+    TELEMETRY_DATA_DIR="$TMPDIR_EVAL"
+    TELEMETRY_SESSION_DIR="$TMPDIR_EVAL/sessions"
+  )
+  if [[ -n "${FLOW_AGENTS_TELEMETRY_RUNTIME:-}" ]]; then
+    env_vars+=(FLOW_AGENTS_TELEMETRY_RUNTIME="$FLOW_AGENTS_TELEMETRY_RUNTIME")
+  fi
+  mkdir -p "$TMPDIR_EVAL/sessions"
+  echo "$input" | env "${env_vars[@]}" bash "$TELEMETRY_SH" "$hook_type" "$agent" 2>/dev/null
+  # Wait for background process to append new line(s)
+  local i=0 current_lines
+  while [[ $i -lt 50 ]]; do
+    current_lines=$(wc -l < "$TMPLOG" 2>/dev/null | tr -d ' ')
+    [[ "${current_lines:-0}" -gt "$before_lines" ]] && break
+    sleep 0.1; i=$((i + 1))
+  done
+  # Return the latest new line. telemetry.sh writes asynchronously, so a
+  # delayed event from the prior assertion can land after before_lines.
+  tail -n +"$((before_lines + 1))" "$TMPLOG" 2>/dev/null | tail -1
+}
+echo "=== Layer 2: Telemetry Contract Validation ==="
+echo ""
+# --- 1. Telemetry script exists ---
+echo "--- Script Existence ---"
+if [[ -f "$TELEMETRY_SH" ]]; then
+  _pass "telemetry.sh exists"
+else
+  _fail "telemetry.sh not found at $TELEMETRY_SH"
+  echo "Cannot continue without telemetry script"
+  rm -rf "$TMPDIR_EVAL"
+  exit 1
+fi
+for lib in config.sh session.sh enrich.sh transport.sh redact.sh; do
+  if [[ -f "${TELEMETRY_DIR}/lib/${lib}" ]]; then
+    _pass "lib/${lib} exists"
+  else
+    _fail "lib/${lib} missing"
+  fi
+done
+# --- 2. Event type mapping ---
+echo ""
+echo "--- Event Type Mapping ---"
+mock_json='{"cwd":"/tmp/eval-test","prompt":"test prompt","tool_name":"test_tool","tool_input":{},"tool_response":{}}'
+for pair in \
+  "agentSpawn:session.start" \
+  "SessionStart:session.start" \
+  "stop:session.end" \
+  "Stop:session.end" \
+  "SessionEnd:session.end" \
+  "userPromptSubmit:turn.user" \
+  "UserPromptSubmit:turn.user" \
+  "preToolUse:tool.invoke" \
+  "PreToolUse:tool.invoke" \
+  "permissionRequest:tool.permission_request" \
+  "PermissionRequest:tool.permission_request" \
+  "postToolUse:tool.result" \
+  "PostToolUse:tool.result" \
+  "PostToolUseFailure:tool.result"; do
+  hook_type="${pair%%:*}"
+  expected="${pair#*:}"
+  output=$(_run_telemetry "$hook_type" "eval-test" "$mock_json")
+  if [[ -z "$output" ]]; then
+    _fail "$hook_type → (no output)"
+    continue
+  fi
+  actual_type=$(echo "$output" | jq -r '.event_type // empty' 2>/dev/null)
+  if [[ "$actual_type" == "$expected" ]]; then
+    _pass "$hook_type → $actual_type"
+  else
+    _fail "$hook_type → expected '$expected', got '$actual_type'"
+  fi
+done
+# --- 3. Schema fields present ---
+echo ""
+echo "--- Schema Fields ---"
+output=$(_run_telemetry "agentSpawn" "eval-test" '{"cwd":"/tmp/eval-test"}')
+for field in schema_version timestamp session_id event_id event_type agent; do
+  val=$(echo "$output" | jq -r ".${field} // empty" 2>/dev/null)
+  if [[ -n "$val" ]]; then
+    _pass "agentSpawn has .$field = $val"
+  else
+    _fail "agentSpawn missing .$field"
+  fi
+done
+# Check agent sub-fields
+for field in name runtime version; do
+  val=$(echo "$output" | jq -r ".agent.${field} // empty" 2>/dev/null)
+  if [[ -n "$val" ]]; then
+    _pass "agentSpawn has .agent.$field"
+  else
+    _fail "agentSpawn missing .agent.$field"
+  fi
+done
+# --- 4. userPromptSubmit captures prompt ---
+echo ""
+echo "--- Prompt Capture ---"
+prompt_output=$(_run_telemetry "userPromptSubmit" "eval-test" '{"cwd":"/tmp","prompt":"Hello eval test"}')
+prompt_text=$(echo "$prompt_output" | jq -r '.turn.prompt_text // empty' 2>/dev/null)
+prompt_length=$(echo "$prompt_output" | jq -r '.turn.prompt_length // empty' 2>/dev/null)
+if [[ "$prompt_text" == "Hello eval test" ]]; then
+  _pass "userPromptSubmit captures prompt_text"
+else
+  _fail "userPromptSubmit prompt_text: expected 'Hello eval test', got '$prompt_text'"
+fi
+if [[ "$prompt_length" -gt 0 ]] 2>/dev/null; then
+  _pass "userPromptSubmit captures prompt_length ($prompt_length)"
+else
+  _fail "userPromptSubmit prompt_length missing or zero"
+fi
+# --- 5. preToolUse captures tool info ---
+echo ""
+echo "--- Tool Capture ---"
+tool_output=$(_run_telemetry "preToolUse" "eval-test" '{"session_id":"runtime-session-1","turn_id":"turn-1","transcript_path":"/tmp/transcript.jsonl","hook_event_name":"PreToolUse","model":"test-model","cwd":"/tmp","tool_name":"run shell commands","tool_input":{"command":"echo hi"}}')
+tool_name=$(echo "$tool_output" | jq -r '.tool.name // empty' 2>/dev/null)
+tool_normalized_name=$(echo "$tool_output" | jq -r '.tool.normalized_name // empty' 2>/dev/null)
+if [[ "$tool_name" == "run shell commands" ]]; then
+  _pass "preToolUse captures tool.name"
+else
+  _fail "preToolUse tool.name: expected 'run shell commands', got '$tool_name'"
+fi
+if [[ "$tool_normalized_name" == "run shell commands" ]]; then
+  _pass "preToolUse captures normalized tool name"
+else
+  _fail "preToolUse tool.normalized_name: expected 'run shell commands', got '$tool_normalized_name'"
+fi
+hook_turn_id=$(echo "$tool_output" | jq -r '.hook.turn_id // empty' 2>/dev/null)
+hook_runtime_session_id=$(echo "$tool_output" | jq -r '.hook.runtime_session_id // empty' 2>/dev/null)
+hook_raw_command=$(echo "$tool_output" | jq -r '.hook.raw_input.tool_input.command // empty' 2>/dev/null)
+if [[ "$hook_turn_id" == "turn-1" && "$hook_runtime_session_id" == "runtime-session-1" && "$hook_raw_command" == "echo hi" ]]; then
+  _pass "preToolUse preserves runtime hook envelope and raw input"
+else
+  _fail "preToolUse hook envelope incomplete: turn='$hook_turn_id' runtime_session='$hook_runtime_session_id' raw_command='$hook_raw_command'"
+fi
+runtime_tool_output=$(_run_telemetry "PreToolUse" "eval-test" '{"session_id":"runtime-session-2","turn_id":"turn-runtime","transcript_path":"/tmp/transcript.jsonl","hook_event_name":"PreToolUse","model":"test-model","cwd":"/tmp","tool_name":"Bash","tool_input":{"command":"echo runtime"}}')
+runtime_tool_type=$(echo "$runtime_tool_output" | jq -r '.event_type // empty' 2>/dev/null)
+runtime_tool_name=$(echo "$runtime_tool_output" | jq -r '.tool.normalized_name // empty' 2>/dev/null)
+runtime_turn_id=$(echo "$runtime_tool_output" | jq -r '.hook.turn_id // empty' 2>/dev/null)
+if [[ "$runtime_tool_type" == "tool.invoke" && "$runtime_tool_name" == "execute_bash" && "$runtime_turn_id" == "turn-runtime" ]]; then
+  _pass "PreToolUse captures runtime-native tool payload"
+else
+  _fail "PreToolUse runtime-native payload incomplete: type='$runtime_tool_type' tool='$runtime_tool_name' turn='$runtime_turn_id'"
+fi
+permission_output=$(_run_telemetry "permissionRequest" "eval-test" '{"cwd":"/tmp","hook_event_name":"PermissionRequest","tool_name":"Bash","tool_input":{"command":"rm -rf /tmp/example","description":"Run escalated shell command"}}')
+permission_event_type=$(echo "$permission_output" | jq -r '.event_type // empty' 2>/dev/null)
+permission_tool_name=$(echo "$permission_output" | jq -r '.tool.name // empty' 2>/dev/null)
+permission_tool_normalized_name=$(echo "$permission_output" | jq -r '.tool.normalized_name // empty' 2>/dev/null)
+permission_description=$(echo "$permission_output" | jq -r '.permission.description // empty' 2>/dev/null)
+if [[ "$permission_event_type" == "tool.permission_request" ]]; then
+  _pass "permissionRequest maps to tool.permission_request"
+else
+  _fail "permissionRequest event_type: expected 'tool.permission_request', got '$permission_event_type'"
+fi
+if [[ "$permission_tool_name" == "Bash" && "$permission_tool_normalized_name" == "execute_bash" && "$permission_description" == "Run escalated shell command" ]]; then
+  _pass "permissionRequest captures tool and approval reason"
+else
+  _fail "permissionRequest missing tool/description: tool='$permission_tool_name' normalized='$permission_tool_normalized_name' description='$permission_description'"
+fi
+runtime_output=$(FLOW_AGENTS_TELEMETRY_RUNTIME=codex _run_telemetry "agentSpawn" "eval-test" '{"cwd":"/tmp"}')
+runtime_name=$(echo "$runtime_output" | jq -r '.agent.runtime // empty' 2>/dev/null)
+if [[ "$runtime_name" == "codex" ]]; then
+  _pass "FLOW_AGENTS_TELEMETRY_RUNTIME controls agent.runtime"
+else
+  _fail "runtime override: expected 'codex', got '$runtime_name'"
+fi
+claude_runtime_output=$(FLOW_AGENTS_TELEMETRY_RUNTIME=claude-code _run_telemetry "agentSpawn" "eval-test" '{"cwd":"/tmp"}')
+claude_runtime_name=$(echo "$claude_runtime_output" | jq -r '.agent.runtime // empty' 2>/dev/null)
+if [[ "$claude_runtime_name" == "claude-code" ]]; then
+  _pass "FLOW_AGENTS_TELEMETRY_RUNTIME supports claude-code runtime"
+else
+  _fail "claude runtime override: expected 'claude-code', got '$claude_runtime_name'"
+fi
+spawn_before=$(wc -l < "$TMPLOG" 2>/dev/null | tr -d ' ')
+_run_telemetry "preToolUse" "eval-test" '{"cwd":"/tmp","tool_name":"spawn_agent","tool_input":{"agent_type":"tool-worker"}}' >/dev/null
+sleep 1
+spawn_delegate=$(tail -n +"$((spawn_before + 1))" "$TMPLOG" 2>/dev/null | jq -r 'select(.event_type == "agent.delegate") | .delegation.targets[0]' 2>/dev/null | head -1)
+if [[ "$spawn_delegate" == "tool-worker" ]]; then
+  _pass "Codex spawn_agent emits agent.delegate"
+else
+  _fail "Codex spawn_agent delegation event missing"
+fi
+agent_before=$(wc -l < "$TMPLOG" 2>/dev/null | tr -d ' ')
+_run_telemetry "preToolUse" "eval-test" '{"cwd":"/tmp","tool_name":"Agent","tool_input":{"subagent_type":"tool-planner"}}' >/dev/null
+sleep 1
+agent_delegate=$(tail -n +"$((agent_before + 1))" "$TMPLOG" 2>/dev/null | jq -r 'select(.event_type == "agent.delegate") | .delegation.targets[0]' 2>/dev/null | head -1)
+if [[ "$agent_delegate" == "tool-planner" ]]; then
+  _pass "Claude Agent tool emits agent.delegate"
+else
+  _fail "Claude Agent delegation event missing"
+fi
+kiro_subagent_before=$(wc -l < "$TMPLOG" 2>/dev/null | tr -d ' ')
+_run_telemetry "preToolUse" "eval-test" '{"cwd":"/tmp","tool_name":"delegate to a specialist agent","tool_input":{"subagents":[{"agent_name":"tool-verifier"},{"agent_name":"tool-code-reviewer"}]}}' >/dev/null
+sleep 1
+kiro_subagent_targets=$(tail -n +"$((kiro_subagent_before + 1))" "$TMPLOG" 2>/dev/null | jq -r 'select(.event_type == "agent.delegate") | .delegation.targets | join(",")' 2>/dev/null | head -1)
+if [[ "$kiro_subagent_targets" == "tool-verifier,tool-code-reviewer" ]]; then
+  _pass "Kiro delegate to a specialist agent emits agent.delegate"
+else
+  _fail "Kiro delegate to a specialist agent delegation event missing: targets='$kiro_subagent_targets'"
+fi
+# --- 6. Redaction on analytics channel ---
+echo ""
+echo "--- Redaction ---"
+redacted=$(_run_telemetry "preToolUse" "eval-test" '{"cwd":"/tmp","tool_name":"test","tool_input":{"secret":"value"}}' "analytics" "tool.input,tool.output,turn.prompt_text,hook.raw_input")
+redacted_input=$(echo "$redacted" | jq -r '.tool.input' 2>/dev/null)
+if [[ "$redacted_input" == "null" ]]; then
+  _pass "Analytics channel redacts tool.input"
+else
+  _fail "Analytics channel did not redact tool.input: $redacted_input"
+fi
+redacted_raw_input=$(echo "$redacted" | jq -r '.hook.raw_input' 2>/dev/null)
+if [[ "$redacted_raw_input" == "null" ]]; then
+  _pass "Analytics channel redacts hook.raw_input"
+else
+  _fail "Analytics channel did not redact hook.raw_input: $redacted_raw_input"
+fi
+codex_log="${TMPDIR_EVAL}/codex-full.jsonl"
+codex_stdout="${TMPDIR_EVAL}/codex-stdout.txt"
+codex_stderr="${TMPDIR_EVAL}/codex-stderr.txt"
+codex_config="${TMPDIR_EVAL}/codex-empty.conf"
+: > "$codex_config"
+printf '%s\n' '{"hook_event_name":"UserPromptSubmit","cwd":"/tmp","prompt":"codex secret","tool_name":"test","tool_input":{"secret":"value"},"tool_response":{"secret":"out"}}' \
+  | env \
+    TELEMETRY_CONFIG_FILE="$codex_config" \
+    TELEMETRY_DATA_DIR="$TMPDIR_EVAL" \
+    TELEMETRY_SESSION_DIR="$TMPDIR_EVAL/sessions" \
+    TELEMETRY_CHANNEL_FULL_LOG_FILE="$codex_log" \
+    FLOW_AGENTS_CODEX_TELEMETRY_CHANNELS=full \
+    FLOW_AGENTS_CODEX_TELEMETRY_FOREGROUND=true \
+    FLOW_AGENTS_TELEMETRY_CAPTURE_RAW_HOOK_INPUT=true \
+    node "$ROOT_DIR/scripts/hooks/codex-telemetry-hook.js" userPromptSubmit eval-test >"$codex_stdout" 2>"$codex_stderr"
+i=0
+while [[ $i -lt 50 && ! -s "$codex_log" ]]; do
+  sleep 0.1; i=$((i + 1))
+done
+codex_event=$(head -1 "$codex_log" 2>/dev/null)
+codex_prompt=$(echo "$codex_event" | jq -r '.turn.prompt_text' 2>/dev/null)
+codex_tool_input=$(echo "$codex_event" | jq -r '.tool.input' 2>/dev/null)
+codex_tool_output=$(echo "$codex_event" | jq -r '.tool.output' 2>/dev/null)
+codex_raw_input=$(echo "$codex_event" | jq -r '.hook.raw_input' 2>/dev/null)
+if [[ "$codex_prompt" == "null" && "$codex_tool_input" == "null" && "$codex_tool_output" == "null" && "$codex_raw_input" == "null" ]]; then
+  _pass "Codex hook defaults redact full-channel sensitive fields"
+else
+  _fail "Codex hook default redaction incomplete: prompt='$codex_prompt' tool_input='$codex_tool_input' tool_output='$codex_tool_output' raw='$codex_raw_input'"
+fi
+if grep -q "TELEMETRY_CHANNEL_FULL_REDACT: process.env.TELEMETRY_CHANNEL_FULL_REDACT || 'none'" "$ROOT_DIR/scripts/hooks/codex-telemetry-hook.js"; then
+  _fail "Codex hook still defaults full redaction to none"
+else
+  _pass "Codex hook source does not default full redaction to none"
+fi
+claude_log="${TMPDIR_EVAL}/claude-full.jsonl"
+claude_stdout="${TMPDIR_EVAL}/claude-stdout.txt"
+claude_stderr="${TMPDIR_EVAL}/claude-stderr.txt"
+printf '%s\n' '{"session_id":"claude-session-1","hook_event_name":"PreToolUse","cwd":"/tmp","tool_name":"Agent","tool_input":{"subagent_type":"tool-verifier","prompt":"verify"}}' \
+  | env \
+    TELEMETRY_CONFIG_FILE="$codex_config" \
+    TELEMETRY_DATA_DIR="$TMPDIR_EVAL" \
+    TELEMETRY_SESSION_DIR="$TMPDIR_EVAL/sessions" \
+    TELEMETRY_CHANNEL_FULL_LOG_FILE="$claude_log" \
+    FLOW_AGENTS_CLAUDE_TELEMETRY_CHANNELS=full \
+    FLOW_AGENTS_CLAUDE_TELEMETRY_FOREGROUND=true \
+    FLOW_AGENTS_TELEMETRY_CAPTURE_RAW_HOOK_INPUT=true \
+    node "$ROOT_DIR/scripts/hooks/claude-telemetry-hook.js" PreToolUse eval-test >"$claude_stdout" 2>"$claude_stderr"
+i=0
+while [[ $i -lt 50 && ! -s "$claude_log" ]]; do
+  sleep 0.1; i=$((i + 1))
+done
+claude_event=$(jq -c 'select(.event_type == "tool.invoke")' "$claude_log" 2>/dev/null | head -1)
+claude_runtime=$(echo "$claude_event" | jq -r '.agent.runtime // empty' 2>/dev/null)
+claude_event_type=$(echo "$claude_event" | jq -r '.event_type // empty' 2>/dev/null)
+claude_delegate=$(grep '"event_type":"agent.delegate"' "$claude_log" 2>/dev/null | jq -r '.delegation.targets[0]' 2>/dev/null | head -1)
+claude_continue=$(jq -r '.continue // empty' "$claude_stdout" 2>/dev/null)
+if [[ "$claude_runtime" == "claude-code" && "$claude_event_type" == "tool.invoke" && "$claude_delegate" == "tool-verifier" && "$claude_continue" == "true" ]]; then
+  _pass "Claude telemetry hook emits normalized tool and delegation events"
+else
+  _fail "Claude telemetry hook output mismatch: runtime='$claude_runtime' event='$claude_event_type' delegate='$claude_delegate' continue='$claude_continue'"
+fi
+# --- 7. Console telemetry transport ---
+echo ""
+echo "--- Console Transport ---"
+console_capture="${TMPDIR_EVAL}/console-request.json"
+fake_bin="${TMPDIR_EVAL}/fake-bin"
+mkdir -p "$fake_bin"
+cat > "${fake_bin}/curl" <<'SH'
+#!/usr/bin/env bash
+set -euo pipefail
+config_file=""
+while [[ $# -gt 0 ]]; do
+  case "$1" in
+    --config)
+      config_file="$2"
+      shift 2
+      ;;
+    *)
+      shift
+      ;;
+  esac
+done
+[[ -n "$config_file" && -n "${FLOW_AGENTS_TEST_CONSOLE_CAPTURE:-}" ]]
+node - "$config_file" "$FLOW_AGENTS_TEST_CONSOLE_CAPTURE" <<'NODE'
+const fs = require("fs");
+const [configPath, capturePath] = process.argv.slice(2);
+const config = fs.readFileSync(configPath, "utf8");
+const lines = config.split(/\r?\n/).filter(Boolean);
+const record = { headers: {}, config };
+for (const line of lines) {
+  const match = line.match(/^([^=]+) = "(.*)"$/);
+  if (!match) continue;
+  const key = match[1].trim();
+  const value = match[2];
+  if (key === "url") record.url = value;
+  if (key === "request") record.method = value;
+  if (key === "header") {
+    const index = value.indexOf(":");
+    if (index >= 0) record.headers[value.slice(0, index).toLowerCase()] = value.slice(index + 1).trim();
+  }
+  if (key === "data-binary" && value.startsWith("@")) {
+    record.body = JSON.parse(fs.readFileSync(value.slice(1), "utf8"));
+  }
+}
+fs.writeFileSync(capturePath, JSON.stringify(record));
+NODE
+SH
+chmod +x "${fake_bin}/curl"
+printf '%s\n' '{"cwd":"/tmp","prompt":"console secret","hook_event_name":"UserPromptSubmit","transcript_path":"/tmp/private/transcript.jsonl","last_assistant_message":"sensitive assistant text"}' \
+  | env \
+    PATH="${fake_bin}:$PATH" \
+    FLOW_AGENTS_TEST_CONSOLE_CAPTURE="$console_capture" \
+    TELEMETRY_ENABLED=true \
+    TELEMETRY_CHANNELS=analytics \
+    TELEMETRY_CHANNEL_ANALYTICS_LOG_FILE="${TMPDIR_EVAL}/console-analytics.jsonl" \
+    TELEMETRY_CONFIG_FILE="$TMPDIR_EVAL/telemetry.conf" \
+    TELEMETRY_DATA_DIR="$TMPDIR_EVAL" \
+    TELEMETRY_SESSION_DIR="$TMPDIR_EVAL/sessions" \
+    FLOW_AGENTS_TELEMETRY_FOREGROUND=true \
+    CONSOLE_TELEMETRY_URL="http://127.0.0.1:3737" \
+    CONSOLE_TELEMETRY_TOKEN="console-token" \
+    CONSOLE_TENANT_ID="tenant-a" \
+    CONSOLE_TELEMETRY_CONNECT_TIMEOUT_SECONDS='1" header = "x-bad: bad' \
+    CONSOLE_TELEMETRY_MAX_TIME_SECONDS='5
+url = "https://bad.example"' \
+    bash "$TELEMETRY_SH" userPromptSubmit eval-test 2>/dev/null
+i=0
+while [[ $i -lt 50 && ! -s "$console_capture" ]]; do
+  sleep 0.1; i=$((i + 1))
+done
+console_url=$(jq -r '.url // empty' "$console_capture" 2>/dev/null)
+console_method=$(jq -r '.method // empty' "$console_capture" 2>/dev/null)
+console_auth=$(jq -r '.headers.authorization // empty' "$console_capture" 2>/dev/null)
+console_tenant=$(jq -r '.headers["x-console-tenant-id"] // empty' "$console_capture" 2>/dev/null)
+console_event_type=$(jq -r '.body.event_type // empty' "$console_capture" 2>/dev/null)
+console_prompt=$(jq -r '.body.turn.prompt_text' "$console_capture" 2>/dev/null)
+console_transcript=$(jq -r '.body.hook.transcript_path' "$console_capture" 2>/dev/null)
+console_assistant=$(jq -r '.body.hook.last_assistant_message' "$console_capture" 2>/dev/null)
+if [[ "$console_url" == "http://127.0.0.1:3737/api/telemetry/records" && "$console_method" == "POST" && "$console_auth" == "Bearer console-token" && "$console_tenant" == "tenant-a" && "$console_event_type" == "turn.user" && "$console_prompt" == "null" && "$console_transcript" == "null" && "$console_assistant" == "null" ]]; then
+  _pass "Console telemetry transport posts redacted event with auth and tenant headers"
+else
+  _fail "Console telemetry transport mismatch: url='$console_url' method='$console_method' auth='$console_auth' tenant='$console_tenant' event='$console_event_type' prompt='$console_prompt' transcript='$console_transcript' assistant='$console_assistant'"
+fi
+# --- 8. discover-agents.sh finds agent cards ---
+echo ""
+echo "--- Agent Discovery ---"
+if [[ -f "$DISCOVER_SCRIPT" ]]; then
+  repo_cards=$(find "$ROOT_DIR/agent-cards" -maxdepth 1 -name '*.json' 2>/dev/null | wc -l | tr -d ' ')
+  if [[ "$repo_cards" -gt 0 ]]; then
+    discover_output=$(bash "$DISCOVER_SCRIPT" 2>/dev/null)
+    card_count=$(echo "$discover_output" | grep -c '📋' || true)
+    if [[ "$card_count" -ge "$repo_cards" ]]; then
+      _pass "discover-agents.sh found $card_count repo-local agent cards"
+    else
+      _fail "discover-agents.sh found $card_count repo-local agent cards, expected at least $repo_cards"
+    fi
+  else
+    # Legacy source-package mode
+    workspace_dir="$(find "$HOME/dev" -maxdepth 5 -name "kiro-agents" -path "*/src/*" -type d 2>/dev/null | head -1)"
+    if [[ -n "$workspace_dir" ]]; then
+      discover_output=$(cd "$(dirname "$workspace_dir")" && bash "$DISCOVER_SCRIPT" 2>/dev/null)
+    else
+      discover_output=$(bash "$DISCOVER_SCRIPT" 2>/dev/null)
+    fi
+    card_count=$(echo "$discover_output" | grep -c '📋' || true)
+    if [[ "$card_count" -ge 3 ]]; then
+      _pass "discover-agents.sh found $card_count legacy agent cards"
+    else
+      src_cards=$(find "$HOME/dev" -maxdepth 5 -name "agent-card.json" -path "*/src/*" 2>/dev/null | wc -l | tr -d ' ')
+      if [[ "$src_cards" -ge 3 ]]; then
+        _pass "discover-agents.sh: $src_cards agent cards exist in source (discovery works at runtime from workspace)"
+      else
+        _fail "discover-agents.sh found 0 cards and only $src_cards in legacy source locations"
+      fi
+    fi
+  fi
+else
+  _fail "discover-agents.sh not found"
+fi
+# --- Cleanup ---
+rm -rf "$TMPDIR_EVAL"
+# --- Summary ---
+echo ""
+echo "==========================="
+total=$((pass + fail))
+echo "Results: ${pass}/${total} passed, ${fail} failed"
+[[ "$fail" -gt 0 ]] && exit 1
+exit 0