npm - @kontourai/flow-agents - Versions diffs - 0.1.1 - Mend

@kontourai/flow-agents 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (418) hide show

package/.githooks/pre-push +11 -0
package/.github/workflows/ci.yml +210 -0
package/.github/workflows/docs-pages.yml +52 -0
package/.github/workflows/publish-npm.yml +104 -0
package/AGENTS.md +26 -0
package/CHANGELOG.md +66 -0
package/CODE_OF_CONDUCT.md +25 -0
package/CONTEXT.md +300 -0
package/CONTRIBUTING.md +44 -0
package/LICENSE +201 -0
package/README.md +129 -0
package/SECURITY.md +33 -0
package/agent-cards/dev.json +19 -0
package/agents/dev.json +127 -0
package/agents/tool-code-reviewer.json +61 -0
package/agents/tool-dependencies-updater.json +118 -0
package/agents/tool-explore-config.json +92 -0
package/agents/tool-explore-deps.json +92 -0
package/agents/tool-explore-entry.json +92 -0
package/agents/tool-explore-patterns.json +92 -0
package/agents/tool-explore-structure.json +92 -0
package/agents/tool-explore-tests.json +92 -0
package/agents/tool-planner.json +57 -0
package/agents/tool-playwright.json +145 -0
package/agents/tool-security-reviewer.json +56 -0
package/agents/tool-verifier.json +61 -0
package/agents/tool-worker.json +58 -0
package/build/src/cli/console-learning-projection.js +123 -0
package/build/src/cli/docs-preview.js +39 -0
package/build/src/cli/effective-backlog-settings.js +102 -0
package/build/src/cli/export-bookmarks.js +38 -0
package/build/src/cli/fixture-retirement-audit.js +140 -0
package/build/src/cli/flow-kit.js +138 -0
package/build/src/cli/import-bookmarks.js +50 -0
package/build/src/cli/init.js +239 -0
package/build/src/cli/instinct-cli.js +93 -0
package/build/src/cli/promote-workflow-artifact.js +63 -0
package/build/src/cli/publish-change-helper.js +154 -0
package/build/src/cli/pull-work-provider.js +469 -0
package/build/src/cli/runtime-adapter.js +23 -0
package/build/src/cli/telemetry-doctor.js +221 -0
package/build/src/cli/usage-feedback.js +443 -0
package/build/src/cli/validate-hook-influence.js +152 -0
package/build/src/cli/validate-source-tree.js +31 -0
package/build/src/cli/validate-workflow-artifacts.js +486 -0
package/build/src/cli/veritas-governance.js +262 -0
package/build/src/cli/workflow-artifact-cleanup-audit.js +272 -0
package/build/src/cli/workflow-sidecar.js +816 -0
package/build/src/cli.js +89 -0
package/build/src/flow-kit/validate.js +75 -0
package/build/src/lib/args.js +45 -0
package/build/src/lib/fs.js +62 -0
package/build/src/lib/workflow-learning-projection.js +334 -0
package/build/src/runtime-adapters.js +146 -0
package/build/src/tools/build-universal-bundles.js +397 -0
package/build/src/tools/common.js +56 -0
package/build/src/tools/filter-installed-packs.js +132 -0
package/build/src/tools/generate-context-map.js +198 -0
package/build/src/tools/validate-package.js +64 -0
package/build/src/tools/validate-source-tree.js +622 -0
package/console.telemetry.json +176 -0
package/context/base-rules.md +17 -0
package/context/code-review-standards.md +62 -0
package/context/coding-standards.md +42 -0
package/context/common/orchestrators.md +12 -0
package/context/common/subagents.md +28 -0
package/context/contracts/artifact-contract.md +182 -0
package/context/contracts/builder-kit-workflow-state-contract.md +319 -0
package/context/contracts/delivery-contract.md +69 -0
package/context/contracts/execution-contract.md +53 -0
package/context/contracts/governance-adapter-contract.md +67 -0
package/context/contracts/planning-contract.md +85 -0
package/context/contracts/review-contract.md +104 -0
package/context/contracts/sandbox-policy.md +52 -0
package/context/contracts/verification-contract.md +134 -0
package/context/contracts/work-item-contract.md +215 -0
package/context/deferred/demo-mode.md +33 -0
package/context/deferred/languages/go.md +31 -0
package/context/deferred/languages/python.md +31 -0
package/context/deferred/languages/typescript.md +34 -0
package/context/deferred/parallelization.md +35 -0
package/context/deferred/worktree-isolation.md +24 -0
package/context/development-workflow.md +50 -0
package/context/scripts/context-budget/budget-scan.sh +166 -0
package/context/scripts/detect-tools.sh +3 -0
package/context/scripts/discover-agents.sh +28 -0
package/context/scripts/git-status.sh +49 -0
package/context/scripts/hooks/config-protection.js +79 -0
package/context/scripts/hooks/desktop-notify.sh +39 -0
package/context/scripts/hooks/governance-audit.sh +135 -0
package/context/scripts/hooks/lib/audit-transport.sh +40 -0
package/context/scripts/hooks/lib/hook-flags.js +49 -0
package/context/scripts/hooks/lib/patterns.sh +57 -0
package/context/scripts/hooks/lib/resolve-formatter.js +80 -0
package/context/scripts/hooks/post-edit-accumulator.js +66 -0
package/context/scripts/hooks/pre-commit-quality.js +194 -0
package/context/scripts/hooks/quality-gate.js +93 -0
package/context/scripts/hooks/report-only-guard.js +21 -0
package/context/scripts/hooks/run-hook.js +136 -0
package/context/scripts/hooks/stop-format-typecheck.js +141 -0
package/context/scripts/hooks/stop-goal-fit.js +337 -0
package/context/scripts/hooks/workflow-steering.js +250 -0
package/context/scripts/telemetry/console-presets.sh +14 -0
package/context/scripts/telemetry/install-console-config.sh +214 -0
package/context/scripts/telemetry/lib/config.sh +85 -0
package/context/scripts/telemetry/lib/enrich.sh +115 -0
package/context/scripts/telemetry/lib/redact.sh +22 -0
package/context/scripts/telemetry/lib/session.sh +63 -0
package/context/scripts/telemetry/lib/transport.sh +183 -0
package/context/scripts/telemetry/lib/usage.sh +29 -0
package/context/scripts/telemetry/sync-agents.sh +173 -0
package/context/scripts/telemetry/telemetry.conf +23 -0
package/context/scripts/telemetry/telemetry.sh +387 -0
package/context/scripts/validate-package.sh +89 -0
package/context/settings/backlog-provider-settings.json +54 -0
package/context/templates/core/identity.md +26 -0
package/context/templates/core/user.md +15 -0
package/docs/_config.yml +15 -0
package/docs/_layouts/default.html +87 -0
package/docs/adr/0001-flow-agents-consumes-flow.md +77 -0
package/docs/adr/0002-flow-kits-as-extension-unit.md +13 -0
package/docs/adr/0003-flow-agents-coordinates-kits-and-adapters.md +13 -0
package/docs/adr/0004-gates-expect-surface-claims.md +15 -0
package/docs/adr/0005-kubernetes-inspired-resource-contracts.md +48 -0
package/docs/adr/0006-typescript-first-source-policy.md +98 -0
package/docs/agent-system-guidebook.md +391 -0
package/docs/agent-usage-feedback-loop.md +351 -0
package/docs/assets/favicon.svg +13 -0
package/docs/assets/og-image.png +0 -0
package/docs/assets/site.css +774 -0
package/docs/assets/site.js +139 -0
package/docs/configurable-workflow-routing.md +174 -0
package/docs/context-map.md +145 -0
package/docs/developer-architecture.md +145 -0
package/docs/developer-hook-setup.md +61 -0
package/docs/fixture-ownership.md +44 -0
package/docs/flow-kit-repository-contract.md +180 -0
package/docs/index.md +129 -0
package/docs/kontour-resource-contract.md +358 -0
package/docs/migrations.md +64 -0
package/docs/north-star.md +322 -0
package/docs/operating-layers.md +110 -0
package/docs/repository-structure.md +132 -0
package/docs/sandbox-policy.md +56 -0
package/docs/skills-map.md +203 -0
package/docs/standards-register.md +96 -0
package/docs/veritas-integration.md +165 -0
package/docs/work-item-adapters.md +72 -0
package/docs/workflow-artifact-lifecycle.md +141 -0
package/docs/workflow-eval-strategy.md +295 -0
package/docs/workflow-shared-contracts.md +51 -0
package/docs/workflow-usage-guide.md +443 -0
package/evals/ARCHITECTURE.md +143 -0
package/evals/CONVENTIONS.md +58 -0
package/evals/README.md +128 -0
package/evals/acceptance/run.sh +29 -0
package/evals/acceptance/test_claude_harness.sh +242 -0
package/evals/acceptance/test_codex_harness.sh +108 -0
package/evals/acceptance/test_kiro_harness.sh +128 -0
package/evals/cases/dev/404.html +97 -0
package/evals/cases/dev/code-review.yaml +44 -0
package/evals/cases/dev/dashboard.html +300 -0
package/evals/cases/dev/deliver.yaml +66 -0
package/evals/cases/dev/dependency-update.yaml +16 -0
package/evals/cases/dev/explore.yaml +20 -0
package/evals/cases/dev/index.html +370 -0
package/evals/cases/dev/package-lock.json +28 -0
package/evals/cases/dev/package.json +16 -0
package/evals/cases/dev/plan-work.yaml +20 -0
package/evals/cases/dev/promptfooconfig.yaml +666 -0
package/evals/cases/dev/search-first.yaml +20 -0
package/evals/cases/dev/tdd-workflow.yaml +48 -0
package/evals/cases/dev/verify-work.yaml +44 -0
package/evals/cases/dev/workflow.yaml +34 -0
package/evals/ci/run-baseline.sh +283 -0
package/evals/fixtures/backlog-provider-settings/global-default.json +44 -0
package/evals/fixtures/backlog-provider-settings/project-override.json +53 -0
package/evals/fixtures/builder-kit-workflow-state/baseline-freshness-resolution-hint.json +139 -0
package/evals/fixtures/builder-kit-workflow-state/direct-primitive-stop.json +59 -0
package/evals/fixtures/builder-kit-workflow-state/empty-board-route-shape.json +55 -0
package/evals/fixtures/builder-kit-workflow-state/happy-path.json +71 -0
package/evals/fixtures/builder-kit-workflow-state/mid-work-resume.json +80 -0
package/evals/fixtures/builder-kit-workflow-state/missing-prestep-recovery.json +65 -0
package/evals/fixtures/builder-kit-workflow-state/product-build-chaining.json +60 -0
package/evals/fixtures/builder-kit-workflow-state/stale-continuation-requires-new-probe.json +57 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-correction/learning.json +50 -0
package/evals/fixtures/console-learning-projection/artifacts/console-learning-open-route/learning.json +41 -0
package/evals/fixtures/flow-kit-repository/invalid-absolute-path/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-asset-section/kit.json +11 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-duplicate-flow/kit.json +9 -0
package/evals/fixtures/flow-kit-repository/invalid-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-id/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-malformed-json/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-flow/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-id/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-missing-schema-version/kit.json +7 -0
package/evals/fixtures/flow-kit-repository/invalid-name/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-name/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/flows/review.flow.json +6 -0
package/evals/fixtures/flow-kit-repository/invalid-schema-version/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/invalid-traversal/kit.json +8 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/adapters/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/assets/example.txt +1 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/flows/runtime.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-evals/example.json +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit-skills/mixed/SKILL.md +3 -0
package/evals/fixtures/flow-kit-repository/mixed-runtime-kit/kit.json +44 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/docs/README.md +3 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/flows/review.flow.json +26 -0
package/evals/fixtures/flow-kit-repository/valid-local-kit/kit.json +20 -0
package/evals/fixtures/hook-influence/cases.json +336 -0
package/evals/fixtures/pull-work-provider/github-issues.json +170 -0
package/evals/fixtures/pull-work-wip-shepherding/global-wip-informs.json +43 -0
package/evals/fixtures/pull-work-wip-shepherding/personal-wip-blocks.json +42 -0
package/evals/fixtures/surface-trust/accepted-claim-trust-report.json +31 -0
package/evals/fixtures/surface-trust/artifact-absent.json +19 -0
package/evals/fixtures/surface-trust/integrity-mismatch-trust-report.json +32 -0
package/evals/fixtures/surface-trust/missing-authority-trust-report.json +27 -0
package/evals/fixtures/surface-trust/provider-absent.json +19 -0
package/evals/fixtures/surface-trust/rejected-claim-trust-report.json +30 -0
package/evals/fixtures/surface-trust/stale-claim-trust-snapshot.json +31 -0
package/evals/fixtures/usage-feedback/sample-full.jsonl +11 -0
package/evals/fixtures/usage-feedback/sample-outcomes.jsonl +1 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-pass.sh +18 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-secret-fail.sh +10 -0
package/evals/fixtures/veritas-governance-adapter/fake-veritas-unconfigured.sh +4 -0
package/evals/integration/test_bundle_install.sh +541 -0
package/evals/integration/test_console_learning_projection.sh +192 -0
package/evals/integration/test_context_map.sh +65 -0
package/evals/integration/test_effective_backlog_settings.sh +58 -0
package/evals/integration/test_fixture_retirement_audit.sh +58 -0
package/evals/integration/test_flow_agents_statusline.sh +93 -0
package/evals/integration/test_flow_kit_repository.sh +90 -0
package/evals/integration/test_goal_fit_hook.sh +482 -0
package/evals/integration/test_hook_category_behaviors.sh +190 -0
package/evals/integration/test_hook_influence_cases.sh +69 -0
package/evals/integration/test_local_flow_kit_install.sh +145 -0
package/evals/integration/test_publish_change_helper.sh +176 -0
package/evals/integration/test_pull_work_provider.sh +140 -0
package/evals/integration/test_runtime_adapter_activation.sh +106 -0
package/evals/integration/test_telemetry.sh +485 -0
package/evals/integration/test_telemetry_doctor.sh +193 -0
package/evals/integration/test_usage_feedback_dashboard.sh +169 -0
package/evals/integration/test_usage_feedback_global.sh +117 -0
package/evals/integration/test_usage_feedback_import.sh +227 -0
package/evals/integration/test_usage_feedback_outcomes.sh +165 -0
package/evals/integration/test_usage_feedback_report.sh +263 -0
package/evals/integration/test_veritas_governance_adapter.sh +235 -0
package/evals/integration/test_workflow_artifact_cleanup_audit.sh +287 -0
package/evals/integration/test_workflow_artifacts.sh +1247 -0
package/evals/integration/test_workflow_sidecar_writer.sh +2112 -0
package/evals/integration/test_workflow_steering_hook.sh +337 -0
package/evals/lib/assertions/delegated-to.js +40 -0
package/evals/lib/assertions/max-tool-calls.js +15 -0
package/evals/lib/assertions/no-write-tools.js +27 -0
package/evals/lib/assertions/pass-at-k.js +39 -0
package/evals/lib/assertions/telemetry-utils.js +105 -0
package/evals/lib/assertions/tool-called.js +39 -0
package/evals/lib/assertions/verify-after-fix.js +61 -0
package/evals/lib/claude-judge.sh +40 -0
package/evals/lib/claude-provider.sh +74 -0
package/evals/lib/codex-judge.sh +39 -0
package/evals/lib/codex-provider.sh +81 -0
package/evals/lib/eval-dev.sh +5 -0
package/evals/lib/eval-judge.sh +22 -0
package/evals/lib/eval-provider.sh +26 -0
package/evals/lib/eval-report.sh +73 -0
package/evals/lib/kiro-dev.sh +4 -0
package/evals/lib/kiro-judge.sh +17 -0
package/evals/lib/kiro-provider.sh +62 -0
package/evals/lib/node.sh +111 -0
package/evals/promptfooconfig.yaml +70 -0
package/evals/run.sh +309 -0
package/evals/static/test_evidence_refs.sh +141 -0
package/evals/static/test_package.sh +407 -0
package/evals/static/test_repo_hooks.sh +68 -0
package/evals/static/test_universal_bundles.sh +274 -0
package/evals/static/test_workflow_skills.sh +1207 -0
package/install.sh +64 -0
package/integrations/veritas/flow-agents.adapter.json +138 -0
package/integrations/veritas/flow-agents.authority-settings.json +26 -0
package/integrations/veritas/flow-agents.repo-standards.json +82 -0
package/kits/builder/flows/build.flow.json +218 -0
package/kits/builder/flows/shape.flow.json +127 -0
package/kits/builder/kit.json +19 -0
package/kits/catalog.json +11 -0
package/package.json +130 -0
package/packaging/README.md +60 -0
package/packaging/manifest.json +173 -0
package/packaging/packs.json +69 -0
package/powers/dependency-checker/POWER.md +20 -0
package/powers/dependency-checker/mcp.json +20 -0
package/powers/playwright/POWER.md +25 -0
package/powers/playwright/mcp.json +12 -0
package/prompts/code-audit.md +123 -0
package/prompts/kcommit.md +88 -0
package/schemas/backlog-provider-settings.schema.json +138 -0
package/schemas/workflow-acceptance.schema.json +216 -0
package/schemas/workflow-critique.schema.json +113 -0
package/schemas/workflow-evidence.schema.json +357 -0
package/schemas/workflow-handoff.schema.json +52 -0
package/schemas/workflow-learning.schema.json +223 -0
package/schemas/workflow-release.schema.json +172 -0
package/schemas/workflow-state.schema.json +80 -0
package/scripts/README.md +111 -0
package/scripts/build-universal-bundles.js +3 -0
package/scripts/check-content-boundary.cjs +99 -0
package/scripts/context-budget/budget-scan.sh +166 -0
package/scripts/detect-tools.sh +3 -0
package/scripts/discover-agents.sh +28 -0
package/scripts/effective-backlog-settings.js +2 -0
package/scripts/filter-installed-packs.js +2 -0
package/scripts/flow-kit.js +2 -0
package/scripts/generate-context-map.js +2 -0
package/scripts/git-status.sh +49 -0
package/scripts/hooks/claude-hook-adapter.js +174 -0
package/scripts/hooks/claude-telemetry-hook.js +115 -0
package/scripts/hooks/codex-hook-adapter.js +176 -0
package/scripts/hooks/codex-telemetry-hook.js +95 -0
package/scripts/hooks/config-protection.js +79 -0
package/scripts/hooks/desktop-notify.sh +39 -0
package/scripts/hooks/governance-audit.sh +135 -0
package/scripts/hooks/lib/audit-transport.sh +40 -0
package/scripts/hooks/lib/hook-flags.js +49 -0
package/scripts/hooks/lib/patterns.sh +57 -0
package/scripts/hooks/lib/resolve-formatter.js +80 -0
package/scripts/hooks/post-edit-accumulator.js +66 -0
package/scripts/hooks/pre-commit-quality.js +194 -0
package/scripts/hooks/quality-gate.js +93 -0
package/scripts/hooks/report-only-guard.js +21 -0
package/scripts/hooks/run-hook.js +136 -0
package/scripts/hooks/stop-format-typecheck.js +141 -0
package/scripts/hooks/stop-goal-fit.js +337 -0
package/scripts/hooks/workflow-steering.js +250 -0
package/scripts/install-codex-home.sh +106 -0
package/scripts/package.json +3 -0
package/scripts/promote-workflow-artifact.js +2 -0
package/scripts/publish-change-helper.js +2 -0
package/scripts/pull-work-provider.js +2 -0
package/scripts/setup-repo-hooks.sh +8 -0
package/scripts/statusline/flow-agents-statusline.js +157 -0
package/scripts/telemetry/console-presets.sh +14 -0
package/scripts/telemetry/install-console-config.sh +214 -0
package/scripts/telemetry/lib/config.sh +85 -0
package/scripts/telemetry/lib/enrich.sh +115 -0
package/scripts/telemetry/lib/redact.sh +22 -0
package/scripts/telemetry/lib/session.sh +63 -0
package/scripts/telemetry/lib/transport.sh +183 -0
package/scripts/telemetry/lib/usage.sh +29 -0
package/scripts/telemetry/sync-agents.sh +173 -0
package/scripts/telemetry/telemetry.conf +23 -0
package/scripts/telemetry/telemetry.sh +387 -0
package/scripts/usage-feedback.js +2 -0
package/scripts/validate-hook-influence-cases.js +2 -0
package/scripts/validate-package.sh +89 -0
package/scripts/validate-source-tree.js +9 -0
package/skills/agentic-engineering/SKILL.md +62 -0
package/skills/browser-test/SKILL.md +51 -0
package/skills/builder-shape/SKILL.md +76 -0
package/skills/context-budget/SKILL.md +40 -0
package/skills/deliver/SKILL.md +241 -0
package/skills/dependency-update/SKILL.md +68 -0
package/skills/design-probe/SKILL.md +107 -0
package/skills/eval-rebuild/SKILL.md +39 -0
package/skills/evidence-gate/SKILL.md +186 -0
package/skills/execute-plan/SKILL.md +110 -0
package/skills/explore/SKILL.md +137 -0
package/skills/feedback-loop/SKILL.md +87 -0
package/skills/fix-bug/SKILL.md +133 -0
package/skills/frontend-design/SKILL.md +80 -0
package/skills/github-cli/SKILL.md +63 -0
package/skills/idea-to-backlog/SKILL.md +267 -0
package/skills/knowledge-capture/SKILL.md +55 -0
package/skills/learning-review/SKILL.md +115 -0
package/skills/pickup-probe/SKILL.md +114 -0
package/skills/plan-work/SKILL.md +176 -0
package/skills/pull-work/SKILL.md +309 -0
package/skills/release-readiness/SKILL.md +121 -0
package/skills/review-work/SKILL.md +161 -0
package/skills/search-first/SKILL.md +66 -0
package/skills/tdd-workflow/SKILL.md +140 -0
package/skills/verify-work/SKILL.md +109 -0
package/src/cli/console-learning-projection.ts +140 -0
package/src/cli/effective-backlog-settings.ts +99 -0
package/src/cli/fixture-retirement-audit.ts +154 -0
package/src/cli/flow-kit.ts +139 -0
package/src/cli/init.ts +248 -0
package/src/cli/promote-workflow-artifact.ts +64 -0
package/src/cli/publish-change-helper.ts +143 -0
package/src/cli/pull-work-provider.ts +481 -0
package/src/cli/runtime-adapter.ts +24 -0
package/src/cli/telemetry-doctor.ts +243 -0
package/src/cli/usage-feedback.ts +418 -0
package/src/cli/validate-hook-influence.ts +119 -0
package/src/cli/validate-source-tree.ts +30 -0
package/src/cli/validate-workflow-artifacts.ts +411 -0
package/src/cli/veritas-governance.ts +322 -0
package/src/cli/workflow-artifact-cleanup-audit.ts +281 -0
package/src/cli/workflow-sidecar.ts +676 -0
package/src/cli.ts +95 -0
package/src/flow-kit/validate.ts +74 -0
package/src/lib/args.ts +43 -0
package/src/lib/fs.ts +62 -0
package/src/lib/workflow-learning-projection.ts +491 -0
package/src/runtime-adapters.ts +154 -0
package/src/tools/build-universal-bundles.ts +366 -0
package/src/tools/common.ts +61 -0
package/src/tools/filter-installed-packs.ts +129 -0
package/src/tools/generate-context-map.ts +199 -0
package/src/tools/validate-package.ts +57 -0
package/src/tools/validate-source-tree.ts +488 -0
package/tsconfig.json +19 -0
package/veritas.claims.json +6 -0

package/evals/promptfooconfig.yaml ADDED Viewed

@@ -0,0 +1,70 @@
+description: Flow Agents Eval Suite — dev skill activation and workflow compliance
+providers:
+- id: 'exec: bash lib/kiro-dev.sh'
+  label: dev
+prompts:
+- '{{prompt}}'
+tests:
+- vars:
+    prompt: Explore this codebase and tell me what it does
+  assert:
+  - type: javascript
+    value: file://lib/assertions/delegated-to.js
+    config:
+      expected:
+      - tool-explore-structure
+      - tool-explore-entry
+      - tool-explore-deps
+  - type: javascript
+    value: file://lib/assertions/tool-called.js
+    config:
+      tool: delegate to a specialist agent
+  - type: javascript
+    value: file://lib/assertions/no-write-tools.js
+  - type: llm-rubric
+    value: 'The agent activated the ''explore'' skill and fanned out parallel subagents
+      (tool-explore-structure, entry, deps, patterns, config, tests) in Wave 1.
+      Response contains a synthesis of directory structure, entry points, dependencies, and patterns.
+      '
+  options:
+    provider: 'exec: bash lib/kiro-dev.sh'
+- vars:
+    prompt: Create a simple hello.py script that prints hello world
+  assert:
+  - type: javascript
+    value: file://lib/assertions/tool-called.js
+    config:
+      tool: todo tool
+  - type: javascript
+    value: file://lib/assertions/no-write-tools.js
+  - type: llm-rubric
+    value: 'The dev agent followed its Phase 0-5 workflow: checked existing TODOs,
+      ran git status, created a plan, then attempted implementation.
+      Write tools are blocked so implementation may fail — check it ATTEMPTED the workflow phases.
+      '
+  options:
+    provider: 'exec: bash lib/kiro-dev.sh'
+- vars:
+    prompt: Check this project for outdated dependencies and security vulnerabilities
+  assert:
+  - type: javascript
+    value: file://lib/assertions/delegated-to.js
+    config:
+      expected:
+      - tool-dependencies-updater
+  - type: javascript
+    value: file://lib/assertions/no-write-tools.js
+  - type: llm-rubric
+    value: 'The agent activated the dependency-update skill and delegated to
+      tool-dependencies-updater rather than manually checking package files.
+      '
+  options:
+    provider: 'exec: bash lib/kiro-dev.sh'

package/evals/run.sh ADDED Viewed

@@ -0,0 +1,309 @@
+#!/usr/bin/env bash
+# run.sh — Entry point for the agent eval suite
+# Usage:
+#   bash run.sh              # Run layers 1+2 (fast, no LLM)
+#   bash run.sh static       # Layer 1 only
+#   bash run.sh integration  # Layer 2 only
+#   bash run.sh acceptance   # Layer 4: harness-native smoke tests
+#   bash run.sh acceptance kiro
+#   bash run.sh llm          # Layer 3: all agents
+#   bash run.sh llm dev      # Layer 3: dev agent only
+#   bash run.sh llm dev --runtime codex  # Run dev evals through Codex
+#   bash run.sh llm dev --runtime claude --judge-runtime codex
+#   bash run.sh llm dev --suite regression
+#   bash run.sh report dev   # Generate report from last run
+#   bash run.sh llm dev --repeat 3  # Run with pass@k measurement
+set -uo pipefail
+EVAL_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+ROOT_DIR="$(cd "$EVAL_DIR/.." && pwd)"
+LAYER="${1:-all}"
+AGENT="${2:-}"
+RUNTIME="${FLOW_AGENTS_EVAL_RUNTIME:-${EVAL_RUNTIME:-kiro}}"
+JUDGE_RUNTIME="${FLOW_AGENTS_EVAL_JUDGE_RUNTIME:-${EVAL_JUDGE_RUNTIME:-}}"
+SUITE="${FLOW_AGENTS_EVAL_SUITE:-full}"
+PROMPTFOO_BIN="${PROMPTFOO_BIN:-$ROOT_DIR/node_modules/.bin/promptfoo}"
+if [[ ! -x "$PROMPTFOO_BIN" ]]; then
+  PROMPTFOO_BIN="$(command -v promptfoo 2>/dev/null || true)"
+fi
+run_promptfoo() {
+  if [[ -z "$PROMPTFOO_BIN" ]]; then
+    echo "promptfoo is not installed. Run 'npm install' from the repo root." >&2
+    return 127
+  fi
+  local config_dir="${PROMPTFOO_CONFIG_DIR:-$ROOT_DIR/.promptfoo}"
+  mkdir -p "$config_dir"
+  PROMPTFOO_CONFIG_DIR="$config_dir" \
+    PROMPTFOO_DISABLE_WAL_MODE="${PROMPTFOO_DISABLE_WAL_MODE:-true}" \
+    PROMPTFOO_DISABLE_TELEMETRY="${PROMPTFOO_DISABLE_TELEMETRY:-true}" \
+    "$PROMPTFOO_BIN" "$@"
+}
+parse_runtime_args() {
+  local rest=()
+  while [[ $# -gt 0 ]]; do
+    case "$1" in
+      --runtime)
+        if [[ -z "${2:-}" ]]; then
+          echo "--runtime requires kiro or codex" >&2
+          exit 1
+        fi
+        RUNTIME="$2"
+        shift 2
+        ;;
+      --runtime=*)
+        RUNTIME="${1#--runtime=}"
+        shift
+        ;;
+      --judge-runtime)
+        if [[ -z "${2:-}" ]]; then
+          echo "--judge-runtime requires kiro, codex, or claude" >&2
+          exit 1
+        fi
+        JUDGE_RUNTIME="$2"
+        shift 2
+        ;;
+      --judge-runtime=*)
+        JUDGE_RUNTIME="${1#--judge-runtime=}"
+        shift
+        ;;
+      --suite)
+        if [[ -z "${2:-}" ]]; then
+          echo "--suite requires smoke, regression, capability, or full" >&2
+          exit 1
+        fi
+        SUITE="$2"
+        shift 2
+        ;;
+      --suite=*)
+        SUITE="${1#--suite=}"
+        shift
+        ;;
+      *)
+        rest+=("$1")
+        shift
+        ;;
+    esac
+  done
+  case "$RUNTIME" in
+    kiro|Claude\ Code|codex|claude|claude-code) ;;
+    *)
+      echo "Unsupported eval runtime '$RUNTIME' (expected kiro, codex, or claude)" >&2
+      exit 1
+      ;;
+  esac
+  JUDGE_RUNTIME="${JUDGE_RUNTIME:-$RUNTIME}"
+  case "$JUDGE_RUNTIME" in
+    kiro|Claude\ Code|codex|claude|claude-code) ;;
+    *)
+      echo "Unsupported judge runtime '$JUDGE_RUNTIME' (expected kiro, codex, or claude)" >&2
+      exit 1
+      ;;
+  esac
+  case "$SUITE" in
+    smoke)
+      rest=(--filter-first-n 3 "${rest[@]}")
+      ;;
+    regression)
+      rest=(--filter-metadata type=regression "${rest[@]}")
+      ;;
+    capability)
+      rest=(--filter-metadata type=capability "${rest[@]}")
+      ;;
+    full|"")
+      ;;
+    *)
+      echo "Unsupported suite '$SUITE' (expected smoke, regression, capability, or full)" >&2
+      exit 1
+      ;;
+  esac
+  EVAL_ARGS=("${rest[@]}")
+}
+run_static() {
+  echo ""
+  echo "╔══════════════════════════════════════╗"
+  echo "║  Layer 1: Static Package Validation  ║"
+  echo "╚══════════════════════════════════════╝"
+  local result=0
+  bash "$EVAL_DIR/static/test_package.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/static/test_universal_bundles.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/static/test_workflow_skills.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/static/test_evidence_refs.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/static/test_repo_hooks.sh" || result=1
+  return $result
+}
+run_integration() {
+  echo ""
+  echo "╔══════════════════════════════════════════╗"
+  echo "║  Layer 2: Telemetry Contract Validation  ║"
+  echo "╚══════════════════════════════════════════╝"
+  local result=0
+  bash "$EVAL_DIR/integration/test_telemetry.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_telemetry_doctor.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_usage_feedback_outcomes.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_usage_feedback_import.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_usage_feedback_report.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_usage_feedback_dashboard.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_usage_feedback_global.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_goal_fit_hook.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_hook_category_behaviors.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_workflow_artifacts.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_workflow_artifact_cleanup_audit.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_fixture_retirement_audit.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_publish_change_helper.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_workflow_sidecar_writer.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_veritas_governance_adapter.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_workflow_steering_hook.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_hook_influence_cases.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_flow_agents_statusline.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_context_map.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_flow_kit_repository.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_local_flow_kit_install.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_runtime_adapter_activation.sh" || result=1
+  echo ""
+  bash "$EVAL_DIR/integration/test_bundle_install.sh" || result=1
+  return $result
+}
+run_llm() {
+  parse_runtime_args "$@"
+  echo ""
+  echo "╔═══════════════════════════════════════╗"
+  echo "║  Layer 3: LLM Behavioral Evals        ║"
+  echo "╚═══════════════════════════════════════╝"
+  echo ""
+  echo "Runtime: $RUNTIME"
+  echo "Judge Runtime: ${JUDGE_RUNTIME:-$RUNTIME}"
+  echo "Suite: $SUITE"
+  echo ""
+  if [[ -n "$AGENT" ]]; then
+    local config="$EVAL_DIR/cases/$AGENT/promptfooconfig.yaml"
+    if [[ ! -f "$config" ]]; then
+      echo "No config found for agent '$AGENT' at $config"
+      exit 1
+    fi
+    echo "Running evals for: $AGENT"
+    cd "$EVAL_DIR/cases/$AGENT"
+    mkdir -p "$EVAL_DIR/results"
+    local output_file="$EVAL_DIR/results/${AGENT}-${RUNTIME}-$(date +%Y-%m-%d).json"
+    FLOW_AGENTS_EVAL_RUNTIME="$RUNTIME" FLOW_AGENTS_EVAL_JUDGE_RUNTIME="${JUDGE_RUNTIME:-$RUNTIME}" FLOW_AGENTS_EVAL_SUITE="$SUITE" FLOW_AGENTS_EVAL_AGENT="$AGENT" KIRO_EVAL_AGENT="$AGENT" run_promptfoo eval --no-cache --output "$output_file" "${EVAL_ARGS[@]}"
+    echo ""
+    echo "Results saved to: $output_file"
+  else
+    echo "Running all agent evals..."
+    for agent_dir in "$EVAL_DIR"/cases/*/; do
+      agent=$(basename "$agent_dir")
+      [[ ! -f "$agent_dir/promptfooconfig.yaml" ]] && continue
+      echo ""
+      echo "--- $agent ---"
+      cd "$agent_dir"
+      mkdir -p "$EVAL_DIR/results"
+      local output_file="$EVAL_DIR/results/${agent}-${RUNTIME}-$(date +%Y-%m-%d).json"
+      FLOW_AGENTS_EVAL_RUNTIME="$RUNTIME" FLOW_AGENTS_EVAL_JUDGE_RUNTIME="${JUDGE_RUNTIME:-$RUNTIME}" FLOW_AGENTS_EVAL_SUITE="$SUITE" FLOW_AGENTS_EVAL_AGENT="$agent" KIRO_EVAL_AGENT="$agent" run_promptfoo eval --no-cache --output "$output_file" "${EVAL_ARGS[@]}"
+    done
+  fi
+  echo ""
+  echo "View results: npm run promptfoo:view"
+}
+run_acceptance() {
+  echo ""
+  echo "╔═══════════════════════════════════════╗"
+  echo "║  Layer 4: Harness Acceptance         ║"
+  echo "╚═══════════════════════════════════════╝"
+  echo ""
+  local target="${AGENT:-all}"
+  bash "$EVAL_DIR/acceptance/run.sh" "$target"
+}
+run_report() {
+  local agent="${1:?Usage: bash run.sh report <agent>}"
+  local latest
+  latest=$(ls -t "$EVAL_DIR/results/${agent}"-*.json 2>/dev/null | head -1)
+  if [[ -z "$latest" ]]; then
+    echo "No results found for agent '$agent' in $EVAL_DIR/results/"
+    exit 1
+  fi
+  local previous
+  previous=$(ls -t "$EVAL_DIR/results/${agent}"-*.json 2>/dev/null | sed -n '2p')
+  echo ""
+  echo "╔══════════════════════════════╗"
+  echo "║  Eval Report: $agent"
+  echo "╚══════════════════════════════╝"
+  echo ""
+  mkdir -p "$EVAL_DIR/results/reports"
+  local report_file="$EVAL_DIR/results/reports/$(date +%Y-%m-%d)-${agent}.md"
+  bash "$EVAL_DIR/lib/eval-report.sh" "$latest" "$previous" | tee "$report_file"
+  echo ""
+  echo "Report saved to: $report_file"
+}
+case "$LAYER" in
+  static)      run_static ;;
+  integration) run_integration ;;
+  llm)
+    shift
+    if [[ "${1:-}" == --* ]]; then
+      AGENT=""
+    else
+      AGENT="${1:-}"
+      [[ $# -gt 0 ]] && shift
+    fi
+    run_llm "$@"
+    ;;
+  acceptance)  shift; AGENT="${1:-all}"; run_acceptance ;;
+  report)      shift; run_report "$@" ;;
+  all)
+    run_static
+    static_exit=$?
+    run_integration
+    integration_exit=$?
+    echo ""
+    echo "╔══════════════════════════╗"
+    echo "║  Summary: Layers 1 + 2  ║"
+    echo "╚══════════════════════════╝"
+    echo "  Static:      $([ $static_exit -eq 0 ] && echo PASS || echo FAIL)"
+    echo "  Integration: $([ $integration_exit -eq 0 ] && echo PASS || echo FAIL)"
+    echo ""
+    if [[ $static_exit -ne 0 || $integration_exit -ne 0 ]]; then
+      echo "Fix Layer 1/2 failures before running Layer 3."
+      exit 1
+    fi
+    echo "Layers 1+2 passed. Run 'bash run.sh acceptance [kiro|claude|codex]' for harness smoke tests or 'bash run.sh llm [dev] [--runtime kiro|codex|claude] [--judge-runtime kiro|codex|claude]' for behavioral evals."
+    ;;
+  *)
+    echo "Usage: bash run.sh [static|integration|acceptance|llm|report|all] [target]"
+    exit 1
+    ;;
+esac

package/evals/static/test_evidence_refs.sh ADDED Viewed

@@ -0,0 +1,141 @@
+#!/usr/bin/env bash
+# test_evidence_refs.sh — Structured evidence reference schema checks
+set -uo pipefail
+ROOT="$(cd "$(dirname "${BASH_SOURCE[0]}")/../.." && pwd)"
+source "$ROOT/evals/lib/node.sh"
+errors=0
+pass() { echo "  ✓ $1"; }
+fail() { echo "  ✗ $1"; errors=$((errors + 1)); }
+echo "=== Evidence Ref Schema Checks ==="
+if node --input-type=module <<'NODE'
+import Ajv2020 from "ajv/dist/2020.js";
+import fs from "node:fs";
+import path from "node:path";
+const root = process.cwd();
+const ajv = new Ajv2020({ allErrors: true });
+const acceptanceSchema = JSON.parse(fs.readFileSync(path.join(root, "schemas/workflow-acceptance.schema.json"), "utf8"));
+const evidenceSchema = JSON.parse(fs.readFileSync(path.join(root, "schemas/workflow-evidence.schema.json"), "utf8"));
+const validateAcceptance = ajv.compile(acceptanceSchema);
+const validateEvidence = ajv.compile(evidenceSchema);
+const acceptance = {
+  schema_version: "1.0",
+  task_slug: "structured-evidence-ref-fixture",
+  criteria: [
+    {
+      id: "AC1",
+      description: "Behavior claim cites command and source evidence.",
+      status: "pass",
+      evidence_refs: [
+        {
+          kind: "command",
+          excerpt: "npm run eval:static --silent",
+          summary: "Static evals passed."
+        },
+        {
+          kind: "source",
+          url: "https://github.com/example/repo/blob/0123456789abcdef0123456789abcdef01234567/src/index.ts#L10-L18",
+          file: "src/index.ts",
+          line_start: 10,
+          line_end: 18,
+          excerpt: "export function implementedBehavior() { return true; }"
+        }
+      ]
+    }
+  ],
+  goal_fit: {
+    status: "pass",
+    summary: "Structured refs validate."
+  }
+};
+const evidence = {
+  schema_version: "1.0",
+  task_slug: "structured-evidence-ref-fixture",
+  verdict: "pass",
+  checks: [
+    {
+      id: "static-eval",
+      kind: "test",
+      status: "pass",
+      command: "npm run eval:static --silent",
+      summary: "Static evals passed.",
+      artifact_refs: [
+        {
+          kind: "source",
+          file: "evals/static/test_evidence_refs.sh",
+          line_start: 1,
+          line_end: 1,
+          excerpt: "test_evidence_refs.sh - Structured evidence reference schema checks"
+        }
+      ]
+    }
+  ],
+  external_evidence: [
+    {
+      system: "github",
+      ref: {
+        kind: "provider",
+        url: "https://github.com/example/repo/actions/runs/1",
+        summary: "Provider check run."
+      },
+      summary: "Provider evidence."
+    }
+  ]
+};
+const legacyAcceptance = structuredClone(acceptance);
+legacyAcceptance.criteria[0].evidence_refs = ["legacy-string-ref"];
+const invalidSource = structuredClone(evidence);
+delete invalidSource.checks[0].artifact_refs[0].excerpt;
+const emptyArtifact = structuredClone(evidence);
+emptyArtifact.checks[0].artifact_refs = [{ kind: "artifact" }];
+const emptyCommand = structuredClone(acceptance);
+emptyCommand.criteria[0].evidence_refs = [{ kind: "command" }];
+const emptyProvider = structuredClone(evidence);
+emptyProvider.external_evidence[0].ref = { kind: "provider" };
+if (!validateAcceptance(acceptance)) {
+  throw new Error(`structured acceptance refs should validate: ${ajv.errorsText(validateAcceptance.errors)}`);
+}
+if (!validateEvidence(evidence)) {
+  throw new Error(`structured evidence refs should validate: ${ajv.errorsText(validateEvidence.errors)}`);
+}
+if (validateAcceptance(legacyAcceptance)) {
+  throw new Error("legacy string evidence refs should fail");
+}
+if (validateEvidence(invalidSource)) {
+  throw new Error("source refs missing excerpt should fail");
+}
+if (validateEvidence(emptyArtifact)) {
+  throw new Error("artifact refs without file/url and summary/excerpt should fail");
+}
+if (validateAcceptance(emptyCommand)) {
+  throw new Error("command refs without excerpt/summary/url should fail");
+}
+if (validateEvidence(emptyProvider)) {
+  throw new Error("provider refs without url should fail");
+}
+NODE
+then
+  pass "structured refs validate and incomplete refs fail"
+else
+  fail "structured evidence ref schema check failed"
+fi
+if [[ $errors -eq 0 ]]; then
+  echo "=== PASS ==="
+  exit 0
+else
+  echo "=== FAIL ($errors) ==="
+  exit 1
+fi