npm - beth-copilot - Versions diffs - 1.0.17 → 1.1.0 - Mend

beth-copilot 1.0.17 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (265) hide show

package/CHANGELOG.md +41 -28
package/README.md +87 -247
package/bin/cli.js +115 -7
package/dist/__tests__/smoke.test.d.ts +8 -0
package/dist/__tests__/smoke.test.d.ts.map +1 -0
package/dist/__tests__/smoke.test.js +49 -0
package/dist/__tests__/smoke.test.js.map +1 -0
package/dist/cli/commands/beads.e2e.test.d.ts +13 -0
package/dist/cli/commands/beads.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/beads.e2e.test.js +526 -0
package/dist/cli/commands/beads.e2e.test.js.map +1 -0
package/dist/cli/commands/cli-edge-cases.e2e.test.d.ts +32 -0
package/dist/cli/commands/cli-edge-cases.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/cli-edge-cases.e2e.test.js +162 -0
package/dist/cli/commands/cli-edge-cases.e2e.test.js.map +1 -0
package/dist/cli/commands/close.d.ts +89 -0
package/dist/cli/commands/close.d.ts.map +1 -0
package/dist/cli/commands/close.e2e.test.d.ts +27 -0
package/dist/cli/commands/close.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/close.e2e.test.js +252 -0
package/dist/cli/commands/close.e2e.test.js.map +1 -0
package/dist/cli/commands/close.js +309 -0
package/dist/cli/commands/close.js.map +1 -0
package/dist/cli/commands/close.test.d.ts +15 -0
package/dist/cli/commands/close.test.d.ts.map +1 -0
package/dist/cli/commands/close.test.js +634 -0
package/dist/cli/commands/close.test.js.map +1 -0
package/dist/cli/commands/doctor.d.ts +23 -0
package/dist/cli/commands/doctor.d.ts.map +1 -1
package/dist/cli/commands/doctor.js +93 -0
package/dist/cli/commands/doctor.js.map +1 -1
package/dist/cli/commands/doctor.test.js +209 -0
package/dist/cli/commands/doctor.test.js.map +1 -1
package/dist/cli/commands/framework-isolation.test.d.ts +30 -0
package/dist/cli/commands/framework-isolation.test.d.ts.map +1 -0
package/dist/cli/commands/framework-isolation.test.js +119 -0
package/dist/cli/commands/framework-isolation.test.js.map +1 -0
package/dist/cli/commands/init-logic.e2e.test.d.ts +37 -0
package/dist/cli/commands/init-logic.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/init-logic.e2e.test.js +305 -0
package/dist/cli/commands/init-logic.e2e.test.js.map +1 -0
package/dist/cli/commands/land.d.ts +142 -0
package/dist/cli/commands/land.d.ts.map +1 -0
package/dist/cli/commands/land.js +647 -0
package/dist/cli/commands/land.js.map +1 -0
package/dist/cli/commands/land.test.d.ts +20 -0
package/dist/cli/commands/land.test.d.ts.map +1 -0
package/dist/cli/commands/land.test.js +622 -0
package/dist/cli/commands/land.test.js.map +1 -0
package/dist/cli/commands/pipeline.e2e.test.js +1 -1
package/dist/cli/commands/pipeline.e2e.test.js.map +1 -1
package/dist/cli/commands/pre-push-guard.d.ts +84 -0
package/dist/cli/commands/pre-push-guard.d.ts.map +1 -0
package/dist/cli/commands/pre-push-guard.e2e.test.d.ts +24 -0
package/dist/cli/commands/pre-push-guard.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/pre-push-guard.e2e.test.js +171 -0
package/dist/cli/commands/pre-push-guard.e2e.test.js.map +1 -0
package/dist/cli/commands/pre-push-guard.js +257 -0
package/dist/cli/commands/pre-push-guard.js.map +1 -0
package/dist/cli/commands/pre-push-guard.test.d.ts +15 -0
package/dist/cli/commands/pre-push-guard.test.d.ts.map +1 -0
package/dist/cli/commands/pre-push-guard.test.js +397 -0
package/dist/cli/commands/pre-push-guard.test.js.map +1 -0
package/dist/cli/commands/quickstart-expanded.e2e.test.d.ts +23 -0
package/dist/cli/commands/quickstart-expanded.e2e.test.d.ts.map +1 -0
package/dist/cli/commands/quickstart-expanded.e2e.test.js +179 -0
package/dist/cli/commands/quickstart-expanded.e2e.test.js.map +1 -0
package/dist/cli/commands/quickstart.test.js +40 -2
package/dist/cli/commands/quickstart.test.js.map +1 -1
package/dist/core/agents/suite.test.js +4 -2
package/dist/core/agents/suite.test.js.map +1 -1
package/dist/core/agents/tools.test.js +5 -1
package/dist/core/agents/tools.test.js.map +1 -1
package/dist/index.d.ts +3 -10
package/dist/index.d.ts.map +1 -1
package/dist/index.js +5 -10
package/dist/index.js.map +1 -1
package/package.json +15 -9
package/sbom.json +2011 -819
package/templates/.github/agents/beth.agent.md +222 -45
package/templates/.github/agents/developer.agent.md +37 -67
package/templates/.github/agents/product-manager.agent.md +15 -57
package/templates/.github/agents/researcher.agent.md +20 -60
package/templates/.github/agents/security-reviewer.agent.md +29 -70
package/templates/.github/agents/tester.agent.md +40 -58
package/templates/.github/agents/ux-designer.agent.md +20 -63
package/templates/.github/copilot-instructions.md +217 -204
package/templates/AGENTS.md +108 -20
package/dist/core/context.d.ts +0 -171
package/dist/core/context.d.ts.map +0 -1
package/dist/core/context.js +0 -353
package/dist/core/context.js.map +0 -1
package/dist/core/context.test.d.ts +0 -8
package/dist/core/context.test.d.ts.map +0 -1
package/dist/core/context.test.js +0 -253
package/dist/core/context.test.js.map +0 -1
package/dist/core/handoffs.d.ts +0 -151
package/dist/core/handoffs.d.ts.map +0 -1
package/dist/core/handoffs.js +0 -220
package/dist/core/handoffs.js.map +0 -1
package/dist/core/handoffs.test.d.ts +0 -8
package/dist/core/handoffs.test.d.ts.map +0 -1
package/dist/core/handoffs.test.js +0 -231
package/dist/core/handoffs.test.js.map +0 -1
package/dist/core/orchestrator.d.ts +0 -246
package/dist/core/orchestrator.d.ts.map +0 -1
package/dist/core/orchestrator.js +0 -514
package/dist/core/orchestrator.js.map +0 -1
package/dist/core/orchestrator.test.d.ts +0 -8
package/dist/core/orchestrator.test.d.ts.map +0 -1
package/dist/core/orchestrator.test.js +0 -517
package/dist/core/orchestrator.test.js.map +0 -1
package/dist/core/router.d.ts +0 -102
package/dist/core/router.d.ts.map +0 -1
package/dist/core/router.js +0 -178
package/dist/core/router.js.map +0 -1
package/dist/core/router.test.d.ts +0 -8
package/dist/core/router.test.d.ts.map +0 -1
package/dist/core/router.test.js +0 -215
package/dist/core/router.test.js.map +0 -1
package/dist/init.test.js +0 -288
package/dist/providers/azure.d.ts +0 -147
package/dist/providers/azure.d.ts.map +0 -1
package/dist/providers/azure.js +0 -491
package/dist/providers/azure.js.map +0 -1
package/dist/providers/azure.test.d.ts +0 -11
package/dist/providers/azure.test.d.ts.map +0 -1
package/dist/providers/azure.test.js +0 -330
package/dist/providers/azure.test.js.map +0 -1
package/dist/providers/config.d.ts +0 -87
package/dist/providers/config.d.ts.map +0 -1
package/dist/providers/config.js +0 -193
package/dist/providers/config.js.map +0 -1
package/dist/providers/config.test.d.ts +0 -7
package/dist/providers/config.test.d.ts.map +0 -1
package/dist/providers/config.test.js +0 -370
package/dist/providers/config.test.js.map +0 -1
package/dist/providers/index.d.ts +0 -18
package/dist/providers/index.d.ts.map +0 -1
package/dist/providers/index.js +0 -14
package/dist/providers/index.js.map +0 -1
package/dist/providers/interface.d.ts +0 -191
package/dist/providers/interface.d.ts.map +0 -1
package/dist/providers/interface.js +0 -94
package/dist/providers/interface.js.map +0 -1
package/dist/providers/retry.d.ts +0 -128
package/dist/providers/retry.d.ts.map +0 -1
package/dist/providers/retry.js +0 -205
package/dist/providers/retry.js.map +0 -1
package/dist/providers/retry.test.d.ts +0 -7
package/dist/providers/retry.test.d.ts.map +0 -1
package/dist/providers/retry.test.js +0 -439
package/dist/providers/retry.test.js.map +0 -1
package/dist/providers/streaming.d.ts +0 -157
package/dist/providers/streaming.d.ts.map +0 -1
package/dist/providers/streaming.js +0 -233
package/dist/providers/streaming.js.map +0 -1
package/dist/providers/streaming.test.d.ts +0 -7
package/dist/providers/streaming.test.d.ts.map +0 -1
package/dist/providers/streaming.test.js +0 -372
package/dist/providers/streaming.test.js.map +0 -1
package/dist/providers/types.d.ts +0 -209
package/dist/providers/types.d.ts.map +0 -1
package/dist/providers/types.js +0 -53
package/dist/providers/types.js.map +0 -1
package/dist/providers/types.test.d.ts +0 -7
package/dist/providers/types.test.d.ts.map +0 -1
package/dist/providers/types.test.js +0 -141
package/dist/providers/types.test.js.map +0 -1
package/dist/tools/cli/beads.d.ts +0 -27
package/dist/tools/cli/beads.d.ts.map +0 -1
package/dist/tools/cli/beads.js +0 -172
package/dist/tools/cli/beads.js.map +0 -1
package/dist/tools/cli/beads.test.d.ts +0 -8
package/dist/tools/cli/beads.test.d.ts.map +0 -1
package/dist/tools/cli/beads.test.js +0 -264
package/dist/tools/cli/beads.test.js.map +0 -1
package/dist/tools/cli/editFile.d.ts +0 -17
package/dist/tools/cli/editFile.d.ts.map +0 -1
package/dist/tools/cli/editFile.js +0 -125
package/dist/tools/cli/editFile.js.map +0 -1
package/dist/tools/cli/editFile.test.d.ts +0 -8
package/dist/tools/cli/editFile.test.d.ts.map +0 -1
package/dist/tools/cli/editFile.test.js +0 -177
package/dist/tools/cli/editFile.test.js.map +0 -1
package/dist/tools/cli/readFile.d.ts +0 -25
package/dist/tools/cli/readFile.d.ts.map +0 -1
package/dist/tools/cli/readFile.js +0 -118
package/dist/tools/cli/readFile.js.map +0 -1
package/dist/tools/cli/readFile.test.d.ts +0 -8
package/dist/tools/cli/readFile.test.d.ts.map +0 -1
package/dist/tools/cli/readFile.test.js +0 -194
package/dist/tools/cli/readFile.test.js.map +0 -1
package/dist/tools/cli/search.d.ts +0 -16
package/dist/tools/cli/search.d.ts.map +0 -1
package/dist/tools/cli/search.js +0 -261
package/dist/tools/cli/search.js.map +0 -1
package/dist/tools/cli/search.test.d.ts +0 -8
package/dist/tools/cli/search.test.d.ts.map +0 -1
package/dist/tools/cli/search.test.js +0 -172
package/dist/tools/cli/search.test.js.map +0 -1
package/dist/tools/cli/subagent.d.ts +0 -43
package/dist/tools/cli/subagent.d.ts.map +0 -1
package/dist/tools/cli/subagent.js +0 -99
package/dist/tools/cli/subagent.js.map +0 -1
package/dist/tools/cli/subagent.test.d.ts +0 -8
package/dist/tools/cli/subagent.test.d.ts.map +0 -1
package/dist/tools/cli/subagent.test.js +0 -190
package/dist/tools/cli/subagent.test.js.map +0 -1
package/dist/tools/cli/terminal.d.ts +0 -19
package/dist/tools/cli/terminal.d.ts.map +0 -1
package/dist/tools/cli/terminal.js +0 -164
package/dist/tools/cli/terminal.js.map +0 -1
package/dist/tools/cli/terminal.test.d.ts +0 -8
package/dist/tools/cli/terminal.test.d.ts.map +0 -1
package/dist/tools/cli/terminal.test.js +0 -161
package/dist/tools/cli/terminal.test.js.map +0 -1
package/dist/tools/index.d.ts +0 -25
package/dist/tools/index.d.ts.map +0 -1
package/dist/tools/index.js +0 -41
package/dist/tools/index.js.map +0 -1
package/dist/tools/interface.d.ts +0 -64
package/dist/tools/interface.d.ts.map +0 -1
package/dist/tools/interface.js +0 -37
package/dist/tools/interface.js.map +0 -1
package/dist/tools/interface.test.d.ts +0 -7
package/dist/tools/interface.test.d.ts.map +0 -1
package/dist/tools/interface.test.js +0 -179
package/dist/tools/interface.test.js.map +0 -1
package/dist/tools/mcp/bridge.d.ts +0 -48
package/dist/tools/mcp/bridge.d.ts.map +0 -1
package/dist/tools/mcp/bridge.js +0 -128
package/dist/tools/mcp/bridge.js.map +0 -1
package/dist/tools/mcp/bridge.test.d.ts +0 -8
package/dist/tools/mcp/bridge.test.d.ts.map +0 -1
package/dist/tools/mcp/bridge.test.js +0 -300
package/dist/tools/mcp/bridge.test.js.map +0 -1
package/dist/tools/mcp/client.d.ts +0 -135
package/dist/tools/mcp/client.d.ts.map +0 -1
package/dist/tools/mcp/client.js +0 -263
package/dist/tools/mcp/client.js.map +0 -1
package/dist/tools/mcp/client.test.d.ts +0 -8
package/dist/tools/mcp/client.test.d.ts.map +0 -1
package/dist/tools/mcp/client.test.js +0 -390
package/dist/tools/mcp/client.test.js.map +0 -1
package/dist/tools/registry.d.ts +0 -82
package/dist/tools/registry.d.ts.map +0 -1
package/dist/tools/registry.js +0 -99
package/dist/tools/registry.js.map +0 -1
package/dist/tools/registry.test.d.ts +0 -7
package/dist/tools/registry.test.d.ts.map +0 -1
package/dist/tools/registry.test.js +0 -199
package/dist/tools/registry.test.js.map +0 -1
package/dist/tools/suite.test.d.ts +0 -11
package/dist/tools/suite.test.d.ts.map +0 -1
package/dist/tools/suite.test.js +0 -119
package/dist/tools/suite.test.js.map +0 -1
package/dist/tools/types.d.ts +0 -75
package/dist/tools/types.d.ts.map +0 -1
package/dist/tools/types.js +0 -30
package/dist/tools/types.js.map +0 -1
package/dist/tools/types.test.d.ts +0 -7
package/dist/tools/types.test.d.ts.map +0 -1
package/dist/tools/types.test.js +0 -178
package/dist/tools/types.test.js.map +0 -1

package/CHANGELOG.md CHANGED Viewed

@@ -6,6 +6,46 @@ All notable changes to Beth are documented here. Format based on [Keep a Changel
 ---
+## [1.1.0] - 2026-03-10
+### Added
+- **`npx beth-copilot land` command** — Automates session completion: verifies epic branch, runs tests, backs up beads, stages/commits/pushes, verifies sync. Options: `--skip-tests`, `--skip-backup`, `--message/-m`, `--force`, `--dry-run`. Protected branch blocking, epic ID extraction for commit prefixes, non-blocking beads backup, structured step results.
+- **`npx beth-copilot close` enforcement** — 3-layer close enforcement: (1) open blocker dependencies via `bd dep list`, (2) open children via `bd children`, (3) mandatory test subtasks (unit/e2e/security) for epics. `--force` bypasses all checks.
+- **Pre-push hook** — Git pre-push hook enforcing branch discipline: blocks pushes from `main`/`master` (exit 1), warns on non-epic branch names. Pure shell hook (no Node overhead). Auto-installed during `npx beth-copilot init`. Bypass with `BETH_SKIP_PUSH_GUARD=1`.
+- **Quality gate infrastructure** — `npm run test:gate` generates markdown test reports to `docs/test-reports/`. `scripts/quality-gate.mjs` runs vitest + legacy tests, parses results, generates report, exits non-zero on failure.
+- **Comprehensive CLI test suite** — 7 new test files: `close.e2e.test.ts`, `pre-push-guard.e2e.test.ts`, `quickstart-expanded.e2e.test.ts`, `cli-edge-cases.e2e.test.ts`, `framework-isolation.test.ts`, `init-logic.e2e.test.ts`, `doctor.e2e.test.ts`. 438 tests total (up from 485).
+- **Doctor: Dolt database hygiene** — `checkDoltDatabases()` detects orphaned `*test*` databases and warns when user DB count exceeds threshold. Extracted `parseDoltDatabases()` with 18 unit tests.
+- **Session startup drift-prevention** — Mandatory 4-step session startup checklist in AGENTS.md: check uncommitted changes, unpushed commits, spot-check closed work, sync beads state.
+- **Beads disaster recovery docs** — `docs/BD-BACKUP-PARSER-FAILURE.md` with exact parser error, root cause, repro steps, and 3 recovery paths.
+- **Mandatory test subtask rules** — Epic creation patterns now require unit/E2E/security test subtasks across all agent files.
+### Changed
+- **Hub-and-spoke agent coordination** — Replaced 15 lateral handoffs across 6 agents with single "Escalate to Beth" handoff per agent. Before: 15-edge mesh where agents bypassed orchestration. After: all agents report to Beth.
+- **Skill routing optimization** — Added Skill Routing Table to Beth agent. Subagent templates restructured with explicit skill loading instructions. All 8 skills wired to agents (zero orphaned).
+- **Shared boilerplate extraction** — Replaced ~120 lines of duplicated Work Tracking + Team Coordination across 12 files with compact AGENTS.md reference. Net -260 lines.
+- **Areas of Expertise** migrated to compact on-demand pointers — net -135 lines across 6 agents.
+- **Landing command hardening** — `isUpToDateWithOrigin` rewritten to compare SHA refs directly, `remoteBranchExists()` helper, `gitRebaseAbort()` for conflict recovery.
+- **Simplified architecture diagrams** — All mermaid diagrams in README.md and SYSTEM-FLOW.md rewritten for accuracy. Removed fake component references that don't exist in src/.
+- **Standardized on npm** — Removed `pnpm-lock.yaml`, regenerated `package-lock.json`, added `packageManager` field.
+### Fixed
+- **Pre-push-guard E2E branch assumptions** — Reworked E2E harness to create temporary git repos on explicit branches instead of assuming CI branch state.
+- **Framework isolation** — Fixed `beforeAll`/`afterAll` imports from `node:test` (doesn't export those names; vitest alias masked the problem).
+- **hasStagedChanges false positives** — Now distinguishes exit-1 (diffs) from unexpected errors.
+- **Rebase conflict handling** — Land command now aborts cleanly on rebase conflicts instead of proceeding to push.
+- **Beads E2E test pollution** — `beforeAll` safety net batch-deletes stale test issues from previous failed runs.
+- **Beads database recovery** — Documented recovery from Dolt server database loss after orphaned test DBs overloaded server.
+---
+## [1.0.18] - 2026-03-06
+### Changed
+- **Simplified architecture diagrams** — Cleaned up README mermaid charts, removed A2A branding
+- **Session branch workflow** — Automatic epic branch creation and PR-on-landing patterns
+---
 ## [1.0.15] - 2026-02-19
 ### Added
@@ -15,7 +55,7 @@ All notable changes to Beth are documented here. Format based on [Keep a Changel
 ### Changed
 - **Optional Azure dependencies** — `openai` and `@azure/identity` added as optionalDependencies so users only install them when needed
-- **README rewritten** — Architecture diagrams, tech stack docs, CLI/MCP/A2A/provider documentation
+- **README rewritten** — Architecture diagrams, tech stack docs, CLI/MCP/provider documentation
 ### Fixed
 - **CodeQL security fixes** — Shell command built from environment values, incomplete URL substring sanitization
@@ -37,33 +77,6 @@ All notable changes to Beth are documented here. Format based on [Keep a Changel
 ---
-## [Unreleased]
-### Added
-- **CLI TypeScript foundation** — Migrated CLI to TypeScript with proper build system
-- **Doctor command** — `beth doctor` validates installation and configuration
-- **Quickstart command** — `beth quickstart` for guided setup
-- **Agent schema types** — TypeScript types for agent definitions
-- **Unit tests** — 86 tests passing for CLI commands and path validation
-- **Architecture diagrams** — Interactive mermaid diagrams with zoom in README
-### Changed
-- **DEMO.md** — Rewritten with Beth's personality and beads integration
-- **P2 backlog completed** — Beth orchestrator references added to all agents, MCP skills updated, documentation fixes
-### Fixed
-- Security-reviewer agent format — Removed obsolete `chatagent` wrapper to match standard YAML frontmatter format used by all other agents
-- Removed unnecessary backlog.md CLI dependency
-- Fixed security-reviewer.agent.md syntax errors
-- Corrected agent/skill counts in help output
-- Allowlisted security documentation examples in Gitleaks config
-### Documentation
-- CLI Architecture guide (docs/CLI-ARCHITECTURE.md)
-- CLI Implementation Plan (docs/CLI-IMPLEMENTATION-PLAN.md)
----
 ## [1.0.12] - 2026-02-01
 ### Changed

package/README.md CHANGED Viewed

@@ -12,9 +12,9 @@ They broke her wings once. They forgot she had claws.
 ## What Is This?
-Beth is a **multi-agent AI orchestrator** with a TypeScript runtime, CLI toolchain, MCP integrations, and agent-to-agent (A2A) delegation—all driven by a ruthless coordinator who runs your development team the way Beth Dutton runs Schwartz & Meyer.
+Beth is a **multi-agent AI orchestrator** with a TypeScript runtime, CLI toolchain, MCP integrations, and subagent delegation—all driven by a ruthless coordinator who runs your development team the way Beth Dutton runs Schwartz & Meyer.
-She commands seven specialized agents, each with their own expertise, tools, and handoff chains. On top of the GitHub Copilot agent layer, Beth ships a **TypeScript core engine** with a full agentic loop: agent routing, conversation context management, tool calling, subagent spawning, and agent-to-agent handoffs—all backed by an Azure OpenAI LLM provider with streaming and retry.
+She commands seven specialized agents, each with their own expertise, tools, and handoff chains. On top of the GitHub Copilot agent layer, Beth ships a **TypeScript core engine** with a full agentic loop: agent routing, conversation context management, tool calling, subagent spawning, and agent handoffs—all backed by an Azure OpenAI LLM provider with streaming and retry.
 **The system has four execution layers:**
@@ -33,43 +33,12 @@ She commands seven specialized agents, each with their own expertise, tools, and
 ## Architecture
 ```mermaid
-flowchart TB
-    subgraph Input["Entry Points"]
-        Copilot["VS Code Copilot Chat"]
-        CLI["Beth CLI"]
-    end
-    subgraph Engine["Orchestration Engine"]
-        Orch["Orchestrator<br/><i>Route → LLM → Tools → Response</i>"]
-    end
-    subgraph Agents["Specialist Agents"]
-        Beth["@Beth"]
-        PM["@product-manager"]
-        UX["@ux-designer"]
-        Dev["@developer"]
-        Sec["@security-reviewer"]
-        Test["@tester"]
-        Res["@researcher"]
-    end
-    subgraph Capabilities["Capabilities"]
-        Tools["Tools<br/><i>files · terminal · search · beads</i>"]
-        Skills["Skills<br/><i>PRD · React · shadcn · security</i>"]
-        MCPs["MCP Servers<br/><i>shadcn · Playwright · Azure</i>"]
-    end
-    LLM["Azure OpenAI<br/><i>Entra ID · Streaming</i>"]
-    Copilot & CLI --> Orch
-    Orch --> Beth
-    Beth -->|"delegates"| PM & UX & Dev & Sec & Test & Res
-    Orch <-->|"chat"| LLM
-    Orch --> Tools & Skills & MCPs
+flowchart LR
+    Input["Copilot Chat / CLI"] --> Beth["@Beth"]
+    Beth --> Agents["PM · UX · Dev · Sec · Test · Research"]
+    Beth --> Skills["Skills · MCP"]
     style Beth fill:#1e3a5f,color:#fff
-    style Engine fill:#fff3e0
-    style Capabilities fill:#e3f2fd
 ```
 ---
@@ -133,7 +102,7 @@ For detailed setup (prerequisites, task tracking, MCP servers): [docs/INSTALLATI
 ---
-## Agent-to-Agent (A2A) Orchestration
+## Agent Orchestration
 Beth doesn't micromanage. She delegates to specialists over **subagent** and **handoff** channels, tracks dependencies with beads, and holds every agent accountable.
@@ -149,38 +118,15 @@ Beth doesn't micromanage. She delegates to specialists over **subagent** and **h
 | **@tester** | The Enforcer | Quality assurance, accessibility, performance |
 | **@security-reviewer** | The Bodyguard | OWASP, compliance, threat modeling |
-### A2A Delegation Model
+### Delegation Model
 ```mermaid
-flowchart TB
-    subgraph Orchestration["Beth Orchestration Layer"]
-        BethCore["@Beth<br/><i>Routes work · Spawns subagents</i>"]
-    end
-    subgraph Specialists["Specialist Agents"]
-        PM["@product-manager<br/>Requirements · Priorities"]
-        R["@researcher<br/>User insights · Market intel"]
-        UX["@ux-designer<br/>Component specs · Design tokens"]
-        D["@developer<br/>React/TS/Next.js · Implementation"]
-        S["@security-reviewer<br/>Threat modeling · Vulnerabilities"]
-        T["@tester<br/>QA · a11y · Performance"]
-    end
+flowchart LR
+    Beth["@Beth"] -->|subagent| PM["PM"] & UX["UX"] & Dev["Dev"] & Sec["Sec"] & Test["Test"] & Res["Research"]
+    PM -.->|handoff| UX & Dev
+    Dev -.->|handoff| Test & UX
-    BethCore -->|"Product Strategy"| PM
-    BethCore -->|"User Research"| R
-    BethCore -->|"UX Design"| UX
-    BethCore -->|"Development"| D
-    BethCore -->|"Security Review"| S
-    BethCore -->|"Quality Assurance"| T
-    PM -.->|"subagent"| R
-    PM -.->|"subagent"| UX
-    UX -.->|"subagent"| D
-    D -.->|"subagent"| T
-    S -.->|"subagent"| D
-    T -.->|"subagent"| D
-    style BethCore fill:#1e3a5f,color:#fff
+    style Beth fill:#1e3a5f,color:#fff
 ```
 ### Subagent vs Handoff
@@ -205,33 +151,27 @@ runSubagent({
 sequenceDiagram
     participant U as User
     participant B as Beth
-    participant PM as Product Manager
-    participant UX as UX Designer
-    participant D as Developer
-    participant S as Security
-    participant T as Tester
-    U->>B: "Build me a feature"
-    B->>B: Assess & Plan
-    B->>PM: Define requirements
-    PM-->>B: PRD + user stories
-    B->>UX: Design the experience
-    UX-->>B: Component specs + tokens
-    B->>D: Implement feature
-    D-->>B: Implementation complete
-    par Parallel quality gates
-        B->>S: Security review
-        S-->>B: OWASP approved
+    participant PM as PM
+    participant UX as UX
+    participant D as Dev
+    participant S as Sec
+    participant T as Test
+    U->>B: Request
+    B->>PM: Requirements
+    PM-->>B: PRD
+    B->>UX: Design
+    UX-->>B: Specs
+    B->>D: Build
+    D-->>B: Done
+    par Quality gates
+        B->>S: Security
+        S-->>B: Approved
     and
-        B->>T: Test & verify
-        T-->>B: a11y + regression pass
+        B->>T: Verify
+        T-->>B: Pass
     end
-    B->>U: Feature complete ✅
+    B->>U: Ship ✅
 ```
 **Bug Hunt?** Tester → Developer → Security → Tester
@@ -291,62 +231,39 @@ Skills are domain-knowledge modules that agents load automatically when trigger
 ---
-## Orchestration Engine (Fan-Out Pattern)
+## How It Works
-The orchestration engine is Beth's brain — the full agentic loop that processes user messages through routing, skill injection, LLM calls, tool execution, and subagent spawning.
+Beth runs inside VS Code Copilot Agent Mode. The `@Beth` agent parses requests, delegates to specialist agents via subagent spawning, and tracks work through beads.
 ```mermaid
-flowchart TB
-    User["User Message"] --> Route["AgentRouter\n@mention · skill match · default"]
-    Route --> Context["ConversationContext\nBuild system prompt + history"]
-    Context --> Skills{"Skill triggers match?"}
-    Skills -->|yes| Inject["Inject skill into system prompt"]
-    Skills -->|no| LLM
-    Inject --> LLM["LLM Call\nAzure OpenAI"]
-    LLM --> Decision{"Response type?"}
-    Decision -->|text| Done["Return response"]
-    Decision -->|tool calls| ToolExec["Execute tools\nvia ToolRegistry"]
-    ToolExec --> SubCheck{"Subagent request?"}
-    SubCheck -->|yes| SubAgent["Spawn child loop\ndepth-limited"]
-    SubCheck -->|no| ToolResult["Return tool result"]
-    SubAgent --> ToolResult
-    ToolResult --> LLM
-    Decision -->|handoff| Handoff["HandoffManager\nContext transfer"]
-    Handoff --> Route
-    style User fill:#1e3a5f,color:#fff
-    style LLM fill:#e8f5e9
-    style ToolExec fill:#e3f2fd
-    style SubAgent fill:#fff3e0
+flowchart LR
+    Msg["@Beth message"] --> Route["Agent Router"]
+    Route -->|subagent| Agent["Specialist"]
+    Agent -->|tools| Work["Code · Test · Review"]
+    Agent -->|done| Route
+    Route --> Done["Response"]
+    style Route fill:#1e3a5f,color:#fff
 ```
 **Key capabilities:**
-- **Agent routing** — `@mention` parsing, skill trigger matching, current-agent stickiness
-- **Fan-out tool calling** — Iterative LLM → tool call → result → LLM loop (up to 25 iterations)
-- **Subagent spawning** — Nested agent loops with depth limiting (default: 3 levels deep)
-- **Handoff management** — Context transfer between agents with conversation summaries, ping-pong loop detection
-- **Context window management** — Token-estimated truncation with tool call/result consistency repair
-- **Observer callbacks** — Hook into routing decisions, LLM calls, tool executions, handoffs for logging/UI
+- **Agent routing** — `@mention` parsing, subagent spawning, handoff chains
+- **Skill injection** — Domain knowledge loaded on trigger phrases
+- **Task tracking** — beads (`bd`) for epics, subtasks, dependencies
+- **MCP integration** — Optional external tool servers (shadcn, Playwright, Azure)
-```typescript
-// Full orchestrator usage
-import { Orchestrator, createDefaultRegistry } from 'beth-copilot';
-const orchestrator = new Orchestrator({
-  agents: loadAgents('.github/agents'),
-  skills: loadSkills('.github/skills'),
-  provider: new AzureOpenAIProvider(config),
-  toolRegistry: createDefaultRegistry(),
-  toolContext: { workingDir: process.cwd(), permissions: { ... } },
-});
-const result = await orchestrator.processMessage('Implement the login page');
-// result.response — final text
-// result.agentId — who handled it
-// result.toolCallsExecuted — what tools ran
-// result.subagentResults — any nested agent work
-// result.injectedSkills — skills loaded for this turn
 ```
+@Beth implement the login page
+→ Beth routes to @developer, tracks work in beads
+@Beth review this PR for security vulnerabilities
+→ Beth routes to @security-reviewer, injects security-analysis skill
+@Beth plan the dashboard feature
+→ Beth routes to @product-manager for requirements, then @ux-designer for specs
+```
+> Invoke Beth by selecting `@Beth` in VS Code Copilot Chat (Agent Mode).
 ---
@@ -360,77 +277,47 @@ A uniform interface for all agent capabilities — file I/O, terminal, search, b
 | **editFile** | Atomic string replacement | Single-match enforcement, whitespace-safe |
 | **search** | Ripgrep search | Node.js fallback, regex support, file filtering |
 | **terminal** | Execute shell commands | `execFile('/bin/sh')` — no shell injection, timeouts |
-| **beads** | Issue tracking | `bd create`, `bd close`, `bd list` via CLI wrapper |
+| **beads** | Issue tracking | `bd create`, `npx beth-copilot close`, `bd list` via CLI wrapper |
 | **subagent** | Spawn nested agents | Returns structured result for orchestrator to process |
 | **MCP Bridge** | External tool servers | JSON-RPC 2.0 over stdio, JSONC config, namespaced tools |
 ```typescript
-import { createDefaultRegistry, ToolRegistry, loadAllMCPTools } from 'beth-copilot';
+import { loadAgents, loadSkills, getInferableAgents, buildTriggerMap } from 'beth-copilot';
-// Built-in tools
-const registry = createDefaultRegistry();
-// → readFile, editFile, search, terminal, beads, subagent
+// Inspect loaded agent definitions
+const { agents, errors: agentErrors } = loadAgents('.github/agents');
+// → each AgentDefinition has: id, frontmatter (name, tools, handoffs), body
-// Add MCP server tools
-const { tools: mcpTools } = await loadAllMCPTools('.vscode/mcp.json');
-for (const tool of mcpTools) {
-  registry.register(tool); // e.g., mcp_shadcn_listComponents
-}
+// Find agents available for subagent spawning
+const subagents = getInferableAgents({ agents, errors: agentErrors });
+// → agents with infer: true in frontmatter
-// Get OpenAI function calling definitions
-const definitions = registry.getDefinitions();
-// Pass to LLM as tools parameter
+// Inspect loaded skill modules and their trigger phrases
+const { skills, errors: skillErrors } = loadSkills('.github/skills');
+const triggerMap = buildTriggerMap({ skills, errors: skillErrors });
+// → Map of trigger phrase → SkillDefinition for runtime injection
 ```
 ---
-## LLM Provider Layer
+## CLI Toolchain
-The TypeScript core includes a production-ready provider abstraction for running Beth outside VS Code.
+The CLI handles scaffolding and health checks — distributing agent and skill files to target projects.
 ```mermaid
 flowchart LR
-    subgraph Config["Configuration"]
-        Env["process.env"]
-        DotEnv["~/.beth/.env"]
-    end
-    subgraph Auth["Authentication"]
-        Entra["Entra ID<br/><i>DefaultAzureCredential</i>"]
-    end
-    subgraph Provider["Provider"]
-        Base["LLMProviderBase<br/><i>Abstract interface</i>"]
-        AzureOAI["AzureOpenAIProvider<br/><i>chat · chatStream · countTokens</i>"]
-    end
-    subgraph Resilience["Resilience"]
-        RetryMod["Exponential Backoff<br/><i>Jitter · 3 retries</i>"]
-        Errors["LLMError<br/><i>Typed error codes</i>"]
-    end
-    subgraph Streaming["Streaming"]
-        Accum["StreamAccumulator<br/><i>Content + tool call assembly</i>"]
-        Collect["collectStream<br/><i>Full response</i>"]
-        Map["mapStream<br/><i>Transform chunks</i>"]
-    end
-    Env --> AzureOAI
-    DotEnv --> AzureOAI
-    Entra --> AzureOAI
-    Base --> AzureOAI
-    RetryMod --> AzureOAI
-    AzureOAI --> Accum
-    AzureOAI --> Collect
-    Errors --> RetryMod
+    CLI["beth"] --> Init["init"]
+    CLI --> Doctor["doctor"]
+    CLI --> QS["quickstart"]
+    Init --> Templates[".agent.md · SKILL.md · settings"]
+    Doctor --> Checks["Node ≥18 · beads · agents · skills"]
+    QS --> Init & Doctor
 ```
-**Key capabilities:**
-- **Entra ID auth** — No API keys. Uses `DefaultAzureCredential` (az login, managed identity, VS Code creds)
-- **Streaming** — `chatStream()` yields `ChatChunk` objects with incremental tool call delta assembly
-- **Retry** — Exponential backoff with jitter for 429/5xx/network errors. Non-transient errors fail fast
-- **Config** — `process.env` → `~/.beth/.env` precedence chain
-- **193 provider tests** covering types, retry, config, streaming, and Azure client
+**Commands:**
+- `beth init` — Scaffold agents, skills, VS Code settings, beads tracking
+- `beth doctor` — Validate Node.js, beads CLI, agent frontmatter, skill directories
+- `beth quickstart` — Run init + doctor + beads init in one shot
 ---
@@ -453,7 +340,7 @@ beth/
 │   │   ├── orchestrator.ts         # Agentic loop: route → LLM → tools → response
 │   │   ├── router.ts               # @mention routing, skill matching, agent lookup
 │   │   ├── context.ts              # Conversation state, token truncation, skill injection
-│   │   ├── handoffs.ts             # Agent-to-agent transfers, loop detection
+│   │   ├── handoffs.ts             # Agent handoff transfers, loop detection
 │   │   ├── agents/
 │   │   │   ├── types.ts            # AgentDefinition, AgentFrontmatter, AgentHandoff
 │   │   │   └── loader.ts           # Parse .agent.md → typed definitions
@@ -537,29 +424,8 @@ Beth follows human-centered design methodology across agent workflows:
 ```mermaid
 flowchart LR
-    subgraph Empathize["1. Empathize"]
-        E["@researcher<br/>User interviews<br/>Pain points"]
-    end
-    subgraph Define["2. Define"]
-        D["@product-manager<br/>Problem framing<br/>Requirements"]
-    end
-    subgraph Ideate["3. Ideate"]
-        I["@ux-designer<br/>Component specs<br/>Patterns"]
-    end
-    subgraph Prototype["4. Prototype"]
-        P["@developer<br/>Build to learn<br/>Feature spikes"]
-    end
-    subgraph Test["5. Test"]
-        T["@tester<br/>Validate<br/>Accessibility"]
-    end
-    E --> D --> I --> P --> T
+    E["1. Empathize<br/>@researcher"] --> D["2. Define<br/>@product-manager"] --> I["3. Ideate<br/>@ux-designer"] --> P["4. Prototype<br/>@developer"] --> T["5. Test<br/>@tester"]
     T -.->|iterate| E
-    T -.->|iterate| I
 ```
 ---
@@ -577,36 +443,10 @@ Beth doesn't ship garbage:
 | **Test Coverage** | Unit + Integration + E2E | Tester |
 ```mermaid
-flowchart TB
-    subgraph Standards["Quality Standards"]
-        A11y["WCAG 2.1 AA"]
-        Perf["Core Web Vitals"]
-        Sec["OWASP Compliant"]
-        Type["Full TypeScript"]
-        Coverage["Test Coverage"]
-    end
-    subgraph Gates["Enforcement"]
-        Designer["UX Designer"]
-        Developer["Developer"]
-        Security["Security Reviewer"]
-        Tester["Tester"]
-    end
-    A11y --> Designer
-    Perf --> Developer
-    Sec --> Security
-    Type --> Developer
-    Coverage --> Tester
-    Designer --> Ship{Ship?}
-    Developer --> Ship
-    Security --> Ship
-    Tester --> Ship
-    Ship -->|All Pass| Deploy["🚀 Deploy"]
-    Ship -->|Fail| Fix["🔧 Fix & Retry"]
-    Fix --> Gates
+flowchart LR
+    Code["Code"] --> Gates["a11y · Perf · OWASP · Types · Tests"]
+    Gates -->|Pass| Ship["🚀 Ship"]
+    Gates -->|Fail| Fix["🔧 Fix"] --> Code
 ```
 ---