npm - @build-astron-co/nimbus - Versions diffs - 0.4.2 → 0.4.3 - Mend

@build-astron-co/nimbus 0.4.2 → 0.4.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (430) hide show

package/dist/src/agent/compaction-agent.js +24 -12
package/dist/src/agent/context-manager.js +2 -1
package/dist/src/agent/expand-files.js +2 -1
package/dist/src/agent/loop.js +71 -33
package/dist/src/agent/permissions.js +4 -2
package/dist/src/agent/system-prompt.js +34 -17
package/dist/src/app.js +1 -1
package/dist/src/auth/keychain.js +8 -4
package/dist/src/auth/store.js +70 -107
package/dist/src/cli/init.js +35 -19
package/dist/src/cli/run.js +18 -10
package/dist/src/cli/serve.js +4 -2
package/dist/src/cli.js +52 -11
package/dist/src/commands/alias.js +5 -3
package/dist/src/commands/audit/index.js +2 -1
package/dist/src/commands/aws-terraform.js +36 -18
package/dist/src/commands/completions.js +1 -1
package/dist/src/commands/config.js +3 -2
package/dist/src/commands/connect-github.js +92 -0
package/dist/src/commands/cost/index.js +3 -2
package/dist/src/commands/deploy.js +15 -10
package/dist/src/commands/doctor.js +6 -3
package/dist/src/commands/drift/index.js +2 -1
package/dist/src/commands/export.js +5 -3
package/dist/src/commands/generate-terraform.js +110 -2
package/dist/src/commands/import.js +3 -3
package/dist/src/commands/incident.js +10 -5
package/dist/src/commands/login.js +8 -93
package/dist/src/commands/logs.js +16 -8
package/dist/src/commands/onboarding.js +6 -4
package/dist/src/commands/pipeline.js +6 -3
package/dist/src/commands/plugin.js +3 -2
package/dist/src/commands/profile.js +27 -14
package/dist/src/commands/questionnaire.js +1 -1
package/dist/src/commands/rollback.js +3 -2
package/dist/src/commands/rollout.js +5 -3
package/dist/src/commands/runbook.js +17 -10
package/dist/src/commands/schedule.js +10 -5
package/dist/src/commands/status.js +2 -1
package/dist/src/commands/team-context.js +12 -7
package/dist/src/commands/template.js +1 -1
package/dist/src/commands/tf/index.js +6 -3
package/dist/src/commands/version.js +6 -3
package/dist/src/commands/watch.js +6 -3
package/dist/src/compat/sqlite.js +5 -3
package/dist/src/config/mode-store.js +2 -1
package/dist/src/config/profiles.js +4 -2
package/dist/src/config/types.js +2 -1
package/dist/src/engine/executor.js +8 -4
package/dist/src/engine/planner.js +9 -5
package/dist/src/llm/providers/anthropic.js +6 -3
package/dist/src/llm/providers/ollama.js +1 -1
package/dist/src/llm/router.js +22 -7
package/dist/src/sessions/manager.js +6 -3
package/dist/src/sharing/viewer.js +2 -1
package/dist/src/tools/file-ops.js +1 -2
package/dist/src/tools/schemas/devops.js +197 -108
package/dist/src/tools/schemas/standard.js +1 -1
package/dist/src/ui/App.js +25 -13
package/dist/src/ui/FileDiffModal.js +22 -11
package/dist/src/ui/HelpModal.js +2 -1
package/dist/src/ui/InputBox.js +6 -3
package/dist/src/ui/MessageList.js +40 -20
package/dist/src/ui/TerminalPane.js +2 -1
package/dist/src/ui/ToolCallDisplay.js +12 -6
package/dist/src/ui/TreePane.js +2 -1
package/dist/src/ui/ink/index.js +37 -21
package/dist/src/watcher/index.js +8 -4
package/package.json +3 -5
package/src/__tests__/alias.test.ts +0 -133
package/src/__tests__/app.test.ts +0 -76
package/src/__tests__/audit.test.ts +0 -877
package/src/__tests__/circuit-breaker.test.ts +0 -116
package/src/__tests__/cli-run.test.ts +0 -351
package/src/__tests__/compat-sqlite.test.ts +0 -68
package/src/__tests__/context-manager.test.ts +0 -632
package/src/__tests__/context.test.ts +0 -242
package/src/__tests__/devops-terminal-gaps.test.ts +0 -718
package/src/__tests__/doctor.test.ts +0 -48
package/src/__tests__/enterprise.test.ts +0 -401
package/src/__tests__/export.test.ts +0 -236
package/src/__tests__/gap-11-18-20.test.ts +0 -958
package/src/__tests__/generator.test.ts +0 -433
package/src/__tests__/helm-streaming.test.ts +0 -127
package/src/__tests__/hooks.test.ts +0 -582
package/src/__tests__/incident.test.ts +0 -179
package/src/__tests__/init.test.ts +0 -487
package/src/__tests__/intent-parser.test.ts +0 -229
package/src/__tests__/llm-router.test.ts +0 -209
package/src/__tests__/logs.test.ts +0 -107
package/src/__tests__/loop-errors.test.ts +0 -244
package/src/__tests__/lsp.test.ts +0 -293
package/src/__tests__/modes.test.ts +0 -336
package/src/__tests__/perf-optimizations.test.ts +0 -847
package/src/__tests__/permissions.test.ts +0 -338
package/src/__tests__/pipeline.test.ts +0 -50
package/src/__tests__/polish-phase3.test.ts +0 -340
package/src/__tests__/profile.test.ts +0 -237
package/src/__tests__/rollback.test.ts +0 -83
package/src/__tests__/runbook.test.ts +0 -219
package/src/__tests__/schedule.test.ts +0 -206
package/src/__tests__/serve.test.ts +0 -275
package/src/__tests__/sessions.test.ts +0 -322
package/src/__tests__/sharing.test.ts +0 -340
package/src/__tests__/snapshots.test.ts +0 -581
package/src/__tests__/standalone-migration.test.ts +0 -199
package/src/__tests__/state-db.test.ts +0 -334
package/src/__tests__/status.test.ts +0 -158
package/src/__tests__/stream-with-tools.test.ts +0 -778
package/src/__tests__/subagents.test.ts +0 -176
package/src/__tests__/system-prompt.test.ts +0 -248
package/src/__tests__/terminal-gap-v2.test.ts +0 -395
package/src/__tests__/terminal-parity.test.ts +0 -393
package/src/__tests__/tf-apply.test.ts +0 -187
package/src/__tests__/tool-converter.test.ts +0 -256
package/src/__tests__/tool-schemas.test.ts +0 -602
package/src/__tests__/tools.test.ts +0 -144
package/src/__tests__/version-json.test.ts +0 -184
package/src/__tests__/version.test.ts +0 -49
package/src/__tests__/watch.test.ts +0 -129
package/src/agent/compaction-agent.ts +0 -266
package/src/agent/context-manager.ts +0 -499
package/src/agent/context.ts +0 -427
package/src/agent/deploy-preview.ts +0 -487
package/src/agent/expand-files.ts +0 -108
package/src/agent/index.ts +0 -68
package/src/agent/loop.ts +0 -1998
package/src/agent/modes.ts +0 -429
package/src/agent/permissions.ts +0 -513
package/src/agent/subagents/base.ts +0 -116
package/src/agent/subagents/cost.ts +0 -51
package/src/agent/subagents/explore.ts +0 -42
package/src/agent/subagents/general.ts +0 -54
package/src/agent/subagents/index.ts +0 -102
package/src/agent/subagents/infra.ts +0 -59
package/src/agent/subagents/security.ts +0 -69
package/src/agent/system-prompt.ts +0 -990
package/src/app.ts +0 -180
package/src/audit/activity-log.ts +0 -290
package/src/audit/compliance-checker.ts +0 -540
package/src/audit/cost-tracker.ts +0 -318
package/src/audit/index.ts +0 -23
package/src/audit/security-scanner.ts +0 -641
package/src/auth/guard.ts +0 -75
package/src/auth/index.ts +0 -56
package/src/auth/keychain.ts +0 -82
package/src/auth/oauth.ts +0 -465
package/src/auth/providers.ts +0 -470
package/src/auth/sso.ts +0 -113
package/src/auth/store.ts +0 -505
package/src/auth/types.ts +0 -187
package/src/build.ts +0 -141
package/src/cli/index.ts +0 -16
package/src/cli/init.ts +0 -1227
package/src/cli/openapi-spec.ts +0 -356
package/src/cli/run.ts +0 -628
package/src/cli/serve-auth.ts +0 -80
package/src/cli/serve.ts +0 -539
package/src/cli/web.ts +0 -71
package/src/cli.ts +0 -1728
package/src/clients/core-engine-client.ts +0 -227
package/src/clients/enterprise-client.ts +0 -334
package/src/clients/generator-client.ts +0 -351
package/src/clients/git-client.ts +0 -627
package/src/clients/github-client.ts +0 -410
package/src/clients/helm-client.ts +0 -504
package/src/clients/index.ts +0 -80
package/src/clients/k8s-client.ts +0 -497
package/src/clients/llm-client.ts +0 -161
package/src/clients/rest-client.ts +0 -130
package/src/clients/service-discovery.ts +0 -38
package/src/clients/terraform-client.ts +0 -482
package/src/clients/tools-client.ts +0 -1843
package/src/clients/ws-client.ts +0 -115
package/src/commands/alias.ts +0 -100
package/src/commands/analyze/index.ts +0 -352
package/src/commands/apply/helm.ts +0 -473
package/src/commands/apply/index.ts +0 -213
package/src/commands/apply/k8s.ts +0 -454
package/src/commands/apply/terraform.ts +0 -582
package/src/commands/ask.ts +0 -167
package/src/commands/audit/index.ts +0 -357
package/src/commands/auth-cloud.ts +0 -407
package/src/commands/auth-list.ts +0 -134
package/src/commands/auth-profile.ts +0 -121
package/src/commands/auth-refresh.ts +0 -187
package/src/commands/auth-status.ts +0 -141
package/src/commands/aws/ec2.ts +0 -501
package/src/commands/aws/iam.ts +0 -397
package/src/commands/aws/index.ts +0 -133
package/src/commands/aws/lambda.ts +0 -396
package/src/commands/aws/rds.ts +0 -439
package/src/commands/aws/s3.ts +0 -439
package/src/commands/aws/vpc.ts +0 -393
package/src/commands/aws-discover.ts +0 -542
package/src/commands/aws-terraform.ts +0 -755
package/src/commands/azure/aks.ts +0 -376
package/src/commands/azure/functions.ts +0 -253
package/src/commands/azure/index.ts +0 -116
package/src/commands/azure/storage.ts +0 -478
package/src/commands/azure/vm.ts +0 -355
package/src/commands/billing/index.ts +0 -256
package/src/commands/chat.ts +0 -320
package/src/commands/completions.ts +0 -268
package/src/commands/config.ts +0 -372
package/src/commands/cost/cloud-cost-estimator.ts +0 -266
package/src/commands/cost/estimator.ts +0 -79
package/src/commands/cost/index.ts +0 -810
package/src/commands/cost/parsers/terraform.ts +0 -273
package/src/commands/cost/parsers/types.ts +0 -25
package/src/commands/cost/pricing/aws.ts +0 -544
package/src/commands/cost/pricing/azure.ts +0 -499
package/src/commands/cost/pricing/gcp.ts +0 -396
package/src/commands/cost/pricing/index.ts +0 -40
package/src/commands/demo.ts +0 -250
package/src/commands/deploy.ts +0 -260
package/src/commands/doctor.ts +0 -1386
package/src/commands/drift/index.ts +0 -787
package/src/commands/explain.ts +0 -277
package/src/commands/export.ts +0 -146
package/src/commands/feedback.ts +0 -389
package/src/commands/fix.ts +0 -324
package/src/commands/fs/index.ts +0 -402
package/src/commands/gcp/compute.ts +0 -325
package/src/commands/gcp/functions.ts +0 -271
package/src/commands/gcp/gke.ts +0 -438
package/src/commands/gcp/iam.ts +0 -344
package/src/commands/gcp/index.ts +0 -129
package/src/commands/gcp/storage.ts +0 -284
package/src/commands/generate-helm.ts +0 -1249
package/src/commands/generate-k8s.ts +0 -1508
package/src/commands/generate-terraform.ts +0 -1202
package/src/commands/gh/index.ts +0 -863
package/src/commands/git/index.ts +0 -1343
package/src/commands/helm/index.ts +0 -1126
package/src/commands/help.ts +0 -715
package/src/commands/history.ts +0 -149
package/src/commands/import.ts +0 -868
package/src/commands/incident.ts +0 -166
package/src/commands/index.ts +0 -367
package/src/commands/init.ts +0 -1051
package/src/commands/k8s/index.ts +0 -1137
package/src/commands/login.ts +0 -716
package/src/commands/logout.ts +0 -83
package/src/commands/logs.ts +0 -167
package/src/commands/onboarding.ts +0 -405
package/src/commands/pipeline.ts +0 -186
package/src/commands/plan/display.ts +0 -279
package/src/commands/plan/index.ts +0 -599
package/src/commands/plugin.ts +0 -398
package/src/commands/preview.ts +0 -452
package/src/commands/profile.ts +0 -342
package/src/commands/questionnaire.ts +0 -1172
package/src/commands/resume.ts +0 -47
package/src/commands/rollback.ts +0 -315
package/src/commands/rollout.ts +0 -88
package/src/commands/runbook.ts +0 -346
package/src/commands/schedule.ts +0 -236
package/src/commands/status.ts +0 -252
package/src/commands/team/index.ts +0 -346
package/src/commands/team-context.ts +0 -220
package/src/commands/template.ts +0 -233
package/src/commands/tf/index.ts +0 -1093
package/src/commands/upgrade.ts +0 -609
package/src/commands/usage/index.ts +0 -134
package/src/commands/version.ts +0 -174
package/src/commands/watch.ts +0 -153
package/src/compat/index.ts +0 -2
package/src/compat/runtime.ts +0 -12
package/src/compat/sqlite.ts +0 -177
package/src/config/index.ts +0 -17
package/src/config/manager.ts +0 -530
package/src/config/mode-store.ts +0 -62
package/src/config/profiles.ts +0 -84
package/src/config/safety-policy.ts +0 -358
package/src/config/schema.ts +0 -125
package/src/config/types.ts +0 -609
package/src/config/workspace-state.ts +0 -53
package/src/context/context-db.ts +0 -199
package/src/demo/index.ts +0 -349
package/src/demo/scenarios/full-journey.ts +0 -229
package/src/demo/scenarios/getting-started.ts +0 -127
package/src/demo/scenarios/helm-release.ts +0 -341
package/src/demo/scenarios/k8s-deployment.ts +0 -194
package/src/demo/scenarios/terraform-vpc.ts +0 -170
package/src/demo/types.ts +0 -92
package/src/engine/cost-estimator.ts +0 -480
package/src/engine/diagram-generator.ts +0 -256
package/src/engine/drift-detector.ts +0 -902
package/src/engine/executor.ts +0 -1066
package/src/engine/index.ts +0 -76
package/src/engine/orchestrator.ts +0 -636
package/src/engine/planner.ts +0 -787
package/src/engine/safety.ts +0 -743
package/src/engine/verifier.ts +0 -770
package/src/enterprise/audit.ts +0 -348
package/src/enterprise/auth.ts +0 -270
package/src/enterprise/billing.ts +0 -822
package/src/enterprise/index.ts +0 -17
package/src/enterprise/teams.ts +0 -443
package/src/generator/best-practices.ts +0 -1608
package/src/generator/helm.ts +0 -630
package/src/generator/index.ts +0 -37
package/src/generator/intent-parser.ts +0 -514
package/src/generator/kubernetes.ts +0 -976
package/src/generator/terraform.ts +0 -1875
package/src/history/index.ts +0 -8
package/src/history/manager.ts +0 -250
package/src/history/types.ts +0 -34
package/src/hooks/config.ts +0 -432
package/src/hooks/engine.ts +0 -392
package/src/hooks/index.ts +0 -4
package/src/llm/auth-bridge.ts +0 -198
package/src/llm/circuit-breaker.ts +0 -140
package/src/llm/config-loader.ts +0 -201
package/src/llm/cost-calculator.ts +0 -171
package/src/llm/index.ts +0 -8
package/src/llm/model-aliases.ts +0 -115
package/src/llm/provider-registry.ts +0 -63
package/src/llm/providers/anthropic.ts +0 -462
package/src/llm/providers/bedrock.ts +0 -477
package/src/llm/providers/google.ts +0 -405
package/src/llm/providers/ollama.ts +0 -767
package/src/llm/providers/openai-compatible.ts +0 -340
package/src/llm/providers/openai.ts +0 -328
package/src/llm/providers/openrouter.ts +0 -338
package/src/llm/router.ts +0 -1104
package/src/llm/types.ts +0 -232
package/src/lsp/client.ts +0 -298
package/src/lsp/languages.ts +0 -119
package/src/lsp/manager.ts +0 -294
package/src/mcp/client.ts +0 -402
package/src/mcp/index.ts +0 -5
package/src/mcp/manager.ts +0 -133
package/src/nimbus.ts +0 -234
package/src/plugins/index.ts +0 -27
package/src/plugins/loader.ts +0 -334
package/src/plugins/manager.ts +0 -376
package/src/plugins/types.ts +0 -284
package/src/scanners/cicd-scanner.ts +0 -258
package/src/scanners/cloud-scanner.ts +0 -466
package/src/scanners/framework-scanner.ts +0 -469
package/src/scanners/iac-scanner.ts +0 -388
package/src/scanners/index.ts +0 -539
package/src/scanners/language-scanner.ts +0 -276
package/src/scanners/package-manager-scanner.ts +0 -277
package/src/scanners/types.ts +0 -172
package/src/sessions/manager.ts +0 -472
package/src/sessions/types.ts +0 -44
package/src/sharing/sync.ts +0 -300
package/src/sharing/viewer.ts +0 -163
package/src/snapshots/index.ts +0 -2
package/src/snapshots/manager.ts +0 -530
package/src/state/artifacts.ts +0 -147
package/src/state/audit.ts +0 -137
package/src/state/billing.ts +0 -240
package/src/state/checkpoints.ts +0 -117
package/src/state/config.ts +0 -67
package/src/state/conversations.ts +0 -14
package/src/state/credentials.ts +0 -154
package/src/state/db.ts +0 -58
package/src/state/index.ts +0 -26
package/src/state/messages.ts +0 -115
package/src/state/projects.ts +0 -123
package/src/state/schema.ts +0 -236
package/src/state/sessions.ts +0 -147
package/src/state/teams.ts +0 -200
package/src/telemetry.ts +0 -108
package/src/tools/aws-ops.ts +0 -952
package/src/tools/azure-ops.ts +0 -579
package/src/tools/file-ops.ts +0 -615
package/src/tools/gcp-ops.ts +0 -625
package/src/tools/git-ops.ts +0 -773
package/src/tools/github-ops.ts +0 -799
package/src/tools/helm-ops.ts +0 -943
package/src/tools/index.ts +0 -17
package/src/tools/k8s-ops.ts +0 -819
package/src/tools/schemas/converter.ts +0 -184
package/src/tools/schemas/devops.ts +0 -3502
package/src/tools/schemas/index.ts +0 -73
package/src/tools/schemas/standard.ts +0 -1148
package/src/tools/schemas/types.ts +0 -735
package/src/tools/spawn-exec.ts +0 -148
package/src/tools/terraform-ops.ts +0 -862
package/src/types/ambient.d.ts +0 -193
package/src/types/config.ts +0 -83
package/src/types/drift.ts +0 -116
package/src/types/enterprise.ts +0 -335
package/src/types/index.ts +0 -20
package/src/types/plan.ts +0 -44
package/src/types/request.ts +0 -65
package/src/types/response.ts +0 -54
package/src/types/service.ts +0 -51
package/src/ui/App.tsx +0 -2114
package/src/ui/DeployPreview.tsx +0 -174
package/src/ui/FileDiffModal.tsx +0 -162
package/src/ui/Header.tsx +0 -131
package/src/ui/HelpModal.tsx +0 -57
package/src/ui/InputBox.tsx +0 -503
package/src/ui/MessageList.tsx +0 -1032
package/src/ui/PermissionPrompt.tsx +0 -163
package/src/ui/StatusBar.tsx +0 -277
package/src/ui/TerminalPane.tsx +0 -84
package/src/ui/ToolCallDisplay.tsx +0 -643
package/src/ui/TreePane.tsx +0 -132
package/src/ui/chat-ui.ts +0 -850
package/src/ui/index.ts +0 -33
package/src/ui/ink/index.ts +0 -1444
package/src/ui/streaming.ts +0 -176
package/src/ui/theme.ts +0 -104
package/src/ui/types.ts +0 -75
package/src/utils/analytics.ts +0 -72
package/src/utils/cost-warning.ts +0 -27
package/src/utils/env.ts +0 -46
package/src/utils/errors.ts +0 -69
package/src/utils/event-bus.ts +0 -38
package/src/utils/index.ts +0 -24
package/src/utils/logger.ts +0 -171
package/src/utils/rate-limiter.ts +0 -121
package/src/utils/service-auth.ts +0 -49
package/src/utils/validation.ts +0 -53
package/src/version.ts +0 -4
package/src/watcher/index.ts +0 -214
package/src/wizard/approval.ts +0 -383
package/src/wizard/index.ts +0 -25
package/src/wizard/prompts.ts +0 -338
package/src/wizard/types.ts +0 -172
package/src/wizard/ui.ts +0 -556
package/src/wizard/wizard.ts +0 -304
package/tsconfig.json +0 -24

package/src/llm/router.ts DELETED Viewed

@@ -1,1104 +0,0 @@
-/**
- * LLM Router
- * Routes requests to the appropriate provider based on model, cost optimization, and fallback logic.
- *
- * Refactored for the embedded Nimbus architecture. Key changes from the microservice version:
- * - Imports providers from local ./providers/ directory
- * - Integrates model alias resolution via resolveModelAlias
- * - Integrates auto-detection via detectProvider
- * - Supports OpenAI-compatible and Bedrock providers via env vars
- * - persistUsage writes to the embedded SQLite usage table (fire-and-forget)
- */
-import { logger } from '../utils';
-import {
-  getTextContent,
-  type LLMProvider,
-  type CompletionRequest,
-  type LLMResponse,
-  type StreamChunk,
-  type ToolCompletionRequest,
-} from './types';
-import { AnthropicProvider } from './providers/anthropic';
-import { OpenAIProvider } from './providers/openai';
-import { GoogleProvider } from './providers/google';
-import { OllamaProvider } from './providers/ollama';
-import { OpenRouterProvider } from './providers/openrouter';
-import { OpenAICompatibleProvider } from './providers/openai-compatible';
-import { BedrockProvider } from './providers/bedrock';
-import { calculateCost, type CostResult } from './cost-calculator';
-import { resolveModelAlias, stripProviderPrefix } from './model-aliases';
-import { detectProvider } from './provider-registry';
-import { ProviderCircuitBreaker } from './circuit-breaker';
-export interface RouterConfig {
-  defaultProvider: string;
-  defaultModel: string;
-  costOptimization: {
-    enabled: boolean;
-    cheapModelFor: string[];
-    expensiveModelFor: string[];
-    cheapModel: string;
-    expensiveModel: string;
-  };
-  fallback: {
-    enabled: boolean;
-    providers: string[];
-  };
-  tokenBudget?: {
-    maxTokensPerRequest?: number;
-  };
-}
-export interface ProviderInfo {
-  name: string;
-  available: boolean;
-  models: string[];
-}
-/**
- * Metadata emitted by the streaming fallback to indicate which provider
- * is actually serving the response.  The WebSocket handler inspects this
- * to notify clients of provider switches.
- */
-export interface StreamFallbackMeta {
-  /** The provider that is actively streaming. */
-  activeProvider: string;
-  /** If a fallback occurred, the provider that originally failed. */
-  failedProvider?: string;
-  /** True when this stream is being served by a fallback provider. */
-  isFallback: boolean;
-}
-export class LLMRouter {
-  private providers: Map<string, LLMProvider>;
-  private config: RouterConfig;
-  private circuitBreaker = new ProviderCircuitBreaker();
-  /**
-   * Populated during streaming with fallback so callers (e.g. WebSocket)
-   * can inspect which provider ended up serving the stream.  Reset on
-   * every call to routeStream / executeStreamWithFallback.
-   */
-  lastStreamFallbackMeta: StreamFallbackMeta | null = null;
-  constructor(config?: Partial<RouterConfig>) {
-    this.providers = new Map();
-    this.config = {
-      defaultProvider: config?.defaultProvider || process.env.DEFAULT_PROVIDER || 'anthropic',
-      defaultModel: config?.defaultModel || process.env.DEFAULT_MODEL || 'claude-sonnet-4-20250514',
-      costOptimization: {
-        enabled:
-          config?.costOptimization?.enabled ?? process.env.ENABLE_COST_OPTIMIZATION === 'true',
-        cheapModelFor: config?.costOptimization?.cheapModelFor || [
-          'simple_queries',
-          'summarization',
-          'classification',
-          'explanations',
-        ],
-        expensiveModelFor: config?.costOptimization?.expensiveModelFor || [
-          'code_generation',
-          'complex_reasoning',
-          'planning',
-        ],
-        cheapModel:
-          config?.costOptimization?.cheapModel ||
-          process.env.CHEAP_MODEL ||
-          'claude-haiku-4-20250514',
-        expensiveModel:
-          config?.costOptimization?.expensiveModel ||
-          process.env.EXPENSIVE_MODEL ||
-          'claude-opus-4-20250514',
-      },
-      fallback: {
-        enabled: config?.fallback?.enabled ?? process.env.DISABLE_FALLBACK !== 'true',
-        providers:
-          config?.fallback?.providers ||
-          (process.env.FALLBACK_PROVIDERS?.split(',') ?? [
-            'anthropic',
-            'openai',
-            'openrouter',
-            'google',
-          ]),
-      },
-    };
-    this.initializeProviders();
-  }
-  /**
-   * Initialize all available providers based on API keys, auth.json, and environment variables.
-   *
-   * Resolution order per provider:
-   *   1. auth.json (~/.nimbus/auth.json) via the auth-bridge
-   *   2. Environment variables (ANTHROPIC_API_KEY, etc.)
-   */
-  private initializeProviders(): void {
-    // Lazy-import the auth-bridge to avoid circular deps at module level
-    let isConfigured: (name: string) => boolean;
-    let getApiKey: (name: string) => string | undefined;
-    try {
-      // eslint-disable-next-line @typescript-eslint/no-var-requires
-      const bridge = require('./auth-bridge');
-      isConfigured = bridge.isProviderConfigured;
-      getApiKey = bridge.getProviderApiKey;
-    } catch (err) {
-      // Auth-bridge unavailable (open-source build) — fall back to env-only
-      logger.debug(
-        'Auth-bridge unavailable, using environment variables only:',
-        err instanceof Error ? err.message : String(err)
-      );
-      isConfigured = () => false;
-      getApiKey = () => undefined;
-    }
-    // Anthropic
-    if (process.env.ANTHROPIC_API_KEY || isConfigured('anthropic')) {
-      this.providers.set('anthropic', new AnthropicProvider());
-      logger.info('Initialized Anthropic provider');
-    }
-    // OpenAI
-    if (process.env.OPENAI_API_KEY || isConfigured('openai')) {
-      this.providers.set('openai', new OpenAIProvider());
-      logger.info('Initialized OpenAI provider');
-    }
-    // Google
-    if (process.env.GOOGLE_API_KEY || isConfigured('google')) {
-      this.providers.set('google', new GoogleProvider());
-      logger.info('Initialized Google provider');
-    }
-    // OpenRouter
-    if (process.env.OPENROUTER_API_KEY || isConfigured('openrouter')) {
-      this.providers.set('openrouter', new OpenRouterProvider());
-      logger.info('Initialized OpenRouter provider');
-    }
-    // Ollama (only if explicitly configured via auth.json or env var)
-    if (process.env.OLLAMA_BASE_URL || isConfigured('ollama')) {
-      this.providers.set('ollama', new OllamaProvider());
-      logger.info('Initialized Ollama provider');
-    }
-    // AWS Bedrock (uses IAM credentials from environment / instance profile)
-    if (
-      process.env.AWS_BEDROCK_ENABLED === 'true' ||
-      process.env.AWS_REGION ||
-      isConfigured('bedrock') ||
-      (process.env.AWS_ACCESS_KEY_ID && process.env.AWS_SECRET_ACCESS_KEY)
-    ) {
-      this.providers.set('bedrock', new BedrockProvider());
-      logger.info('Initialized AWS Bedrock provider');
-    }
-    // Groq (OpenAI-compatible)
-    const groqKey = process.env.GROQ_API_KEY || getApiKey('groq');
-    if (groqKey) {
-      this.providers.set(
-        'groq',
-        new OpenAICompatibleProvider({
-          name: 'groq',
-          apiKey: groqKey,
-          baseURL: 'https://api.groq.com/openai/v1',
-          defaultModel: 'llama-3.1-70b-versatile',
-        })
-      );
-      logger.info('Initialized Groq provider (OpenAI-compatible)');
-    }
-    // Together AI (OpenAI-compatible)
-    const togetherKey = process.env.TOGETHER_API_KEY || getApiKey('together');
-    if (togetherKey) {
-      this.providers.set(
-        'together',
-        new OpenAICompatibleProvider({
-          name: 'together',
-          apiKey: togetherKey,
-          baseURL: 'https://api.together.xyz/v1',
-          defaultModel: 'meta-llama/Llama-3.1-70B-Instruct-Turbo',
-        })
-      );
-      logger.info('Initialized Together AI provider (OpenAI-compatible)');
-    }
-    // DeepSeek (OpenAI-compatible)
-    const deepseekKey = process.env.DEEPSEEK_API_KEY || getApiKey('deepseek');
-    if (deepseekKey) {
-      this.providers.set(
-        'deepseek',
-        new OpenAICompatibleProvider({
-          name: 'deepseek',
-          apiKey: deepseekKey,
-          baseURL: 'https://api.deepseek.com/v1',
-          defaultModel: 'deepseek-chat',
-        })
-      );
-      logger.info('Initialized DeepSeek provider (OpenAI-compatible)');
-    }
-    // Fireworks AI (OpenAI-compatible)
-    const fireworksKey = process.env.FIREWORKS_API_KEY || getApiKey('fireworks');
-    if (fireworksKey) {
-      this.providers.set(
-        'fireworks',
-        new OpenAICompatibleProvider({
-          name: 'fireworks',
-          apiKey: fireworksKey,
-          baseURL: 'https://api.fireworks.ai/inference/v1',
-          defaultModel: 'accounts/fireworks/models/llama-v3p1-70b-instruct',
-        })
-      );
-      logger.info('Initialized Fireworks AI provider (OpenAI-compatible)');
-    }
-    // Perplexity (OpenAI-compatible)
-    const perplexityKey = process.env.PERPLEXITY_API_KEY || getApiKey('perplexity');
-    if (perplexityKey) {
-      this.providers.set(
-        'perplexity',
-        new OpenAICompatibleProvider({
-          name: 'perplexity',
-          apiKey: perplexityKey,
-          baseURL: 'https://api.perplexity.ai',
-          defaultModel: 'llama-3.1-sonar-large-128k-online',
-        })
-      );
-      logger.info('Initialized Perplexity provider (OpenAI-compatible)');
-    }
-  }
-  /**
-   * Get the names of all initialized providers.
-   */
-  getAvailableProviders(): string[] {
-    return [...this.providers.keys()];
-  }
-  /**
-   * Get the names of providers whose circuit breakers are currently OPEN
-   * (i.e. temporarily disabled due to consecutive failures).
-   */
-  getDisabledProviders(): string[] {
-    return this.circuitBreaker.getOpenCircuits();
-  }
-  /**
-   * Register a custom provider
-   */
-  registerProvider(provider: LLMProvider): void {
-    this.providers.set(provider.name, provider);
-    logger.info(`Registered custom provider: ${provider.name}`);
-  }
-  /**
-   * Route a completion request to the appropriate provider
-   */
-  async route(request: CompletionRequest, taskType?: string): Promise<LLMResponse> {
-    // Resolve model alias before routing
-    if (request.model) {
-      request.model = resolveModelAlias(request.model);
-    }
-    const provider = this.selectProvider(request, taskType);
-    // Strip provider prefix after routing (APIs expect model ID without prefix)
-    if (request.model) {
-      request.model = stripProviderPrefix(request.model);
-    }
-    // Enforce token budget
-    this.enforceTokenBudget(request);
-    if (!provider) {
-      throw new Error(
-        'No LLM provider available. Run `nimbus login` to configure a provider, or set an API key via environment variable (e.g. ANTHROPIC_API_KEY).'
-      );
-    }
-    let response: LLMResponse;
-    if (this.config.fallback.enabled) {
-      response = await this.executeWithFallback(provider, request);
-    } else {
-      response = await provider.complete(request);
-    }
-    // Attach per-request cost calculation
-    const cost = this.computeCost(provider.name, response);
-    response.cost = cost;
-    // Persist usage (fire-and-forget)
-    if (response.usage) {
-      this.persistUsage(response.usage, response.model, provider.name, cost);
-    }
-    return response;
-  }
-  /**
-   * Route a streaming completion request.
-   * Collects token usage from the final chunk and persists cost data
-   * after the stream completes (fire-and-forget, same as route()).
-   */
-  async *routeStream(request: CompletionRequest, taskType?: string): AsyncIterable<StreamChunk> {
-    // Resolve model alias before routing
-    if (request.model) {
-      request.model = resolveModelAlias(request.model);
-    }
-    // Capture `this` and config references before yield points.
-    // TypeScript strict mode narrows `this` to `never` after yield in
-    // async generators, so all post-yield access goes through locals.
-    const self = this as LLMRouter;
-    const defaultModel = self.config.defaultModel;
-    const provider = self.selectProvider(request, taskType);
-    // Strip provider prefix after routing (APIs expect model ID without prefix)
-    if (request.model) {
-      request.model = stripProviderPrefix(request.model);
-    }
-    // Enforce token budget
-    self.enforceTokenBudget(request);
-    if (!provider) {
-      throw new Error(
-        'No LLM provider available. Run `nimbus login` to configure a provider, or set an API key via environment variable (e.g. ANTHROPIC_API_KEY).'
-      );
-    }
-    // Reset fallback metadata
-    self.lastStreamFallbackMeta = null;
-    const stream = self.config.fallback.enabled
-      ? self.executeStreamWithFallback(provider, request)
-      : provider.stream(request);
-    let totalContent = '';
-    let lastUsage: StreamChunk['usage'] | undefined;
-    for await (const chunk of stream) {
-      if (chunk.content) {
-        totalContent += chunk.content;
-      }
-      if (chunk.usage) {
-        lastUsage = chunk.usage;
-      }
-      yield chunk;
-    }
-    // Determine which provider actually served the stream.
-    // Use type assertion because TS control-flow analysis incorrectly
-    // narrows lastStreamFallbackMeta to `null` -- it was mutated by
-    // executeStreamWithFallback during iteration above.
-    const fallbackMeta = self.lastStreamFallbackMeta as StreamFallbackMeta | null;
-    const activeProviderName = fallbackMeta?.activeProvider ?? provider.name;
-    // Track cost after stream completes
-    if (lastUsage) {
-      const model = request.model || defaultModel;
-      const cost = calculateCost(
-        activeProviderName,
-        model,
-        lastUsage.promptTokens,
-        lastUsage.completionTokens
-      );
-      self.persistUsage(lastUsage, model, activeProviderName, cost);
-    } else {
-      // Estimate tokens from content length if no usage data
-      const estimatedOutputTokens = Math.ceil(totalContent.length / 4);
-      const estimatedInputTokens = request.messages.reduce(
-        (sum, m) => sum + Math.ceil(getTextContent(m.content).length / 4),
-        0
-      );
-      const model = request.model || defaultModel;
-      const cost = calculateCost(
-        activeProviderName,
-        model,
-        estimatedInputTokens,
-        estimatedOutputTokens
-      );
-      self.persistUsage(
-        {
-          promptTokens: estimatedInputTokens,
-          completionTokens: estimatedOutputTokens,
-          totalTokens: estimatedInputTokens + estimatedOutputTokens,
-        },
-        model,
-        activeProviderName,
-        cost
-      );
-    }
-  }
-  /**
-   * Route a streaming tool completion request.
-   * Text chunks are yielded incrementally; tool calls arrive on the final
-   * chunk.  Falls back to non-streaming completeWithTools when the selected
-   * provider doesn't support streamWithTools.
-   */
-  async *routeStreamWithTools(
-    request: ToolCompletionRequest,
-    taskType?: string
-  ): AsyncIterable<StreamChunk> {
-    // Resolve model alias before routing
-    if (request.model) {
-      request.model = resolveModelAlias(request.model);
-    }
-    const self = this as LLMRouter;
-    const defaultModel = self.config.defaultModel;
-    const provider = self.selectProvider(request, taskType);
-    // Strip provider prefix after routing
-    if (request.model) {
-      request.model = stripProviderPrefix(request.model);
-    }
-    self.enforceTokenBudget(request);
-    if (!provider) {
-      throw new Error(
-        'No LLM provider available. Run `nimbus login` to configure a provider, or set an API key via environment variable (e.g. ANTHROPIC_API_KEY).'
-      );
-    }
-    // Use native streaming-with-tools if providers support it
-    if (provider.streamWithTools && self.config.fallback.enabled) {
-      // Try primary provider first, then fallbacks
-      const fallbackProviders = self.config.fallback.providers
-        .map(name => self.providers.get(name))
-        .filter(Boolean) as LLMProvider[];
-      const allProviders = [provider, ...fallbackProviders.filter(p => p !== provider)];
-      for (const p of allProviders) {
-        if (!p.streamWithTools || !self.circuitBreaker.isAvailable(p.name)) {
-          continue;
-        }
-        try {
-          let lastUsage: StreamChunk['usage'] | undefined;
-          // Yield each chunk immediately (no buffering) for real-time streaming UX.
-          for await (const chunk of p.streamWithTools(request)) {
-            if (chunk.usage) {
-              lastUsage = chunk.usage;
-            }
-            yield chunk;
-          }
-          // Record success after the `done: true` chunk has been received and yielded.
-          self.circuitBreaker.recordSuccess(p.name);
-          if (lastUsage) {
-            const model = request.model || defaultModel;
-            const cost = calculateCost(
-              p.name,
-              model,
-              lastUsage.promptTokens,
-              lastUsage.completionTokens
-            );
-            self.persistUsage(lastUsage, model, p.name, cost);
-          }
-          return;
-        } catch (error) {
-          self.circuitBreaker.recordFailure(p.name);
-          logger.warn(`Provider ${p.name} failed for streamWithTools, trying fallback...`, {
-            error,
-          });
-          continue;
-        }
-      }
-      // If all providers with streamWithTools failed, fall through to non-streaming fallback below
-    } else if (provider.streamWithTools) {
-      // Fallback disabled — use provider directly
-      let lastUsage: StreamChunk['usage'] | undefined;
-      for await (const chunk of provider.streamWithTools(request)) {
-        if (chunk.usage) {
-          lastUsage = chunk.usage;
-        }
-        yield chunk;
-      }
-      if (lastUsage) {
-        const model = request.model || defaultModel;
-        const cost = calculateCost(
-          provider.name,
-          model,
-          lastUsage.promptTokens,
-          lastUsage.completionTokens
-        );
-        self.persistUsage(lastUsage, model, provider.name, cost);
-      }
-      return;
-    }
-    // Fallback: non-streaming completeWithTools, yield result as a single chunk
-    const response = await provider.completeWithTools(request);
-    const cost = self.computeCost(provider.name, response);
-    response.cost = cost;
-    if (response.usage) {
-      self.persistUsage(response.usage, response.model, provider.name, cost);
-    }
-    if (response.content) {
-      yield { content: response.content, done: false };
-    }
-    yield {
-      done: true,
-      toolCalls: response.toolCalls,
-      usage: response.usage,
-    };
-  }
-  /**
-   * Route a tool completion request
-   */
-  async routeWithTools(request: ToolCompletionRequest, taskType?: string): Promise<LLMResponse> {
-    // Resolve model alias before routing
-    if (request.model) {
-      request.model = resolveModelAlias(request.model);
-    }
-    const provider = this.selectProvider(request, taskType);
-    // Strip provider prefix after routing (APIs expect model ID without prefix)
-    if (request.model) {
-      request.model = stripProviderPrefix(request.model);
-    }
-    // Enforce token budget
-    this.enforceTokenBudget(request);
-    if (!provider) {
-      throw new Error(
-        'No LLM provider available. Run `nimbus login` to configure a provider, or set an API key via environment variable (e.g. ANTHROPIC_API_KEY).'
-      );
-    }
-    let response: LLMResponse;
-    if (this.config.fallback.enabled) {
-      response = await this.executeToolsWithFallback(provider, request);
-    } else {
-      response = await provider.completeWithTools(request);
-    }
-    // Attach per-request cost calculation
-    const cost = this.computeCost(provider.name, response);
-    response.cost = cost;
-    // Persist usage (fire-and-forget)
-    if (response.usage) {
-      this.persistUsage(response.usage, response.model, provider.name, cost);
-    }
-    return response;
-  }
-  /**
-   * Get list of available models across all providers
-   */
-  async getAvailableModels(): Promise<Record<string, string[]>> {
-    const models: Record<string, string[]> = {};
-    const entries = Array.from(this.providers.entries());
-    const results = await Promise.allSettled(
-      entries.map(async ([name, provider]) => {
-        const providerModels = await provider.listModels();
-        return { name, models: providerModels };
-      })
-    );
-    for (const result of results) {
-      if (result.status === 'fulfilled') {
-        models[result.value.name] = result.value.models;
-      }
-    }
-    return models;
-  }
-  /**
-   * Get provider information including availability and models.
-   * Each registered provider is queried for its model list. If the query
-   * succeeds the provider is marked available; otherwise it is marked
-   * unavailable with an empty model list.
-   */
-  async getProviders(): Promise<ProviderInfo[]> {
-    const entries = Array.from(this.providers.entries());
-    const results = await Promise.allSettled(
-      entries.map(async ([name, provider]) => {
-        const models = await provider.listModels();
-        return { name, available: true, models };
-      })
-    );
-    const providers: ProviderInfo[] = [];
-    for (let i = 0; i < results.length; i++) {
-      const result = results[i];
-      if (result.status === 'fulfilled') {
-        providers.push(result.value);
-      } else {
-        providers.push({ name: entries[i][0], available: false, models: [] });
-      }
-    }
-    return providers;
-  }
-  /**
-   * Select the appropriate provider based on request and task type
-   */
-  private selectProvider(request: CompletionRequest, taskType?: string): LLMProvider | null {
-    // If model explicitly specified, use its provider
-    if (request.model) {
-      const providerName = this.getProviderForModel(request.model);
-      const provider = this.providers.get(providerName);
-      if (provider) {
-        logger.info(`Selected ${providerName} provider for model ${request.model}`);
-        return provider;
-      }
-    }
-    // Cost optimization
-    if (this.config.costOptimization.enabled && taskType) {
-      if (this.config.costOptimization.cheapModelFor.includes(taskType)) {
-        const cheapModel = this.config.costOptimization.cheapModel;
-        const provider = this.getProviderForModel(cheapModel)
-          ? this.providers.get(this.getProviderForModel(cheapModel)) || this.getCheapProvider()
-          : this.getCheapProvider();
-        if (provider) {
-          if (!request.model) {
-            request.model = cheapModel;
-          }
-          logger.info(
-            `Selected cheap provider ${provider.name} with model ${request.model} for task type: ${taskType}`
-          );
-          return provider;
-        }
-      }
-      if (this.config.costOptimization.expensiveModelFor.includes(taskType)) {
-        const expensiveModel = this.config.costOptimization.expensiveModel;
-        const provider = this.getProviderForModel(expensiveModel)
-          ? this.providers.get(this.getProviderForModel(expensiveModel)) ||
-            this.getExpensiveProvider()
-          : this.getExpensiveProvider();
-        if (provider) {
-          if (!request.model) {
-            request.model = expensiveModel;
-          }
-          logger.info(
-            `Selected expensive provider ${provider.name} with model ${request.model} for task type: ${taskType}`
-          );
-          return provider;
-        }
-      }
-    }
-    // Default provider
-    const defaultProvider = this.providers.get(this.config.defaultProvider);
-    if (defaultProvider) {
-      logger.info(`Using default provider: ${this.config.defaultProvider}`);
-      return defaultProvider;
-    }
-    // Fallback to any available provider
-    const firstAvailable = Array.from(this.providers.values())[0];
-    if (firstAvailable) {
-      logger.warn(`No default provider, using first available: ${firstAvailable.name}`);
-      return firstAvailable;
-    }
-    return null;
-  }
-  /**
-   * Check whether an error is a rate-limit (429) or server error (5xx)
-   * that should be retried with backoff before falling through.
-   */
-  private static isRetryableError(error: unknown): boolean {
-    if (error && typeof error === 'object') {
-      const errObj = error as Record<string, unknown>;
-      const status =
-        (typeof errObj.status === 'number' ? errObj.status : undefined) ??
-        (typeof errObj.statusCode === 'number' ? errObj.statusCode : undefined);
-      if (status !== undefined && (status === 429 || (status >= 500 && status < 600))) {
-        return true;
-      }
-      const msg = typeof errObj.message === 'string' ? errObj.message : '';
-      if (/rate.?limit|429|too many requests|overloaded|503/i.test(msg)) {
-        return true;
-      }
-    }
-    return false;
-  }
-  /**
-   * Execute an async function with retry + exponential backoff for rate limits.
-   * Retries up to `maxRetries` times with delays of 1s, 2s, 4s, ...
-   */
-  private async withRetry<T>(fn: () => Promise<T>, maxRetries = 3): Promise<T> {
-    let lastError: unknown;
-    for (let attempt = 0; attempt <= maxRetries; attempt++) {
-      try {
-        return await fn();
-      } catch (error) {
-        lastError = error;
-        if (attempt < maxRetries && LLMRouter.isRetryableError(error)) {
-          const delay = Math.min(1000 * Math.pow(2, attempt), 8000);
-          const jitter = Math.random() * 500;
-          logger.info(
-            `Rate limited — retrying in ${Math.round(delay + jitter)}ms (attempt ${attempt + 1}/${maxRetries})`
-          );
-          await new Promise(resolve => setTimeout(resolve, delay + jitter));
-          continue;
-        }
-        throw error;
-      }
-    }
-    throw lastError;
-  }
-  /**
-   * Execute request with fallback logic
-   */
-  private async executeWithFallback(
-    primaryProvider: LLMProvider,
-    request: CompletionRequest
-  ): Promise<LLMResponse> {
-    const fallbackProviders = this.config.fallback.providers
-      .map(name => this.providers.get(name))
-      .filter(Boolean) as LLMProvider[];
-    const allProviders = [primaryProvider, ...fallbackProviders.filter(p => p !== primaryProvider)];
-    for (const provider of allProviders) {
-      if (!this.circuitBreaker.isAvailable(provider.name)) {
-        logger.info(`Skipping ${provider.name} (circuit open)`);
-        continue;
-      }
-      try {
-        logger.info(`Attempting request with ${provider.name}`);
-        const result = await this.withRetry(() => provider.complete(request));
-        this.circuitBreaker.recordSuccess(provider.name);
-        return result;
-      } catch (error) {
-        this.circuitBreaker.recordFailure(provider.name);
-        logger.warn(`Provider ${provider.name} failed, trying fallback...`, { error });
-        continue;
-      }
-    }
-    throw new Error(
-      'All LLM providers failed. Check your API keys and network connection, or try a different provider.'
-    );
-  }
-  /**
-   * Execute tool request with fallback logic
-   */
-  private async executeToolsWithFallback(
-    primaryProvider: LLMProvider,
-    request: ToolCompletionRequest
-  ): Promise<LLMResponse> {
-    const fallbackProviders = this.config.fallback.providers
-      .map(name => this.providers.get(name))
-      .filter(Boolean) as LLMProvider[];
-    const allProviders = [primaryProvider, ...fallbackProviders.filter(p => p !== primaryProvider)];
-    for (const provider of allProviders) {
-      if (!this.circuitBreaker.isAvailable(provider.name)) {
-        logger.info(`Skipping ${provider.name} for tool request (circuit open)`);
-        continue;
-      }
-      try {
-        logger.info(`Attempting tool request with ${provider.name}`);
-        const result = await this.withRetry(() => provider.completeWithTools(request));
-        this.circuitBreaker.recordSuccess(provider.name);
-        return result;
-      } catch (error) {
-        this.circuitBreaker.recordFailure(provider.name);
-        logger.warn(`Provider ${provider.name} failed for tool request, trying fallback...`, {
-          error,
-        });
-        continue;
-      }
-    }
-    throw new Error(
-      'All LLM providers failed for tool request. Check your API keys and network connection, or try a different provider.'
-    );
-  }
-  /**
-   * Execute streaming request with fallback logic.
-   *
-   * Handles two failure modes:
-   * 1. Provider fails before producing any chunks (e.g. auth error, rate limit) --
-   *    immediately falls through to the next provider.
-   * 2. Provider fails mid-stream (partial chunks already buffered) -- discards
-   *    the partial output and starts fresh with the next provider.
-   *
-   * Chunks are buffered internally per-provider attempt.  Only once a provider
-   * completes its full stream successfully are the buffered chunks yielded to
-   * the caller.  This prevents the caller from receiving a garbled mix of
-   * partial responses from multiple providers.
-   */
-  private async *executeStreamWithFallback(
-    primaryProvider: LLMProvider,
-    request: CompletionRequest
-  ): AsyncIterable<StreamChunk> {
-    // Capture `this` for use across yield points
-    const self = this as LLMRouter;
-    const fallbackProviders = self.config.fallback.providers
-      .map(name => self.providers.get(name))
-      .filter(Boolean) as LLMProvider[];
-    const allProviders = [primaryProvider, ...fallbackProviders.filter(p => p !== primaryProvider)];
-    let failedProvider: string | undefined;
-    for (const provider of allProviders) {
-      if (!self.circuitBreaker.isAvailable(provider.name)) {
-        logger.info(`Skipping ${provider.name} for stream (circuit open)`);
-        continue;
-      }
-      const bufferedChunks: StreamChunk[] = [];
-      let streamCompleted = false;
-      try {
-        logger.info(`Attempting stream with ${provider.name}`);
-        for await (const chunk of provider.stream(request)) {
-          bufferedChunks.push(chunk);
-          if (chunk.done) {
-            streamCompleted = true;
-          }
-        }
-        // If we got here the stream completed without throwing.
-        // Even if there was no explicit done=true chunk we treat
-        // exhausting the iterator as success.
-        streamCompleted = true;
-        self.circuitBreaker.recordSuccess(provider.name);
-      } catch (error) {
-        self.circuitBreaker.recordFailure(provider.name);
-        const partialChunkCount = bufferedChunks.length;
-        logger.warn(
-          `Provider ${provider.name} failed for stream after ${partialChunkCount} chunk(s), trying fallback...`,
-          { error }
-        );
-        failedProvider = provider.name;
-        // Discard buffered chunks from the failed provider and try next
-        continue;
-      }
-      if (streamCompleted) {
-        // Record which provider served the response
-        self.lastStreamFallbackMeta = {
-          activeProvider: provider.name,
-          failedProvider,
-          isFallback: !!failedProvider,
-        };
-        if (failedProvider) {
-          logger.info(
-            `Stream fallback: ${failedProvider} -> ${provider.name} (${bufferedChunks.length} chunks)`
-          );
-        }
-        // Yield all buffered chunks to the caller
-        for (const chunk of bufferedChunks) {
-          yield chunk;
-        }
-        return;
-      }
-    }
-    throw new Error(
-      'All LLM providers failed for streaming request. Check your API keys and network connection, or try a different provider.'
-    );
-  }
-  /**
-   * Compute cost for a response using the cost calculator
-   */
-  private computeCost(providerName: string, response: LLMResponse): CostResult {
-    return calculateCost(
-      providerName,
-      response.model,
-      response.usage.promptTokens,
-      response.usage.completionTokens
-    );
-  }
-  /**
-   * Get provider name for a specific model.
-   * Uses the detectProvider utility for auto-detection.
-   */
-  private getProviderForModel(model: string): string {
-    const detected = detectProvider(model);
-    // If the detected provider is registered, use it
-    if (this.providers.has(detected)) {
-      return detected;
-    }
-    // For models with "/" prefix that could be OpenRouter
-    if (model.includes('/') && this.providers.has('openrouter')) {
-      return 'openrouter';
-    }
-    return this.config.defaultProvider;
-  }
-  /**
-   * Get the cheapest available provider
-   */
-  private getCheapProvider(): LLMProvider | null {
-    // Prefer Ollama (free) > Haiku > GPT-4o-mini
-    return (
-      this.providers.get('ollama') ||
-      this.providers.get('anthropic') || // Will use Haiku in practice
-      this.providers.get('openai') || // Will use gpt-4o-mini in practice
-      null
-    );
-  }
-  /**
-   * Persist token usage to the embedded SQLite state layer (fire-and-forget).
-   *
-   * Inserts a row into the `usage` table with token counts, cost, and metadata.
-   * Failures are logged but never propagated -- persistence is non-critical and
-   * must not break the LLM request path.
-   */
-  persistUsage(
-    usage: { promptTokens: number; completionTokens: number; totalTokens: number },
-    model?: string,
-    provider?: string,
-    cost?: CostResult
-  ): void {
-    try {
-      // Lazy import to avoid circular dependency between llm/ and state/
-      import('../state/db')
-        .then(({ getDb }) => {
-          try {
-            const db = getDb();
-            const id = crypto.randomUUID();
-            const metadata = JSON.stringify({
-              model: model ?? null,
-              provider: provider ?? null,
-              prompt_tokens: usage.promptTokens,
-              completion_tokens: usage.completionTokens,
-            });
-            db.run(
-              `INSERT INTO usage (id, type, quantity, unit, cost_usd, metadata)
-             VALUES (?, ?, ?, ?, ?, ?)`,
-              [id, 'llm_call', usage.totalTokens, 'tokens', cost?.costUSD ?? 0, metadata]
-            );
-          } catch (err) {
-            logger.debug('Failed to persist LLM usage to SQLite', { error: err });
-          }
-        })
-        .catch(err => {
-          logger.debug('Failed to import state/db for usage persistence', { error: err });
-        });
-    } catch (err) {
-      logger.debug('Unexpected error in persistUsage', { error: err });
-    }
-  }
-  /**
-   * Get the most capable (expensive) provider
-   */
-  private getExpensiveProvider(): LLMProvider | null {
-    // Prefer Claude Opus/Sonnet > GPT-4o > Gemini Pro
-    return (
-      this.providers.get('anthropic') ||
-      this.providers.get('openai') ||
-      this.providers.get('google') ||
-      null
-    );
-  }
-  /**
-   * Enforce token budget on a request
-   */
-  private enforceTokenBudget(request: CompletionRequest): void {
-    const maxTokens = this.config.tokenBudget?.maxTokensPerRequest || 32768;
-    request.maxTokens = Math.min(request.maxTokens || 4096, maxTokens);
-  }
-}
-// ---------------------------------------------------------------------------
-// Gap 6: List authenticated providers for /model command
-// ---------------------------------------------------------------------------
-/**
- * Return the names of providers that have valid credentials configured.
- * Checks both environment variables and the auth store.
- */
-export function listAuthenticatedProviders(): string[] {
-  const authenticated: string[] = [];
-  if (process.env.ANTHROPIC_API_KEY) authenticated.push('anthropic');
-  if (process.env.OPENAI_API_KEY) authenticated.push('openai');
-  if (process.env.GOOGLE_API_KEY || process.env.GOOGLE_GENERATIVE_AI_API_KEY) authenticated.push('google');
-  if (process.env.GROQ_API_KEY) authenticated.push('groq');
-  if (process.env.OPENROUTER_API_KEY) authenticated.push('openrouter');
-  if (process.env.AWS_ACCESS_KEY_ID || process.env.AWS_PROFILE) authenticated.push('bedrock');
-  return authenticated;
-}
-// ---------------------------------------------------------------------------
-// Gap 18: Multi-model routing based on task complexity
-// ---------------------------------------------------------------------------
-/** Complexity tiers for automatic model selection. */
-export type TaskComplexity = 'simple' | 'moderate' | 'complex';
-/**
- * Classify a user message as simple, moderate, or complex.
- *
- * - **simple**: short status/list/describe queries (<200 chars, no code generation)
- * - **complex**: long messages, code generation, architectural reasoning
- * - **moderate**: everything else
- */
-export function classifyTaskComplexity(message: string): TaskComplexity {
-  const lower = message.toLowerCase().trim();
-  // Simple: short status/list queries
-  if (
-    message.length < 200 &&
-    /^(list|show|get|check|status|what is|what are|describe|which|where|who|ping|echo)\b/.test(lower)
-  ) {
-    return 'simple';
-  }
-  // Complex: long messages or keywords that imply heavy reasoning
-  if (
-    message.length > 500 ||
-    /\b(implement|design|architect|refactor|migrate|rewrite|build|create|scaffold|generate|optimize|debug|diagnose|analyze)\b/.test(lower)
-  ) {
-    return 'complex';
-  }
-  return 'moderate';
-}
-/**
- * Select the appropriate model string for a given complexity level.
- * If `preferredModel` is provided it always wins (user override).
- */
-export function routeModel(complexity: TaskComplexity, preferredModel?: string): string {
-  if (preferredModel) return preferredModel;
-  switch (complexity) {
-    case 'simple':
-      return 'anthropic/claude-haiku-4-5-20251001';
-    case 'complex':
-      return 'anthropic/claude-opus-4-6';
-    default:
-      return 'anthropic/claude-sonnet-4-20250514';
-  }
-}