npm - @dotsetlabs/bellwether - Versions diffs - 0.10.0 - Mend

@dotsetlabs/bellwether 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (403) hide show

package/CHANGELOG.md +291 -0
package/LICENSE +21 -0
package/README.md +739 -0
package/dist/auth/credentials.d.ts +64 -0
package/dist/auth/credentials.js +218 -0
package/dist/auth/index.d.ts +6 -0
package/dist/auth/index.js +6 -0
package/dist/auth/keychain.d.ts +64 -0
package/dist/auth/keychain.js +268 -0
package/dist/baseline/ab-testing.d.ts +80 -0
package/dist/baseline/ab-testing.js +236 -0
package/dist/baseline/ai-compatibility-scorer.d.ts +95 -0
package/dist/baseline/ai-compatibility-scorer.js +606 -0
package/dist/baseline/calibration.d.ts +77 -0
package/dist/baseline/calibration.js +136 -0
package/dist/baseline/category-matching.d.ts +85 -0
package/dist/baseline/category-matching.js +289 -0
package/dist/baseline/change-impact-analyzer.d.ts +98 -0
package/dist/baseline/change-impact-analyzer.js +592 -0
package/dist/baseline/comparator.d.ts +64 -0
package/dist/baseline/comparator.js +916 -0
package/dist/baseline/confidence.d.ts +55 -0
package/dist/baseline/confidence.js +122 -0
package/dist/baseline/converter.d.ts +61 -0
package/dist/baseline/converter.js +585 -0
package/dist/baseline/dependency-analyzer.d.ts +89 -0
package/dist/baseline/dependency-analyzer.js +567 -0
package/dist/baseline/deprecation-tracker.d.ts +133 -0
package/dist/baseline/deprecation-tracker.js +322 -0
package/dist/baseline/diff.d.ts +55 -0
package/dist/baseline/diff.js +1584 -0
package/dist/baseline/documentation-scorer.d.ts +205 -0
package/dist/baseline/documentation-scorer.js +466 -0
package/dist/baseline/embeddings.d.ts +118 -0
package/dist/baseline/embeddings.js +251 -0
package/dist/baseline/error-analyzer.d.ts +198 -0
package/dist/baseline/error-analyzer.js +721 -0
package/dist/baseline/evaluation/evaluator.d.ts +42 -0
package/dist/baseline/evaluation/evaluator.js +323 -0
package/dist/baseline/evaluation/expanded-dataset.d.ts +45 -0
package/dist/baseline/evaluation/expanded-dataset.js +1164 -0
package/dist/baseline/evaluation/golden-dataset.d.ts +58 -0
package/dist/baseline/evaluation/golden-dataset.js +717 -0
package/dist/baseline/evaluation/index.d.ts +15 -0
package/dist/baseline/evaluation/index.js +15 -0
package/dist/baseline/evaluation/types.d.ts +186 -0
package/dist/baseline/evaluation/types.js +8 -0
package/dist/baseline/external-dependency-detector.d.ts +181 -0
package/dist/baseline/external-dependency-detector.js +524 -0
package/dist/baseline/golden-output.d.ts +162 -0
package/dist/baseline/golden-output.js +636 -0
package/dist/baseline/health-scorer.d.ts +174 -0
package/dist/baseline/health-scorer.js +451 -0
package/dist/baseline/incremental-checker.d.ts +97 -0
package/dist/baseline/incremental-checker.js +174 -0
package/dist/baseline/index.d.ts +31 -0
package/dist/baseline/index.js +42 -0
package/dist/baseline/migration-generator.d.ts +137 -0
package/dist/baseline/migration-generator.js +554 -0
package/dist/baseline/migrations.d.ts +60 -0
package/dist/baseline/migrations.js +197 -0
package/dist/baseline/performance-tracker.d.ts +214 -0
package/dist/baseline/performance-tracker.js +577 -0
package/dist/baseline/pr-comment-generator.d.ts +117 -0
package/dist/baseline/pr-comment-generator.js +546 -0
package/dist/baseline/response-fingerprint.d.ts +127 -0
package/dist/baseline/response-fingerprint.js +728 -0
package/dist/baseline/response-schema-tracker.d.ts +129 -0
package/dist/baseline/response-schema-tracker.js +420 -0
package/dist/baseline/risk-scorer.d.ts +54 -0
package/dist/baseline/risk-scorer.js +434 -0
package/dist/baseline/saver.d.ts +89 -0
package/dist/baseline/saver.js +554 -0
package/dist/baseline/scenario-generator.d.ts +151 -0
package/dist/baseline/scenario-generator.js +905 -0
package/dist/baseline/schema-compare.d.ts +86 -0
package/dist/baseline/schema-compare.js +557 -0
package/dist/baseline/schema-evolution.d.ts +189 -0
package/dist/baseline/schema-evolution.js +467 -0
package/dist/baseline/semantic.d.ts +203 -0
package/dist/baseline/semantic.js +908 -0
package/dist/baseline/synonyms.d.ts +60 -0
package/dist/baseline/synonyms.js +386 -0
package/dist/baseline/telemetry.d.ts +165 -0
package/dist/baseline/telemetry.js +294 -0
package/dist/baseline/test-pruner.d.ts +120 -0
package/dist/baseline/test-pruner.js +387 -0
package/dist/baseline/types.d.ts +449 -0
package/dist/baseline/types.js +5 -0
package/dist/baseline/version.d.ts +138 -0
package/dist/baseline/version.js +206 -0
package/dist/cache/index.d.ts +5 -0
package/dist/cache/index.js +5 -0
package/dist/cache/response-cache.d.ts +151 -0
package/dist/cache/response-cache.js +287 -0
package/dist/ci/index.d.ts +60 -0
package/dist/ci/index.js +342 -0
package/dist/cli/commands/auth.d.ts +12 -0
package/dist/cli/commands/auth.js +352 -0
package/dist/cli/commands/badge.d.ts +3 -0
package/dist/cli/commands/badge.js +74 -0
package/dist/cli/commands/baseline-accept.d.ts +15 -0
package/dist/cli/commands/baseline-accept.js +178 -0
package/dist/cli/commands/baseline-migrate.d.ts +12 -0
package/dist/cli/commands/baseline-migrate.js +164 -0
package/dist/cli/commands/baseline.d.ts +14 -0
package/dist/cli/commands/baseline.js +449 -0
package/dist/cli/commands/beta.d.ts +10 -0
package/dist/cli/commands/beta.js +231 -0
package/dist/cli/commands/check.d.ts +11 -0
package/dist/cli/commands/check.js +820 -0
package/dist/cli/commands/cloud/badge.d.ts +3 -0
package/dist/cli/commands/cloud/badge.js +74 -0
package/dist/cli/commands/cloud/diff.d.ts +6 -0
package/dist/cli/commands/cloud/diff.js +79 -0
package/dist/cli/commands/cloud/history.d.ts +6 -0
package/dist/cli/commands/cloud/history.js +102 -0
package/dist/cli/commands/cloud/link.d.ts +9 -0
package/dist/cli/commands/cloud/link.js +119 -0
package/dist/cli/commands/cloud/login.d.ts +7 -0
package/dist/cli/commands/cloud/login.js +499 -0
package/dist/cli/commands/cloud/projects.d.ts +6 -0
package/dist/cli/commands/cloud/projects.js +44 -0
package/dist/cli/commands/cloud/shared.d.ts +7 -0
package/dist/cli/commands/cloud/shared.js +42 -0
package/dist/cli/commands/cloud/teams.d.ts +8 -0
package/dist/cli/commands/cloud/teams.js +169 -0
package/dist/cli/commands/cloud/upload.d.ts +8 -0
package/dist/cli/commands/cloud/upload.js +181 -0
package/dist/cli/commands/contract.d.ts +11 -0
package/dist/cli/commands/contract.js +280 -0
package/dist/cli/commands/discover.d.ts +3 -0
package/dist/cli/commands/discover.js +82 -0
package/dist/cli/commands/eval.d.ts +9 -0
package/dist/cli/commands/eval.js +187 -0
package/dist/cli/commands/explore.d.ts +11 -0
package/dist/cli/commands/explore.js +437 -0
package/dist/cli/commands/feedback.d.ts +9 -0
package/dist/cli/commands/feedback.js +174 -0
package/dist/cli/commands/golden.d.ts +12 -0
package/dist/cli/commands/golden.js +407 -0
package/dist/cli/commands/history.d.ts +10 -0
package/dist/cli/commands/history.js +202 -0
package/dist/cli/commands/init.d.ts +9 -0
package/dist/cli/commands/init.js +219 -0
package/dist/cli/commands/interview.d.ts +3 -0
package/dist/cli/commands/interview.js +903 -0
package/dist/cli/commands/link.d.ts +10 -0
package/dist/cli/commands/link.js +169 -0
package/dist/cli/commands/login.d.ts +7 -0
package/dist/cli/commands/login.js +499 -0
package/dist/cli/commands/preset.d.ts +33 -0
package/dist/cli/commands/preset.js +297 -0
package/dist/cli/commands/profile.d.ts +33 -0
package/dist/cli/commands/profile.js +286 -0
package/dist/cli/commands/registry.d.ts +11 -0
package/dist/cli/commands/registry.js +146 -0
package/dist/cli/commands/shared.d.ts +79 -0
package/dist/cli/commands/shared.js +196 -0
package/dist/cli/commands/teams.d.ts +8 -0
package/dist/cli/commands/teams.js +169 -0
package/dist/cli/commands/test.d.ts +9 -0
package/dist/cli/commands/test.js +500 -0
package/dist/cli/commands/upload.d.ts +8 -0
package/dist/cli/commands/upload.js +223 -0
package/dist/cli/commands/validate-config.d.ts +6 -0
package/dist/cli/commands/validate-config.js +35 -0
package/dist/cli/commands/verify.d.ts +11 -0
package/dist/cli/commands/verify.js +283 -0
package/dist/cli/commands/watch.d.ts +12 -0
package/dist/cli/commands/watch.js +253 -0
package/dist/cli/index.d.ts +3 -0
package/dist/cli/index.js +178 -0
package/dist/cli/interactive.d.ts +47 -0
package/dist/cli/interactive.js +216 -0
package/dist/cli/output/terminal-reporter.d.ts +19 -0
package/dist/cli/output/terminal-reporter.js +104 -0
package/dist/cli/output.d.ts +226 -0
package/dist/cli/output.js +438 -0
package/dist/cli/utils/env.d.ts +5 -0
package/dist/cli/utils/env.js +14 -0
package/dist/cli/utils/progress.d.ts +59 -0
package/dist/cli/utils/progress.js +206 -0
package/dist/cli/utils/server-context.d.ts +10 -0
package/dist/cli/utils/server-context.js +36 -0
package/dist/cloud/auth.d.ts +144 -0
package/dist/cloud/auth.js +374 -0
package/dist/cloud/client.d.ts +24 -0
package/dist/cloud/client.js +65 -0
package/dist/cloud/http-client.d.ts +38 -0
package/dist/cloud/http-client.js +215 -0
package/dist/cloud/index.d.ts +23 -0
package/dist/cloud/index.js +25 -0
package/dist/cloud/mock-client.d.ts +107 -0
package/dist/cloud/mock-client.js +545 -0
package/dist/cloud/types.d.ts +515 -0
package/dist/cloud/types.js +15 -0
package/dist/config/defaults.d.ts +160 -0
package/dist/config/defaults.js +169 -0
package/dist/config/loader.d.ts +24 -0
package/dist/config/loader.js +122 -0
package/dist/config/template.d.ts +42 -0
package/dist/config/template.js +647 -0
package/dist/config/validator.d.ts +2112 -0
package/dist/config/validator.js +658 -0
package/dist/constants/cloud.d.ts +107 -0
package/dist/constants/cloud.js +110 -0
package/dist/constants/core.d.ts +521 -0
package/dist/constants/core.js +556 -0
package/dist/constants/testing.d.ts +1283 -0
package/dist/constants/testing.js +1568 -0
package/dist/constants.d.ts +10 -0
package/dist/constants.js +10 -0
package/dist/contract/index.d.ts +6 -0
package/dist/contract/index.js +5 -0
package/dist/contract/validator.d.ts +177 -0
package/dist/contract/validator.js +574 -0
package/dist/cost/index.d.ts +6 -0
package/dist/cost/index.js +5 -0
package/dist/cost/tracker.d.ts +134 -0
package/dist/cost/tracker.js +313 -0
package/dist/discovery/discovery.d.ts +16 -0
package/dist/discovery/discovery.js +173 -0
package/dist/discovery/types.d.ts +51 -0
package/dist/discovery/types.js +2 -0
package/dist/docs/agents.d.ts +3 -0
package/dist/docs/agents.js +995 -0
package/dist/docs/contract.d.ts +51 -0
package/dist/docs/contract.js +1681 -0
package/dist/docs/generator.d.ts +4 -0
package/dist/docs/generator.js +4 -0
package/dist/docs/html-reporter.d.ts +9 -0
package/dist/docs/html-reporter.js +757 -0
package/dist/docs/index.d.ts +10 -0
package/dist/docs/index.js +11 -0
package/dist/docs/junit-reporter.d.ts +18 -0
package/dist/docs/junit-reporter.js +210 -0
package/dist/docs/report.d.ts +14 -0
package/dist/docs/report.js +44 -0
package/dist/docs/sarif-reporter.d.ts +19 -0
package/dist/docs/sarif-reporter.js +335 -0
package/dist/docs/shared.d.ts +35 -0
package/dist/docs/shared.js +162 -0
package/dist/docs/templates.d.ts +12 -0
package/dist/docs/templates.js +76 -0
package/dist/errors/index.d.ts +6 -0
package/dist/errors/index.js +6 -0
package/dist/errors/retry.d.ts +92 -0
package/dist/errors/retry.js +323 -0
package/dist/errors/types.d.ts +321 -0
package/dist/errors/types.js +584 -0
package/dist/index.d.ts +32 -0
package/dist/index.js +32 -0
package/dist/interview/dependency-resolver.d.ts +11 -0
package/dist/interview/dependency-resolver.js +32 -0
package/dist/interview/interviewer.d.ts +232 -0
package/dist/interview/interviewer.js +1939 -0
package/dist/interview/mock-response-generator.d.ts +7 -0
package/dist/interview/mock-response-generator.js +102 -0
package/dist/interview/orchestrator.d.ts +237 -0
package/dist/interview/orchestrator.js +1296 -0
package/dist/interview/rate-limiter.d.ts +15 -0
package/dist/interview/rate-limiter.js +55 -0
package/dist/interview/response-validator.d.ts +10 -0
package/dist/interview/response-validator.js +132 -0
package/dist/interview/schema-inferrer.d.ts +8 -0
package/dist/interview/schema-inferrer.js +71 -0
package/dist/interview/schema-test-generator.d.ts +71 -0
package/dist/interview/schema-test-generator.js +834 -0
package/dist/interview/smart-value-generator.d.ts +155 -0
package/dist/interview/smart-value-generator.js +554 -0
package/dist/interview/stateful-test-runner.d.ts +19 -0
package/dist/interview/stateful-test-runner.js +106 -0
package/dist/interview/types.d.ts +561 -0
package/dist/interview/types.js +2 -0
package/dist/llm/anthropic.d.ts +41 -0
package/dist/llm/anthropic.js +355 -0
package/dist/llm/client.d.ts +123 -0
package/dist/llm/client.js +42 -0
package/dist/llm/factory.d.ts +38 -0
package/dist/llm/factory.js +145 -0
package/dist/llm/fallback.d.ts +140 -0
package/dist/llm/fallback.js +379 -0
package/dist/llm/index.d.ts +18 -0
package/dist/llm/index.js +15 -0
package/dist/llm/ollama.d.ts +37 -0
package/dist/llm/ollama.js +330 -0
package/dist/llm/openai.d.ts +25 -0
package/dist/llm/openai.js +320 -0
package/dist/llm/token-budget.d.ts +161 -0
package/dist/llm/token-budget.js +395 -0
package/dist/logging/logger.d.ts +70 -0
package/dist/logging/logger.js +130 -0
package/dist/metrics/collector.d.ts +106 -0
package/dist/metrics/collector.js +547 -0
package/dist/metrics/index.d.ts +7 -0
package/dist/metrics/index.js +7 -0
package/dist/metrics/prometheus.d.ts +20 -0
package/dist/metrics/prometheus.js +241 -0
package/dist/metrics/types.d.ts +209 -0
package/dist/metrics/types.js +5 -0
package/dist/persona/builtins.d.ts +54 -0
package/dist/persona/builtins.js +219 -0
package/dist/persona/index.d.ts +8 -0
package/dist/persona/index.js +8 -0
package/dist/persona/loader.d.ts +30 -0
package/dist/persona/loader.js +190 -0
package/dist/persona/types.d.ts +144 -0
package/dist/persona/types.js +5 -0
package/dist/persona/validation.d.ts +94 -0
package/dist/persona/validation.js +332 -0
package/dist/prompts/index.d.ts +5 -0
package/dist/prompts/index.js +5 -0
package/dist/prompts/templates.d.ts +180 -0
package/dist/prompts/templates.js +431 -0
package/dist/registry/client.d.ts +49 -0
package/dist/registry/client.js +191 -0
package/dist/registry/index.d.ts +7 -0
package/dist/registry/index.js +6 -0
package/dist/registry/types.d.ts +140 -0
package/dist/registry/types.js +6 -0
package/dist/scenarios/evaluator.d.ts +43 -0
package/dist/scenarios/evaluator.js +206 -0
package/dist/scenarios/index.d.ts +10 -0
package/dist/scenarios/index.js +9 -0
package/dist/scenarios/loader.d.ts +20 -0
package/dist/scenarios/loader.js +285 -0
package/dist/scenarios/types.d.ts +153 -0
package/dist/scenarios/types.js +8 -0
package/dist/security/index.d.ts +17 -0
package/dist/security/index.js +18 -0
package/dist/security/payloads.d.ts +61 -0
package/dist/security/payloads.js +268 -0
package/dist/security/security-tester.d.ts +42 -0
package/dist/security/security-tester.js +582 -0
package/dist/security/types.d.ts +166 -0
package/dist/security/types.js +8 -0
package/dist/transport/base-transport.d.ts +59 -0
package/dist/transport/base-transport.js +38 -0
package/dist/transport/http-transport.d.ts +67 -0
package/dist/transport/http-transport.js +238 -0
package/dist/transport/mcp-client.d.ts +141 -0
package/dist/transport/mcp-client.js +496 -0
package/dist/transport/sse-transport.d.ts +88 -0
package/dist/transport/sse-transport.js +316 -0
package/dist/transport/stdio-transport.d.ts +43 -0
package/dist/transport/stdio-transport.js +238 -0
package/dist/transport/types.d.ts +125 -0
package/dist/transport/types.js +16 -0
package/dist/utils/concurrency.d.ts +123 -0
package/dist/utils/concurrency.js +213 -0
package/dist/utils/formatters.d.ts +16 -0
package/dist/utils/formatters.js +37 -0
package/dist/utils/index.d.ts +8 -0
package/dist/utils/index.js +8 -0
package/dist/utils/jsonpath.d.ts +87 -0
package/dist/utils/jsonpath.js +326 -0
package/dist/utils/markdown.d.ts +113 -0
package/dist/utils/markdown.js +265 -0
package/dist/utils/network.d.ts +14 -0
package/dist/utils/network.js +17 -0
package/dist/utils/sanitize.d.ts +92 -0
package/dist/utils/sanitize.js +191 -0
package/dist/utils/semantic.d.ts +194 -0
package/dist/utils/semantic.js +1051 -0
package/dist/utils/smart-truncate.d.ts +94 -0
package/dist/utils/smart-truncate.js +361 -0
package/dist/utils/timeout.d.ts +153 -0
package/dist/utils/timeout.js +205 -0
package/dist/utils/yaml-parser.d.ts +58 -0
package/dist/utils/yaml-parser.js +86 -0
package/dist/validation/index.d.ts +32 -0
package/dist/validation/index.js +32 -0
package/dist/validation/semantic-test-generator.d.ts +50 -0
package/dist/validation/semantic-test-generator.js +176 -0
package/dist/validation/semantic-types.d.ts +66 -0
package/dist/validation/semantic-types.js +94 -0
package/dist/validation/semantic-validator.d.ts +38 -0
package/dist/validation/semantic-validator.js +340 -0
package/dist/verification/index.d.ts +6 -0
package/dist/verification/index.js +5 -0
package/dist/verification/types.d.ts +133 -0
package/dist/verification/types.js +5 -0
package/dist/verification/verifier.d.ts +30 -0
package/dist/verification/verifier.js +309 -0
package/dist/version.d.ts +19 -0
package/dist/version.js +48 -0
package/dist/workflow/auto-generator.d.ts +27 -0
package/dist/workflow/auto-generator.js +513 -0
package/dist/workflow/discovery.d.ts +40 -0
package/dist/workflow/discovery.js +195 -0
package/dist/workflow/executor.d.ts +82 -0
package/dist/workflow/executor.js +611 -0
package/dist/workflow/index.d.ts +10 -0
package/dist/workflow/index.js +10 -0
package/dist/workflow/loader.d.ts +24 -0
package/dist/workflow/loader.js +194 -0
package/dist/workflow/state-tracker.d.ts +98 -0
package/dist/workflow/state-tracker.js +424 -0
package/dist/workflow/types.d.ts +337 -0
package/dist/workflow/types.js +5 -0
package/package.json +94 -0
package/schemas/bellwether-check.schema.json +651 -0

package/dist/cli/commands/test.js ADDED Viewed

@@ -0,0 +1,500 @@
+/**
+ * Test command - the simplified, config-driven MCP server testing command.
+ *
+ * All settings are read from bellwether.yaml (created by `bellwether init`).
+ * The only optional argument is the server command, which can also be in config.
+ */
+import { Command } from 'commander';
+import { writeFileSync, existsSync, mkdirSync } from 'fs';
+import { join } from 'path';
+import { MCPClient } from '../../transport/mcp-client.js';
+import { discover } from '../../discovery/discovery.js';
+import { createLLMClient } from '../../llm/index.js';
+import { Interviewer } from '../../interview/interviewer.js';
+import { generateAgentsMd, generateJsonReport } from '../../docs/generator.js';
+import { loadConfig, ConfigNotFoundError } from '../../config/loader.js';
+import { validateConfigForTest } from '../../config/validator.js';
+import { createBaseline, loadBaseline, compareBaselines, formatDiffText, } from '../../baseline/index.js';
+import { CostTracker, estimateInterviewCost, estimateInterviewTime, formatCostAndTimeEstimate, suggestOptimizations, formatOptimizationSuggestions, } from '../../cost/index.js';
+import { getMetricsCollector, resetMetricsCollector } from '../../metrics/collector.js';
+import { FallbackLLMClient } from '../../llm/fallback.js';
+import { getGlobalCache, resetGlobalCache } from '../../cache/response-cache.js';
+import { INTERVIEW, WORKFLOW } from '../../constants.js';
+import { InterviewProgressBar, formatStartupBanner } from '../utils/progress.js';
+import { parsePersonas } from '../../persona/builtins.js';
+import { loadScenariosFromFile, tryLoadDefaultScenarios, DEFAULT_SCENARIOS_FILE, } from '../../scenarios/index.js';
+import { loadWorkflowsFromFile, tryLoadDefaultWorkflows, DEFAULT_WORKFLOWS_FILE, } from '../../workflow/loader.js';
+import * as output from '../output.js';
+import { StreamingDisplay } from '../output.js';
+import { suppressLogs, restoreLogLevel } from '../../logging/logger.js';
+/**
+ * Wrapper to parse personas with warning output.
+ */
+function parsePersonasWithWarning(personaList) {
+    return parsePersonas(personaList, (unknownName, validNames) => {
+        output.warn(`Unknown persona: ${unknownName}. Available: ${validNames.join(', ')}`);
+    });
+}
+/**
+ * Extract server context from command and arguments.
+ */
+function extractServerContextFromArgs(command, args) {
+    const context = {
+        allowedDirectories: [],
+        constraints: [],
+        hints: [],
+    };
+    const fullCommand = `${command} ${args.join(' ')}`.toLowerCase();
+    const pathArgs = args.filter((arg) => arg.startsWith('/') && !arg.startsWith('--'));
+    if (fullCommand.includes('filesystem') || fullCommand.includes('file-system')) {
+        context.allowedDirectories = pathArgs;
+        if (context.allowedDirectories.length > 0) {
+            context.hints.push(`Filesystem server with allowed directories: ${context.allowedDirectories.join(', ')}`);
+        }
+        context.constraints.push('Operations limited to specified directories');
+    }
+    else if (fullCommand.includes('postgres') || fullCommand.includes('mysql') || fullCommand.includes('sqlite')) {
+        context.hints.push('Database server - SQL operations expected');
+        context.constraints.push('Database operations only');
+    }
+    else if (fullCommand.includes('git')) {
+        context.allowedDirectories = pathArgs;
+        context.hints.push('Git server - repository operations expected');
+    }
+    else {
+        context.allowedDirectories = pathArgs;
+    }
+    return context;
+}
+/**
+ * Detect if running in a CI environment.
+ */
+function isCI() {
+    return !!(process.env.CI ||
+        process.env.CONTINUOUS_INTEGRATION ||
+        process.env.GITHUB_ACTIONS ||
+        process.env.GITLAB_CI ||
+        process.env.CIRCLECI ||
+        process.env.JENKINS_URL ||
+        process.env.TRAVIS ||
+        process.env.BUILDKITE);
+}
+export const testCommand = new Command('test')
+    .description('Test an MCP server using settings from bellwether.yaml')
+    .argument('[server-command]', 'Server command (overrides config)')
+    .argument('[args...]', 'Server arguments')
+    .option('-c, --config <path>', 'Path to config file (default: ./bellwether.yaml)')
+    .action(async (serverCommandArg, serverArgs, options) => {
+    // Load configuration (required)
+    let config;
+    try {
+        config = loadConfig(options.config);
+    }
+    catch (error) {
+        if (error instanceof ConfigNotFoundError) {
+            output.error(error.message);
+            process.exit(1);
+        }
+        throw error;
+    }
+    // Determine server command (CLI arg overrides config)
+    const serverCommand = serverCommandArg || config.server.command;
+    const args = serverArgs.length > 0 ? serverArgs : config.server.args;
+    // Validate config for running tests
+    try {
+        validateConfigForTest(config, serverCommand);
+    }
+    catch (error) {
+        output.error(error instanceof Error ? error.message : String(error));
+        process.exit(1);
+    }
+    // Extract settings from config
+    const isContractMode = config.mode === 'contract';
+    const timeout = config.server.timeout;
+    const outputDir = config.output.dir;
+    const wantsJson = config.output.format === 'json' || config.output.format === 'both';
+    const cacheEnabled = config.cache.enabled;
+    const verbose = config.logging.verbose;
+    const logLevel = config.logging.level;
+    // Parse personas from config
+    const selectedPersonas = parsePersonasWithWarning(config.test.personas);
+    const maxQuestions = config.test.maxQuestionsPerTool;
+    const parallelPersonas = config.test.parallelPersonas;
+    // Get LLM settings
+    const provider = config.llm.provider;
+    const model = config.llm.model || undefined; // Empty string means use default
+    // Display startup banner
+    const banner = formatStartupBanner({
+        serverCommand: `${serverCommand} ${args.join(' ')}`,
+        provider,
+        model: model || 'default',
+        isQuality: false,
+        personas: selectedPersonas.map((p) => p.name),
+        questionsPerTool: maxQuestions,
+    });
+    output.info(banner);
+    output.newline();
+    if (isContractMode) {
+        output.info('Mode: contract (free, deterministic - no LLM calls)');
+    }
+    else {
+        output.info(`Mode: document (LLM-powered using ${provider})`);
+    }
+    output.newline();
+    // Initialize cost tracker
+    const costTracker = new CostTracker(model || 'default');
+    // Initialize metrics collector
+    resetMetricsCollector();
+    const metricsCollector = getMetricsCollector();
+    metricsCollector.startInterview();
+    // Initialize cache
+    resetGlobalCache();
+    const cache = getGlobalCache({ enabled: cacheEnabled });
+    if (cacheEnabled && verbose) {
+        output.info('Response caching enabled');
+    }
+    // Initialize MCP client
+    const mcpClient = new MCPClient({
+        timeout,
+        debug: logLevel === 'debug',
+        transport: 'stdio',
+    });
+    // Initialize LLM client (only for document mode)
+    let llmClient;
+    if (!isContractMode) {
+        const onUsageCallback = (inputTokens, outputTokens) => {
+            costTracker.addUsage(inputTokens, outputTokens);
+            metricsCollector.recordTokenUsage(provider, model || 'default', inputTokens, outputTokens, 'llm_call');
+        };
+        try {
+            // Use fallback client for robustness
+            llmClient = new FallbackLLMClient({
+                providers: [{ provider, model, baseUrl: provider === 'ollama' ? config.llm.ollama.baseUrl : undefined }],
+                useOllamaFallback: true,
+                onUsage: onUsageCallback,
+            });
+        }
+        catch (error) {
+            output.error('Failed to initialize LLM client: ' + (error instanceof Error ? error.message : String(error)));
+            output.error(`\nProvider: ${provider}`);
+            output.error('Make sure the appropriate API key environment variable is set:');
+            output.error('  - OpenAI: OPENAI_API_KEY');
+            output.error('  - Anthropic: ANTHROPIC_API_KEY');
+            output.error('  - Ollama: No API key needed (ensure Ollama is running)');
+            process.exit(1);
+        }
+    }
+    // For contract mode, create a minimal LLM client that won't be used
+    if (!llmClient) {
+        llmClient = createLLMClient({
+            provider: 'ollama',
+            model: 'llama3.2', // Default model; not actually used in contract mode
+            baseUrl: 'http://localhost:11434',
+        });
+    }
+    try {
+        // Connect to MCP server
+        output.info('Connecting to MCP server...');
+        await mcpClient.connect(serverCommand, args, config.server.env);
+        // Discovery phase
+        output.info('Discovering capabilities...');
+        const discovery = await discover(mcpClient, serverCommand, args);
+        const resourceCount = discovery.resources?.length ?? 0;
+        const discoveryParts = [`${discovery.tools.length} tools`, `${discovery.prompts.length} prompts`];
+        if (resourceCount > 0) {
+            discoveryParts.push(`${resourceCount} resources`);
+        }
+        output.info(`Found ${discoveryParts.join(', ')}\n`);
+        // Update metrics
+        metricsCollector.updateInterviewCounters({
+            toolsDiscovered: discovery.tools.length,
+            personasUsed: selectedPersonas.length,
+        });
+        if (discovery.tools.length === 0) {
+            output.info('No tools found. Nothing to test.');
+            metricsCollector.endInterview();
+            await mcpClient.disconnect();
+            return;
+        }
+        // Show cost/time estimate (unless in contract mode or CI)
+        if (!isContractMode && !isCI()) {
+            const costEstimate = estimateInterviewCost(model || 'default', discovery.tools.length, maxQuestions, selectedPersonas.length);
+            const timeEstimate = estimateInterviewTime(discovery.tools.length, maxQuestions, selectedPersonas.length, parallelPersonas, provider, discovery.prompts.length, resourceCount, false);
+            output.info(formatCostAndTimeEstimate(costEstimate, timeEstimate));
+            // Show optimization suggestions
+            const hasScenariosFile = !!(config.scenarios.path || existsSync(join(outputDir, DEFAULT_SCENARIOS_FILE)));
+            const suggestions = suggestOptimizations({
+                estimatedCost: costEstimate.costUSD,
+                toolCount: discovery.tools.length,
+                personaCount: selectedPersonas.length,
+                isParallelPersonas: parallelPersonas,
+                isPremiumModel: false,
+                isUsingCiPreset: isContractMode,
+                hasScenariosFile,
+            });
+            if (suggestions.length > 0) {
+                output.newline();
+                output.info(formatOptimizationSuggestions(suggestions));
+            }
+            output.newline();
+        }
+        // Load custom scenarios
+        let customScenarios;
+        if (config.scenarios.path) {
+            try {
+                customScenarios = loadScenariosFromFile(config.scenarios.path);
+                output.info(`Loaded ${customScenarios.toolScenarios.length} tool scenarios from ${config.scenarios.path}`);
+            }
+            catch (error) {
+                output.error(`Failed to load scenarios: ${error instanceof Error ? error.message : error}`);
+                process.exit(1);
+            }
+        }
+        else if (!isContractMode) {
+            const defaultScenarios = tryLoadDefaultScenarios(outputDir);
+            if (defaultScenarios) {
+                customScenarios = defaultScenarios;
+                output.info(`Auto-loaded ${customScenarios.toolScenarios.length} scenarios from ${DEFAULT_SCENARIOS_FILE}`);
+            }
+        }
+        // Build workflow configuration
+        let workflowConfig;
+        if (config.workflows.path || config.workflows.discover) {
+            workflowConfig = {
+                discoverWorkflows: config.workflows.discover,
+                maxDiscoveredWorkflows: WORKFLOW.MAX_DISCOVERED_WORKFLOWS,
+                enableStateTracking: config.workflows.trackState,
+            };
+            if (config.workflows.path) {
+                try {
+                    const workflows = loadWorkflowsFromFile(config.workflows.path);
+                    workflowConfig.workflows = workflows;
+                    workflowConfig.workflowsFile = config.workflows.path;
+                    output.info(`Loaded ${workflows.length} workflow(s) from ${config.workflows.path}`);
+                }
+                catch (error) {
+                    output.error(`Failed to load workflows: ${error instanceof Error ? error.message : error}`);
+                    process.exit(1);
+                }
+            }
+        }
+        else if (!isContractMode) {
+            const defaultWorkflows = tryLoadDefaultWorkflows(outputDir);
+            if (defaultWorkflows && defaultWorkflows.length > 0) {
+                workflowConfig = {
+                    discoverWorkflows: false,
+                    maxDiscoveredWorkflows: WORKFLOW.MAX_DISCOVERED_WORKFLOWS,
+                    enableStateTracking: config.workflows.trackState,
+                    workflows: defaultWorkflows,
+                    workflowsFile: `${outputDir}/${DEFAULT_WORKFLOWS_FILE}`,
+                };
+                output.info(`Auto-loaded ${defaultWorkflows.length} workflow(s) from ${DEFAULT_WORKFLOWS_FILE}`);
+            }
+        }
+        // Set up streaming display
+        let streamingDisplay = null;
+        let streamingCallbacks;
+        if (!isContractMode && !isCI() && logLevel !== 'silent') {
+            suppressLogs();
+            streamingDisplay = new StreamingDisplay({ style: 'dim', maxWidth: 100 });
+            streamingCallbacks = {
+                onStart: (operation) => {
+                    const parts = operation.split(':');
+                    const opType = parts[0];
+                    const context = parts[1];
+                    let prefix = '';
+                    switch (opType) {
+                        case 'generate-questions':
+                            prefix = context ? `\n  Generating questions for ${context}... ` : '\n  Generating questions... ';
+                            break;
+                        case 'analyze':
+                            prefix = context ? `\n  Analyzing ${context}... ` : '\n  Analyzing... ';
+                            break;
+                        case 'synthesize-tool':
+                            prefix = context ? `\n  Synthesizing profile for ${context}... ` : '\n  Synthesizing profile... ';
+                            break;
+                        case 'synthesize-overall':
+                            prefix = '\n  Synthesizing overall findings... ';
+                            break;
+                        default:
+                            prefix = '\n  Processing... ';
+                    }
+                    streamingDisplay?.start(prefix);
+                },
+                onChunk: (chunk) => {
+                    streamingDisplay?.write(chunk);
+                },
+                onComplete: () => {
+                    streamingDisplay?.finish(' [done]');
+                },
+                onError: (error) => {
+                    streamingDisplay?.abort(`[error: ${error.message}]`);
+                },
+            };
+        }
+        // Create interviewer
+        const fullServerCommand = `${serverCommand} ${args.join(' ')}`.trim();
+        const interviewer = new Interviewer(llmClient, {
+            maxQuestionsPerTool: maxQuestions,
+            timeout,
+            skipErrorTests: config.test.skipErrorTests,
+            model: model || 'default',
+            personas: selectedPersonas,
+            customScenarios,
+            customScenariosOnly: config.scenarios.only,
+            enableStreaming: !!streamingCallbacks,
+            streamingCallbacks,
+            parallelPersonas,
+            personaConcurrency: INTERVIEW.DEFAULT_PERSONA_CONCURRENCY,
+            cache,
+            workflowConfig,
+            contractOnly: isContractMode,
+            serverCommand: fullServerCommand,
+        });
+        // Extract server context
+        const serverContext = extractServerContextFromArgs(serverCommand, args);
+        if (serverContext.allowedDirectories && serverContext.allowedDirectories.length > 0) {
+            output.info(`Detected allowed directories: ${serverContext.allowedDirectories.join(', ')}`);
+        }
+        interviewer.setServerContext(serverContext);
+        // Set up progress display
+        const progressBar = new InterviewProgressBar({ enabled: !verbose && !streamingCallbacks });
+        const progressCallback = (progress) => {
+            if (verbose) {
+                switch (progress.phase) {
+                    case 'starting':
+                        output.info('Starting test...');
+                        progressBar.start(progress.totalTools, progress.totalPersonas, progress.totalPrompts ?? 0, progress.totalResources ?? 0);
+                        break;
+                    case 'interviewing':
+                        output.info(`[${progress.currentPersona}] Testing: ${progress.currentTool} (${progress.toolsCompleted + 1}/${progress.totalTools})`);
+                        break;
+                    case 'synthesizing':
+                        output.info('Synthesizing findings...');
+                        break;
+                    case 'complete':
+                        output.info('Test complete!');
+                        break;
+                }
+            }
+            else {
+                if (progress.phase === 'starting') {
+                    progressBar.start(progress.totalTools, progress.totalPersonas, progress.totalPrompts ?? 0, progress.totalResources ?? 0);
+                }
+                else if (['interviewing', 'prompts', 'resources', 'workflows'].includes(progress.phase)) {
+                    progressBar.update(progress);
+                }
+                else if (progress.phase === 'complete' || progress.phase === 'synthesizing') {
+                    progressBar.stop();
+                }
+            }
+        };
+        output.info('Starting test...\n');
+        const result = await interviewer.interview(mcpClient, discovery, progressCallback);
+        progressBar.stop();
+        if (!verbose) {
+            output.newline();
+        }
+        // Generate documentation
+        output.info('Generating documentation...');
+        mkdirSync(outputDir, { recursive: true });
+        const agentsMd = generateAgentsMd(result);
+        // Use CONTRACT.md for contract mode, AGENTS.md for document mode
+        const outputFileName = isContractMode ? 'CONTRACT.md' : 'AGENTS.md';
+        const agentsMdPath = join(outputDir, outputFileName);
+        writeFileSync(agentsMdPath, agentsMd);
+        output.info(`Written: ${agentsMdPath}`);
+        if (wantsJson) {
+            const jsonReport = generateJsonReport(result);
+            const jsonPath = join(outputDir, 'bellwether-report.json');
+            writeFileSync(jsonPath, jsonReport);
+            output.info(`Written: ${jsonPath}`);
+        }
+        // End metrics
+        metricsCollector.endInterview();
+        output.info('\nTest complete!');
+        output.info(`Duration: ${(result.metadata.durationMs / 1000).toFixed(1)}s`);
+        output.info(`Tools verified: ${result.toolProfiles.length}`);
+        // Display scenario results
+        if (result.scenarioResults && result.scenarioResults.length > 0) {
+            const passed = result.scenarioResults.filter((r) => r.passed).length;
+            const failed = result.scenarioResults.length - passed;
+            const statusIcon = failed === 0 ? '\u2713' : '\u2717';
+            output.info(`\nCustom scenarios: ${passed}/${result.scenarioResults.length} passed ${statusIcon}`);
+            if (failed > 0) {
+                output.info('\nFailed scenarios:');
+                for (const scenarioResult of result.scenarioResults.filter((r) => !r.passed)) {
+                    const scenario = scenarioResult.scenario;
+                    const toolOrPrompt = 'tool' in scenario ? scenario.tool : scenario.prompt;
+                    output.info(`  - ${toolOrPrompt}: ${scenario.description}`);
+                    if (scenarioResult.error) {
+                        output.info(`    Error: ${scenarioResult.error}`);
+                    }
+                }
+            }
+        }
+        // Display workflow results
+        if (result.workflowResults && result.workflowResults.length > 0) {
+            const successful = result.workflowResults.filter((wr) => wr.success).length;
+            const failed = result.workflowResults.length - successful;
+            const statusIcon = failed === 0 ? '\u2713' : '\u2717';
+            output.info(`\nWorkflows: ${successful}/${result.workflowResults.length} passed ${statusIcon}`);
+            if (failed > 0) {
+                output.info('\nFailed workflows:');
+                for (const wr of result.workflowResults.filter((w) => !w.success)) {
+                    output.info(`  - ${wr.workflow.name}: ${wr.failureReason ?? 'Unknown error'}`);
+                }
+            }
+        }
+        // Handle baseline comparison from config
+        if (config.baseline.comparePath) {
+            const compareBaselinePath = config.baseline.comparePath;
+            if (!existsSync(compareBaselinePath)) {
+                output.error(`\nBaseline file not found: ${compareBaselinePath}`);
+                process.exit(1);
+            }
+            const previousBaseline = loadBaseline(compareBaselinePath);
+            const baselineMode = isContractMode ? 'contract' : 'document';
+            const currentBaseline = createBaseline(result, fullServerCommand, baselineMode);
+            const diff = compareBaselines(previousBaseline, currentBaseline, {});
+            output.info('\n--- Drift Report ---');
+            output.info(formatDiffText(diff));
+            if (config.baseline.failOnDrift) {
+                if (diff.severity === 'breaking') {
+                    output.error('\nBreaking changes detected!');
+                    process.exit(1);
+                }
+                else if (diff.severity === 'warning') {
+                    output.warn('\nWarning-level changes detected.');
+                    process.exit(1);
+                }
+            }
+        }
+    }
+    catch (error) {
+        const errorMessage = error instanceof Error ? error.message : String(error);
+        output.error('\n--- Test Failed ---');
+        output.error(`Error: ${errorMessage}`);
+        if (errorMessage.includes('ECONNREFUSED') || errorMessage.includes('Connection refused')) {
+            output.error('\nPossible causes:');
+            output.error('  - The MCP server is not running');
+            output.error('  - The server address/port is incorrect');
+        }
+        else if (errorMessage.includes('timeout') || errorMessage.includes('Timeout')) {
+            output.error('\nPossible causes:');
+            output.error('  - The MCP server is taking too long to respond');
+            output.error('  - Increase server.timeout in bellwether.yaml');
+        }
+        else if (errorMessage.includes('ENOENT') || errorMessage.includes('not found')) {
+            output.error('\nPossible causes:');
+            output.error('  - The server command was not found');
+            output.error('  - Check that the command is installed and in PATH');
+        }
+        process.exit(1);
+    }
+    finally {
+        restoreLogLevel();
+        await mcpClient.disconnect();
+    }
+});
+//# sourceMappingURL=test.js.map

package/dist/cli/commands/upload.d.ts ADDED Viewed

@@ -0,0 +1,8 @@
+/**
+ * Upload command for uploading baselines to Bellwether Cloud.
+ *
+ * Can read baseline path from bellwether.yaml config.
+ */
+import { Command } from 'commander';
+export declare const uploadCommand: Command;
+//# sourceMappingURL=upload.d.ts.map