npm - @dotsetlabs/bellwether - Versions diffs - 0.10.0 - Mend

@dotsetlabs/bellwether 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (403) hide show

package/CHANGELOG.md +291 -0
package/LICENSE +21 -0
package/README.md +739 -0
package/dist/auth/credentials.d.ts +64 -0
package/dist/auth/credentials.js +218 -0
package/dist/auth/index.d.ts +6 -0
package/dist/auth/index.js +6 -0
package/dist/auth/keychain.d.ts +64 -0
package/dist/auth/keychain.js +268 -0
package/dist/baseline/ab-testing.d.ts +80 -0
package/dist/baseline/ab-testing.js +236 -0
package/dist/baseline/ai-compatibility-scorer.d.ts +95 -0
package/dist/baseline/ai-compatibility-scorer.js +606 -0
package/dist/baseline/calibration.d.ts +77 -0
package/dist/baseline/calibration.js +136 -0
package/dist/baseline/category-matching.d.ts +85 -0
package/dist/baseline/category-matching.js +289 -0
package/dist/baseline/change-impact-analyzer.d.ts +98 -0
package/dist/baseline/change-impact-analyzer.js +592 -0
package/dist/baseline/comparator.d.ts +64 -0
package/dist/baseline/comparator.js +916 -0
package/dist/baseline/confidence.d.ts +55 -0
package/dist/baseline/confidence.js +122 -0
package/dist/baseline/converter.d.ts +61 -0
package/dist/baseline/converter.js +585 -0
package/dist/baseline/dependency-analyzer.d.ts +89 -0
package/dist/baseline/dependency-analyzer.js +567 -0
package/dist/baseline/deprecation-tracker.d.ts +133 -0
package/dist/baseline/deprecation-tracker.js +322 -0
package/dist/baseline/diff.d.ts +55 -0
package/dist/baseline/diff.js +1584 -0
package/dist/baseline/documentation-scorer.d.ts +205 -0
package/dist/baseline/documentation-scorer.js +466 -0
package/dist/baseline/embeddings.d.ts +118 -0
package/dist/baseline/embeddings.js +251 -0
package/dist/baseline/error-analyzer.d.ts +198 -0
package/dist/baseline/error-analyzer.js +721 -0
package/dist/baseline/evaluation/evaluator.d.ts +42 -0
package/dist/baseline/evaluation/evaluator.js +323 -0
package/dist/baseline/evaluation/expanded-dataset.d.ts +45 -0
package/dist/baseline/evaluation/expanded-dataset.js +1164 -0
package/dist/baseline/evaluation/golden-dataset.d.ts +58 -0
package/dist/baseline/evaluation/golden-dataset.js +717 -0
package/dist/baseline/evaluation/index.d.ts +15 -0
package/dist/baseline/evaluation/index.js +15 -0
package/dist/baseline/evaluation/types.d.ts +186 -0
package/dist/baseline/evaluation/types.js +8 -0
package/dist/baseline/external-dependency-detector.d.ts +181 -0
package/dist/baseline/external-dependency-detector.js +524 -0
package/dist/baseline/golden-output.d.ts +162 -0
package/dist/baseline/golden-output.js +636 -0
package/dist/baseline/health-scorer.d.ts +174 -0
package/dist/baseline/health-scorer.js +451 -0
package/dist/baseline/incremental-checker.d.ts +97 -0
package/dist/baseline/incremental-checker.js +174 -0
package/dist/baseline/index.d.ts +31 -0
package/dist/baseline/index.js +42 -0
package/dist/baseline/migration-generator.d.ts +137 -0
package/dist/baseline/migration-generator.js +554 -0
package/dist/baseline/migrations.d.ts +60 -0
package/dist/baseline/migrations.js +197 -0
package/dist/baseline/performance-tracker.d.ts +214 -0
package/dist/baseline/performance-tracker.js +577 -0
package/dist/baseline/pr-comment-generator.d.ts +117 -0
package/dist/baseline/pr-comment-generator.js +546 -0
package/dist/baseline/response-fingerprint.d.ts +127 -0
package/dist/baseline/response-fingerprint.js +728 -0
package/dist/baseline/response-schema-tracker.d.ts +129 -0
package/dist/baseline/response-schema-tracker.js +420 -0
package/dist/baseline/risk-scorer.d.ts +54 -0
package/dist/baseline/risk-scorer.js +434 -0
package/dist/baseline/saver.d.ts +89 -0
package/dist/baseline/saver.js +554 -0
package/dist/baseline/scenario-generator.d.ts +151 -0
package/dist/baseline/scenario-generator.js +905 -0
package/dist/baseline/schema-compare.d.ts +86 -0
package/dist/baseline/schema-compare.js +557 -0
package/dist/baseline/schema-evolution.d.ts +189 -0
package/dist/baseline/schema-evolution.js +467 -0
package/dist/baseline/semantic.d.ts +203 -0
package/dist/baseline/semantic.js +908 -0
package/dist/baseline/synonyms.d.ts +60 -0
package/dist/baseline/synonyms.js +386 -0
package/dist/baseline/telemetry.d.ts +165 -0
package/dist/baseline/telemetry.js +294 -0
package/dist/baseline/test-pruner.d.ts +120 -0
package/dist/baseline/test-pruner.js +387 -0
package/dist/baseline/types.d.ts +449 -0
package/dist/baseline/types.js +5 -0
package/dist/baseline/version.d.ts +138 -0
package/dist/baseline/version.js +206 -0
package/dist/cache/index.d.ts +5 -0
package/dist/cache/index.js +5 -0
package/dist/cache/response-cache.d.ts +151 -0
package/dist/cache/response-cache.js +287 -0
package/dist/ci/index.d.ts +60 -0
package/dist/ci/index.js +342 -0
package/dist/cli/commands/auth.d.ts +12 -0
package/dist/cli/commands/auth.js +352 -0
package/dist/cli/commands/badge.d.ts +3 -0
package/dist/cli/commands/badge.js +74 -0
package/dist/cli/commands/baseline-accept.d.ts +15 -0
package/dist/cli/commands/baseline-accept.js +178 -0
package/dist/cli/commands/baseline-migrate.d.ts +12 -0
package/dist/cli/commands/baseline-migrate.js +164 -0
package/dist/cli/commands/baseline.d.ts +14 -0
package/dist/cli/commands/baseline.js +449 -0
package/dist/cli/commands/beta.d.ts +10 -0
package/dist/cli/commands/beta.js +231 -0
package/dist/cli/commands/check.d.ts +11 -0
package/dist/cli/commands/check.js +820 -0
package/dist/cli/commands/cloud/badge.d.ts +3 -0
package/dist/cli/commands/cloud/badge.js +74 -0
package/dist/cli/commands/cloud/diff.d.ts +6 -0
package/dist/cli/commands/cloud/diff.js +79 -0
package/dist/cli/commands/cloud/history.d.ts +6 -0
package/dist/cli/commands/cloud/history.js +102 -0
package/dist/cli/commands/cloud/link.d.ts +9 -0
package/dist/cli/commands/cloud/link.js +119 -0
package/dist/cli/commands/cloud/login.d.ts +7 -0
package/dist/cli/commands/cloud/login.js +499 -0
package/dist/cli/commands/cloud/projects.d.ts +6 -0
package/dist/cli/commands/cloud/projects.js +44 -0
package/dist/cli/commands/cloud/shared.d.ts +7 -0
package/dist/cli/commands/cloud/shared.js +42 -0
package/dist/cli/commands/cloud/teams.d.ts +8 -0
package/dist/cli/commands/cloud/teams.js +169 -0
package/dist/cli/commands/cloud/upload.d.ts +8 -0
package/dist/cli/commands/cloud/upload.js +181 -0
package/dist/cli/commands/contract.d.ts +11 -0
package/dist/cli/commands/contract.js +280 -0
package/dist/cli/commands/discover.d.ts +3 -0
package/dist/cli/commands/discover.js +82 -0
package/dist/cli/commands/eval.d.ts +9 -0
package/dist/cli/commands/eval.js +187 -0
package/dist/cli/commands/explore.d.ts +11 -0
package/dist/cli/commands/explore.js +437 -0
package/dist/cli/commands/feedback.d.ts +9 -0
package/dist/cli/commands/feedback.js +174 -0
package/dist/cli/commands/golden.d.ts +12 -0
package/dist/cli/commands/golden.js +407 -0
package/dist/cli/commands/history.d.ts +10 -0
package/dist/cli/commands/history.js +202 -0
package/dist/cli/commands/init.d.ts +9 -0
package/dist/cli/commands/init.js +219 -0
package/dist/cli/commands/interview.d.ts +3 -0
package/dist/cli/commands/interview.js +903 -0
package/dist/cli/commands/link.d.ts +10 -0
package/dist/cli/commands/link.js +169 -0
package/dist/cli/commands/login.d.ts +7 -0
package/dist/cli/commands/login.js +499 -0
package/dist/cli/commands/preset.d.ts +33 -0
package/dist/cli/commands/preset.js +297 -0
package/dist/cli/commands/profile.d.ts +33 -0
package/dist/cli/commands/profile.js +286 -0
package/dist/cli/commands/registry.d.ts +11 -0
package/dist/cli/commands/registry.js +146 -0
package/dist/cli/commands/shared.d.ts +79 -0
package/dist/cli/commands/shared.js +196 -0
package/dist/cli/commands/teams.d.ts +8 -0
package/dist/cli/commands/teams.js +169 -0
package/dist/cli/commands/test.d.ts +9 -0
package/dist/cli/commands/test.js +500 -0
package/dist/cli/commands/upload.d.ts +8 -0
package/dist/cli/commands/upload.js +223 -0
package/dist/cli/commands/validate-config.d.ts +6 -0
package/dist/cli/commands/validate-config.js +35 -0
package/dist/cli/commands/verify.d.ts +11 -0
package/dist/cli/commands/verify.js +283 -0
package/dist/cli/commands/watch.d.ts +12 -0
package/dist/cli/commands/watch.js +253 -0
package/dist/cli/index.d.ts +3 -0
package/dist/cli/index.js +178 -0
package/dist/cli/interactive.d.ts +47 -0
package/dist/cli/interactive.js +216 -0
package/dist/cli/output/terminal-reporter.d.ts +19 -0
package/dist/cli/output/terminal-reporter.js +104 -0
package/dist/cli/output.d.ts +226 -0
package/dist/cli/output.js +438 -0
package/dist/cli/utils/env.d.ts +5 -0
package/dist/cli/utils/env.js +14 -0
package/dist/cli/utils/progress.d.ts +59 -0
package/dist/cli/utils/progress.js +206 -0
package/dist/cli/utils/server-context.d.ts +10 -0
package/dist/cli/utils/server-context.js +36 -0
package/dist/cloud/auth.d.ts +144 -0
package/dist/cloud/auth.js +374 -0
package/dist/cloud/client.d.ts +24 -0
package/dist/cloud/client.js +65 -0
package/dist/cloud/http-client.d.ts +38 -0
package/dist/cloud/http-client.js +215 -0
package/dist/cloud/index.d.ts +23 -0
package/dist/cloud/index.js +25 -0
package/dist/cloud/mock-client.d.ts +107 -0
package/dist/cloud/mock-client.js +545 -0
package/dist/cloud/types.d.ts +515 -0
package/dist/cloud/types.js +15 -0
package/dist/config/defaults.d.ts +160 -0
package/dist/config/defaults.js +169 -0
package/dist/config/loader.d.ts +24 -0
package/dist/config/loader.js +122 -0
package/dist/config/template.d.ts +42 -0
package/dist/config/template.js +647 -0
package/dist/config/validator.d.ts +2112 -0
package/dist/config/validator.js +658 -0
package/dist/constants/cloud.d.ts +107 -0
package/dist/constants/cloud.js +110 -0
package/dist/constants/core.d.ts +521 -0
package/dist/constants/core.js +556 -0
package/dist/constants/testing.d.ts +1283 -0
package/dist/constants/testing.js +1568 -0
package/dist/constants.d.ts +10 -0
package/dist/constants.js +10 -0
package/dist/contract/index.d.ts +6 -0
package/dist/contract/index.js +5 -0
package/dist/contract/validator.d.ts +177 -0
package/dist/contract/validator.js +574 -0
package/dist/cost/index.d.ts +6 -0
package/dist/cost/index.js +5 -0
package/dist/cost/tracker.d.ts +134 -0
package/dist/cost/tracker.js +313 -0
package/dist/discovery/discovery.d.ts +16 -0
package/dist/discovery/discovery.js +173 -0
package/dist/discovery/types.d.ts +51 -0
package/dist/discovery/types.js +2 -0
package/dist/docs/agents.d.ts +3 -0
package/dist/docs/agents.js +995 -0
package/dist/docs/contract.d.ts +51 -0
package/dist/docs/contract.js +1681 -0
package/dist/docs/generator.d.ts +4 -0
package/dist/docs/generator.js +4 -0
package/dist/docs/html-reporter.d.ts +9 -0
package/dist/docs/html-reporter.js +757 -0
package/dist/docs/index.d.ts +10 -0
package/dist/docs/index.js +11 -0
package/dist/docs/junit-reporter.d.ts +18 -0
package/dist/docs/junit-reporter.js +210 -0
package/dist/docs/report.d.ts +14 -0
package/dist/docs/report.js +44 -0
package/dist/docs/sarif-reporter.d.ts +19 -0
package/dist/docs/sarif-reporter.js +335 -0
package/dist/docs/shared.d.ts +35 -0
package/dist/docs/shared.js +162 -0
package/dist/docs/templates.d.ts +12 -0
package/dist/docs/templates.js +76 -0
package/dist/errors/index.d.ts +6 -0
package/dist/errors/index.js +6 -0
package/dist/errors/retry.d.ts +92 -0
package/dist/errors/retry.js +323 -0
package/dist/errors/types.d.ts +321 -0
package/dist/errors/types.js +584 -0
package/dist/index.d.ts +32 -0
package/dist/index.js +32 -0
package/dist/interview/dependency-resolver.d.ts +11 -0
package/dist/interview/dependency-resolver.js +32 -0
package/dist/interview/interviewer.d.ts +232 -0
package/dist/interview/interviewer.js +1939 -0
package/dist/interview/mock-response-generator.d.ts +7 -0
package/dist/interview/mock-response-generator.js +102 -0
package/dist/interview/orchestrator.d.ts +237 -0
package/dist/interview/orchestrator.js +1296 -0
package/dist/interview/rate-limiter.d.ts +15 -0
package/dist/interview/rate-limiter.js +55 -0
package/dist/interview/response-validator.d.ts +10 -0
package/dist/interview/response-validator.js +132 -0
package/dist/interview/schema-inferrer.d.ts +8 -0
package/dist/interview/schema-inferrer.js +71 -0
package/dist/interview/schema-test-generator.d.ts +71 -0
package/dist/interview/schema-test-generator.js +834 -0
package/dist/interview/smart-value-generator.d.ts +155 -0
package/dist/interview/smart-value-generator.js +554 -0
package/dist/interview/stateful-test-runner.d.ts +19 -0
package/dist/interview/stateful-test-runner.js +106 -0
package/dist/interview/types.d.ts +561 -0
package/dist/interview/types.js +2 -0
package/dist/llm/anthropic.d.ts +41 -0
package/dist/llm/anthropic.js +355 -0
package/dist/llm/client.d.ts +123 -0
package/dist/llm/client.js +42 -0
package/dist/llm/factory.d.ts +38 -0
package/dist/llm/factory.js +145 -0
package/dist/llm/fallback.d.ts +140 -0
package/dist/llm/fallback.js +379 -0
package/dist/llm/index.d.ts +18 -0
package/dist/llm/index.js +15 -0
package/dist/llm/ollama.d.ts +37 -0
package/dist/llm/ollama.js +330 -0
package/dist/llm/openai.d.ts +25 -0
package/dist/llm/openai.js +320 -0
package/dist/llm/token-budget.d.ts +161 -0
package/dist/llm/token-budget.js +395 -0
package/dist/logging/logger.d.ts +70 -0
package/dist/logging/logger.js +130 -0
package/dist/metrics/collector.d.ts +106 -0
package/dist/metrics/collector.js +547 -0
package/dist/metrics/index.d.ts +7 -0
package/dist/metrics/index.js +7 -0
package/dist/metrics/prometheus.d.ts +20 -0
package/dist/metrics/prometheus.js +241 -0
package/dist/metrics/types.d.ts +209 -0
package/dist/metrics/types.js +5 -0
package/dist/persona/builtins.d.ts +54 -0
package/dist/persona/builtins.js +219 -0
package/dist/persona/index.d.ts +8 -0
package/dist/persona/index.js +8 -0
package/dist/persona/loader.d.ts +30 -0
package/dist/persona/loader.js +190 -0
package/dist/persona/types.d.ts +144 -0
package/dist/persona/types.js +5 -0
package/dist/persona/validation.d.ts +94 -0
package/dist/persona/validation.js +332 -0
package/dist/prompts/index.d.ts +5 -0
package/dist/prompts/index.js +5 -0
package/dist/prompts/templates.d.ts +180 -0
package/dist/prompts/templates.js +431 -0
package/dist/registry/client.d.ts +49 -0
package/dist/registry/client.js +191 -0
package/dist/registry/index.d.ts +7 -0
package/dist/registry/index.js +6 -0
package/dist/registry/types.d.ts +140 -0
package/dist/registry/types.js +6 -0
package/dist/scenarios/evaluator.d.ts +43 -0
package/dist/scenarios/evaluator.js +206 -0
package/dist/scenarios/index.d.ts +10 -0
package/dist/scenarios/index.js +9 -0
package/dist/scenarios/loader.d.ts +20 -0
package/dist/scenarios/loader.js +285 -0
package/dist/scenarios/types.d.ts +153 -0
package/dist/scenarios/types.js +8 -0
package/dist/security/index.d.ts +17 -0
package/dist/security/index.js +18 -0
package/dist/security/payloads.d.ts +61 -0
package/dist/security/payloads.js +268 -0
package/dist/security/security-tester.d.ts +42 -0
package/dist/security/security-tester.js +582 -0
package/dist/security/types.d.ts +166 -0
package/dist/security/types.js +8 -0
package/dist/transport/base-transport.d.ts +59 -0
package/dist/transport/base-transport.js +38 -0
package/dist/transport/http-transport.d.ts +67 -0
package/dist/transport/http-transport.js +238 -0
package/dist/transport/mcp-client.d.ts +141 -0
package/dist/transport/mcp-client.js +496 -0
package/dist/transport/sse-transport.d.ts +88 -0
package/dist/transport/sse-transport.js +316 -0
package/dist/transport/stdio-transport.d.ts +43 -0
package/dist/transport/stdio-transport.js +238 -0
package/dist/transport/types.d.ts +125 -0
package/dist/transport/types.js +16 -0
package/dist/utils/concurrency.d.ts +123 -0
package/dist/utils/concurrency.js +213 -0
package/dist/utils/formatters.d.ts +16 -0
package/dist/utils/formatters.js +37 -0
package/dist/utils/index.d.ts +8 -0
package/dist/utils/index.js +8 -0
package/dist/utils/jsonpath.d.ts +87 -0
package/dist/utils/jsonpath.js +326 -0
package/dist/utils/markdown.d.ts +113 -0
package/dist/utils/markdown.js +265 -0
package/dist/utils/network.d.ts +14 -0
package/dist/utils/network.js +17 -0
package/dist/utils/sanitize.d.ts +92 -0
package/dist/utils/sanitize.js +191 -0
package/dist/utils/semantic.d.ts +194 -0
package/dist/utils/semantic.js +1051 -0
package/dist/utils/smart-truncate.d.ts +94 -0
package/dist/utils/smart-truncate.js +361 -0
package/dist/utils/timeout.d.ts +153 -0
package/dist/utils/timeout.js +205 -0
package/dist/utils/yaml-parser.d.ts +58 -0
package/dist/utils/yaml-parser.js +86 -0
package/dist/validation/index.d.ts +32 -0
package/dist/validation/index.js +32 -0
package/dist/validation/semantic-test-generator.d.ts +50 -0
package/dist/validation/semantic-test-generator.js +176 -0
package/dist/validation/semantic-types.d.ts +66 -0
package/dist/validation/semantic-types.js +94 -0
package/dist/validation/semantic-validator.d.ts +38 -0
package/dist/validation/semantic-validator.js +340 -0
package/dist/verification/index.d.ts +6 -0
package/dist/verification/index.js +5 -0
package/dist/verification/types.d.ts +133 -0
package/dist/verification/types.js +5 -0
package/dist/verification/verifier.d.ts +30 -0
package/dist/verification/verifier.js +309 -0
package/dist/version.d.ts +19 -0
package/dist/version.js +48 -0
package/dist/workflow/auto-generator.d.ts +27 -0
package/dist/workflow/auto-generator.js +513 -0
package/dist/workflow/discovery.d.ts +40 -0
package/dist/workflow/discovery.js +195 -0
package/dist/workflow/executor.d.ts +82 -0
package/dist/workflow/executor.js +611 -0
package/dist/workflow/index.d.ts +10 -0
package/dist/workflow/index.js +10 -0
package/dist/workflow/loader.d.ts +24 -0
package/dist/workflow/loader.js +194 -0
package/dist/workflow/state-tracker.d.ts +98 -0
package/dist/workflow/state-tracker.js +424 -0
package/dist/workflow/types.d.ts +337 -0
package/dist/workflow/types.js +5 -0
package/package.json +94 -0
package/schemas/bellwether-check.schema.json +651 -0

package/dist/scenarios/loader.js ADDED Viewed

@@ -0,0 +1,285 @@
+/**
+ * Scenario loader - loads test scenarios from YAML files.
+ */
+import { readFileSync, existsSync } from 'fs';
+import { parseYamlSecure } from '../utils/yaml-parser.js';
+import { PATHS } from '../constants.js';
+/** Default file name for test scenarios */
+export const DEFAULT_SCENARIOS_FILE = PATHS.DEFAULT_SCENARIOS_FILE;
+/** Valid question categories */
+const VALID_CATEGORIES = [
+    'happy_path',
+    'edge_case',
+    'error_handling',
+    'boundary',
+    'security',
+];
+/** Valid assertion conditions */
+const VALID_CONDITIONS = [
+    'exists',
+    'equals',
+    'contains',
+    'truthy',
+    'type',
+    'not_error',
+];
+/**
+ * Load test scenarios from a YAML file.
+ */
+export function loadScenariosFromFile(path) {
+    if (!existsSync(path)) {
+        throw new Error(`Test scenarios file not found: ${path}`);
+    }
+    const content = readFileSync(path, 'utf-8');
+    const parsed = parseYamlSecure(content);
+    if (!parsed || typeof parsed !== 'object') {
+        throw new Error(`Invalid test scenarios file: ${path} (expected object)`);
+    }
+    const globalTags = parsed.tags ?? [];
+    const toolScenarios = [];
+    const promptScenarios = [];
+    // Parse tool scenarios
+    if (parsed.scenarios && Array.isArray(parsed.scenarios)) {
+        for (let i = 0; i < parsed.scenarios.length; i++) {
+            const raw = parsed.scenarios[i];
+            try {
+                const scenario = validateToolScenario(raw, i, path, globalTags);
+                toolScenarios.push(scenario);
+            }
+            catch (error) {
+                throw new Error(`Error in scenario ${i + 1} of ${path}: ${error.message}`);
+            }
+        }
+    }
+    // Parse prompt scenarios
+    if (parsed.prompts && Array.isArray(parsed.prompts)) {
+        for (let i = 0; i < parsed.prompts.length; i++) {
+            const raw = parsed.prompts[i];
+            try {
+                const scenario = validatePromptScenario(raw, i, path, globalTags);
+                promptScenarios.push(scenario);
+            }
+            catch (error) {
+                throw new Error(`Error in prompt scenario ${i + 1} of ${path}: ${error.message}`);
+            }
+        }
+    }
+    return {
+        source: path,
+        toolScenarios,
+        promptScenarios,
+        description: parsed.description,
+        version: parsed.version,
+    };
+}
+/**
+ * Try to load scenarios from the default file in a directory.
+ * Returns null if file doesn't exist.
+ */
+export function tryLoadDefaultScenarios(directory) {
+    const path = `${directory}/${DEFAULT_SCENARIOS_FILE}`;
+    if (!existsSync(path)) {
+        return null;
+    }
+    return loadScenariosFromFile(path);
+}
+/**
+ * Validate and normalize a tool test scenario.
+ */
+function validateToolScenario(data, _index, _source, globalTags) {
+    // Required: tool
+    if (!data.tool || typeof data.tool !== 'string') {
+        throw new Error('missing required field: tool');
+    }
+    // Optional: category (default: happy_path)
+    let category = 'happy_path';
+    if (data.category) {
+        if (!VALID_CATEGORIES.includes(data.category)) {
+            throw new Error(`invalid category "${data.category}". Valid categories: ${VALID_CATEGORIES.join(', ')}`);
+        }
+        category = data.category;
+    }
+    // Optional: args (default: empty)
+    const args = data.args ?? {};
+    if (typeof args !== 'object' || Array.isArray(args)) {
+        throw new Error('args must be an object');
+    }
+    // Optional: assertions
+    const assertions = data.assertions?.map((a, i) => validateAssertion(a, i));
+    // Merge global tags with scenario tags
+    const tags = [...globalTags, ...(data.tags ?? [])];
+    return {
+        tool: data.tool,
+        description: data.description ?? `Test ${data.tool} with ${category} scenario`,
+        category,
+        args,
+        assertions,
+        skip: data.skip ?? false,
+        tags: tags.length > 0 ? tags : undefined,
+    };
+}
+/**
+ * Validate and normalize a prompt test scenario.
+ */
+function validatePromptScenario(data, _index, _source, globalTags) {
+    // Required: prompt
+    if (!data.prompt || typeof data.prompt !== 'string') {
+        throw new Error('missing required field: prompt');
+    }
+    // Optional: args (default: empty)
+    const args = data.args ?? {};
+    if (typeof args !== 'object' || Array.isArray(args)) {
+        throw new Error('args must be an object');
+    }
+    // Validate that all arg values are strings
+    for (const [key, value] of Object.entries(args)) {
+        if (typeof value !== 'string') {
+            throw new Error(`prompt arg "${key}" must be a string, got ${typeof value}`);
+        }
+    }
+    // Optional: assertions
+    const assertions = data.assertions?.map((a, i) => validateAssertion(a, i));
+    // Merge global tags with scenario tags
+    const tags = [...globalTags, ...(data.tags ?? [])];
+    return {
+        prompt: data.prompt,
+        description: data.description ?? `Test prompt ${data.prompt}`,
+        args,
+        assertions,
+        skip: data.skip ?? false,
+        tags: tags.length > 0 ? tags : undefined,
+    };
+}
+/**
+ * Validate and normalize an assertion.
+ */
+function validateAssertion(data, index) {
+    // Required: path
+    if (!data.path || typeof data.path !== 'string') {
+        throw new Error(`assertion ${index + 1}: missing required field "path"`);
+    }
+    // Required: condition
+    if (!data.condition || typeof data.condition !== 'string') {
+        throw new Error(`assertion ${index + 1}: missing required field "condition"`);
+    }
+    if (!VALID_CONDITIONS.includes(data.condition)) {
+        throw new Error(`assertion ${index + 1}: invalid condition "${data.condition}". ` +
+            `Valid conditions: ${VALID_CONDITIONS.join(', ')}`);
+    }
+    // Validate that 'value' is provided for conditions that require it
+    const conditionsRequiringValue = ['equals', 'contains', 'type'];
+    if (conditionsRequiringValue.includes(data.condition) && data.value === undefined) {
+        throw new Error(`assertion ${index + 1}: condition "${data.condition}" requires a "value" field`);
+    }
+    return {
+        path: data.path,
+        condition: data.condition,
+        value: data.value,
+        message: data.message,
+    };
+}
+/**
+ * Generate a sample YAML template for test scenarios.
+ */
+export function generateSampleScenariosYaml() {
+    return `# Bellwether Test Scenarios
+# Save as: bellwether-tests.yaml in your project root
+# Docs: https://docs.bellwether.sh/guides/custom-scenarios
+version: "1"
+description: Custom test scenarios for my MCP server
+# Global tags applied to all scenarios (optional)
+tags:
+  - custom
+# Tool test scenarios
+scenarios:
+  # Happy path test
+  - tool: read_file
+    description: Read a valid file
+    category: happy_path
+    args:
+      path: "/tmp/test.txt"
+    assertions:
+      - path: content
+        condition: exists
+        message: File content should be returned
+  # Edge case test
+  - tool: read_file
+    description: Read file with special characters in name
+    category: edge_case
+    args:
+      path: "/tmp/file with spaces.txt"
+    assertions:
+      - path: content
+        condition: exists
+  # Error handling test
+  - tool: read_file
+    description: Handle missing file gracefully
+    category: error_handling
+    args:
+      path: "/nonexistent/file.txt"
+    assertions:
+      - path: error
+        condition: exists
+        message: Should return error for missing file
+  # Security test
+  - tool: read_file
+    description: Reject path traversal attempt
+    category: security
+    args:
+      path: "../../etc/passwd"
+    tags:
+      - security
+      - critical
+  # Skip a test (won't run)
+  - tool: dangerous_operation
+    description: Skipped test
+    skip: true
+    args:
+      action: delete_all
+# Prompt test scenarios
+prompts:
+  - prompt: summarize
+    description: Test summarize prompt with sample text
+    args:
+      text: "This is a long document that needs to be summarized..."
+    assertions:
+      - path: messages
+        condition: exists
+      - path: messages[0].content
+        condition: truthy
+  - prompt: translate
+    description: Test translation prompt
+    args:
+      text: "Hello, world!"
+      language: "Spanish"
+    assertions:
+      - path: messages[0].content.text
+        condition: contains
+        value: "Hola"
+# Assertion conditions:
+# - exists: Path exists (value is not undefined)
+# - equals: Value equals expected
+# - contains: String/array contains value
+# - truthy: Value is truthy
+# - type: Value is of type (string, number, boolean, object, array)
+# - not_error: Response is not an error
+# Categories:
+# - happy_path: Normal usage
+# - edge_case: Boundary conditions
+# - error_handling: Invalid inputs
+# - boundary: Limits and extremes
+# - security: Security-related tests
+`;
+}
+//# sourceMappingURL=loader.js.map

package/dist/scenarios/types.d.ts ADDED Viewed

@@ -0,0 +1,153 @@
+/**
+ * Types for custom YAML-defined test scenarios.
+ *
+ * These types define the schema for user-defined test cases
+ * that can be provided via bellwether-tests.yaml files.
+ */
+import type { QuestionCategory } from '../persona/types.js';
+/**
+ * Valid assertion conditions for scenario expectations.
+ */
+export type AssertionCondition = 'exists' | 'equals' | 'contains' | 'truthy' | 'type' | 'not_error';
+/**
+ * An assertion/expectation for a test scenario.
+ */
+export interface ScenarioAssertion {
+    /** JSONPath to the value to check */
+    path: string;
+    /** Condition to evaluate */
+    condition: AssertionCondition;
+    /** Expected value (for equals, contains, type) */
+    value?: unknown;
+    /** Custom error message on failure */
+    message?: string;
+}
+/**
+ * A single test scenario for a tool.
+ */
+export interface TestScenario {
+    /** Tool to test */
+    tool: string;
+    /** Description of what this test verifies */
+    description: string;
+    /** Category of test (default: happy_path) */
+    category: QuestionCategory;
+    /** Arguments to pass to the tool */
+    args: Record<string, unknown>;
+    /** Assertions to verify after execution */
+    assertions?: ScenarioAssertion[];
+    /** Whether this scenario should be skipped */
+    skip?: boolean;
+    /** Tags for filtering scenarios */
+    tags?: string[];
+}
+/**
+ * A single test scenario for a prompt.
+ */
+export interface PromptScenario {
+    /** Prompt to test */
+    prompt: string;
+    /** Description of what this test verifies */
+    description: string;
+    /** Arguments to pass to the prompt */
+    args: Record<string, string>;
+    /** Assertions to verify on the rendered output */
+    assertions?: ScenarioAssertion[];
+    /** Whether this scenario should be skipped */
+    skip?: boolean;
+    /** Tags for filtering scenarios */
+    tags?: string[];
+}
+/**
+ * YAML file structure for test scenarios.
+ */
+export interface TestScenariosYAML {
+    /** Version of the schema (for future compatibility) */
+    version?: string;
+    /** Description of this test file */
+    description?: string;
+    /** Tool test scenarios */
+    scenarios?: TestScenarioYAML[];
+    /** Prompt test scenarios */
+    prompts?: PromptScenarioYAML[];
+    /** Global tags applied to all scenarios */
+    tags?: string[];
+}
+/**
+ * YAML representation of a test scenario (looser types for parsing).
+ */
+export interface TestScenarioYAML {
+    tool: string;
+    description?: string;
+    category?: string;
+    args?: Record<string, unknown>;
+    assertions?: ScenarioAssertionYAML[];
+    skip?: boolean;
+    tags?: string[];
+}
+/**
+ * YAML representation of a prompt scenario.
+ */
+export interface PromptScenarioYAML {
+    prompt: string;
+    description?: string;
+    args?: Record<string, string>;
+    assertions?: ScenarioAssertionYAML[];
+    skip?: boolean;
+    tags?: string[];
+}
+/**
+ * YAML representation of an assertion.
+ */
+export interface ScenarioAssertionYAML {
+    path?: string;
+    condition?: string;
+    value?: unknown;
+    message?: string;
+}
+/**
+ * Loaded test scenarios file.
+ */
+export interface LoadedScenarios {
+    /** Source file path */
+    source: string;
+    /** Tool test scenarios */
+    toolScenarios: TestScenario[];
+    /** Prompt test scenarios */
+    promptScenarios: PromptScenario[];
+    /** File description */
+    description?: string;
+    /** Schema version */
+    version?: string;
+}
+/**
+ * Result of running a scenario assertion.
+ */
+export interface AssertionResult {
+    /** The assertion that was checked */
+    assertion: ScenarioAssertion;
+    /** Whether the assertion passed */
+    passed: boolean;
+    /** Actual value found */
+    actualValue?: unknown;
+    /** Error message if failed */
+    error?: string;
+}
+/**
+ * Result of running a single test scenario.
+ */
+export interface ScenarioResult {
+    /** The scenario that was run */
+    scenario: TestScenario | PromptScenario;
+    /** Whether the scenario passed (all assertions passed and no error) */
+    passed: boolean;
+    /** Assertion results */
+    assertionResults: AssertionResult[];
+    /** Error if execution failed */
+    error?: string;
+    /** Response from the tool/prompt */
+    response?: unknown;
+    /** Execution duration in ms */
+    durationMs: number;
+}
+//# sourceMappingURL=types.d.ts.map

package/dist/scenarios/types.js ADDED Viewed

@@ -0,0 +1,8 @@
+/**
+ * Types for custom YAML-defined test scenarios.
+ *
+ * These types define the schema for user-defined test cases
+ * that can be provided via bellwether-tests.yaml files.
+ */
+export {};
+//# sourceMappingURL=types.js.map

package/dist/security/index.d.ts ADDED Viewed

@@ -0,0 +1,17 @@
+/**
+ * Security testing module for bellwether check mode.
+ *
+ * This module provides deterministic security testing capabilities that can
+ * detect common vulnerability patterns in MCP tools without requiring LLM.
+ *
+ * Usage:
+ *   bellwether check --security           # Run security tests with default categories
+ *   bellwether check --security --security-categories sql_injection,xss
+ *
+ * The security baseline is stored in the baseline file and can be compared
+ * across runs to detect security posture changes.
+ */
+export type { SecurityCategory, RiskLevel, SecurityPayload, SecurityTestResult, SecurityFinding, SecurityFingerprint, SecurityDiff, SecurityTestOptions, SecurityTestContext, SecurityToolCallResult, SecurityReport, } from './types.js';
+export { SQL_INJECTION_PAYLOADS, XSS_PAYLOADS, PATH_TRAVERSAL_PAYLOADS, COMMAND_INJECTION_PAYLOADS, SSRF_PAYLOADS, getPayloadsForCategory, getAllSecurityPayloads, getAllSecurityCategories, } from './payloads.js';
+export { runSecurityTests, compareSecurityFingerprints, getRiskLevelFromScore, parseSecurityCategories, } from './security-tester.js';
+//# sourceMappingURL=index.d.ts.map

package/dist/security/index.js ADDED Viewed

@@ -0,0 +1,18 @@
+/**
+ * Security testing module for bellwether check mode.
+ *
+ * This module provides deterministic security testing capabilities that can
+ * detect common vulnerability patterns in MCP tools without requiring LLM.
+ *
+ * Usage:
+ *   bellwether check --security           # Run security tests with default categories
+ *   bellwether check --security --security-categories sql_injection,xss
+ *
+ * The security baseline is stored in the baseline file and can be compared
+ * across runs to detect security posture changes.
+ */
+// Payload exports
+export { SQL_INJECTION_PAYLOADS, XSS_PAYLOADS, PATH_TRAVERSAL_PAYLOADS, COMMAND_INJECTION_PAYLOADS, SSRF_PAYLOADS, getPayloadsForCategory, getAllSecurityPayloads, getAllSecurityCategories, } from './payloads.js';
+// Security tester exports
+export { runSecurityTests, compareSecurityFingerprints, getRiskLevelFromScore, parseSecurityCategories, } from './security-tester.js';
+//# sourceMappingURL=index.js.map

package/dist/security/payloads.d.ts ADDED Viewed

@@ -0,0 +1,61 @@
+/**
+ * Deterministic security test payloads.
+ *
+ * These are well-known test patterns used for security testing that don't
+ * require LLM generation. Each payload is designed to test a specific
+ * vulnerability class.
+ *
+ * IMPORTANT: These payloads are for defensive security testing only.
+ * They help developers identify input validation gaps in their MCP servers.
+ */
+import type { SecurityPayload, SecurityCategory } from './types.js';
+/**
+ * SQL injection test payloads.
+ * Tests for improper handling of SQL metacharacters in user input.
+ * CWE-89: Improper Neutralization of Special Elements used in an SQL Command
+ */
+export declare const SQL_INJECTION_PAYLOADS: SecurityPayload[];
+/**
+ * Cross-Site Scripting (XSS) test payloads.
+ * Tests for improper handling of HTML/JavaScript in user input.
+ * CWE-79: Improper Neutralization of Input During Web Page Generation
+ */
+export declare const XSS_PAYLOADS: SecurityPayload[];
+/**
+ * Path traversal test payloads.
+ * Tests for improper handling of file path inputs.
+ * CWE-22: Improper Limitation of a Pathname to a Restricted Directory
+ */
+export declare const PATH_TRAVERSAL_PAYLOADS: SecurityPayload[];
+/**
+ * Command injection test payloads.
+ * Tests for improper handling of shell metacharacters.
+ * CWE-78: Improper Neutralization of Special Elements used in an OS Command
+ */
+export declare const COMMAND_INJECTION_PAYLOADS: SecurityPayload[];
+/**
+ * Server-Side Request Forgery (SSRF) test payloads.
+ * Tests for improper URL validation allowing internal network access.
+ * CWE-918: Server-Side Request Forgery (SSRF)
+ */
+export declare const SSRF_PAYLOADS: SecurityPayload[];
+/**
+ * Get payloads for a specific security category.
+ *
+ * @param category - The security category to get payloads for
+ * @returns Array of payloads for that category
+ */
+export declare function getPayloadsForCategory(category: SecurityCategory): SecurityPayload[];
+/**
+ * Get all security payloads across all categories.
+ *
+ * @returns Array of all security payloads
+ */
+export declare function getAllSecurityPayloads(): SecurityPayload[];
+/**
+ * Get all available security categories.
+ *
+ * @returns Array of all security category identifiers
+ */
+export declare function getAllSecurityCategories(): SecurityCategory[];
+//# sourceMappingURL=payloads.d.ts.map