npm - @dotsetlabs/bellwether - Versions diffs - 0.10.0 - Mend

@dotsetlabs/bellwether 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (403) hide show

package/CHANGELOG.md +291 -0
package/LICENSE +21 -0
package/README.md +739 -0
package/dist/auth/credentials.d.ts +64 -0
package/dist/auth/credentials.js +218 -0
package/dist/auth/index.d.ts +6 -0
package/dist/auth/index.js +6 -0
package/dist/auth/keychain.d.ts +64 -0
package/dist/auth/keychain.js +268 -0
package/dist/baseline/ab-testing.d.ts +80 -0
package/dist/baseline/ab-testing.js +236 -0
package/dist/baseline/ai-compatibility-scorer.d.ts +95 -0
package/dist/baseline/ai-compatibility-scorer.js +606 -0
package/dist/baseline/calibration.d.ts +77 -0
package/dist/baseline/calibration.js +136 -0
package/dist/baseline/category-matching.d.ts +85 -0
package/dist/baseline/category-matching.js +289 -0
package/dist/baseline/change-impact-analyzer.d.ts +98 -0
package/dist/baseline/change-impact-analyzer.js +592 -0
package/dist/baseline/comparator.d.ts +64 -0
package/dist/baseline/comparator.js +916 -0
package/dist/baseline/confidence.d.ts +55 -0
package/dist/baseline/confidence.js +122 -0
package/dist/baseline/converter.d.ts +61 -0
package/dist/baseline/converter.js +585 -0
package/dist/baseline/dependency-analyzer.d.ts +89 -0
package/dist/baseline/dependency-analyzer.js +567 -0
package/dist/baseline/deprecation-tracker.d.ts +133 -0
package/dist/baseline/deprecation-tracker.js +322 -0
package/dist/baseline/diff.d.ts +55 -0
package/dist/baseline/diff.js +1584 -0
package/dist/baseline/documentation-scorer.d.ts +205 -0
package/dist/baseline/documentation-scorer.js +466 -0
package/dist/baseline/embeddings.d.ts +118 -0
package/dist/baseline/embeddings.js +251 -0
package/dist/baseline/error-analyzer.d.ts +198 -0
package/dist/baseline/error-analyzer.js +721 -0
package/dist/baseline/evaluation/evaluator.d.ts +42 -0
package/dist/baseline/evaluation/evaluator.js +323 -0
package/dist/baseline/evaluation/expanded-dataset.d.ts +45 -0
package/dist/baseline/evaluation/expanded-dataset.js +1164 -0
package/dist/baseline/evaluation/golden-dataset.d.ts +58 -0
package/dist/baseline/evaluation/golden-dataset.js +717 -0
package/dist/baseline/evaluation/index.d.ts +15 -0
package/dist/baseline/evaluation/index.js +15 -0
package/dist/baseline/evaluation/types.d.ts +186 -0
package/dist/baseline/evaluation/types.js +8 -0
package/dist/baseline/external-dependency-detector.d.ts +181 -0
package/dist/baseline/external-dependency-detector.js +524 -0
package/dist/baseline/golden-output.d.ts +162 -0
package/dist/baseline/golden-output.js +636 -0
package/dist/baseline/health-scorer.d.ts +174 -0
package/dist/baseline/health-scorer.js +451 -0
package/dist/baseline/incremental-checker.d.ts +97 -0
package/dist/baseline/incremental-checker.js +174 -0
package/dist/baseline/index.d.ts +31 -0
package/dist/baseline/index.js +42 -0
package/dist/baseline/migration-generator.d.ts +137 -0
package/dist/baseline/migration-generator.js +554 -0
package/dist/baseline/migrations.d.ts +60 -0
package/dist/baseline/migrations.js +197 -0
package/dist/baseline/performance-tracker.d.ts +214 -0
package/dist/baseline/performance-tracker.js +577 -0
package/dist/baseline/pr-comment-generator.d.ts +117 -0
package/dist/baseline/pr-comment-generator.js +546 -0
package/dist/baseline/response-fingerprint.d.ts +127 -0
package/dist/baseline/response-fingerprint.js +728 -0
package/dist/baseline/response-schema-tracker.d.ts +129 -0
package/dist/baseline/response-schema-tracker.js +420 -0
package/dist/baseline/risk-scorer.d.ts +54 -0
package/dist/baseline/risk-scorer.js +434 -0
package/dist/baseline/saver.d.ts +89 -0
package/dist/baseline/saver.js +554 -0
package/dist/baseline/scenario-generator.d.ts +151 -0
package/dist/baseline/scenario-generator.js +905 -0
package/dist/baseline/schema-compare.d.ts +86 -0
package/dist/baseline/schema-compare.js +557 -0
package/dist/baseline/schema-evolution.d.ts +189 -0
package/dist/baseline/schema-evolution.js +467 -0
package/dist/baseline/semantic.d.ts +203 -0
package/dist/baseline/semantic.js +908 -0
package/dist/baseline/synonyms.d.ts +60 -0
package/dist/baseline/synonyms.js +386 -0
package/dist/baseline/telemetry.d.ts +165 -0
package/dist/baseline/telemetry.js +294 -0
package/dist/baseline/test-pruner.d.ts +120 -0
package/dist/baseline/test-pruner.js +387 -0
package/dist/baseline/types.d.ts +449 -0
package/dist/baseline/types.js +5 -0
package/dist/baseline/version.d.ts +138 -0
package/dist/baseline/version.js +206 -0
package/dist/cache/index.d.ts +5 -0
package/dist/cache/index.js +5 -0
package/dist/cache/response-cache.d.ts +151 -0
package/dist/cache/response-cache.js +287 -0
package/dist/ci/index.d.ts +60 -0
package/dist/ci/index.js +342 -0
package/dist/cli/commands/auth.d.ts +12 -0
package/dist/cli/commands/auth.js +352 -0
package/dist/cli/commands/badge.d.ts +3 -0
package/dist/cli/commands/badge.js +74 -0
package/dist/cli/commands/baseline-accept.d.ts +15 -0
package/dist/cli/commands/baseline-accept.js +178 -0
package/dist/cli/commands/baseline-migrate.d.ts +12 -0
package/dist/cli/commands/baseline-migrate.js +164 -0
package/dist/cli/commands/baseline.d.ts +14 -0
package/dist/cli/commands/baseline.js +449 -0
package/dist/cli/commands/beta.d.ts +10 -0
package/dist/cli/commands/beta.js +231 -0
package/dist/cli/commands/check.d.ts +11 -0
package/dist/cli/commands/check.js +820 -0
package/dist/cli/commands/cloud/badge.d.ts +3 -0
package/dist/cli/commands/cloud/badge.js +74 -0
package/dist/cli/commands/cloud/diff.d.ts +6 -0
package/dist/cli/commands/cloud/diff.js +79 -0
package/dist/cli/commands/cloud/history.d.ts +6 -0
package/dist/cli/commands/cloud/history.js +102 -0
package/dist/cli/commands/cloud/link.d.ts +9 -0
package/dist/cli/commands/cloud/link.js +119 -0
package/dist/cli/commands/cloud/login.d.ts +7 -0
package/dist/cli/commands/cloud/login.js +499 -0
package/dist/cli/commands/cloud/projects.d.ts +6 -0
package/dist/cli/commands/cloud/projects.js +44 -0
package/dist/cli/commands/cloud/shared.d.ts +7 -0
package/dist/cli/commands/cloud/shared.js +42 -0
package/dist/cli/commands/cloud/teams.d.ts +8 -0
package/dist/cli/commands/cloud/teams.js +169 -0
package/dist/cli/commands/cloud/upload.d.ts +8 -0
package/dist/cli/commands/cloud/upload.js +181 -0
package/dist/cli/commands/contract.d.ts +11 -0
package/dist/cli/commands/contract.js +280 -0
package/dist/cli/commands/discover.d.ts +3 -0
package/dist/cli/commands/discover.js +82 -0
package/dist/cli/commands/eval.d.ts +9 -0
package/dist/cli/commands/eval.js +187 -0
package/dist/cli/commands/explore.d.ts +11 -0
package/dist/cli/commands/explore.js +437 -0
package/dist/cli/commands/feedback.d.ts +9 -0
package/dist/cli/commands/feedback.js +174 -0
package/dist/cli/commands/golden.d.ts +12 -0
package/dist/cli/commands/golden.js +407 -0
package/dist/cli/commands/history.d.ts +10 -0
package/dist/cli/commands/history.js +202 -0
package/dist/cli/commands/init.d.ts +9 -0
package/dist/cli/commands/init.js +219 -0
package/dist/cli/commands/interview.d.ts +3 -0
package/dist/cli/commands/interview.js +903 -0
package/dist/cli/commands/link.d.ts +10 -0
package/dist/cli/commands/link.js +169 -0
package/dist/cli/commands/login.d.ts +7 -0
package/dist/cli/commands/login.js +499 -0
package/dist/cli/commands/preset.d.ts +33 -0
package/dist/cli/commands/preset.js +297 -0
package/dist/cli/commands/profile.d.ts +33 -0
package/dist/cli/commands/profile.js +286 -0
package/dist/cli/commands/registry.d.ts +11 -0
package/dist/cli/commands/registry.js +146 -0
package/dist/cli/commands/shared.d.ts +79 -0
package/dist/cli/commands/shared.js +196 -0
package/dist/cli/commands/teams.d.ts +8 -0
package/dist/cli/commands/teams.js +169 -0
package/dist/cli/commands/test.d.ts +9 -0
package/dist/cli/commands/test.js +500 -0
package/dist/cli/commands/upload.d.ts +8 -0
package/dist/cli/commands/upload.js +223 -0
package/dist/cli/commands/validate-config.d.ts +6 -0
package/dist/cli/commands/validate-config.js +35 -0
package/dist/cli/commands/verify.d.ts +11 -0
package/dist/cli/commands/verify.js +283 -0
package/dist/cli/commands/watch.d.ts +12 -0
package/dist/cli/commands/watch.js +253 -0
package/dist/cli/index.d.ts +3 -0
package/dist/cli/index.js +178 -0
package/dist/cli/interactive.d.ts +47 -0
package/dist/cli/interactive.js +216 -0
package/dist/cli/output/terminal-reporter.d.ts +19 -0
package/dist/cli/output/terminal-reporter.js +104 -0
package/dist/cli/output.d.ts +226 -0
package/dist/cli/output.js +438 -0
package/dist/cli/utils/env.d.ts +5 -0
package/dist/cli/utils/env.js +14 -0
package/dist/cli/utils/progress.d.ts +59 -0
package/dist/cli/utils/progress.js +206 -0
package/dist/cli/utils/server-context.d.ts +10 -0
package/dist/cli/utils/server-context.js +36 -0
package/dist/cloud/auth.d.ts +144 -0
package/dist/cloud/auth.js +374 -0
package/dist/cloud/client.d.ts +24 -0
package/dist/cloud/client.js +65 -0
package/dist/cloud/http-client.d.ts +38 -0
package/dist/cloud/http-client.js +215 -0
package/dist/cloud/index.d.ts +23 -0
package/dist/cloud/index.js +25 -0
package/dist/cloud/mock-client.d.ts +107 -0
package/dist/cloud/mock-client.js +545 -0
package/dist/cloud/types.d.ts +515 -0
package/dist/cloud/types.js +15 -0
package/dist/config/defaults.d.ts +160 -0
package/dist/config/defaults.js +169 -0
package/dist/config/loader.d.ts +24 -0
package/dist/config/loader.js +122 -0
package/dist/config/template.d.ts +42 -0
package/dist/config/template.js +647 -0
package/dist/config/validator.d.ts +2112 -0
package/dist/config/validator.js +658 -0
package/dist/constants/cloud.d.ts +107 -0
package/dist/constants/cloud.js +110 -0
package/dist/constants/core.d.ts +521 -0
package/dist/constants/core.js +556 -0
package/dist/constants/testing.d.ts +1283 -0
package/dist/constants/testing.js +1568 -0
package/dist/constants.d.ts +10 -0
package/dist/constants.js +10 -0
package/dist/contract/index.d.ts +6 -0
package/dist/contract/index.js +5 -0
package/dist/contract/validator.d.ts +177 -0
package/dist/contract/validator.js +574 -0
package/dist/cost/index.d.ts +6 -0
package/dist/cost/index.js +5 -0
package/dist/cost/tracker.d.ts +134 -0
package/dist/cost/tracker.js +313 -0
package/dist/discovery/discovery.d.ts +16 -0
package/dist/discovery/discovery.js +173 -0
package/dist/discovery/types.d.ts +51 -0
package/dist/discovery/types.js +2 -0
package/dist/docs/agents.d.ts +3 -0
package/dist/docs/agents.js +995 -0
package/dist/docs/contract.d.ts +51 -0
package/dist/docs/contract.js +1681 -0
package/dist/docs/generator.d.ts +4 -0
package/dist/docs/generator.js +4 -0
package/dist/docs/html-reporter.d.ts +9 -0
package/dist/docs/html-reporter.js +757 -0
package/dist/docs/index.d.ts +10 -0
package/dist/docs/index.js +11 -0
package/dist/docs/junit-reporter.d.ts +18 -0
package/dist/docs/junit-reporter.js +210 -0
package/dist/docs/report.d.ts +14 -0
package/dist/docs/report.js +44 -0
package/dist/docs/sarif-reporter.d.ts +19 -0
package/dist/docs/sarif-reporter.js +335 -0
package/dist/docs/shared.d.ts +35 -0
package/dist/docs/shared.js +162 -0
package/dist/docs/templates.d.ts +12 -0
package/dist/docs/templates.js +76 -0
package/dist/errors/index.d.ts +6 -0
package/dist/errors/index.js +6 -0
package/dist/errors/retry.d.ts +92 -0
package/dist/errors/retry.js +323 -0
package/dist/errors/types.d.ts +321 -0
package/dist/errors/types.js +584 -0
package/dist/index.d.ts +32 -0
package/dist/index.js +32 -0
package/dist/interview/dependency-resolver.d.ts +11 -0
package/dist/interview/dependency-resolver.js +32 -0
package/dist/interview/interviewer.d.ts +232 -0
package/dist/interview/interviewer.js +1939 -0
package/dist/interview/mock-response-generator.d.ts +7 -0
package/dist/interview/mock-response-generator.js +102 -0
package/dist/interview/orchestrator.d.ts +237 -0
package/dist/interview/orchestrator.js +1296 -0
package/dist/interview/rate-limiter.d.ts +15 -0
package/dist/interview/rate-limiter.js +55 -0
package/dist/interview/response-validator.d.ts +10 -0
package/dist/interview/response-validator.js +132 -0
package/dist/interview/schema-inferrer.d.ts +8 -0
package/dist/interview/schema-inferrer.js +71 -0
package/dist/interview/schema-test-generator.d.ts +71 -0
package/dist/interview/schema-test-generator.js +834 -0
package/dist/interview/smart-value-generator.d.ts +155 -0
package/dist/interview/smart-value-generator.js +554 -0
package/dist/interview/stateful-test-runner.d.ts +19 -0
package/dist/interview/stateful-test-runner.js +106 -0
package/dist/interview/types.d.ts +561 -0
package/dist/interview/types.js +2 -0
package/dist/llm/anthropic.d.ts +41 -0
package/dist/llm/anthropic.js +355 -0
package/dist/llm/client.d.ts +123 -0
package/dist/llm/client.js +42 -0
package/dist/llm/factory.d.ts +38 -0
package/dist/llm/factory.js +145 -0
package/dist/llm/fallback.d.ts +140 -0
package/dist/llm/fallback.js +379 -0
package/dist/llm/index.d.ts +18 -0
package/dist/llm/index.js +15 -0
package/dist/llm/ollama.d.ts +37 -0
package/dist/llm/ollama.js +330 -0
package/dist/llm/openai.d.ts +25 -0
package/dist/llm/openai.js +320 -0
package/dist/llm/token-budget.d.ts +161 -0
package/dist/llm/token-budget.js +395 -0
package/dist/logging/logger.d.ts +70 -0
package/dist/logging/logger.js +130 -0
package/dist/metrics/collector.d.ts +106 -0
package/dist/metrics/collector.js +547 -0
package/dist/metrics/index.d.ts +7 -0
package/dist/metrics/index.js +7 -0
package/dist/metrics/prometheus.d.ts +20 -0
package/dist/metrics/prometheus.js +241 -0
package/dist/metrics/types.d.ts +209 -0
package/dist/metrics/types.js +5 -0
package/dist/persona/builtins.d.ts +54 -0
package/dist/persona/builtins.js +219 -0
package/dist/persona/index.d.ts +8 -0
package/dist/persona/index.js +8 -0
package/dist/persona/loader.d.ts +30 -0
package/dist/persona/loader.js +190 -0
package/dist/persona/types.d.ts +144 -0
package/dist/persona/types.js +5 -0
package/dist/persona/validation.d.ts +94 -0
package/dist/persona/validation.js +332 -0
package/dist/prompts/index.d.ts +5 -0
package/dist/prompts/index.js +5 -0
package/dist/prompts/templates.d.ts +180 -0
package/dist/prompts/templates.js +431 -0
package/dist/registry/client.d.ts +49 -0
package/dist/registry/client.js +191 -0
package/dist/registry/index.d.ts +7 -0
package/dist/registry/index.js +6 -0
package/dist/registry/types.d.ts +140 -0
package/dist/registry/types.js +6 -0
package/dist/scenarios/evaluator.d.ts +43 -0
package/dist/scenarios/evaluator.js +206 -0
package/dist/scenarios/index.d.ts +10 -0
package/dist/scenarios/index.js +9 -0
package/dist/scenarios/loader.d.ts +20 -0
package/dist/scenarios/loader.js +285 -0
package/dist/scenarios/types.d.ts +153 -0
package/dist/scenarios/types.js +8 -0
package/dist/security/index.d.ts +17 -0
package/dist/security/index.js +18 -0
package/dist/security/payloads.d.ts +61 -0
package/dist/security/payloads.js +268 -0
package/dist/security/security-tester.d.ts +42 -0
package/dist/security/security-tester.js +582 -0
package/dist/security/types.d.ts +166 -0
package/dist/security/types.js +8 -0
package/dist/transport/base-transport.d.ts +59 -0
package/dist/transport/base-transport.js +38 -0
package/dist/transport/http-transport.d.ts +67 -0
package/dist/transport/http-transport.js +238 -0
package/dist/transport/mcp-client.d.ts +141 -0
package/dist/transport/mcp-client.js +496 -0
package/dist/transport/sse-transport.d.ts +88 -0
package/dist/transport/sse-transport.js +316 -0
package/dist/transport/stdio-transport.d.ts +43 -0
package/dist/transport/stdio-transport.js +238 -0
package/dist/transport/types.d.ts +125 -0
package/dist/transport/types.js +16 -0
package/dist/utils/concurrency.d.ts +123 -0
package/dist/utils/concurrency.js +213 -0
package/dist/utils/formatters.d.ts +16 -0
package/dist/utils/formatters.js +37 -0
package/dist/utils/index.d.ts +8 -0
package/dist/utils/index.js +8 -0
package/dist/utils/jsonpath.d.ts +87 -0
package/dist/utils/jsonpath.js +326 -0
package/dist/utils/markdown.d.ts +113 -0
package/dist/utils/markdown.js +265 -0
package/dist/utils/network.d.ts +14 -0
package/dist/utils/network.js +17 -0
package/dist/utils/sanitize.d.ts +92 -0
package/dist/utils/sanitize.js +191 -0
package/dist/utils/semantic.d.ts +194 -0
package/dist/utils/semantic.js +1051 -0
package/dist/utils/smart-truncate.d.ts +94 -0
package/dist/utils/smart-truncate.js +361 -0
package/dist/utils/timeout.d.ts +153 -0
package/dist/utils/timeout.js +205 -0
package/dist/utils/yaml-parser.d.ts +58 -0
package/dist/utils/yaml-parser.js +86 -0
package/dist/validation/index.d.ts +32 -0
package/dist/validation/index.js +32 -0
package/dist/validation/semantic-test-generator.d.ts +50 -0
package/dist/validation/semantic-test-generator.js +176 -0
package/dist/validation/semantic-types.d.ts +66 -0
package/dist/validation/semantic-types.js +94 -0
package/dist/validation/semantic-validator.d.ts +38 -0
package/dist/validation/semantic-validator.js +340 -0
package/dist/verification/index.d.ts +6 -0
package/dist/verification/index.js +5 -0
package/dist/verification/types.d.ts +133 -0
package/dist/verification/types.js +5 -0
package/dist/verification/verifier.d.ts +30 -0
package/dist/verification/verifier.js +309 -0
package/dist/version.d.ts +19 -0
package/dist/version.js +48 -0
package/dist/workflow/auto-generator.d.ts +27 -0
package/dist/workflow/auto-generator.js +513 -0
package/dist/workflow/discovery.d.ts +40 -0
package/dist/workflow/discovery.js +195 -0
package/dist/workflow/executor.d.ts +82 -0
package/dist/workflow/executor.js +611 -0
package/dist/workflow/index.d.ts +10 -0
package/dist/workflow/index.js +10 -0
package/dist/workflow/loader.d.ts +24 -0
package/dist/workflow/loader.js +194 -0
package/dist/workflow/state-tracker.d.ts +98 -0
package/dist/workflow/state-tracker.js +424 -0
package/dist/workflow/types.d.ts +337 -0
package/dist/workflow/types.js +5 -0
package/package.json +94 -0
package/schemas/bellwether-check.schema.json +651 -0

package/dist/baseline/risk-scorer.js ADDED Viewed

@@ -0,0 +1,434 @@
+/**
+ * Regression Risk Scorer.
+ *
+ * Calculates weighted risk scores for detected changes to help prioritize fixes.
+ * Considers multiple factors: breaking changes, tool importance, error rates,
+ * performance regressions, and security posture.
+ */
+import { REGRESSION_RISK } from '../constants.js';
+/**
+ * Calculate regression risk score from a behavioral diff.
+ */
+export function calculateRiskScore(diff) {
+    const factors = [];
+    // Factor 1: Breaking Change Severity
+    const breakingFactor = scoreBreakingChanges(diff);
+    factors.push(breakingFactor);
+    // Factor 2: Affected Tool Importance
+    const importanceFactor = scoreToolImportance(diff);
+    factors.push(importanceFactor);
+    // Factor 3: Error Rate Delta
+    const errorFactor = scoreErrorDelta(diff);
+    factors.push(errorFactor);
+    // Factor 4: Performance Regression
+    const performanceFactor = scorePerformanceRegression(diff);
+    factors.push(performanceFactor);
+    // Factor 5: Security Posture
+    const securityFactor = scoreSecurityChange(diff);
+    factors.push(securityFactor);
+    // Calculate overall score
+    const overallScore = Math.round(factors.reduce((sum, f) => sum + f.weightedScore, 0));
+    // Determine risk level
+    const level = getRiskLevel(overallScore);
+    // Generate recommendation
+    const recommendation = generateRecommendation(overallScore, factors, diff);
+    // Build change summary
+    const changeSummary = {
+        breaking: diff.breakingCount,
+        warning: diff.warningCount,
+        info: diff.infoCount,
+        toolsRemoved: diff.toolsRemoved.length,
+        toolsAdded: diff.toolsAdded.length,
+        toolsModified: diff.toolsModified.length,
+    };
+    return {
+        score: overallScore,
+        level,
+        factors,
+        recommendation,
+        changeSummary,
+    };
+}
+/**
+ * Score breaking changes based on type and count.
+ */
+function scoreBreakingChanges(diff) {
+    const weight = REGRESSION_RISK.WEIGHTS.breakingChangeSeverity;
+    let score = 0;
+    const details = [];
+    // Score removed tools (most severe)
+    if (diff.toolsRemoved.length > 0) {
+        score = Math.max(score, REGRESSION_RISK.BREAKING_SCORES.toolRemoved);
+        details.push(`${diff.toolsRemoved.length} tool(s) removed`);
+    }
+    // Score breaking behavior changes
+    for (const change of diff.behaviorChanges) {
+        if (change.severity === 'breaking') {
+            const changeScore = getChangeScore(change);
+            score = Math.max(score, changeScore);
+            details.push(`${change.aspect}: ${change.description.slice(0, 50)}`);
+        }
+    }
+    // Compound score based on count
+    if (diff.breakingCount > 1) {
+        score = Math.min(100, score + (diff.breakingCount - 1) * 10);
+    }
+    return {
+        name: 'Breaking Changes',
+        weight,
+        score,
+        weightedScore: score * weight,
+        details: details.length > 0 ? details.join('; ') : 'No breaking changes',
+    };
+}
+/**
+ * Get score for a specific change type.
+ */
+function getChangeScore(change) {
+    const description = change.description.toLowerCase();
+    if (description.includes('removed') && description.includes('required')) {
+        return REGRESSION_RISK.BREAKING_SCORES.requiredParamRemoved;
+    }
+    if (description.includes('type') && description.includes('changed')) {
+        return REGRESSION_RISK.BREAKING_SCORES.typeChanged;
+    }
+    if (description.includes('enum') && description.includes('removed')) {
+        return REGRESSION_RISK.BREAKING_SCORES.enumValueRemoved;
+    }
+    if (description.includes('constraint') && description.includes('tightened')) {
+        return REGRESSION_RISK.BREAKING_SCORES.constraintTightened;
+    }
+    if (description.includes('required') && description.includes('added')) {
+        return REGRESSION_RISK.BREAKING_SCORES.requiredParamAdded;
+    }
+    // Default score for unrecognized breaking changes
+    return 50;
+}
+/**
+ * Score based on importance of affected tools.
+ */
+function scoreToolImportance(diff) {
+    const weight = REGRESSION_RISK.WEIGHTS.toolImportance;
+    let score = 0;
+    const details = [];
+    // Analyze affected tools
+    const affectedTools = [
+        ...diff.toolsRemoved,
+        ...diff.toolsModified.map(t => t.tool),
+    ];
+    let highImportanceCount = 0;
+    let lowImportanceCount = 0;
+    for (const toolDiff of diff.toolsModified) {
+        const description = toolDiff.previous?.description || toolDiff.current?.description || '';
+        // Check for high importance indicators
+        const isHighImportance = REGRESSION_RISK.IMPORTANCE_PATTERNS.highFrequency.some(pattern => pattern.test(description));
+        // Check for low importance indicators
+        const isLowImportance = REGRESSION_RISK.IMPORTANCE_PATTERNS.lowFrequency.some(pattern => pattern.test(description));
+        if (isHighImportance) {
+            highImportanceCount++;
+        }
+        else if (isLowImportance) {
+            lowImportanceCount++;
+        }
+    }
+    // Calculate score based on importance distribution
+    const totalAffected = affectedTools.length;
+    if (totalAffected > 0) {
+        const importanceRatio = highImportanceCount / totalAffected;
+        score = Math.round(importanceRatio * 100);
+        if (highImportanceCount > 0) {
+            details.push(`${highImportanceCount} high-importance tool(s) affected`);
+        }
+        if (lowImportanceCount > 0 && lowImportanceCount === totalAffected) {
+            score = Math.max(0, score - 20);
+            details.push('Only low-importance tools affected');
+        }
+    }
+    // Minimum score if there are any breaking changes in any tools
+    if (diff.breakingCount > 0 && score < 30) {
+        score = 30;
+    }
+    return {
+        name: 'Tool Importance',
+        weight,
+        score,
+        weightedScore: score * weight,
+        details: details.length > 0 ? details.join('; ') : 'No high-importance tools affected',
+    };
+}
+/**
+ * Score based on error rate changes.
+ */
+function scoreErrorDelta(diff) {
+    const weight = REGRESSION_RISK.WEIGHTS.errorRateDelta;
+    let score = 0;
+    const details = [];
+    // Check error trend report if available
+    if (diff.errorTrendReport) {
+        const report = diff.errorTrendReport;
+        // Score based on new error categories
+        if (report.newCategories.length > 0) {
+            score = Math.max(score, 70);
+            details.push(`${report.newCategories.length} new error category(s)`);
+        }
+        // Score based on increasing error rates
+        for (const trend of report.trends) {
+            if (trend.trend === 'increasing') {
+                if (trend.changePercent >= REGRESSION_RISK.ERROR_RATE.CRITICAL_INCREASE) {
+                    score = Math.max(score, 90);
+                    details.push(`${trend.category}: +${Math.round(trend.changePercent)}%`);
+                }
+                else if (trend.changePercent >= REGRESSION_RISK.ERROR_RATE.SIGNIFICANT_INCREASE) {
+                    score = Math.max(score, 60);
+                }
+            }
+        }
+    }
+    // Fallback to behavior changes for error patterns
+    const errorChanges = diff.behaviorChanges.filter(c => c.aspect === 'error_pattern');
+    if (errorChanges.length > 0 && score === 0) {
+        score = REGRESSION_RISK.ERROR_RATE.BASE_SCORE;
+        details.push(`${errorChanges.length} error pattern change(s)`);
+    }
+    return {
+        name: 'Error Rate',
+        weight,
+        score,
+        weightedScore: score * weight,
+        details: details.length > 0 ? details.join('; ') : 'No error rate changes',
+    };
+}
+/**
+ * Score based on performance regressions.
+ */
+function scorePerformanceRegression(diff) {
+    const weight = REGRESSION_RISK.WEIGHTS.performanceRegression;
+    let score = 0;
+    const details = [];
+    if (!diff.performanceReport) {
+        return {
+            name: 'Performance',
+            weight,
+            score: 0,
+            weightedScore: 0,
+            details: 'No performance data available',
+        };
+    }
+    const report = diff.performanceReport;
+    if (!report.hasRegressions) {
+        if (report.improvementCount > 0) {
+            details.push(`${report.improvementCount} tool(s) improved`);
+        }
+        return {
+            name: 'Performance',
+            weight,
+            score: 0,
+            weightedScore: 0,
+            details: details.length > 0 ? details.join('; ') : 'No performance regressions',
+        };
+    }
+    // Score each regression
+    for (const regression of report.regressions) {
+        if (!regression.exceedsThreshold)
+            continue;
+        const percent = regression.regressionPercent;
+        let regressionScore;
+        if (percent >= REGRESSION_RISK.PERFORMANCE.CRITICAL_REGRESSION) {
+            regressionScore = REGRESSION_RISK.PERFORMANCE.SCORES.critical;
+            details.push(`${regression.toolName}: +${Math.round(percent)}% (critical)`);
+        }
+        else if (percent >= REGRESSION_RISK.PERFORMANCE.MAJOR_REGRESSION) {
+            regressionScore = REGRESSION_RISK.PERFORMANCE.SCORES.major;
+            details.push(`${regression.toolName}: +${Math.round(percent)}% (major)`);
+        }
+        else {
+            regressionScore = REGRESSION_RISK.PERFORMANCE.SCORES.minor;
+        }
+        score = Math.max(score, regressionScore);
+    }
+    // Compound for multiple regressions
+    if (report.regressionCount > 1) {
+        score = Math.min(100, score + (report.regressionCount - 1) * 5);
+    }
+    return {
+        name: 'Performance',
+        weight,
+        score,
+        weightedScore: score * weight,
+        details: details.length > 0 ? details.join('; ') : `${report.regressionCount} regression(s)`,
+    };
+}
+/**
+ * Score based on security posture changes.
+ */
+function scoreSecurityChange(diff) {
+    const weight = REGRESSION_RISK.WEIGHTS.securityPosture;
+    let score = 0;
+    const details = [];
+    if (!diff.securityReport) {
+        return {
+            name: 'Security',
+            weight,
+            score: 0,
+            weightedScore: 0,
+            details: 'No security testing data',
+        };
+    }
+    const report = diff.securityReport;
+    // Score new vulnerabilities
+    if (report.newFindings && report.newFindings.length > 0) {
+        const criticalCount = report.newFindings.filter(f => f.riskLevel === 'critical').length;
+        const highCount = report.newFindings.filter(f => f.riskLevel === 'high').length;
+        if (criticalCount > 0) {
+            score = REGRESSION_RISK.SECURITY.NEW_VULNERABILITY;
+            details.push(`${criticalCount} new critical vulnerability(ies)`);
+        }
+        else if (highCount > 0) {
+            score = Math.max(score, 80);
+            details.push(`${highCount} new high severity finding(s)`);
+        }
+        else {
+            score = Math.max(score, 50);
+            details.push(`${report.newFindings.length} new security finding(s)`);
+        }
+    }
+    // Credit resolved vulnerabilities
+    if (report.resolvedFindings && report.resolvedFindings.length > 0) {
+        score = Math.max(0, score + REGRESSION_RISK.SECURITY.RESOLVED_VULNERABILITY);
+        details.push(`${report.resolvedFindings.length} resolved`);
+    }
+    // Score severity increases
+    if (report.riskScoreChange && report.riskScoreChange > 0) {
+        score = Math.max(score, REGRESSION_RISK.SECURITY.SEVERITY_INCREASE);
+        details.push('Overall security risk score increased');
+    }
+    return {
+        name: 'Security',
+        weight,
+        score: Math.max(0, score),
+        weightedScore: Math.max(0, score) * weight,
+        details: details.length > 0 ? details.join('; ') : 'No security changes',
+    };
+}
+/**
+ * Get risk level from score.
+ */
+function getRiskLevel(score) {
+    if (score >= REGRESSION_RISK.LEVEL_THRESHOLDS.critical)
+        return 'critical';
+    if (score >= REGRESSION_RISK.LEVEL_THRESHOLDS.high)
+        return 'high';
+    if (score >= REGRESSION_RISK.LEVEL_THRESHOLDS.medium)
+        return 'medium';
+    if (score >= REGRESSION_RISK.LEVEL_THRESHOLDS.low)
+        return 'low';
+    return 'info';
+}
+/**
+ * Generate recommendation based on risk analysis.
+ */
+function generateRecommendation(score, factors, diff) {
+    const level = getRiskLevel(score);
+    // Find highest contributing factor
+    const sortedFactors = [...factors].sort((a, b) => b.weightedScore - a.weightedScore);
+    const topFactor = sortedFactors[0];
+    switch (level) {
+        case 'critical':
+            if (diff.toolsRemoved.length > 0) {
+                return 'CRITICAL: Tools were removed. Ensure consumers are migrated before releasing.';
+            }
+            if (topFactor.name === 'Security') {
+                return 'CRITICAL: Security vulnerabilities introduced. Address before any deployment.';
+            }
+            return 'CRITICAL: Major breaking changes detected. Requires thorough review and migration plan.';
+        case 'high':
+            if (topFactor.name === 'Performance') {
+                return 'HIGH RISK: Significant performance regressions. Profile and optimize before release.';
+            }
+            if (topFactor.name === 'Error Rate') {
+                return 'HIGH RISK: Error rates increased substantially. Investigate new failure modes.';
+            }
+            return 'HIGH RISK: Multiple breaking changes. Create deprecation notices and migration guides.';
+        case 'medium':
+            if (topFactor.name === 'Tool Importance') {
+                return 'MEDIUM RISK: Changes affect important tools. Stage release with deprecation warnings.';
+            }
+            return 'MEDIUM RISK: Notable changes detected. Test with key consumers before release.';
+        case 'low':
+            if (diff.warningCount > 0) {
+                return 'LOW RISK: Minor changes with warnings. Review before release but likely safe.';
+            }
+            return 'LOW RISK: Changes are minor. Standard release process should be sufficient.';
+        default:
+            if (diff.infoCount > 0) {
+                return 'MINIMAL RISK: Only informational changes. Safe to release.';
+            }
+            return 'NO RISK: No significant changes detected.';
+    }
+}
+/**
+ * Generate markdown report for risk score.
+ */
+export function generateRiskScoreMarkdown(riskScore) {
+    const lines = [];
+    // Risk level badge
+    const levelEmoji = {
+        critical: '🔴',
+        high: '🟠',
+        medium: '🟡',
+        low: '🟢',
+        info: '⚪',
+    };
+    lines.push('## Regression Risk Assessment');
+    lines.push('');
+    lines.push(`**Risk Level: ${levelEmoji[riskScore.level]} ${riskScore.level.toUpperCase()}** (Score: ${riskScore.score}/100)`);
+    lines.push('');
+    lines.push(`> ${riskScore.recommendation}`);
+    lines.push('');
+    // Factor breakdown
+    lines.push('### Risk Factors');
+    lines.push('');
+    lines.push('| Factor | Score | Weight | Details |');
+    lines.push('|--------|-------|--------|---------|');
+    for (const factor of riskScore.factors) {
+        const bar = generateScoreBar(factor.score);
+        const weightPercent = Math.round(factor.weight * 100);
+        lines.push(`| ${factor.name} | ${bar} ${factor.score}/100 | ${weightPercent}% | ${factor.details} |`);
+    }
+    lines.push('');
+    // Change summary
+    lines.push('### Change Summary');
+    lines.push('');
+    const summary = riskScore.changeSummary;
+    if (summary.breaking > 0 || summary.warning > 0 || summary.info > 0) {
+        lines.push('| Type | Count |');
+        lines.push('|------|-------|');
+        if (summary.breaking > 0)
+            lines.push(`| Breaking | ${summary.breaking} |`);
+        if (summary.warning > 0)
+            lines.push(`| Warnings | ${summary.warning} |`);
+        if (summary.info > 0)
+            lines.push(`| Info | ${summary.info} |`);
+        if (summary.toolsRemoved > 0)
+            lines.push(`| Tools Removed | ${summary.toolsRemoved} |`);
+        if (summary.toolsAdded > 0)
+            lines.push(`| Tools Added | ${summary.toolsAdded} |`);
+        if (summary.toolsModified > 0)
+            lines.push(`| Tools Modified | ${summary.toolsModified} |`);
+        lines.push('');
+    }
+    else {
+        lines.push('No changes detected.');
+        lines.push('');
+    }
+    return lines.join('\n');
+}
+/**
+ * Generate ASCII score bar.
+ */
+function generateScoreBar(score, width = 10) {
+    const filled = Math.round((score / 100) * width);
+    const empty = width - filled;
+    return '[' + '█'.repeat(filled) + '░'.repeat(empty) + ']';
+}
+//# sourceMappingURL=risk-scorer.js.map

package/dist/baseline/saver.d.ts ADDED Viewed

@@ -0,0 +1,89 @@
+/**
+ * Baseline save/load functionality.
+ */
+import type { InterviewResult } from '../interview/types.js';
+import type { BehavioralBaseline, BehavioralDiff } from './types.js';
+/**
+ * Options for loading a baseline.
+ */
+export interface LoadBaselineOptions {
+    /**
+     * Automatically migrate old baseline formats to the current version.
+     * If false and the baseline is outdated, a warning will be logged but
+     * the baseline will still be loaded (with potential compatibility issues).
+     * @default true
+     */
+    migrate?: boolean;
+    /**
+     * Skip integrity hash verification.
+     * Use with caution - only for debugging or when you know the file was modified intentionally.
+     * @default false
+     */
+    skipIntegrityCheck?: boolean;
+}
+/**
+ * Create a behavioral baseline from interview results.
+ *
+ * Baselines can only be created from check mode results.
+ * Explore mode results are for documentation only.
+ */
+export declare function createBaseline(result: InterviewResult, serverCommand: string): BehavioralBaseline;
+/**
+ * Save baseline to a file.
+ */
+export declare function saveBaseline(baseline: BehavioralBaseline, path: string): void;
+/**
+ * Load baseline from a file.
+ * Validates against Zod schema to prevent malicious JSON injection.
+ *
+ * @param path - Path to the baseline file
+ * @param options - Load options
+ * @returns Loaded baseline (migrated to current version if needed)
+ */
+export declare function loadBaseline(path: string, options?: LoadBaselineOptions): BehavioralBaseline;
+/**
+ * Verify baseline integrity.
+ */
+export declare function verifyIntegrity(baseline: BehavioralBaseline): boolean;
+/**
+ * Recalculate and update the integrity hash for a baseline.
+ * Useful after migration or manual modifications.
+ */
+export declare function recalculateIntegrityHash(baseline: Omit<BehavioralBaseline, 'integrityHash'>): BehavioralBaseline;
+/**
+ * Check if a baseline file exists.
+ * Returns false for directories - baselines must be files.
+ */
+export declare function baselineExists(path: string): boolean;
+/**
+ * Options for accepting drift.
+ */
+export interface AcceptDriftOptions {
+    /** Who is accepting the drift (for audit trail) */
+    acceptedBy?: string;
+    /** Reason for accepting the drift */
+    reason?: string;
+}
+/**
+ * Accept drift by updating a baseline with drift acceptance metadata.
+ *
+ * This marks the current state of the server as the new expected baseline,
+ * acknowledging that the detected changes were intentional.
+ *
+ * @param currentBaseline - The new baseline from the current server state
+ * @param diff - The diff that is being accepted
+ * @param options - Acceptance options (reason, acceptedBy)
+ * @returns The baseline with acceptance metadata attached
+ */
+export declare function acceptDrift(currentBaseline: BehavioralBaseline, diff: BehavioralDiff, options?: AcceptDriftOptions): BehavioralBaseline;
+/**
+ * Check if a baseline has acceptance metadata.
+ */
+export declare function hasAcceptance(baseline: BehavioralBaseline): boolean;
+/**
+ * Clear acceptance metadata from a baseline.
+ * Useful when re-running checks after the accepted changes are no longer relevant.
+ * Returns a new baseline without acceptance, with recalculated integrity hash.
+ */
+export declare function clearAcceptance(baseline: BehavioralBaseline): BehavioralBaseline;
+//# sourceMappingURL=saver.d.ts.map