npm - @dotsetlabs/bellwether - Versions diffs - 0.10.0 - Mend

@dotsetlabs/bellwether 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (403) hide show

package/CHANGELOG.md +291 -0
package/LICENSE +21 -0
package/README.md +739 -0
package/dist/auth/credentials.d.ts +64 -0
package/dist/auth/credentials.js +218 -0
package/dist/auth/index.d.ts +6 -0
package/dist/auth/index.js +6 -0
package/dist/auth/keychain.d.ts +64 -0
package/dist/auth/keychain.js +268 -0
package/dist/baseline/ab-testing.d.ts +80 -0
package/dist/baseline/ab-testing.js +236 -0
package/dist/baseline/ai-compatibility-scorer.d.ts +95 -0
package/dist/baseline/ai-compatibility-scorer.js +606 -0
package/dist/baseline/calibration.d.ts +77 -0
package/dist/baseline/calibration.js +136 -0
package/dist/baseline/category-matching.d.ts +85 -0
package/dist/baseline/category-matching.js +289 -0
package/dist/baseline/change-impact-analyzer.d.ts +98 -0
package/dist/baseline/change-impact-analyzer.js +592 -0
package/dist/baseline/comparator.d.ts +64 -0
package/dist/baseline/comparator.js +916 -0
package/dist/baseline/confidence.d.ts +55 -0
package/dist/baseline/confidence.js +122 -0
package/dist/baseline/converter.d.ts +61 -0
package/dist/baseline/converter.js +585 -0
package/dist/baseline/dependency-analyzer.d.ts +89 -0
package/dist/baseline/dependency-analyzer.js +567 -0
package/dist/baseline/deprecation-tracker.d.ts +133 -0
package/dist/baseline/deprecation-tracker.js +322 -0
package/dist/baseline/diff.d.ts +55 -0
package/dist/baseline/diff.js +1584 -0
package/dist/baseline/documentation-scorer.d.ts +205 -0
package/dist/baseline/documentation-scorer.js +466 -0
package/dist/baseline/embeddings.d.ts +118 -0
package/dist/baseline/embeddings.js +251 -0
package/dist/baseline/error-analyzer.d.ts +198 -0
package/dist/baseline/error-analyzer.js +721 -0
package/dist/baseline/evaluation/evaluator.d.ts +42 -0
package/dist/baseline/evaluation/evaluator.js +323 -0
package/dist/baseline/evaluation/expanded-dataset.d.ts +45 -0
package/dist/baseline/evaluation/expanded-dataset.js +1164 -0
package/dist/baseline/evaluation/golden-dataset.d.ts +58 -0
package/dist/baseline/evaluation/golden-dataset.js +717 -0
package/dist/baseline/evaluation/index.d.ts +15 -0
package/dist/baseline/evaluation/index.js +15 -0
package/dist/baseline/evaluation/types.d.ts +186 -0
package/dist/baseline/evaluation/types.js +8 -0
package/dist/baseline/external-dependency-detector.d.ts +181 -0
package/dist/baseline/external-dependency-detector.js +524 -0
package/dist/baseline/golden-output.d.ts +162 -0
package/dist/baseline/golden-output.js +636 -0
package/dist/baseline/health-scorer.d.ts +174 -0
package/dist/baseline/health-scorer.js +451 -0
package/dist/baseline/incremental-checker.d.ts +97 -0
package/dist/baseline/incremental-checker.js +174 -0
package/dist/baseline/index.d.ts +31 -0
package/dist/baseline/index.js +42 -0
package/dist/baseline/migration-generator.d.ts +137 -0
package/dist/baseline/migration-generator.js +554 -0
package/dist/baseline/migrations.d.ts +60 -0
package/dist/baseline/migrations.js +197 -0
package/dist/baseline/performance-tracker.d.ts +214 -0
package/dist/baseline/performance-tracker.js +577 -0
package/dist/baseline/pr-comment-generator.d.ts +117 -0
package/dist/baseline/pr-comment-generator.js +546 -0
package/dist/baseline/response-fingerprint.d.ts +127 -0
package/dist/baseline/response-fingerprint.js +728 -0
package/dist/baseline/response-schema-tracker.d.ts +129 -0
package/dist/baseline/response-schema-tracker.js +420 -0
package/dist/baseline/risk-scorer.d.ts +54 -0
package/dist/baseline/risk-scorer.js +434 -0
package/dist/baseline/saver.d.ts +89 -0
package/dist/baseline/saver.js +554 -0
package/dist/baseline/scenario-generator.d.ts +151 -0
package/dist/baseline/scenario-generator.js +905 -0
package/dist/baseline/schema-compare.d.ts +86 -0
package/dist/baseline/schema-compare.js +557 -0
package/dist/baseline/schema-evolution.d.ts +189 -0
package/dist/baseline/schema-evolution.js +467 -0
package/dist/baseline/semantic.d.ts +203 -0
package/dist/baseline/semantic.js +908 -0
package/dist/baseline/synonyms.d.ts +60 -0
package/dist/baseline/synonyms.js +386 -0
package/dist/baseline/telemetry.d.ts +165 -0
package/dist/baseline/telemetry.js +294 -0
package/dist/baseline/test-pruner.d.ts +120 -0
package/dist/baseline/test-pruner.js +387 -0
package/dist/baseline/types.d.ts +449 -0
package/dist/baseline/types.js +5 -0
package/dist/baseline/version.d.ts +138 -0
package/dist/baseline/version.js +206 -0
package/dist/cache/index.d.ts +5 -0
package/dist/cache/index.js +5 -0
package/dist/cache/response-cache.d.ts +151 -0
package/dist/cache/response-cache.js +287 -0
package/dist/ci/index.d.ts +60 -0
package/dist/ci/index.js +342 -0
package/dist/cli/commands/auth.d.ts +12 -0
package/dist/cli/commands/auth.js +352 -0
package/dist/cli/commands/badge.d.ts +3 -0
package/dist/cli/commands/badge.js +74 -0
package/dist/cli/commands/baseline-accept.d.ts +15 -0
package/dist/cli/commands/baseline-accept.js +178 -0
package/dist/cli/commands/baseline-migrate.d.ts +12 -0
package/dist/cli/commands/baseline-migrate.js +164 -0
package/dist/cli/commands/baseline.d.ts +14 -0
package/dist/cli/commands/baseline.js +449 -0
package/dist/cli/commands/beta.d.ts +10 -0
package/dist/cli/commands/beta.js +231 -0
package/dist/cli/commands/check.d.ts +11 -0
package/dist/cli/commands/check.js +820 -0
package/dist/cli/commands/cloud/badge.d.ts +3 -0
package/dist/cli/commands/cloud/badge.js +74 -0
package/dist/cli/commands/cloud/diff.d.ts +6 -0
package/dist/cli/commands/cloud/diff.js +79 -0
package/dist/cli/commands/cloud/history.d.ts +6 -0
package/dist/cli/commands/cloud/history.js +102 -0
package/dist/cli/commands/cloud/link.d.ts +9 -0
package/dist/cli/commands/cloud/link.js +119 -0
package/dist/cli/commands/cloud/login.d.ts +7 -0
package/dist/cli/commands/cloud/login.js +499 -0
package/dist/cli/commands/cloud/projects.d.ts +6 -0
package/dist/cli/commands/cloud/projects.js +44 -0
package/dist/cli/commands/cloud/shared.d.ts +7 -0
package/dist/cli/commands/cloud/shared.js +42 -0
package/dist/cli/commands/cloud/teams.d.ts +8 -0
package/dist/cli/commands/cloud/teams.js +169 -0
package/dist/cli/commands/cloud/upload.d.ts +8 -0
package/dist/cli/commands/cloud/upload.js +181 -0
package/dist/cli/commands/contract.d.ts +11 -0
package/dist/cli/commands/contract.js +280 -0
package/dist/cli/commands/discover.d.ts +3 -0
package/dist/cli/commands/discover.js +82 -0
package/dist/cli/commands/eval.d.ts +9 -0
package/dist/cli/commands/eval.js +187 -0
package/dist/cli/commands/explore.d.ts +11 -0
package/dist/cli/commands/explore.js +437 -0
package/dist/cli/commands/feedback.d.ts +9 -0
package/dist/cli/commands/feedback.js +174 -0
package/dist/cli/commands/golden.d.ts +12 -0
package/dist/cli/commands/golden.js +407 -0
package/dist/cli/commands/history.d.ts +10 -0
package/dist/cli/commands/history.js +202 -0
package/dist/cli/commands/init.d.ts +9 -0
package/dist/cli/commands/init.js +219 -0
package/dist/cli/commands/interview.d.ts +3 -0
package/dist/cli/commands/interview.js +903 -0
package/dist/cli/commands/link.d.ts +10 -0
package/dist/cli/commands/link.js +169 -0
package/dist/cli/commands/login.d.ts +7 -0
package/dist/cli/commands/login.js +499 -0
package/dist/cli/commands/preset.d.ts +33 -0
package/dist/cli/commands/preset.js +297 -0
package/dist/cli/commands/profile.d.ts +33 -0
package/dist/cli/commands/profile.js +286 -0
package/dist/cli/commands/registry.d.ts +11 -0
package/dist/cli/commands/registry.js +146 -0
package/dist/cli/commands/shared.d.ts +79 -0
package/dist/cli/commands/shared.js +196 -0
package/dist/cli/commands/teams.d.ts +8 -0
package/dist/cli/commands/teams.js +169 -0
package/dist/cli/commands/test.d.ts +9 -0
package/dist/cli/commands/test.js +500 -0
package/dist/cli/commands/upload.d.ts +8 -0
package/dist/cli/commands/upload.js +223 -0
package/dist/cli/commands/validate-config.d.ts +6 -0
package/dist/cli/commands/validate-config.js +35 -0
package/dist/cli/commands/verify.d.ts +11 -0
package/dist/cli/commands/verify.js +283 -0
package/dist/cli/commands/watch.d.ts +12 -0
package/dist/cli/commands/watch.js +253 -0
package/dist/cli/index.d.ts +3 -0
package/dist/cli/index.js +178 -0
package/dist/cli/interactive.d.ts +47 -0
package/dist/cli/interactive.js +216 -0
package/dist/cli/output/terminal-reporter.d.ts +19 -0
package/dist/cli/output/terminal-reporter.js +104 -0
package/dist/cli/output.d.ts +226 -0
package/dist/cli/output.js +438 -0
package/dist/cli/utils/env.d.ts +5 -0
package/dist/cli/utils/env.js +14 -0
package/dist/cli/utils/progress.d.ts +59 -0
package/dist/cli/utils/progress.js +206 -0
package/dist/cli/utils/server-context.d.ts +10 -0
package/dist/cli/utils/server-context.js +36 -0
package/dist/cloud/auth.d.ts +144 -0
package/dist/cloud/auth.js +374 -0
package/dist/cloud/client.d.ts +24 -0
package/dist/cloud/client.js +65 -0
package/dist/cloud/http-client.d.ts +38 -0
package/dist/cloud/http-client.js +215 -0
package/dist/cloud/index.d.ts +23 -0
package/dist/cloud/index.js +25 -0
package/dist/cloud/mock-client.d.ts +107 -0
package/dist/cloud/mock-client.js +545 -0
package/dist/cloud/types.d.ts +515 -0
package/dist/cloud/types.js +15 -0
package/dist/config/defaults.d.ts +160 -0
package/dist/config/defaults.js +169 -0
package/dist/config/loader.d.ts +24 -0
package/dist/config/loader.js +122 -0
package/dist/config/template.d.ts +42 -0
package/dist/config/template.js +647 -0
package/dist/config/validator.d.ts +2112 -0
package/dist/config/validator.js +658 -0
package/dist/constants/cloud.d.ts +107 -0
package/dist/constants/cloud.js +110 -0
package/dist/constants/core.d.ts +521 -0
package/dist/constants/core.js +556 -0
package/dist/constants/testing.d.ts +1283 -0
package/dist/constants/testing.js +1568 -0
package/dist/constants.d.ts +10 -0
package/dist/constants.js +10 -0
package/dist/contract/index.d.ts +6 -0
package/dist/contract/index.js +5 -0
package/dist/contract/validator.d.ts +177 -0
package/dist/contract/validator.js +574 -0
package/dist/cost/index.d.ts +6 -0
package/dist/cost/index.js +5 -0
package/dist/cost/tracker.d.ts +134 -0
package/dist/cost/tracker.js +313 -0
package/dist/discovery/discovery.d.ts +16 -0
package/dist/discovery/discovery.js +173 -0
package/dist/discovery/types.d.ts +51 -0
package/dist/discovery/types.js +2 -0
package/dist/docs/agents.d.ts +3 -0
package/dist/docs/agents.js +995 -0
package/dist/docs/contract.d.ts +51 -0
package/dist/docs/contract.js +1681 -0
package/dist/docs/generator.d.ts +4 -0
package/dist/docs/generator.js +4 -0
package/dist/docs/html-reporter.d.ts +9 -0
package/dist/docs/html-reporter.js +757 -0
package/dist/docs/index.d.ts +10 -0
package/dist/docs/index.js +11 -0
package/dist/docs/junit-reporter.d.ts +18 -0
package/dist/docs/junit-reporter.js +210 -0
package/dist/docs/report.d.ts +14 -0
package/dist/docs/report.js +44 -0
package/dist/docs/sarif-reporter.d.ts +19 -0
package/dist/docs/sarif-reporter.js +335 -0
package/dist/docs/shared.d.ts +35 -0
package/dist/docs/shared.js +162 -0
package/dist/docs/templates.d.ts +12 -0
package/dist/docs/templates.js +76 -0
package/dist/errors/index.d.ts +6 -0
package/dist/errors/index.js +6 -0
package/dist/errors/retry.d.ts +92 -0
package/dist/errors/retry.js +323 -0
package/dist/errors/types.d.ts +321 -0
package/dist/errors/types.js +584 -0
package/dist/index.d.ts +32 -0
package/dist/index.js +32 -0
package/dist/interview/dependency-resolver.d.ts +11 -0
package/dist/interview/dependency-resolver.js +32 -0
package/dist/interview/interviewer.d.ts +232 -0
package/dist/interview/interviewer.js +1939 -0
package/dist/interview/mock-response-generator.d.ts +7 -0
package/dist/interview/mock-response-generator.js +102 -0
package/dist/interview/orchestrator.d.ts +237 -0
package/dist/interview/orchestrator.js +1296 -0
package/dist/interview/rate-limiter.d.ts +15 -0
package/dist/interview/rate-limiter.js +55 -0
package/dist/interview/response-validator.d.ts +10 -0
package/dist/interview/response-validator.js +132 -0
package/dist/interview/schema-inferrer.d.ts +8 -0
package/dist/interview/schema-inferrer.js +71 -0
package/dist/interview/schema-test-generator.d.ts +71 -0
package/dist/interview/schema-test-generator.js +834 -0
package/dist/interview/smart-value-generator.d.ts +155 -0
package/dist/interview/smart-value-generator.js +554 -0
package/dist/interview/stateful-test-runner.d.ts +19 -0
package/dist/interview/stateful-test-runner.js +106 -0
package/dist/interview/types.d.ts +561 -0
package/dist/interview/types.js +2 -0
package/dist/llm/anthropic.d.ts +41 -0
package/dist/llm/anthropic.js +355 -0
package/dist/llm/client.d.ts +123 -0
package/dist/llm/client.js +42 -0
package/dist/llm/factory.d.ts +38 -0
package/dist/llm/factory.js +145 -0
package/dist/llm/fallback.d.ts +140 -0
package/dist/llm/fallback.js +379 -0
package/dist/llm/index.d.ts +18 -0
package/dist/llm/index.js +15 -0
package/dist/llm/ollama.d.ts +37 -0
package/dist/llm/ollama.js +330 -0
package/dist/llm/openai.d.ts +25 -0
package/dist/llm/openai.js +320 -0
package/dist/llm/token-budget.d.ts +161 -0
package/dist/llm/token-budget.js +395 -0
package/dist/logging/logger.d.ts +70 -0
package/dist/logging/logger.js +130 -0
package/dist/metrics/collector.d.ts +106 -0
package/dist/metrics/collector.js +547 -0
package/dist/metrics/index.d.ts +7 -0
package/dist/metrics/index.js +7 -0
package/dist/metrics/prometheus.d.ts +20 -0
package/dist/metrics/prometheus.js +241 -0
package/dist/metrics/types.d.ts +209 -0
package/dist/metrics/types.js +5 -0
package/dist/persona/builtins.d.ts +54 -0
package/dist/persona/builtins.js +219 -0
package/dist/persona/index.d.ts +8 -0
package/dist/persona/index.js +8 -0
package/dist/persona/loader.d.ts +30 -0
package/dist/persona/loader.js +190 -0
package/dist/persona/types.d.ts +144 -0
package/dist/persona/types.js +5 -0
package/dist/persona/validation.d.ts +94 -0
package/dist/persona/validation.js +332 -0
package/dist/prompts/index.d.ts +5 -0
package/dist/prompts/index.js +5 -0
package/dist/prompts/templates.d.ts +180 -0
package/dist/prompts/templates.js +431 -0
package/dist/registry/client.d.ts +49 -0
package/dist/registry/client.js +191 -0
package/dist/registry/index.d.ts +7 -0
package/dist/registry/index.js +6 -0
package/dist/registry/types.d.ts +140 -0
package/dist/registry/types.js +6 -0
package/dist/scenarios/evaluator.d.ts +43 -0
package/dist/scenarios/evaluator.js +206 -0
package/dist/scenarios/index.d.ts +10 -0
package/dist/scenarios/index.js +9 -0
package/dist/scenarios/loader.d.ts +20 -0
package/dist/scenarios/loader.js +285 -0
package/dist/scenarios/types.d.ts +153 -0
package/dist/scenarios/types.js +8 -0
package/dist/security/index.d.ts +17 -0
package/dist/security/index.js +18 -0
package/dist/security/payloads.d.ts +61 -0
package/dist/security/payloads.js +268 -0
package/dist/security/security-tester.d.ts +42 -0
package/dist/security/security-tester.js +582 -0
package/dist/security/types.d.ts +166 -0
package/dist/security/types.js +8 -0
package/dist/transport/base-transport.d.ts +59 -0
package/dist/transport/base-transport.js +38 -0
package/dist/transport/http-transport.d.ts +67 -0
package/dist/transport/http-transport.js +238 -0
package/dist/transport/mcp-client.d.ts +141 -0
package/dist/transport/mcp-client.js +496 -0
package/dist/transport/sse-transport.d.ts +88 -0
package/dist/transport/sse-transport.js +316 -0
package/dist/transport/stdio-transport.d.ts +43 -0
package/dist/transport/stdio-transport.js +238 -0
package/dist/transport/types.d.ts +125 -0
package/dist/transport/types.js +16 -0
package/dist/utils/concurrency.d.ts +123 -0
package/dist/utils/concurrency.js +213 -0
package/dist/utils/formatters.d.ts +16 -0
package/dist/utils/formatters.js +37 -0
package/dist/utils/index.d.ts +8 -0
package/dist/utils/index.js +8 -0
package/dist/utils/jsonpath.d.ts +87 -0
package/dist/utils/jsonpath.js +326 -0
package/dist/utils/markdown.d.ts +113 -0
package/dist/utils/markdown.js +265 -0
package/dist/utils/network.d.ts +14 -0
package/dist/utils/network.js +17 -0
package/dist/utils/sanitize.d.ts +92 -0
package/dist/utils/sanitize.js +191 -0
package/dist/utils/semantic.d.ts +194 -0
package/dist/utils/semantic.js +1051 -0
package/dist/utils/smart-truncate.d.ts +94 -0
package/dist/utils/smart-truncate.js +361 -0
package/dist/utils/timeout.d.ts +153 -0
package/dist/utils/timeout.js +205 -0
package/dist/utils/yaml-parser.d.ts +58 -0
package/dist/utils/yaml-parser.js +86 -0
package/dist/validation/index.d.ts +32 -0
package/dist/validation/index.js +32 -0
package/dist/validation/semantic-test-generator.d.ts +50 -0
package/dist/validation/semantic-test-generator.js +176 -0
package/dist/validation/semantic-types.d.ts +66 -0
package/dist/validation/semantic-types.js +94 -0
package/dist/validation/semantic-validator.d.ts +38 -0
package/dist/validation/semantic-validator.js +340 -0
package/dist/verification/index.d.ts +6 -0
package/dist/verification/index.js +5 -0
package/dist/verification/types.d.ts +133 -0
package/dist/verification/types.js +5 -0
package/dist/verification/verifier.d.ts +30 -0
package/dist/verification/verifier.js +309 -0
package/dist/version.d.ts +19 -0
package/dist/version.js +48 -0
package/dist/workflow/auto-generator.d.ts +27 -0
package/dist/workflow/auto-generator.js +513 -0
package/dist/workflow/discovery.d.ts +40 -0
package/dist/workflow/discovery.js +195 -0
package/dist/workflow/executor.d.ts +82 -0
package/dist/workflow/executor.js +611 -0
package/dist/workflow/index.d.ts +10 -0
package/dist/workflow/index.js +10 -0
package/dist/workflow/loader.d.ts +24 -0
package/dist/workflow/loader.js +194 -0
package/dist/workflow/state-tracker.d.ts +98 -0
package/dist/workflow/state-tracker.js +424 -0
package/dist/workflow/types.d.ts +337 -0
package/dist/workflow/types.js +5 -0
package/package.json +94 -0
package/schemas/bellwether-check.schema.json +651 -0

package/dist/baseline/comparator.js ADDED Viewed

@@ -0,0 +1,916 @@
+/**
+ * Structural comparison for drift detection.
+ *
+ * Compares baselines using deterministic structural comparison:
+ * - Tool presence/absence
+ * - Schema changes (hash comparison)
+ * - Description changes (exact string comparison)
+ * - Workflow success/failure changes
+ *
+ * All comparisons are 100% deterministic - no LLM involvement.
+ */
+import { createBaseline } from './saver.js';
+import { compareFingerprints, compareErrorPatterns, } from './response-fingerprint.js';
+import { analyzeErrorTrends } from './error-analyzer.js';
+import { compareSecurityFingerprints } from '../security/security-tester.js';
+import { compareSchemaEvolution } from './response-schema-tracker.js';
+import { checkVersionCompatibility, BaselineVersionError, parseVersion, areVersionsCompatible, getCompatibilityWarning, } from './version.js';
+import { compareSchemas } from './schema-compare.js';
+import { PERFORMANCE_TRACKING } from '../constants.js';
+import { hasReliableConfidence } from './performance-tracker.js';
+import { compareDocumentationScores, scoreDocumentation } from './documentation-scorer.js';
+/**
+ * Compare current interview results against a baseline.
+ */
+export function compareWithBaseline(baseline, current, serverCommand, options = {}) {
+    const currentBaseline = createBaseline(current, serverCommand);
+    return compareBaselines(baseline, currentBaseline, options);
+}
+/**
+ * Compare two baselines directly.
+ * All changes are structural and deterministic.
+ *
+ * @param previous - The baseline to compare against (source/old)
+ * @param current - The current baseline (target/new)
+ * @param options - Comparison options
+ * @returns Diff result including version compatibility information
+ * @throws BaselineVersionError if versions are incompatible and ignoreVersionMismatch is false
+ */
+export function compareBaselines(previous, current, options = {}) {
+    // Check version compatibility
+    const v1 = parseVersion(previous.version);
+    const v2 = parseVersion(current.version);
+    const versionCompatibility = {
+        compatible: areVersionsCompatible(v1, v2),
+        warning: getCompatibilityWarning(v1, v2),
+        sourceVersion: v1.raw,
+        targetVersion: v2.raw,
+    };
+    // Throw error if versions are incompatible (unless ignored)
+    if (!versionCompatibility.compatible && !options.ignoreVersionMismatch) {
+        throw new BaselineVersionError(`Cannot compare baselines with incompatible format versions: v${v1.raw} vs v${v2.raw}. ` +
+            `Use \`bellwether baseline migrate\` to upgrade the older baseline, ` +
+            `or use --ignore-version-mismatch to force comparison (results may be incorrect).`, v1.raw, v2.raw);
+    }
+    const previousToolMap = new Map(previous.tools.map((t) => [t.name, t]));
+    const currentToolMap = new Map(current.tools.map((t) => [t.name, t]));
+    const toolsAdded = [];
+    const toolsRemoved = [];
+    const toolsModified = [];
+    const behaviorChanges = [];
+    // Check for removed tools
+    for (const [name] of previousToolMap) {
+        if (!currentToolMap.has(name)) {
+            if (!options.tools || options.tools.length === 0 || options.tools.includes(name)) {
+                toolsRemoved.push(name);
+            }
+        }
+    }
+    // Check for added tools and modifications
+    for (const [name, currentTool] of currentToolMap) {
+        if (options.tools && options.tools.length > 0 && !options.tools.includes(name)) {
+            continue;
+        }
+        const previousTool = previousToolMap.get(name);
+        if (!previousTool) {
+            toolsAdded.push(name);
+            continue;
+        }
+        const toolDiff = compareTool(previousTool, currentTool, options);
+        if (toolDiff.changes.length > 0 ||
+            toolDiff.schemaChanged ||
+            toolDiff.descriptionChanged ||
+            toolDiff.securityChanged ||
+            toolDiff.responseSchemaEvolutionChanged) {
+            toolsModified.push(toolDiff);
+            behaviorChanges.push(...toolDiff.changes);
+        }
+    }
+    // Compare workflows
+    const workflowChanges = compareWorkflows(previous.workflowSignatures || [], current.workflowSignatures || []);
+    behaviorChanges.push(...workflowChanges);
+    const { severity, breakingCount, warningCount, infoCount } = calculateSeverity(toolsAdded, toolsRemoved, behaviorChanges);
+    const summary = generateSummary(toolsAdded, toolsRemoved, toolsModified, behaviorChanges, severity);
+    // Generate performance regression report if performance data is available
+    const performanceReport = comparePerformanceData(previous, current, options.performanceThreshold ?? PERFORMANCE_TRACKING.DEFAULT_REGRESSION_THRESHOLD);
+    // Generate security diff report if security testing was performed
+    const securityReport = compareSecurityData(previous, current, options.ignoreSecurityChanges ?? false);
+    // Generate schema evolution report if schema evolution data is available
+    const schemaEvolutionReport = generateSchemaEvolutionReport(toolsModified, previous, current);
+    // Generate error trend report if error pattern data is available
+    const errorTrendReport = generateErrorTrendReport(previous, current, options.ignoreErrorPatternChanges ?? false);
+    // Generate documentation score comparison if documentation scores are available
+    const documentationScoreReport = compareDocumentationData(previous, current);
+    return {
+        toolsAdded,
+        toolsRemoved,
+        toolsModified,
+        behaviorChanges,
+        severity,
+        breakingCount,
+        warningCount,
+        infoCount,
+        summary,
+        versionCompatibility,
+        performanceReport,
+        securityReport,
+        schemaEvolutionReport,
+        errorTrendReport,
+        documentationScoreReport,
+    };
+}
+function compareTool(previous, current, options) {
+    const changes = [];
+    let schemaChanged = false;
+    let descriptionChanged = false;
+    let responseStructureChanged = false;
+    let errorPatternsChanged = false;
+    let responseSchemaEvolutionChanged = false;
+    let securityChanged = false;
+    let schemaEvolutionDiff;
+    // Compare input schema with detailed diff
+    if (previous.schemaHash !== current.schemaHash && !options.ignoreSchemaChanges) {
+        schemaChanged = true;
+        // Get detailed schema comparison if inputSchema is available on both
+        const schemaComparison = compareSchemas(previous.inputSchema, current.inputSchema);
+        if (schemaComparison.changes.length > 0) {
+            // Add individual schema changes with proper severity
+            for (const schemaChange of schemaComparison.changes) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'schema',
+                    before: formatSchemaChangeValue(schemaChange.before),
+                    after: formatSchemaChangeValue(schemaChange.after),
+                    severity: schemaChange.breaking ? 'breaking' : 'warning',
+                    description: `${schemaChange.path}: ${schemaChange.description}`,
+                });
+            }
+        }
+        else {
+            // Fallback to hash comparison if no detailed changes detected
+            // (can happen if inputSchema is missing on one or both sides)
+            changes.push({
+                tool: current.name,
+                aspect: 'schema',
+                before: `Schema hash: ${previous.schemaHash}`,
+                after: `Schema hash: ${current.schemaHash}`,
+                severity: 'breaking',
+                description: `Schema for ${current.name} has changed`,
+            });
+        }
+    }
+    // Compare description
+    if (previous.description !== current.description && !options.ignoreDescriptionChanges) {
+        descriptionChanged = true;
+        changes.push({
+            tool: current.name,
+            aspect: 'description',
+            before: previous.description,
+            after: current.description,
+            severity: 'info',
+            description: `Description for ${current.name} has changed`,
+        });
+    }
+    // Compare response structure fingerprints (check mode enhancement)
+    if (!options.ignoreResponseStructureChanges) {
+        const fingerprintDiff = compareFingerprints(previous.responseFingerprint, current.responseFingerprint);
+        if (!fingerprintDiff.identical) {
+            responseStructureChanged = true;
+            for (const change of fingerprintDiff.changes) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'response_structure',
+                    before: change.before,
+                    after: change.after,
+                    severity: change.breaking ? 'breaking' : 'warning',
+                    description: change.description,
+                });
+            }
+        }
+    }
+    // Compare error patterns (check mode enhancement)
+    if (!options.ignoreErrorPatternChanges) {
+        const errorDiff = compareErrorPatterns(previous.errorPatterns, current.errorPatterns);
+        if (errorDiff.behaviorChanged) {
+            errorPatternsChanged = true;
+            for (const added of errorDiff.added) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'error_pattern',
+                    before: 'none',
+                    after: `${added.category}: ${added.example.slice(0, 50)}...`,
+                    severity: 'warning',
+                    description: `New error pattern detected: ${added.category}`,
+                });
+            }
+            for (const removed of errorDiff.removed) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'error_pattern',
+                    before: `${removed.category}: ${removed.example.slice(0, 50)}...`,
+                    after: 'none',
+                    severity: 'info',
+                    description: `Error pattern no longer occurs: ${removed.category}`,
+                });
+            }
+        }
+    }
+    // Compare response schema evolution (check mode enhancement)
+    if (!options.ignoreResponseStructureChanges) {
+        schemaEvolutionDiff = compareSchemaEvolution(previous.responseSchemaEvolution, current.responseSchemaEvolution);
+        if (schemaEvolutionDiff.structureChanged) {
+            responseSchemaEvolutionChanged = true;
+            // Add changes for removed fields (breaking)
+            if (schemaEvolutionDiff.fieldsRemoved.length > 0) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'response_schema_evolution',
+                    before: schemaEvolutionDiff.fieldsRemoved.join(', '),
+                    after: 'removed',
+                    severity: 'breaking',
+                    description: `Response fields removed: ${schemaEvolutionDiff.fieldsRemoved.join(', ')}`,
+                });
+            }
+            // Add changes for added fields (non-breaking)
+            if (schemaEvolutionDiff.fieldsAdded.length > 0) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'response_schema_evolution',
+                    before: 'none',
+                    after: schemaEvolutionDiff.fieldsAdded.join(', '),
+                    severity: 'info',
+                    description: `Response fields added: ${schemaEvolutionDiff.fieldsAdded.join(', ')}`,
+                });
+            }
+            // Add changes for type changes
+            for (const typeChange of schemaEvolutionDiff.typeChanges) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'response_schema_evolution',
+                    before: typeChange.previousType,
+                    after: typeChange.currentType,
+                    severity: typeChange.backwardCompatible ? 'warning' : 'breaking',
+                    description: `Response field "${typeChange.field}" type changed: ${typeChange.previousType} → ${typeChange.currentType}`,
+                });
+            }
+            // Add changes for new required fields (breaking)
+            if (schemaEvolutionDiff.newRequired.length > 0) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'response_schema_evolution',
+                    before: 'optional',
+                    after: 'required',
+                    severity: 'breaking',
+                    description: `Response fields now required: ${schemaEvolutionDiff.newRequired.join(', ')}`,
+                });
+            }
+        }
+    }
+    // Compare security fingerprints (check mode --security flag)
+    if (!options.ignoreSecurityChanges) {
+        const securityDiff = compareSecurityFingerprints(previous.securityFingerprint, current.securityFingerprint);
+        if (securityDiff.newFindings.length > 0 || securityDiff.resolvedFindings.length > 0) {
+            securityChanged = true;
+            // Add changes for new security findings (security degradation)
+            for (const finding of securityDiff.newFindings) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'security',
+                    before: 'no finding',
+                    after: `${finding.riskLevel}: ${finding.title}`,
+                    severity: finding.riskLevel === 'critical' || finding.riskLevel === 'high'
+                        ? 'breaking'
+                        : finding.riskLevel === 'medium'
+                            ? 'warning'
+                            : 'info',
+                    description: `New security finding: ${finding.title} (${finding.cweId})`,
+                });
+            }
+            // Add changes for resolved security findings (security improvement)
+            for (const finding of securityDiff.resolvedFindings) {
+                changes.push({
+                    tool: current.name,
+                    aspect: 'security',
+                    before: `${finding.riskLevel}: ${finding.title}`,
+                    after: 'resolved',
+                    severity: 'info',
+                    description: `Security finding resolved: ${finding.title} (${finding.cweId})`,
+                });
+            }
+        }
+    }
+    return {
+        tool: current.name,
+        changes,
+        schemaChanged,
+        descriptionChanged,
+        responseStructureChanged,
+        errorPatternsChanged,
+        responseSchemaEvolutionChanged,
+        securityChanged,
+        schemaEvolutionDiff,
+    };
+}
+/**
+ * Format a schema change value for display in BehaviorChange.
+ * Converts unknown values to human-readable strings.
+ */
+function formatSchemaChangeValue(value) {
+    if (value === undefined)
+        return '<none>';
+    if (value === null)
+        return 'null';
+    if (typeof value === 'string')
+        return value;
+    if (typeof value === 'number' || typeof value === 'boolean')
+        return String(value);
+    if (Array.isArray(value)) {
+        if (value.length === 0)
+            return '[]';
+        if (value.length <= 3)
+            return `[${value.map(v => formatSchemaChangeValue(v)).join(', ')}]`;
+        return `[${value.slice(0, 3).map(v => formatSchemaChangeValue(v)).join(', ')}, ...]`;
+    }
+    // For objects, show a compact representation
+    try {
+        const json = JSON.stringify(value);
+        return json.length > 50 ? json.slice(0, 47) + '...' : json;
+    }
+    catch {
+        return String(value);
+    }
+}
+function compareWorkflows(previous, current) {
+    const changes = [];
+    const prevMap = new Map(previous.map((w) => [w.id, w]));
+    const currMap = new Map(current.map((w) => [w.id, w]));
+    for (const [id, currWorkflow] of currMap) {
+        const prevWorkflow = prevMap.get(id);
+        if (prevWorkflow) {
+            if (prevWorkflow.succeeded && !currWorkflow.succeeded) {
+                changes.push({
+                    tool: currWorkflow.name,
+                    aspect: 'error_handling',
+                    before: 'succeeded',
+                    after: 'failed',
+                    severity: 'breaking',
+                    description: `Workflow "${currWorkflow.name}" now fails (previously succeeded)`,
+                });
+            }
+            else if (!prevWorkflow.succeeded && currWorkflow.succeeded) {
+                changes.push({
+                    tool: currWorkflow.name,
+                    aspect: 'error_handling',
+                    before: 'failed',
+                    after: 'succeeded',
+                    severity: 'info',
+                    description: `Workflow "${currWorkflow.name}" now succeeds (previously failed)`,
+                });
+            }
+        }
+    }
+    return changes;
+}
+function calculateSeverity(toolsAdded, toolsRemoved, changes) {
+    let breakingCount = toolsRemoved.length;
+    let warningCount = 0;
+    let infoCount = toolsAdded.length;
+    for (const change of changes) {
+        switch (change.severity) {
+            case 'breaking':
+                breakingCount++;
+                break;
+            case 'warning':
+                warningCount++;
+                break;
+            case 'info':
+                infoCount++;
+                break;
+        }
+    }
+    let severity = 'none';
+    if (breakingCount > 0) {
+        severity = 'breaking';
+    }
+    else if (warningCount > 0) {
+        severity = 'warning';
+    }
+    else if (infoCount > 0) {
+        severity = 'info';
+    }
+    return { severity, breakingCount, warningCount, infoCount };
+}
+function generateSummary(toolsAdded, toolsRemoved, toolsModified, changes, severity) {
+    if (severity === 'none') {
+        return 'No changes detected.';
+    }
+    const parts = [];
+    if (toolsRemoved.length > 0) {
+        parts.push(`${toolsRemoved.length} tool(s) removed: ${toolsRemoved.join(', ')}`);
+    }
+    if (toolsAdded.length > 0) {
+        parts.push(`${toolsAdded.length} tool(s) added: ${toolsAdded.join(', ')}`);
+    }
+    if (toolsModified.length > 0) {
+        parts.push(`${toolsModified.length} tool(s) modified`);
+    }
+    const breakingChanges = changes.filter((c) => c.severity === 'breaking').length;
+    const warningChanges = changes.filter((c) => c.severity === 'warning').length;
+    if (breakingChanges > 0) {
+        parts.push(`${breakingChanges} breaking change(s)`);
+    }
+    if (warningChanges > 0) {
+        parts.push(`${warningChanges} warning(s)`);
+    }
+    return parts.join('. ') + '.';
+}
+export function hasBreakingChanges(diff) {
+    return diff.severity === 'breaking';
+}
+export function hasSecurityChanges(diff) {
+    return diff.behaviorChanges.some((c) => c.aspect === 'security');
+}
+export function filterByMinimumSeverity(diff, minSeverity) {
+    const severityOrder = ['none', 'info', 'warning', 'breaking'];
+    const minIndex = severityOrder.indexOf(minSeverity);
+    return diff.behaviorChanges.filter((change) => {
+        // BehaviorChange.severity is already a ChangeSeverity, so no mapping needed
+        return severityOrder.indexOf(change.severity) >= minIndex;
+    });
+}
+/**
+ * Severity order for comparison.
+ */
+const SEVERITY_ORDER = ['none', 'info', 'warning', 'breaking'];
+/**
+ * Compare two severity levels.
+ * Returns negative if a < b, positive if a > b, 0 if equal.
+ */
+export function compareSeverity(a, b) {
+    return SEVERITY_ORDER.indexOf(a) - SEVERITY_ORDER.indexOf(b);
+}
+/**
+ * Check if a severity meets or exceeds a threshold.
+ */
+export function severityMeetsThreshold(severity, threshold) {
+    return compareSeverity(severity, threshold) >= 0;
+}
+/**
+ * Apply aspect overrides to a behavior change.
+ * Returns the modified severity based on aspect overrides.
+ */
+export function applyAspectOverride(change, aspectOverrides) {
+    if (!aspectOverrides) {
+        return change.severity;
+    }
+    const override = aspectOverrides[change.aspect];
+    return override !== undefined ? override : change.severity;
+}
+/**
+ * Apply severity configuration to a diff result.
+ * Returns a new diff with filtered/modified changes based on config.
+ */
+export function applySeverityConfig(diff, config) {
+    const { minimumSeverity = 'none', suppressWarnings = false, aspectOverrides, } = config;
+    // Apply aspect overrides and filter by minimum severity
+    const filteredChanges = diff.behaviorChanges
+        .map((change) => {
+        const newSeverity = applyAspectOverride(change, aspectOverrides);
+        return { ...change, severity: newSeverity };
+    })
+        .filter((change) => {
+        // Filter by minimum severity
+        if (!severityMeetsThreshold(change.severity, minimumSeverity)) {
+            return false;
+        }
+        // Suppress warnings if configured
+        if (suppressWarnings && change.severity === 'warning') {
+            return false;
+        }
+        return true;
+    });
+    // Filter toolsModified to only include those with remaining changes
+    const toolsWithChanges = new Set(filteredChanges.map((c) => c.tool));
+    const filteredToolsModified = diff.toolsModified.filter((td) => toolsWithChanges.has(td.tool) ||
+        (td.schemaChanged &&
+            (!aspectOverrides?.schema || aspectOverrides.schema !== 'none')) ||
+        (td.descriptionChanged &&
+            (!aspectOverrides?.description || aspectOverrides.description !== 'none')));
+    // Recalculate counts
+    let breakingCount = diff.toolsRemoved.length;
+    let warningCount = 0;
+    let infoCount = diff.toolsAdded.length;
+    for (const change of filteredChanges) {
+        switch (change.severity) {
+            case 'breaking':
+                breakingCount++;
+                break;
+            case 'warning':
+                warningCount++;
+                break;
+            case 'info':
+                infoCount++;
+                break;
+        }
+    }
+    // Determine overall severity
+    let severity = 'none';
+    if (breakingCount > 0) {
+        severity = 'breaking';
+    }
+    else if (warningCount > 0) {
+        severity = 'warning';
+    }
+    else if (infoCount > 0) {
+        severity = 'info';
+    }
+    return {
+        ...diff,
+        behaviorChanges: filteredChanges,
+        toolsModified: filteredToolsModified,
+        severity,
+        breakingCount,
+        warningCount,
+        infoCount,
+        summary: generateSummary(diff.toolsAdded, diff.toolsRemoved, filteredToolsModified, filteredChanges, severity),
+    };
+}
+/**
+ * Determine the appropriate exit code based on diff severity and config.
+ * Returns true if the check should fail (non-zero exit).
+ */
+export function shouldFailOnDiff(diff, failOnSeverity = 'breaking') {
+    return severityMeetsThreshold(diff.severity, failOnSeverity);
+}
+/**
+ * Check if two baselines have compatible versions for comparison.
+ *
+ * @param baseline1 - First baseline
+ * @param baseline2 - Second baseline
+ * @returns Version compatibility information
+ */
+export function checkBaselineVersionCompatibility(baseline1, baseline2) {
+    const result = checkVersionCompatibility(baseline1.version, baseline2.version);
+    return {
+        compatible: result.compatible,
+        warning: result.warning,
+        sourceVersion: result.sourceVersion,
+        targetVersion: result.targetVersion,
+    };
+}
+/**
+ * Compare performance data between two baselines.
+ * Detects performance regressions based on p50 latency threshold.
+ * Includes confidence information to indicate reliability of comparisons.
+ *
+ * @param previous - The previous baseline
+ * @param current - The current baseline
+ * @param threshold - Regression threshold (0-1, e.g., 0.10 = 10% slower)
+ * @returns Performance regression report, or undefined if no performance data
+ */
+function comparePerformanceData(previous, current, threshold) {
+    const regressions = [];
+    const confidenceChanges = [];
+    const lowConfidenceTools = [];
+    let improvementCount = 0;
+    // Build map of previous tool performance (including confidence)
+    const previousPerf = new Map();
+    for (const tool of previous.tools) {
+        if (tool.baselineP50Ms !== undefined) {
+            previousPerf.set(tool.name, {
+                p50: tool.baselineP50Ms,
+                p95: tool.baselineP95Ms ?? tool.baselineP50Ms,
+                confidence: tool.performanceConfidence?.confidenceLevel,
+            });
+        }
+    }
+    // Compare current tool performance
+    for (const tool of current.tools) {
+        if (tool.baselineP50Ms === undefined) {
+            continue; // No performance data
+        }
+        const currentConfidence = tool.performanceConfidence;
+        const currentConfidenceLevel = currentConfidence?.confidenceLevel ?? 'low';
+        // Track low confidence tools
+        if (currentConfidence && !hasReliableConfidence(currentConfidence)) {
+            lowConfidenceTools.push(tool.name);
+        }
+        const prev = previousPerf.get(tool.name);
+        if (!prev) {
+            continue; // New tool, no baseline to compare
+        }
+        // Track confidence level changes
+        if (prev.confidence && currentConfidenceLevel !== prev.confidence) {
+            const previousLevel = prev.confidence;
+            const improved = (previousLevel === 'low' && currentConfidenceLevel !== 'low') ||
+                (previousLevel === 'medium' && currentConfidenceLevel === 'high');
+            const degraded = (previousLevel === 'high' && currentConfidenceLevel !== 'high') ||
+                (previousLevel === 'medium' && currentConfidenceLevel === 'low');
+            confidenceChanges.push({
+                toolName: tool.name,
+                previousLevel,
+                currentLevel: currentConfidenceLevel,
+                improved,
+                degraded,
+                summary: improved
+                    ? `Confidence improved from ${previousLevel} to ${currentConfidenceLevel}`
+                    : degraded
+                        ? `Confidence degraded from ${previousLevel} to ${currentConfidenceLevel}`
+                        : `Confidence changed from ${previousLevel} to ${currentConfidenceLevel}`,
+            });
+        }
+        // Calculate regression percentage
+        const regressionPercent = prev.p50 > 0 ? (tool.baselineP50Ms - prev.p50) / prev.p50 : 0;
+        // Determine if the regression is reliable (based on confidence)
+        const isReliable = currentConfidence !== undefined && hasReliableConfidence(currentConfidence);
+        if (regressionPercent > threshold) {
+            // Performance regression
+            regressions.push({
+                toolName: tool.name,
+                previousP50Ms: prev.p50,
+                currentP50Ms: tool.baselineP50Ms,
+                regressionPercent,
+                exceedsThreshold: true,
+                previousConfidence: prev.confidence,
+                currentConfidence: currentConfidenceLevel,
+                isReliable,
+            });
+        }
+        else if (regressionPercent < -PERFORMANCE_TRACKING.WARNING_THRESHOLD) {
+            // Performance improvement (> 5% faster)
+            improvementCount++;
+        }
+    }
+    // Return undefined if no performance data exists
+    if (previousPerf.size === 0) {
+        return undefined;
+    }
+    return {
+        regressions,
+        regressionCount: regressions.length,
+        improvementCount,
+        hasRegressions: regressions.length > 0,
+        confidenceChanges: confidenceChanges.length > 0 ? confidenceChanges : undefined,
+        lowConfidenceTools: lowConfidenceTools.length > 0 ? lowConfidenceTools : undefined,
+    };
+}
+/**
+ * Compare security data between two baselines.
+ * Aggregates security findings across all tools to produce a server-level security diff.
+ *
+ * @param previous - The previous baseline
+ * @param current - The current baseline
+ * @param ignoreSecurityChanges - Whether to skip security comparison
+ * @returns Security diff report, or undefined if no security data
+ */
+function compareSecurityData(previous, current, ignoreSecurityChanges) {
+    if (ignoreSecurityChanges) {
+        return undefined;
+    }
+    // Check if either baseline has security data
+    const previousHasSecurity = previous.tools.some((t) => t.securityFingerprint?.tested);
+    const currentHasSecurity = current.tools.some((t) => t.securityFingerprint?.tested);
+    if (!previousHasSecurity && !currentHasSecurity) {
+        return undefined; // No security data to compare
+    }
+    // Aggregate findings from all tools
+    const previousFindings = new Map();
+    const currentFindings = new Map();
+    // Build finding maps keyed by a unique identifier (tool:category:cweId:parameter)
+    for (const tool of previous.tools) {
+        if (tool.securityFingerprint?.findings) {
+            for (const finding of tool.securityFingerprint.findings) {
+                const key = `${finding.tool}:${finding.category}:${finding.cweId}:${finding.parameter}`;
+                previousFindings.set(key, finding);
+            }
+        }
+    }
+    for (const tool of current.tools) {
+        if (tool.securityFingerprint?.findings) {
+            for (const finding of tool.securityFingerprint.findings) {
+                const key = `${finding.tool}:${finding.category}:${finding.cweId}:${finding.parameter}`;
+                currentFindings.set(key, finding);
+            }
+        }
+    }
+    // Calculate new and resolved findings
+    const newFindings = [];
+    const resolvedFindings = [];
+    for (const [key, finding] of currentFindings) {
+        if (!previousFindings.has(key)) {
+            newFindings.push(finding);
+        }
+    }
+    for (const [key, finding] of previousFindings) {
+        if (!currentFindings.has(key)) {
+            resolvedFindings.push(finding);
+        }
+    }
+    // Calculate aggregate risk scores
+    let previousRiskScore = 0;
+    let currentRiskScore = 0;
+    let previousToolCount = 0;
+    let currentToolCount = 0;
+    for (const tool of previous.tools) {
+        if (tool.securityFingerprint?.tested) {
+            previousRiskScore += tool.securityFingerprint.riskScore;
+            previousToolCount++;
+        }
+    }
+    for (const tool of current.tools) {
+        if (tool.securityFingerprint?.tested) {
+            currentRiskScore += tool.securityFingerprint.riskScore;
+            currentToolCount++;
+        }
+    }
+    // Average risk scores if there are tested tools
+    const avgPreviousRisk = previousToolCount > 0 ? previousRiskScore / previousToolCount : 0;
+    const avgCurrentRisk = currentToolCount > 0 ? currentRiskScore / currentToolCount : 0;
+    const riskScoreChange = avgCurrentRisk - avgPreviousRisk;
+    // Generate summary
+    const summaryParts = [];
+    if (newFindings.length > 0) {
+        const criticalHigh = newFindings.filter((f) => f.riskLevel === 'critical' || f.riskLevel === 'high').length;
+        if (criticalHigh > 0) {
+            summaryParts.push(`${criticalHigh} critical/high severity findings detected`);
+        }
+        summaryParts.push(`${newFindings.length} new security finding(s)`);
+    }
+    if (resolvedFindings.length > 0) {
+        summaryParts.push(`${resolvedFindings.length} finding(s) resolved`);
+    }
+    if (riskScoreChange > 0) {
+        summaryParts.push(`risk score increased by ${riskScoreChange.toFixed(1)}`);
+    }
+    else if (riskScoreChange < 0) {
+        summaryParts.push(`risk score decreased by ${Math.abs(riskScoreChange).toFixed(1)}`);
+    }
+    const summary = summaryParts.length > 0 ? summaryParts.join('; ') : 'No security changes detected';
+    return {
+        newFindings,
+        resolvedFindings,
+        previousRiskScore: Math.round(avgPreviousRisk),
+        currentRiskScore: Math.round(avgCurrentRisk),
+        riskScoreChange: Math.round(riskScoreChange),
+        degraded: newFindings.length > 0 || riskScoreChange > 0,
+        summary,
+    };
+}
+/**
+ * Generate schema evolution report from tool diffs.
+ * Tracks schema stability changes across tools.
+ *
+ * @param toolsModified - Tools with modifications
+ * @param previous - The previous baseline
+ * @param current - The current baseline
+ * @returns Schema evolution report, or undefined if no schema evolution data
+ */
+function generateSchemaEvolutionReport(toolsModified, previous, current) {
+    // Check if either baseline has schema evolution data
+    const previousHasEvolution = previous.tools.some((t) => t.responseSchemaEvolution);
+    const currentHasEvolution = current.tools.some((t) => t.responseSchemaEvolution);
+    if (!previousHasEvolution && !currentHasEvolution) {
+        return undefined; // No schema evolution data to compare
+    }
+    const toolsWithIssues = [];
+    let unstableCount = 0;
+    let stableCount = 0;
+    let structureChangedCount = 0;
+    let hasBreakingChanges = false;
+    // Analyze tools with schema evolution data
+    for (const tool of current.tools) {
+        const currEvolution = tool.responseSchemaEvolution;
+        if (!currEvolution)
+            continue;
+        // Count stable vs unstable
+        if (currEvolution.isStable) {
+            stableCount++;
+        }
+        else {
+            unstableCount++;
+        }
+        // Find corresponding tool diff
+        const toolDiff = toolsModified.find((td) => td.tool === tool.name);
+        if (toolDiff?.schemaEvolutionDiff?.structureChanged) {
+            structureChangedCount++;
+            if (toolDiff.schemaEvolutionDiff.isBreaking) {
+                hasBreakingChanges = true;
+            }
+            // Find previous tool
+            const prevTool = previous.tools.find((t) => t.name === tool.name);
+            const prevEvolution = prevTool?.responseSchemaEvolution;
+            const becameUnstable = (prevEvolution?.isStable ?? false) && !currEvolution.isStable;
+            toolsWithIssues.push({
+                toolName: tool.name,
+                becameUnstable,
+                fieldsAdded: toolDiff.schemaEvolutionDiff.fieldsAdded,
+                fieldsRemoved: toolDiff.schemaEvolutionDiff.fieldsRemoved,
+                isBreaking: toolDiff.schemaEvolutionDiff.isBreaking,
+                summary: toolDiff.schemaEvolutionDiff.summary,
+            });
+        }
+        else if (!currEvolution.isStable && currEvolution.inconsistentFields.length > 0) {
+            // Tool with unstable schema (no change, but already unstable)
+            const prevTool = previous.tools.find((t) => t.name === tool.name);
+            const prevEvolution = prevTool?.responseSchemaEvolution;
+            const becameUnstable = (prevEvolution?.isStable ?? false) && !currEvolution.isStable;
+            if (becameUnstable) {
+                toolsWithIssues.push({
+                    toolName: tool.name,
+                    becameUnstable: true,
+                    fieldsAdded: [],
+                    fieldsRemoved: [],
+                    isBreaking: false,
+                    summary: `Schema became unstable: ${currEvolution.inconsistentFields.join(', ')}`,
+                });
+            }
+        }
+    }
+    return {
+        toolsWithIssues,
+        unstableCount,
+        stableCount,
+        structureChangedCount,
+        hasBreakingChanges,
+    };
+}
+/**
+ * Generate error trend report from baseline comparison.
+ * Aggregates error patterns across all tools to identify trends.
+ *
+ * @param previous - The previous baseline
+ * @param current - The current baseline
+ * @param ignoreErrorPatternChanges - Whether to skip error pattern comparison
+ * @returns Error trend report, or undefined if no error pattern data
+ */
+function generateErrorTrendReport(previous, current, ignoreErrorPatternChanges) {
+    if (ignoreErrorPatternChanges) {
+        return undefined;
+    }
+    // Check if either baseline has error pattern data
+    const previousHasErrors = previous.tools.some((t) => t.errorPatterns && t.errorPatterns.length > 0);
+    const currentHasErrors = current.tools.some((t) => t.errorPatterns && t.errorPatterns.length > 0);
+    if (!previousHasErrors && !currentHasErrors) {
+        return undefined; // No error pattern data to compare
+    }
+    // Aggregate error patterns from all tools
+    const allPreviousPatterns = previous.tools.flatMap((t) => t.errorPatterns ?? []);
+    const allCurrentPatterns = current.tools.flatMap((t) => t.errorPatterns ?? []);
+    return analyzeErrorTrends(allPreviousPatterns, allCurrentPatterns);
+}
+/**
+ * Compare documentation scores between baselines.
+ * Returns a change report if documentation score data is available.
+ *
+ * @param previous - The previous baseline
+ * @param current - The current baseline
+ * @returns Documentation score change report, or undefined if no data
+ */
+function compareDocumentationData(previous, current) {
+    // If current doesn't have documentation score, try to calculate it from tools
+    // This allows comparing old baselines without scores against new ones with scores
+    const currentScore = current.documentationScore ?? calculateDocScoreFromTools(current);
+    const previousScore = previous.documentationScore;
+    if (!currentScore) {
+        return undefined;
+    }
+    // Use the documentation scorer's comparison function
+    // We need to reconstruct a minimal DocumentationScore for comparison
+    const currentDocScore = {
+        overallScore: currentScore.overallScore,
+        grade: currentScore.grade,
+        components: {
+            descriptionCoverage: 0,
+            descriptionQuality: 0,
+            parameterDocumentation: 0,
+            exampleCoverage: 0,
+        },
+        issues: [],
+        suggestions: [],
+        toolCount: currentScore.toolCount,
+    };
+    return compareDocumentationScores(previousScore, currentDocScore);
+}
+/**
+ * Calculate documentation score summary from baseline tools.
+ * Used when baseline doesn't have pre-calculated score.
+ */
+function calculateDocScoreFromTools(baseline) {
+    if (!baseline.tools || baseline.tools.length === 0) {
+        return undefined;
+    }
+    // Create minimal MCPTool objects from ToolFingerprint
+    const tools = baseline.tools.map((t) => ({
+        name: t.name,
+        description: t.description,
+        inputSchema: t.inputSchema ?? {},
+    }));
+    const score = scoreDocumentation(tools);
+    return {
+        overallScore: score.overallScore,
+        grade: score.grade,
+        issueCount: score.issues.length,
+        toolCount: score.toolCount,
+    };
+}
+//# sourceMappingURL=comparator.js.map