RubyGems - decision_agent - Versions diffs - 0.3.0 → 1.1.0 - Mend

decision_agent 0.3.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (220) hide show

checksums.yaml +4 -4
data/README.md +234 -14
data/lib/decision_agent/ab_testing/ab_test.rb +5 -1
data/lib/decision_agent/ab_testing/ab_test_assignment.rb +2 -0
data/lib/decision_agent/ab_testing/ab_test_manager.rb +2 -0
data/lib/decision_agent/ab_testing/ab_testing_agent.rb +2 -0
data/lib/decision_agent/ab_testing/storage/activerecord_adapter.rb +2 -13
data/lib/decision_agent/ab_testing/storage/adapter.rb +2 -0
data/lib/decision_agent/ab_testing/storage/memory_adapter.rb +2 -0
data/lib/decision_agent/agent.rb +78 -9
data/lib/decision_agent/audit/adapter.rb +2 -0
data/lib/decision_agent/audit/logger_adapter.rb +2 -0
data/lib/decision_agent/audit/null_adapter.rb +2 -0
data/lib/decision_agent/auth/access_audit_logger.rb +2 -0
data/lib/decision_agent/auth/authenticator.rb +2 -0
data/lib/decision_agent/auth/password_reset_manager.rb +2 -0
data/lib/decision_agent/auth/password_reset_token.rb +2 -0
data/lib/decision_agent/auth/permission.rb +2 -0
data/lib/decision_agent/auth/permission_checker.rb +2 -0
data/lib/decision_agent/auth/rbac_adapter.rb +2 -0
data/lib/decision_agent/auth/rbac_config.rb +2 -0
data/lib/decision_agent/auth/role.rb +2 -0
data/lib/decision_agent/auth/session.rb +2 -0
data/lib/decision_agent/auth/session_manager.rb +2 -0
data/lib/decision_agent/auth/user.rb +2 -0
data/lib/decision_agent/context.rb +14 -0
data/lib/decision_agent/decision.rb +113 -4
data/lib/decision_agent/dmn/adapter.rb +2 -0
data/lib/decision_agent/dmn/cache.rb +2 -2
data/lib/decision_agent/dmn/decision_graph.rb +7 -7
data/lib/decision_agent/dmn/decision_tree.rb +16 -8
data/lib/decision_agent/dmn/errors.rb +2 -0
data/lib/decision_agent/dmn/exporter.rb +2 -0
data/lib/decision_agent/dmn/feel/evaluator.rb +130 -114
data/lib/decision_agent/dmn/feel/functions.rb +2 -0
data/lib/decision_agent/dmn/feel/parser.rb +2 -0
data/lib/decision_agent/dmn/feel/simple_parser.rb +98 -77
data/lib/decision_agent/dmn/feel/transformer.rb +56 -102
data/lib/decision_agent/dmn/feel/types.rb +2 -0
data/lib/decision_agent/dmn/importer.rb +2 -0
data/lib/decision_agent/dmn/model.rb +2 -4
data/lib/decision_agent/dmn/parser.rb +2 -0
data/lib/decision_agent/dmn/testing.rb +3 -2
data/lib/decision_agent/dmn/validator.rb +5 -3
data/lib/decision_agent/dmn/visualizer.rb +7 -6
data/lib/decision_agent/dsl/condition_evaluator.rb +242 -1375
data/lib/decision_agent/dsl/helpers/cache_helpers.rb +82 -0
data/lib/decision_agent/dsl/helpers/comparison_helpers.rb +98 -0
data/lib/decision_agent/dsl/helpers/date_helpers.rb +91 -0
data/lib/decision_agent/dsl/helpers/geospatial_helpers.rb +85 -0
data/lib/decision_agent/dsl/helpers/operator_evaluation_helpers.rb +160 -0
data/lib/decision_agent/dsl/helpers/parameter_parsing_helpers.rb +206 -0
data/lib/decision_agent/dsl/helpers/template_helpers.rb +39 -0
data/lib/decision_agent/dsl/helpers/utility_helpers.rb +45 -0
data/lib/decision_agent/dsl/operators/base.rb +70 -0
data/lib/decision_agent/dsl/operators/basic_comparison_operators.rb +80 -0
data/lib/decision_agent/dsl/operators/collection_operators.rb +60 -0
data/lib/decision_agent/dsl/operators/date_arithmetic_operators.rb +206 -0
data/lib/decision_agent/dsl/operators/date_time_operators.rb +47 -0
data/lib/decision_agent/dsl/operators/duration_operators.rb +149 -0
data/lib/decision_agent/dsl/operators/financial_operators.rb +237 -0
data/lib/decision_agent/dsl/operators/geospatial_operators.rb +106 -0
data/lib/decision_agent/dsl/operators/mathematical_operators.rb +234 -0
data/lib/decision_agent/dsl/operators/moving_window_operators.rb +135 -0
data/lib/decision_agent/dsl/operators/numeric_operators.rb +120 -0
data/lib/decision_agent/dsl/operators/rate_operators.rb +65 -0
data/lib/decision_agent/dsl/operators/statistical_aggregations.rb +187 -0
data/lib/decision_agent/dsl/operators/string_aggregations.rb +84 -0
data/lib/decision_agent/dsl/operators/string_operators.rb +72 -0
data/lib/decision_agent/dsl/operators/time_component_operators.rb +72 -0
data/lib/decision_agent/dsl/rule_parser.rb +2 -0
data/lib/decision_agent/dsl/schema_validator.rb +37 -14
data/lib/decision_agent/errors.rb +2 -0
data/lib/decision_agent/evaluation.rb +14 -2
data/lib/decision_agent/evaluators/base.rb +2 -0
data/lib/decision_agent/evaluators/dmn_evaluator.rb +108 -19
data/lib/decision_agent/evaluators/json_rule_evaluator.rb +56 -11
data/lib/decision_agent/evaluators/static_evaluator.rb +2 -0
data/lib/decision_agent/explainability/condition_trace.rb +85 -0
data/lib/decision_agent/explainability/explainability_result.rb +50 -0
data/lib/decision_agent/explainability/rule_trace.rb +41 -0
data/lib/decision_agent/explainability/trace_collector.rb +26 -0
data/lib/decision_agent/monitoring/alert_manager.rb +7 -16
data/lib/decision_agent/monitoring/dashboard_server.rb +383 -250
data/lib/decision_agent/monitoring/metrics_collector.rb +2 -0
data/lib/decision_agent/monitoring/monitored_agent.rb +2 -0
data/lib/decision_agent/monitoring/prometheus_exporter.rb +3 -1
data/lib/decision_agent/replay/replay.rb +4 -1
data/lib/decision_agent/scoring/base.rb +2 -0
data/lib/decision_agent/scoring/consensus.rb +2 -0
data/lib/decision_agent/scoring/max_weight.rb +2 -0
data/lib/decision_agent/scoring/threshold.rb +2 -0
data/lib/decision_agent/scoring/weighted_average.rb +2 -0
data/lib/decision_agent/simulation/errors.rb +20 -0
data/lib/decision_agent/simulation/impact_analyzer.rb +500 -0
data/lib/decision_agent/simulation/monte_carlo_simulator.rb +638 -0
data/lib/decision_agent/simulation/replay_engine.rb +488 -0
data/lib/decision_agent/simulation/scenario_engine.rb +320 -0
data/lib/decision_agent/simulation/scenario_library.rb +165 -0
data/lib/decision_agent/simulation/shadow_test_engine.rb +274 -0
data/lib/decision_agent/simulation/what_if_analyzer.rb +1008 -0
data/lib/decision_agent/simulation.rb +19 -0
data/lib/decision_agent/testing/batch_test_importer.rb +6 -2
data/lib/decision_agent/testing/batch_test_runner.rb +5 -2
data/lib/decision_agent/testing/test_coverage_analyzer.rb +2 -0
data/lib/decision_agent/testing/test_result_comparator.rb +2 -0
data/lib/decision_agent/testing/test_scenario.rb +2 -0
data/lib/decision_agent/version.rb +3 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +108 -43
data/lib/decision_agent/versioning/adapter.rb +9 -0
data/lib/decision_agent/versioning/file_storage_adapter.rb +19 -6
data/lib/decision_agent/versioning/version_manager.rb +9 -0
data/lib/decision_agent/web/dmn_editor/serialization.rb +74 -0
data/lib/decision_agent/web/dmn_editor/xml_builder.rb +107 -0
data/lib/decision_agent/web/dmn_editor.rb +8 -67
data/lib/decision_agent/web/middleware/auth_middleware.rb +2 -0
data/lib/decision_agent/web/middleware/permission_middleware.rb +3 -1
data/lib/decision_agent/web/public/app.js +186 -26
data/lib/decision_agent/web/public/batch_testing.html +80 -6
data/lib/decision_agent/web/public/dmn-editor.html +2 -2
data/lib/decision_agent/web/public/dmn-editor.js +74 -8
data/lib/decision_agent/web/public/index.html +69 -3
data/lib/decision_agent/web/public/login.html +1 -1
data/lib/decision_agent/web/public/sample_batch.csv +11 -0
data/lib/decision_agent/web/public/sample_impact.csv +11 -0
data/lib/decision_agent/web/public/sample_replay.csv +11 -0
data/lib/decision_agent/web/public/sample_rules.json +118 -0
data/lib/decision_agent/web/public/sample_shadow.csv +11 -0
data/lib/decision_agent/web/public/sample_whatif.csv +11 -0
data/lib/decision_agent/web/public/simulation.html +146 -0
data/lib/decision_agent/web/public/simulation_impact.html +495 -0
data/lib/decision_agent/web/public/simulation_replay.html +547 -0
data/lib/decision_agent/web/public/simulation_shadow.html +561 -0
data/lib/decision_agent/web/public/simulation_whatif.html +549 -0
data/lib/decision_agent/web/public/styles.css +65 -0
data/lib/decision_agent/web/public/users.html +1 -1
data/lib/decision_agent/web/rack_helpers.rb +106 -0
data/lib/decision_agent/web/rack_request_helpers.rb +196 -0
data/lib/decision_agent/web/server.rb +2126 -1374
data/lib/decision_agent.rb +19 -1
data/lib/generators/decision_agent/install/install_generator.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_test_assignment_model.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_test_model.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_testing_migration.rb +2 -0
data/lib/generators/decision_agent/install/templates/migration.rb +2 -0
data/lib/generators/decision_agent/install/templates/rule.rb +2 -0
data/lib/generators/decision_agent/install/templates/rule_version.rb +2 -0
metadata +103 -89
data/spec/ab_testing/ab_test_assignment_spec.rb +0 -253
data/spec/ab_testing/ab_test_manager_spec.rb +0 -612
data/spec/ab_testing/ab_test_spec.rb +0 -270
data/spec/ab_testing/ab_testing_agent_spec.rb +0 -655
data/spec/ab_testing/storage/adapter_spec.rb +0 -64
data/spec/ab_testing/storage/memory_adapter_spec.rb +0 -485
data/spec/activerecord_thread_safety_spec.rb +0 -553
data/spec/advanced_operators_spec.rb +0 -3150
data/spec/agent_spec.rb +0 -289
data/spec/api_contract_spec.rb +0 -430
data/spec/audit_adapters_spec.rb +0 -92
data/spec/auth/access_audit_logger_spec.rb +0 -394
data/spec/auth/authenticator_spec.rb +0 -112
data/spec/auth/password_reset_spec.rb +0 -294
data/spec/auth/permission_checker_spec.rb +0 -207
data/spec/auth/permission_spec.rb +0 -73
data/spec/auth/rbac_adapter_spec.rb +0 -778
data/spec/auth/rbac_config_spec.rb +0 -82
data/spec/auth/role_spec.rb +0 -51
data/spec/auth/session_manager_spec.rb +0 -172
data/spec/auth/session_spec.rb +0 -112
data/spec/auth/user_spec.rb +0 -130
data/spec/comprehensive_edge_cases_spec.rb +0 -1777
data/spec/context_spec.rb +0 -127
data/spec/decision_agent_spec.rb +0 -96
data/spec/decision_spec.rb +0 -423
data/spec/dmn/decision_graph_spec.rb +0 -282
data/spec/dmn/decision_tree_spec.rb +0 -203
data/spec/dmn/feel/errors_spec.rb +0 -18
data/spec/dmn/feel/functions_spec.rb +0 -400
data/spec/dmn/feel/simple_parser_spec.rb +0 -274
data/spec/dmn/feel/types_spec.rb +0 -176
data/spec/dmn/feel_parser_spec.rb +0 -489
data/spec/dmn/hit_policy_spec.rb +0 -202
data/spec/dmn/integration_spec.rb +0 -226
data/spec/dsl/condition_evaluator_spec.rb +0 -774
data/spec/dsl_validation_spec.rb +0 -648
data/spec/edge_cases_spec.rb +0 -353
data/spec/evaluation_spec.rb +0 -364
data/spec/evaluation_validator_spec.rb +0 -165
data/spec/examples/feedback_aware_evaluator_spec.rb +0 -460
data/spec/examples.txt +0 -1909
data/spec/fixtures/dmn/complex_decision.dmn +0 -81
data/spec/fixtures/dmn/invalid_structure.dmn +0 -31
data/spec/fixtures/dmn/simple_decision.dmn +0 -40
data/spec/issue_verification_spec.rb +0 -759
data/spec/json_rule_evaluator_spec.rb +0 -587
data/spec/monitoring/alert_manager_spec.rb +0 -378
data/spec/monitoring/metrics_collector_spec.rb +0 -501
data/spec/monitoring/monitored_agent_spec.rb +0 -225
data/spec/monitoring/prometheus_exporter_spec.rb +0 -242
data/spec/monitoring/storage/activerecord_adapter_spec.rb +0 -498
data/spec/monitoring/storage/base_adapter_spec.rb +0 -61
data/spec/monitoring/storage/memory_adapter_spec.rb +0 -247
data/spec/performance_optimizations_spec.rb +0 -493
data/spec/replay_edge_cases_spec.rb +0 -699
data/spec/replay_spec.rb +0 -210
data/spec/rfc8785_canonicalization_spec.rb +0 -215
data/spec/scoring_spec.rb +0 -225
data/spec/spec_helper.rb +0 -60
data/spec/testing/batch_test_importer_spec.rb +0 -693
data/spec/testing/batch_test_runner_spec.rb +0 -307
data/spec/testing/test_coverage_analyzer_spec.rb +0 -292
data/spec/testing/test_result_comparator_spec.rb +0 -392
data/spec/testing/test_scenario_spec.rb +0 -113
data/spec/thread_safety_spec.rb +0 -490
data/spec/thread_safety_spec.rb.broken +0 -878
data/spec/versioning/adapter_spec.rb +0 -156
data/spec/versioning_spec.rb +0 -1030
data/spec/web/middleware/auth_middleware_spec.rb +0 -133
data/spec/web/middleware/permission_middleware_spec.rb +0 -247
data/spec/web_ui_rack_spec.rb +0 -2134

data/spec/monitoring/monitored_agent_spec.rb DELETED Viewed

@@ -1,225 +0,0 @@
-require "spec_helper"
-require "decision_agent/monitoring/metrics_collector"
-require "decision_agent/monitoring/monitored_agent"
-RSpec.describe DecisionAgent::Monitoring::MonitoredAgent do
-  let(:collector) { DecisionAgent::Monitoring::MetricsCollector.new(storage: :memory) }
-  let(:evaluator) do
-    DecisionAgent::Evaluators::JsonRuleEvaluator.new(
-      rules_json: {
-        version: "1.0",
-        ruleset: "test",
-        rules: [{
-          id: "test_rule",
-          if: { field: "amount", op: "gt", value: 100 },
-          then: { decision: "approve", weight: 0.9, reason: "Test reason" }
-        }]
-      },
-      name: "test_evaluator"
-    )
-  end
-  let(:agent) { DecisionAgent::Agent.new(evaluators: [evaluator]) }
-  let(:monitored_agent) { described_class.new(agent: agent, metrics_collector: collector) }
-  describe "#initialize" do
-    it "wraps an agent with metrics collection" do
-      expect(monitored_agent.agent).to eq(agent)
-      expect(monitored_agent.metrics_collector).to eq(collector)
-    end
-  end
-  describe "#decide" do
-    let(:context) { { amount: 1000 } }
-    it "makes a decision and records metrics" do
-      result = monitored_agent.decide(context: context)
-      expect(result).to be_a(DecisionAgent::Decision)
-      expect(result.decision).to eq("approve")
-      expect(collector.metrics_count[:decisions]).to eq(1)
-      expect(collector.metrics_count[:evaluations]).to eq(1)
-      expect(collector.metrics_count[:performance]).to eq(1)
-    end
-    it "records decision metrics with duration" do
-      monitored_agent.decide(context: context)
-      stats = collector.statistics
-      expect(stats[:decisions][:total]).to eq(1)
-      expect(stats[:decisions][:avg_duration_ms]).to be > 0
-    end
-    it "records evaluation metrics" do
-      monitored_agent.decide(context: context)
-      stats = collector.statistics
-      expect(stats[:evaluations][:total]).to eq(1)
-      expect(stats[:evaluations][:evaluator_distribution]["test_evaluator"]).to eq(1)
-    end
-    it "records performance metrics as successful" do
-      monitored_agent.decide(context: context)
-      stats = collector.statistics
-      expect(stats[:performance][:total_operations]).to eq(1)
-      expect(stats[:performance][:successful]).to eq(1)
-      expect(stats[:performance][:success_rate]).to eq(1.0)
-    end
-    it "includes metadata in performance metrics" do
-      monitored_agent.decide(context: context)
-      collector.statistics
-      perf_metric = collector.instance_variable_get(:@metrics)[:performance].first
-      expect(perf_metric[:metadata][:evaluators_count]).to eq(1)
-      expect(perf_metric[:metadata][:decision]).to eq("approve")
-      expect(perf_metric[:metadata][:confidence]).to be_a(Float)
-    end
-    context "when decision fails" do
-      before do
-        allow(agent).to receive(:decide).and_raise(StandardError.new("Test error"))
-      end
-      it "records error metrics" do
-        expect do
-          monitored_agent.decide(context: context)
-        end.to raise_error(StandardError, "Test error")
-        expect(collector.metrics_count[:errors]).to eq(1)
-      end
-      it "records failed performance metrics" do
-        expect do
-          monitored_agent.decide(context: context)
-        end.to raise_error(StandardError)
-        stats = collector.statistics
-        expect(stats[:performance][:total_operations]).to eq(1)
-        expect(stats[:performance][:failed]).to eq(1)
-        expect(stats[:performance][:success_rate]).to eq(0.0)
-      end
-      it "includes error details in metrics" do
-        expect do
-          monitored_agent.decide(context: context)
-        end.to raise_error(StandardError)
-        error_metric = collector.instance_variable_get(:@metrics)[:errors].first
-        expect(error_metric[:error_class]).to eq("StandardError")
-        expect(error_metric[:error_message]).to eq("Test error")
-        expect(error_metric[:context]).to eq(context)
-      end
-      it "re-raises the error" do
-        expect do
-          monitored_agent.decide(context: context)
-        end.to raise_error(StandardError, "Test error")
-      end
-    end
-    it "handles Context objects" do
-      ctx = DecisionAgent::Context.new(context)
-      result = monitored_agent.decide(context: ctx)
-      expect(result).to be_a(DecisionAgent::Decision)
-      expect(collector.metrics_count[:decisions]).to eq(1)
-    end
-    it "handles hash contexts" do
-      result = monitored_agent.decide(context: context)
-      expect(result).to be_a(DecisionAgent::Decision)
-      expect(collector.metrics_count[:decisions]).to eq(1)
-    end
-    it "measures decision duration accurately" do
-      # Mock agent to introduce delay
-      allow(agent).to receive(:decide) do |context:, **_kwargs|
-        sleep 0.01 # 10ms delay
-        evaluation = evaluator.evaluate(context)
-        DecisionAgent::Decision.new(
-          decision: "approve",
-          confidence: 0.9,
-          explanations: ["Test"],
-          evaluations: [evaluation].compact, # Remove nils in case evaluation returns nil
-          audit_payload: {}
-        )
-      end
-      monitored_agent.decide(context: context)
-      stats = collector.statistics
-      expect(stats[:decisions][:avg_duration_ms]).to be >= 10
-    end
-  end
-  describe "method delegation" do
-    it "delegates methods to wrapped agent" do
-      expect(monitored_agent.evaluators).to eq(agent.evaluators)
-      expect(monitored_agent.scoring_strategy).to eq(agent.scoring_strategy)
-      expect(monitored_agent.audit_adapter).to eq(agent.audit_adapter)
-    end
-    it "responds to agent methods" do
-      expect(monitored_agent).to respond_to(:evaluators)
-      expect(monitored_agent).to respond_to(:scoring_strategy)
-      expect(monitored_agent).to respond_to(:audit_adapter)
-    end
-  end
-  describe "thread safety" do
-    it "handles concurrent decisions safely" do
-      # Materialize let variables before creating threads
-      test_context = { amount: 1000 }
-      test_monitored_agent = monitored_agent
-      test_collector = collector
-      threads = 10.times.map do
-        Thread.new do
-          10.times do
-            test_monitored_agent.decide(context: test_context)
-          end
-        end
-      end
-      threads.each(&:join)
-      expect(test_collector.metrics_count[:decisions]).to eq(100)
-      expect(test_collector.metrics_count[:evaluations]).to eq(100)
-      expect(test_collector.metrics_count[:performance]).to eq(100)
-    end
-  end
-  describe "integration test" do
-    it "provides comprehensive metrics for multiple decisions" do
-      contexts = [
-        { amount: 500 },
-        { amount: 1500 },
-        { amount: 2000 }
-      ]
-      contexts.each do |ctx|
-        monitored_agent.decide(context: ctx)
-      end
-      stats = collector.statistics
-      # Summary
-      expect(stats[:summary][:total_decisions]).to eq(3)
-      expect(stats[:summary][:total_evaluations]).to eq(3)
-      expect(stats[:summary][:total_errors]).to eq(0)
-      # Decision stats
-      expect(stats[:decisions][:total]).to eq(3)
-      expect(stats[:decisions][:avg_confidence]).to be > 0
-      expect(stats[:decisions][:decision_distribution]["approve"]).to eq(3)
-      # Performance stats
-      expect(stats[:performance][:total_operations]).to eq(3)
-      expect(stats[:performance][:success_rate]).to eq(1.0)
-      expect(stats[:performance][:avg_duration_ms]).to be > 0
-    end
-  end
-end

data/spec/monitoring/prometheus_exporter_spec.rb DELETED Viewed

@@ -1,242 +0,0 @@
-require "spec_helper"
-require "decision_agent/monitoring/metrics_collector"
-require "decision_agent/monitoring/prometheus_exporter"
-RSpec.describe DecisionAgent::Monitoring::PrometheusExporter do
-  let(:collector) { DecisionAgent::Monitoring::MetricsCollector.new(storage: :memory) }
-  let(:exporter) { described_class.new(metrics_collector: collector, namespace: "test") }
-  let(:decision) do
-    double(
-      "Decision",
-      decision: "approve",
-      confidence: 0.85,
-      evaluations: [double("Evaluation", evaluator_name: "test_evaluator")]
-    )
-  end
-  let(:context) { double("Context", to_h: { user: "test" }) }
-  describe "#initialize" do
-    it "initializes with metrics collector" do
-      expect(exporter).to be_a(described_class)
-    end
-    it "uses default namespace" do
-      exporter = described_class.new(metrics_collector: collector)
-      output = exporter.export
-      expect(output).to include("decision_agent_")
-    end
-    it "uses custom namespace" do
-      output = exporter.export
-      expect(output).to include("test_")
-    end
-  end
-  describe "#export" do
-    before do
-      # Record some metrics
-      3.times { collector.record_decision(decision, context, duration_ms: 10.0) }
-      collector.record_performance(operation: "decide", duration_ms: 15.0, success: true)
-      collector.record_error(StandardError.new("Test error"))
-    end
-    it "exports in Prometheus text format" do
-      output = exporter.export
-      expect(output).to be_a(String)
-      expect(output).to include("# DecisionAgent Metrics Export")
-    end
-    it "includes decision metrics" do
-      output = exporter.export
-      expect(output).to include("# HELP test_decisions_total")
-      expect(output).to include("# TYPE test_decisions_total counter")
-      expect(output).to include("test_decisions_total 3")
-    end
-    it "includes confidence metrics" do
-      output = exporter.export
-      expect(output).to include("# HELP test_decision_confidence_avg")
-      expect(output).to include("# TYPE test_decision_confidence_avg gauge")
-      expect(output).to include("test_decision_confidence_avg 0.85")
-    end
-    it "includes performance metrics" do
-      output = exporter.export
-      expect(output).to include("# HELP test_success_rate")
-      expect(output).to include("# TYPE test_success_rate gauge")
-    end
-    it "includes error metrics" do
-      output = exporter.export
-      expect(output).to include("# HELP test_errors_total")
-      expect(output).to include("# TYPE test_errors_total counter")
-      expect(output).to include("test_errors_total 1")
-    end
-    it "includes system info" do
-      output = exporter.export
-      expect(output).to include("# HELP test_info")
-      expect(output).to include("# TYPE test_info gauge")
-      expect(output).to include("version=\"#{DecisionAgent::VERSION}\"")
-    end
-    it "includes decision distribution" do
-      output = exporter.export
-      expect(output).to include("# HELP test_decisions_by_type")
-      expect(output).to include("test_decisions_by_type{decision=\"approve\"} 3")
-    end
-    it "includes error distribution by type" do
-      output = exporter.export
-      expect(output).to include("# HELP test_errors_by_type")
-      expect(output).to include("test_errors_by_type{error=\"StandardError\"} 1")
-    end
-    it "includes metrics count" do
-      output = exporter.export
-      expect(output).to include("# HELP test_metrics_stored")
-      expect(output).to include("test_metrics_stored{type=\"decisions\"} 3")
-      expect(output).to include("test_metrics_stored{type=\"errors\"} 1")
-    end
-  end
-  describe "#register_kpi" do
-    it "registers a custom KPI" do
-      exporter.register_kpi(
-        name: "custom_metric",
-        value: 42.5,
-        help: "A custom metric"
-      )
-      output = exporter.export
-      expect(output).to include("# HELP test_custom_metric A custom metric")
-      expect(output).to include("# TYPE test_custom_metric gauge")
-      expect(output).to include("test_custom_metric 42.5")
-    end
-    it "registers KPI with labels" do
-      exporter.register_kpi(
-        name: "requests",
-        value: 100,
-        labels: { endpoint: "/api/v1", method: "GET" }
-      )
-      output = exporter.export
-      expect(output).to include("test_requests{endpoint=\"/api/v1\",method=\"GET\"} 100")
-    end
-    it "sanitizes metric names" do
-      exporter.register_kpi(name: "my-custom.metric!", value: 10)
-      output = exporter.export
-      expect(output).to include("test_my_custom_metric_")
-    end
-    it "escapes label values" do
-      exporter.register_kpi(
-        name: "metric",
-        value: 1,
-        labels: { message: 'Contains "quotes"' }
-      )
-      output = exporter.export
-      expect(output).to include('message="Contains \"quotes\""')
-    end
-  end
-  describe "#metrics_hash" do
-    before do
-      collector.record_decision(decision, context, duration_ms: 10.0)
-    end
-    it "returns metrics as hash" do
-      metrics = exporter.metrics_hash
-      expect(metrics).to be_a(Hash)
-      expect(metrics).to have_key(:decisions)
-      expect(metrics).to have_key(:performance)
-      expect(metrics).to have_key(:errors)
-      expect(metrics).to have_key(:system)
-    end
-    it "includes metric types" do
-      metrics = exporter.metrics_hash
-      expect(metrics[:decisions][:total][:type]).to eq("counter")
-      expect(metrics[:decisions][:avg_confidence][:type]).to eq("gauge")
-    end
-    it "includes metric values" do
-      metrics = exporter.metrics_hash
-      expect(metrics[:decisions][:total][:value]).to eq(1)
-      expect(metrics[:decisions][:avg_confidence][:value]).to eq(0.85)
-    end
-  end
-  describe "thread safety" do
-    it "handles concurrent KPI registration" do
-      threads = 10.times.map do |i|
-        Thread.new do
-          10.times do |j|
-            exporter.register_kpi(
-              name: "metric_#{i}_#{j}",
-              value: (i * 10) + j
-            )
-          end
-        end
-      end
-      expect { threads.each(&:join) }.not_to raise_error
-    end
-    it "handles concurrent exports" do
-      threads = 5.times.map do
-        Thread.new do
-          10.times { exporter.export }
-        end
-      end
-      expect { threads.each(&:join) }.not_to raise_error
-    end
-  end
-  describe "performance metrics export" do
-    before do
-      5.times do |i|
-        collector.record_performance(
-          operation: "decide",
-          duration_ms: (i + 1) * 10.0,
-          success: true
-        )
-      end
-    end
-    it "exports summary metrics" do
-      output = exporter.export
-      expect(output).to include("# TYPE test_operation_duration_ms summary")
-      expect(output).to include("test_operation_duration_ms{quantile=\"0.5\"}")
-      expect(output).to include("test_operation_duration_ms{quantile=\"0.95\"}")
-      expect(output).to include("test_operation_duration_ms{quantile=\"0.99\"}")
-      expect(output).to include("test_operation_duration_ms_sum")
-      expect(output).to include("test_operation_duration_ms_count")
-    end
-  end
-  describe "content type" do
-    it "defines Prometheus content type" do
-      expect(described_class::CONTENT_TYPE).to eq("text/plain; version=0.0.4")
-    end
-  end
-end