RubyGems - decision_agent - Versions diffs - 0.2.0 → 1.0.1 - Mend

decision_agent 0.2.0 → 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (126) hide show

checksums.yaml +4 -4
data/README.md +313 -8
data/bin/decision_agent +104 -0
data/lib/decision_agent/agent.rb +72 -1
data/lib/decision_agent/context.rb +1 -0
data/lib/decision_agent/data_enrichment/cache/memory_adapter.rb +86 -0
data/lib/decision_agent/data_enrichment/cache_adapter.rb +49 -0
data/lib/decision_agent/data_enrichment/circuit_breaker.rb +135 -0
data/lib/decision_agent/data_enrichment/client.rb +220 -0
data/lib/decision_agent/data_enrichment/config.rb +78 -0
data/lib/decision_agent/data_enrichment/errors.rb +36 -0
data/lib/decision_agent/decision.rb +102 -2
data/lib/decision_agent/dmn/adapter.rb +135 -0
data/lib/decision_agent/dmn/cache.rb +306 -0
data/lib/decision_agent/dmn/decision_graph.rb +327 -0
data/lib/decision_agent/dmn/decision_tree.rb +192 -0
data/lib/decision_agent/dmn/errors.rb +30 -0
data/lib/decision_agent/dmn/exporter.rb +217 -0
data/lib/decision_agent/dmn/feel/evaluator.rb +819 -0
data/lib/decision_agent/dmn/feel/functions.rb +420 -0
data/lib/decision_agent/dmn/feel/parser.rb +349 -0
data/lib/decision_agent/dmn/feel/simple_parser.rb +276 -0
data/lib/decision_agent/dmn/feel/transformer.rb +372 -0
data/lib/decision_agent/dmn/feel/types.rb +276 -0
data/lib/decision_agent/dmn/importer.rb +77 -0
data/lib/decision_agent/dmn/model.rb +197 -0
data/lib/decision_agent/dmn/parser.rb +191 -0
data/lib/decision_agent/dmn/testing.rb +333 -0
data/lib/decision_agent/dmn/validator.rb +315 -0
data/lib/decision_agent/dmn/versioning.rb +229 -0
data/lib/decision_agent/dmn/visualizer.rb +513 -0
data/lib/decision_agent/dsl/condition_evaluator.rb +984 -838
data/lib/decision_agent/dsl/schema_validator.rb +53 -14
data/lib/decision_agent/evaluators/dmn_evaluator.rb +308 -0
data/lib/decision_agent/evaluators/json_rule_evaluator.rb +69 -9
data/lib/decision_agent/explainability/condition_trace.rb +83 -0
data/lib/decision_agent/explainability/explainability_result.rb +52 -0
data/lib/decision_agent/explainability/rule_trace.rb +39 -0
data/lib/decision_agent/explainability/trace_collector.rb +24 -0
data/lib/decision_agent/monitoring/alert_manager.rb +5 -1
data/lib/decision_agent/simulation/errors.rb +18 -0
data/lib/decision_agent/simulation/impact_analyzer.rb +498 -0
data/lib/decision_agent/simulation/monte_carlo_simulator.rb +635 -0
data/lib/decision_agent/simulation/replay_engine.rb +486 -0
data/lib/decision_agent/simulation/scenario_engine.rb +318 -0
data/lib/decision_agent/simulation/scenario_library.rb +163 -0
data/lib/decision_agent/simulation/shadow_test_engine.rb +287 -0
data/lib/decision_agent/simulation/what_if_analyzer.rb +1002 -0
data/lib/decision_agent/simulation.rb +17 -0
data/lib/decision_agent/version.rb +1 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +23 -8
data/lib/decision_agent/web/dmn_editor.rb +426 -0
data/lib/decision_agent/web/public/app.js +119 -0
data/lib/decision_agent/web/public/dmn-editor.css +596 -0
data/lib/decision_agent/web/public/dmn-editor.html +250 -0
data/lib/decision_agent/web/public/dmn-editor.js +553 -0
data/lib/decision_agent/web/public/index.html +52 -0
data/lib/decision_agent/web/public/simulation.html +130 -0
data/lib/decision_agent/web/public/simulation_impact.html +478 -0
data/lib/decision_agent/web/public/simulation_replay.html +551 -0
data/lib/decision_agent/web/public/simulation_shadow.html +546 -0
data/lib/decision_agent/web/public/simulation_whatif.html +532 -0
data/lib/decision_agent/web/public/styles.css +86 -0
data/lib/decision_agent/web/server.rb +1059 -23
data/lib/decision_agent.rb +60 -2
metadata +105 -61
data/spec/ab_testing/ab_test_assignment_spec.rb +0 -253
data/spec/ab_testing/ab_test_manager_spec.rb +0 -612
data/spec/ab_testing/ab_test_spec.rb +0 -270
data/spec/ab_testing/ab_testing_agent_spec.rb +0 -481
data/spec/ab_testing/storage/adapter_spec.rb +0 -64
data/spec/ab_testing/storage/memory_adapter_spec.rb +0 -485
data/spec/activerecord_thread_safety_spec.rb +0 -553
data/spec/advanced_operators_spec.rb +0 -3150
data/spec/agent_spec.rb +0 -289
data/spec/api_contract_spec.rb +0 -430
data/spec/audit_adapters_spec.rb +0 -92
data/spec/auth/access_audit_logger_spec.rb +0 -394
data/spec/auth/authenticator_spec.rb +0 -112
data/spec/auth/password_reset_spec.rb +0 -294
data/spec/auth/permission_checker_spec.rb +0 -207
data/spec/auth/permission_spec.rb +0 -73
data/spec/auth/rbac_adapter_spec.rb +0 -550
data/spec/auth/rbac_config_spec.rb +0 -82
data/spec/auth/role_spec.rb +0 -51
data/spec/auth/session_manager_spec.rb +0 -172
data/spec/auth/session_spec.rb +0 -112
data/spec/auth/user_spec.rb +0 -130
data/spec/comprehensive_edge_cases_spec.rb +0 -1777
data/spec/context_spec.rb +0 -127
data/spec/decision_agent_spec.rb +0 -96
data/spec/decision_spec.rb +0 -423
data/spec/dsl/condition_evaluator_spec.rb +0 -774
data/spec/dsl_validation_spec.rb +0 -648
data/spec/edge_cases_spec.rb +0 -353
data/spec/evaluation_spec.rb +0 -364
data/spec/evaluation_validator_spec.rb +0 -165
data/spec/examples/feedback_aware_evaluator_spec.rb +0 -460
data/spec/examples.txt +0 -1633
data/spec/issue_verification_spec.rb +0 -759
data/spec/json_rule_evaluator_spec.rb +0 -587
data/spec/monitoring/alert_manager_spec.rb +0 -378
data/spec/monitoring/metrics_collector_spec.rb +0 -499
data/spec/monitoring/monitored_agent_spec.rb +0 -222
data/spec/monitoring/prometheus_exporter_spec.rb +0 -242
data/spec/monitoring/storage/activerecord_adapter_spec.rb +0 -498
data/spec/monitoring/storage/base_adapter_spec.rb +0 -61
data/spec/monitoring/storage/memory_adapter_spec.rb +0 -247
data/spec/performance_optimizations_spec.rb +0 -486
data/spec/replay_edge_cases_spec.rb +0 -699
data/spec/replay_spec.rb +0 -210
data/spec/rfc8785_canonicalization_spec.rb +0 -215
data/spec/scoring_spec.rb +0 -225
data/spec/spec_helper.rb +0 -60
data/spec/testing/batch_test_importer_spec.rb +0 -693
data/spec/testing/batch_test_runner_spec.rb +0 -307
data/spec/testing/test_coverage_analyzer_spec.rb +0 -292
data/spec/testing/test_result_comparator_spec.rb +0 -392
data/spec/testing/test_scenario_spec.rb +0 -113
data/spec/thread_safety_spec.rb +0 -482
data/spec/thread_safety_spec.rb.broken +0 -878
data/spec/versioning/adapter_spec.rb +0 -156
data/spec/versioning_spec.rb +0 -1030
data/spec/web/middleware/auth_middleware_spec.rb +0 -133
data/spec/web/middleware/permission_middleware_spec.rb +0 -247
data/spec/web_ui_rack_spec.rb +0 -1840

data/spec/evaluation_validator_spec.rb DELETED Viewed

@@ -1,165 +0,0 @@
-require "spec_helper"
-RSpec.describe DecisionAgent::EvaluationValidator do
-  let(:valid_evaluation) do
-    DecisionAgent::Evaluation.new(
-      decision: "approve",
-      weight: 0.8,
-      reason: "Valid reason",
-      evaluator_name: "TestEvaluator"
-    )
-  end
-  describe ".validate!" do
-    it "validates a valid evaluation" do
-      expect do
-        described_class.validate!(valid_evaluation)
-      end.not_to raise_error
-    end
-    it "raises error for nil evaluation" do
-      expect do
-        described_class.validate!(nil)
-      end.to raise_error(described_class::ValidationError, /cannot be nil/)
-    end
-    it "raises error for non-Evaluation object" do
-      expect do
-        described_class.validate!("not an evaluation")
-      end.to raise_error(described_class::ValidationError, /must be an Evaluation instance/)
-    end
-    it "validates multiple valid evaluations" do
-      eval1 = DecisionAgent::Evaluation.new(
-        decision: "approve",
-        weight: 0.8,
-        reason: "Reason 1",
-        evaluator_name: "Eval1"
-      )
-      eval2 = DecisionAgent::Evaluation.new(
-        decision: "reject",
-        weight: 0.9,
-        reason: "Reason 2",
-        evaluator_name: "Eval2"
-      )
-      expect do
-        described_class.validate!(eval1)
-        described_class.validate!(eval2)
-      end.not_to raise_error
-    end
-  end
-  describe ".validate_all!" do
-    it "validates an array of valid evaluations" do
-      evaluations = [
-        valid_evaluation,
-        DecisionAgent::Evaluation.new(
-          decision: "reject",
-          weight: 0.9,
-          reason: "Another reason",
-          evaluator_name: "OtherEvaluator"
-        )
-      ]
-      expect do
-        described_class.validate_all!(evaluations)
-      end.not_to raise_error
-    end
-    it "raises error for non-array input" do
-      expect do
-        described_class.validate_all!("not an array")
-      end.to raise_error(described_class::ValidationError, /must be an Array/)
-    end
-    it "raises error for empty array" do
-      expect do
-        described_class.validate_all!([])
-      end.to raise_error(described_class::ValidationError, /cannot be empty/)
-    end
-    it "validates all evaluations in array" do
-      eval1 = DecisionAgent::Evaluation.new(
-        decision: "approve",
-        weight: 0.8,
-        reason: "Reason 1",
-        evaluator_name: "Eval1"
-      )
-      eval2 = DecisionAgent::Evaluation.new(
-        decision: "reject",
-        weight: 0.9,
-        reason: "Reason 2",
-        evaluator_name: "Eval2"
-      )
-      expect do
-        described_class.validate_all!([eval1, eval2])
-      end.not_to raise_error
-    end
-    it "includes index in error message for invalid evaluation" do
-      evaluations = [
-        valid_evaluation,
-        nil # Invalid evaluation
-      ]
-      expect do
-        described_class.validate_all!(evaluations)
-      end.to raise_error(described_class::ValidationError, /index 1/)
-    end
-  end
-  describe "optimized frozen validation" do
-    it "uses fast path for frozen evaluations" do
-      # Evaluations are always frozen in their initializer
-      evaluation = DecisionAgent::Evaluation.new(
-        decision: "approve",
-        weight: 0.8,
-        reason: "Test reason",
-        evaluator_name: "TestEvaluator"
-      )
-      expect(evaluation).to be_frozen
-      expect do
-        described_class.validate!(evaluation)
-      end.not_to raise_error
-    end
-    it "skips nested frozen checks when evaluation is frozen" do
-      # Since evaluations are always frozen in initializer,
-      # the optimized validator should skip checking nested structures
-      evaluation = DecisionAgent::Evaluation.new(
-        decision: "approve",
-        weight: 0.8,
-        reason: "Test reason",
-        evaluator_name: "TestEvaluator",
-        metadata: { nested: { data: "value" } }
-      )
-      expect(evaluation).to be_frozen
-      expect(evaluation.metadata).to be_frozen
-      expect do
-        described_class.validate!(evaluation)
-      end.not_to raise_error
-    end
-    it "still validates unfrozen evaluations" do
-      # Create a mock object that isn't frozen (simulating an edge case)
-      # In practice, evaluations are always frozen in their initializer
-      unfrozen_evaluation = double("UnfrozenEvaluation")
-      allow(unfrozen_evaluation).to receive(:frozen?).and_return(false)
-      allow(unfrozen_evaluation).to receive(:is_a?).with(DecisionAgent::Evaluation).and_return(true)
-      allow(unfrozen_evaluation).to receive(:decision).and_return("approve")
-      allow(unfrozen_evaluation).to receive(:weight).and_return(0.8)
-      allow(unfrozen_evaluation).to receive(:reason).and_return("Test reason")
-      allow(unfrozen_evaluation).to receive(:evaluator_name).and_return("TestEvaluator")
-      expect do
-        described_class.validate!(unfrozen_evaluation)
-      end.to raise_error(described_class::ValidationError, /must be frozen/)
-    end
-  end
-end

data/spec/examples/feedback_aware_evaluator_spec.rb DELETED Viewed

@@ -1,460 +0,0 @@
-# frozen_string_literal: true
-require "spec_helper"
-require_relative "../../examples/feedback_aware_evaluator"
-RSpec.describe Examples::FeedbackAwareEvaluator do
-  describe "initialization" do
-    it "creates an evaluator with base decision and weight" do
-      evaluator = described_class.new(base_decision: "approve", base_weight: 0.8)
-      expect(evaluator).to be_a(DecisionAgent::Evaluators::Base)
-    end
-    it "uses default weight of 0.5 when not specified" do
-      evaluator = described_class.new(base_decision: "approve")
-      context = DecisionAgent::Context.new({})
-      result = evaluator.evaluate(context, feedback: {})
-      expect(result.weight).to eq(0.5)
-    end
-  end
-  describe "#evaluate with no feedback" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({ user: "alice" }) }
-    it "returns base decision with base weight" do
-      result = evaluator.evaluate(context, feedback: {})
-      expect(result.decision).to eq("approve")
-      expect(result.weight).to eq(0.8)
-      expect(result.reason).to include("Base decision")
-    end
-    it "includes metadata about feedback presence" do
-      result = evaluator.evaluate(context, feedback: {})
-      expect(result.metadata[:base_weight]).to eq(0.8)
-      expect(result.metadata[:feedback_present]).to be false
-      expect(result.metadata[:feedback_keys]).to eq([])
-    end
-    it "tracks feedback keys when feedback is provided" do
-      result = evaluator.evaluate(context, feedback: { custom_key: "value" })
-      expect(result.metadata[:feedback_present]).to be true
-      expect(result.metadata[:feedback_keys]).to include(:custom_key)
-    end
-  end
-  describe "#evaluate with override feedback" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({ user: "bob" }) }
-    it "overrides the base decision" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "reject" }
-      )
-      expect(result.decision).to eq("reject")
-      expect(result.decision).not_to eq("approve")
-    end
-    it "uses high confidence weight for manual override" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "reject" }
-      )
-      expect(result.weight).to eq(0.9)
-    end
-    it "uses provided reason from feedback" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "reject", reason: "Fraud detected" }
-      )
-      expect(result.reason).to eq("Fraud detected")
-    end
-    it "uses default reason when none provided" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "reject" }
-      )
-      expect(result.reason).to eq("Manual override from feedback")
-    end
-    it "includes override metadata" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "manual_review", reason: "Complex case" }
-      )
-      expect(result.metadata[:feedback_override]).to be true
-      expect(result.metadata[:original_decision]).to eq("approve")
-      expect(result.metadata[:override_timestamp]).to be_a(String)
-    end
-    it "takes precedence over other feedback types" do
-      result = evaluator.evaluate(
-        context,
-        feedback: {
-          override: "escalate",
-          past_accuracy: 0.95,
-          source: "expert_review"
-        }
-      )
-      # Override should take precedence
-      expect(result.decision).to eq("escalate")
-      expect(result.weight).to eq(0.9)
-    end
-  end
-  describe "#evaluate with past_accuracy feedback" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({ user: "charlie" }) }
-    it "adjusts weight based on past accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.5 }
-      )
-      # 0.8 * 0.5 = 0.4
-      expect(result.weight).to eq(0.4)
-      expect(result.decision).to eq("approve")
-    end
-    it "boosts weight with high accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 1.0 }
-      )
-      # 0.8 * 1.0 = 0.8
-      expect(result.weight).to eq(0.8)
-    end
-    it "reduces weight with low accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.25 }
-      )
-      # 0.8 * 0.25 = 0.2
-      expect(result.weight).to eq(0.2)
-    end
-    it "clamps weight to minimum 0.0" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: -1.0 } # Invalid, but should be handled
-      )
-      expect(result.weight).to be >= 0.0
-    end
-    it "clamps weight to maximum 1.0" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 2.0 } # Would produce 1.6, should clamp to 1.0
-      )
-      expect(result.weight).to be <= 1.0
-    end
-    it "includes adjustment metadata" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.95 }
-      )
-      expect(result.metadata[:base_weight]).to eq(0.8)
-      expect(result.metadata[:adjusted_weight]).to eq(0.76)
-      expect(result.metadata[:past_accuracy]).to eq(0.95)
-      expect(result.metadata[:adjustment_factor]).to eq(0.95)
-    end
-    it "provides descriptive reason with accuracy percentage" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.95 }
-      )
-      expect(result.reason).to include("95%")
-      expect(result.reason).to include("past accuracy")
-    end
-  end
-  describe "#evaluate with source feedback" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({ user: "dave" }) }
-    it "reduces weight for user_override source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "user_override" }
-      )
-      # 0.8 * 0.5 = 0.4
-      expect(result.weight).to eq(0.4)
-      expect(result.metadata[:multiplier]).to eq(0.5)
-    end
-    it "maintains weight for automated_test source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "automated_test" }
-      )
-      # 0.8 * 1.0 = 0.8
-      expect(result.weight).to eq(0.8)
-      expect(result.metadata[:multiplier]).to eq(1.0)
-    end
-    it "boosts weight for peer_review source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "peer_review" }
-      )
-      # 0.8 * 1.1 = 0.88
-      expect(result.weight).to be_within(0.0001).of(0.88)
-      expect(result.metadata[:multiplier]).to eq(1.1)
-    end
-    it "boosts weight significantly for expert_review source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "expert_review" }
-      )
-      # 0.8 * 1.2 = 0.96
-      expect(result.weight).to eq(0.96)
-      expect(result.metadata[:multiplier]).to eq(1.2)
-    end
-    it "uses default multiplier for unknown source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "unknown_source" }
-      )
-      # 0.8 * 1.0 = 0.8 (default multiplier)
-      expect(result.weight).to eq(0.8)
-      expect(result.metadata[:multiplier]).to eq(1.0)
-    end
-    it "clamps boosted weight to 1.0" do
-      high_weight_evaluator = described_class.new(base_decision: "approve", base_weight: 0.9)
-      result = high_weight_evaluator.evaluate(
-        context,
-        feedback: { source: "expert_review" } # 0.9 * 1.2 = 1.08, should clamp to 1.0
-      )
-      expect(result.weight).to eq(1.0)
-    end
-    it "includes source metadata" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "peer_review" }
-      )
-      expect(result.metadata[:feedback_source]).to eq("peer_review")
-      expect(result.metadata[:base_weight]).to eq(0.8)
-      expect(result.metadata[:adjusted_weight]).to be_within(0.0001).of(0.88)
-    end
-    it "provides descriptive reason with source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { source: "expert_review" }
-      )
-      expect(result.reason).to include("expert_review")
-      expect(result.reason).to include("feedback source")
-    end
-  end
-  describe "feedback priority" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({}) }
-    it "override takes precedence over past_accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "reject", past_accuracy: 0.95 }
-      )
-      expect(result.decision).to eq("reject")
-      expect(result.weight).to eq(0.9)  # Override weight, not adjusted weight
-    end
-    it "override takes precedence over source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "escalate", source: "expert_review" }
-      )
-      expect(result.decision).to eq("escalate")
-      expect(result.weight).to eq(0.9)  # Override weight, not source-adjusted weight
-    end
-    it "past_accuracy takes precedence over source" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.5, source: "expert_review" }
-      )
-      # Should use past_accuracy adjustment (0.8 * 0.5 = 0.4)
-      # Not source adjustment (0.8 * 1.2 = 0.96)
-      expect(result.weight).to eq(0.4)
-      expect(result.metadata[:past_accuracy]).to eq(0.5)
-    end
-  end
-  describe "integration with DecisionAgent::Agent" do
-    it "works as an evaluator in a full decision agent" do
-      evaluator = described_class.new(base_decision: "approve", base_weight: 0.8)
-      agent = DecisionAgent::Agent.new(evaluators: [evaluator])
-      result = agent.decide(
-        context: { user_id: 123 },
-        feedback: {}
-      )
-      expect(result.decision).to eq("approve")
-      expect(result.confidence).to eq(1.0) # Single evaluator normalized to 1.0
-    end
-    it "respects feedback in agent context" do
-      evaluator = described_class.new(base_decision: "approve", base_weight: 0.8)
-      agent = DecisionAgent::Agent.new(evaluators: [evaluator])
-      result = agent.decide(
-        context: { user_id: 456 },
-        feedback: { override: "manual_review", reason: "Sensitive action" }
-      )
-      expect(result.decision).to eq("manual_review")
-      expect(result.evaluations.first.reason).to eq("Sensitive action")
-    end
-    it "combines with other evaluators" do
-      feedback_eval = described_class.new(base_decision: "approve", base_weight: 0.8)
-      static_eval = DecisionAgent::Evaluators::StaticEvaluator.new(
-        decision: "approve",
-        weight: 0.6
-      )
-      agent = DecisionAgent::Agent.new(evaluators: [feedback_eval, static_eval])
-      result = agent.decide(
-        context: {},
-        feedback: { past_accuracy: 0.5 } # Reduces feedback_eval weight to 0.4
-      )
-      expect(result.decision).to eq("approve")
-      expect(result.evaluations.size).to eq(2)
-      # Confidence = (0.4 + 0.6) / (0.4 + 0.6) = 1.0 (both agree)
-      expect(result.confidence).to eq(1.0)
-    end
-    it "feedback affects only feedback-aware evaluators" do
-      feedback_eval = described_class.new(base_decision: "approve", base_weight: 0.8)
-      static_eval = DecisionAgent::Evaluators::StaticEvaluator.new(
-        decision: "reject",
-        weight: 0.9
-      )
-      agent = DecisionAgent::Agent.new(
-        evaluators: [feedback_eval, static_eval],
-        scoring_strategy: DecisionAgent::Scoring::MaxWeight.new
-      )
-      result_no_feedback = agent.decide(context: {}, feedback: {})
-      # MaxWeight picks static_eval (0.9 > 0.8)
-      expect(result_no_feedback.decision).to eq("reject")
-      result_with_feedback = agent.decide(
-        context: {},
-        feedback: { past_accuracy: 0.5 } # Reduces feedback_eval to 0.4
-      )
-      # MaxWeight still picks static_eval (0.9 > 0.4)
-      expect(result_with_feedback.decision).to eq("reject")
-    end
-  end
-  describe "edge cases" do
-    let(:evaluator) { described_class.new(base_decision: "approve", base_weight: 0.8) }
-    let(:context) { DecisionAgent::Context.new({}) }
-    it "handles feedback with string keys" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { "override" => "reject" } # String key instead of symbol
-      )
-      # Should not match because code expects symbols
-      # Falls back to base decision
-      expect(result.decision).to eq("approve")
-      expect(result.weight).to eq(0.8)
-    end
-    it "handles nil feedback gracefully" do
-      # Feedback defaults to {} in the signature, but test explicit nil handling
-      result = evaluator.evaluate(context, feedback: {})
-      expect(result.decision).to eq("approve")
-    end
-    it "handles empty override value" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { override: "" }
-      )
-      # Empty string is truthy in Ruby, so override applies
-      expect(result.decision).to eq("")
-      expect(result.metadata[:feedback_override]).to be true
-    end
-    it "handles zero past_accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 0.0 }
-      )
-      # 0.8 * 0.0 = 0.0
-      expect(result.weight).to eq(0.0)
-    end
-    it "handles very high past_accuracy" do
-      result = evaluator.evaluate(
-        context,
-        feedback: { past_accuracy: 10.0 }
-      )
-      # 0.8 * 10.0 = 8.0, clamped to 1.0
-      expect(result.weight).to eq(1.0)
-    end
-  end
-  describe "evaluator_name" do
-    it "returns the correct evaluator name" do
-      evaluator = described_class.new(base_decision: "approve", base_weight: 0.8)
-      context = DecisionAgent::Context.new({})
-      result = evaluator.evaluate(context, feedback: {})
-      # Base class extracts just the class name without module
-      expect(result.evaluator_name).to eq("FeedbackAwareEvaluator")
-    end
-  end
-end