RubyGems - decision_agent - Versions diffs - 0.3.0 → 1.1.0 - Mend

decision_agent 0.3.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (220) hide show

checksums.yaml +4 -4
data/README.md +234 -14
data/lib/decision_agent/ab_testing/ab_test.rb +5 -1
data/lib/decision_agent/ab_testing/ab_test_assignment.rb +2 -0
data/lib/decision_agent/ab_testing/ab_test_manager.rb +2 -0
data/lib/decision_agent/ab_testing/ab_testing_agent.rb +2 -0
data/lib/decision_agent/ab_testing/storage/activerecord_adapter.rb +2 -13
data/lib/decision_agent/ab_testing/storage/adapter.rb +2 -0
data/lib/decision_agent/ab_testing/storage/memory_adapter.rb +2 -0
data/lib/decision_agent/agent.rb +78 -9
data/lib/decision_agent/audit/adapter.rb +2 -0
data/lib/decision_agent/audit/logger_adapter.rb +2 -0
data/lib/decision_agent/audit/null_adapter.rb +2 -0
data/lib/decision_agent/auth/access_audit_logger.rb +2 -0
data/lib/decision_agent/auth/authenticator.rb +2 -0
data/lib/decision_agent/auth/password_reset_manager.rb +2 -0
data/lib/decision_agent/auth/password_reset_token.rb +2 -0
data/lib/decision_agent/auth/permission.rb +2 -0
data/lib/decision_agent/auth/permission_checker.rb +2 -0
data/lib/decision_agent/auth/rbac_adapter.rb +2 -0
data/lib/decision_agent/auth/rbac_config.rb +2 -0
data/lib/decision_agent/auth/role.rb +2 -0
data/lib/decision_agent/auth/session.rb +2 -0
data/lib/decision_agent/auth/session_manager.rb +2 -0
data/lib/decision_agent/auth/user.rb +2 -0
data/lib/decision_agent/context.rb +14 -0
data/lib/decision_agent/decision.rb +113 -4
data/lib/decision_agent/dmn/adapter.rb +2 -0
data/lib/decision_agent/dmn/cache.rb +2 -2
data/lib/decision_agent/dmn/decision_graph.rb +7 -7
data/lib/decision_agent/dmn/decision_tree.rb +16 -8
data/lib/decision_agent/dmn/errors.rb +2 -0
data/lib/decision_agent/dmn/exporter.rb +2 -0
data/lib/decision_agent/dmn/feel/evaluator.rb +130 -114
data/lib/decision_agent/dmn/feel/functions.rb +2 -0
data/lib/decision_agent/dmn/feel/parser.rb +2 -0
data/lib/decision_agent/dmn/feel/simple_parser.rb +98 -77
data/lib/decision_agent/dmn/feel/transformer.rb +56 -102
data/lib/decision_agent/dmn/feel/types.rb +2 -0
data/lib/decision_agent/dmn/importer.rb +2 -0
data/lib/decision_agent/dmn/model.rb +2 -4
data/lib/decision_agent/dmn/parser.rb +2 -0
data/lib/decision_agent/dmn/testing.rb +3 -2
data/lib/decision_agent/dmn/validator.rb +5 -3
data/lib/decision_agent/dmn/visualizer.rb +7 -6
data/lib/decision_agent/dsl/condition_evaluator.rb +242 -1375
data/lib/decision_agent/dsl/helpers/cache_helpers.rb +82 -0
data/lib/decision_agent/dsl/helpers/comparison_helpers.rb +98 -0
data/lib/decision_agent/dsl/helpers/date_helpers.rb +91 -0
data/lib/decision_agent/dsl/helpers/geospatial_helpers.rb +85 -0
data/lib/decision_agent/dsl/helpers/operator_evaluation_helpers.rb +160 -0
data/lib/decision_agent/dsl/helpers/parameter_parsing_helpers.rb +206 -0
data/lib/decision_agent/dsl/helpers/template_helpers.rb +39 -0
data/lib/decision_agent/dsl/helpers/utility_helpers.rb +45 -0
data/lib/decision_agent/dsl/operators/base.rb +70 -0
data/lib/decision_agent/dsl/operators/basic_comparison_operators.rb +80 -0
data/lib/decision_agent/dsl/operators/collection_operators.rb +60 -0
data/lib/decision_agent/dsl/operators/date_arithmetic_operators.rb +206 -0
data/lib/decision_agent/dsl/operators/date_time_operators.rb +47 -0
data/lib/decision_agent/dsl/operators/duration_operators.rb +149 -0
data/lib/decision_agent/dsl/operators/financial_operators.rb +237 -0
data/lib/decision_agent/dsl/operators/geospatial_operators.rb +106 -0
data/lib/decision_agent/dsl/operators/mathematical_operators.rb +234 -0
data/lib/decision_agent/dsl/operators/moving_window_operators.rb +135 -0
data/lib/decision_agent/dsl/operators/numeric_operators.rb +120 -0
data/lib/decision_agent/dsl/operators/rate_operators.rb +65 -0
data/lib/decision_agent/dsl/operators/statistical_aggregations.rb +187 -0
data/lib/decision_agent/dsl/operators/string_aggregations.rb +84 -0
data/lib/decision_agent/dsl/operators/string_operators.rb +72 -0
data/lib/decision_agent/dsl/operators/time_component_operators.rb +72 -0
data/lib/decision_agent/dsl/rule_parser.rb +2 -0
data/lib/decision_agent/dsl/schema_validator.rb +37 -14
data/lib/decision_agent/errors.rb +2 -0
data/lib/decision_agent/evaluation.rb +14 -2
data/lib/decision_agent/evaluators/base.rb +2 -0
data/lib/decision_agent/evaluators/dmn_evaluator.rb +108 -19
data/lib/decision_agent/evaluators/json_rule_evaluator.rb +56 -11
data/lib/decision_agent/evaluators/static_evaluator.rb +2 -0
data/lib/decision_agent/explainability/condition_trace.rb +85 -0
data/lib/decision_agent/explainability/explainability_result.rb +50 -0
data/lib/decision_agent/explainability/rule_trace.rb +41 -0
data/lib/decision_agent/explainability/trace_collector.rb +26 -0
data/lib/decision_agent/monitoring/alert_manager.rb +7 -16
data/lib/decision_agent/monitoring/dashboard_server.rb +383 -250
data/lib/decision_agent/monitoring/metrics_collector.rb +2 -0
data/lib/decision_agent/monitoring/monitored_agent.rb +2 -0
data/lib/decision_agent/monitoring/prometheus_exporter.rb +3 -1
data/lib/decision_agent/replay/replay.rb +4 -1
data/lib/decision_agent/scoring/base.rb +2 -0
data/lib/decision_agent/scoring/consensus.rb +2 -0
data/lib/decision_agent/scoring/max_weight.rb +2 -0
data/lib/decision_agent/scoring/threshold.rb +2 -0
data/lib/decision_agent/scoring/weighted_average.rb +2 -0
data/lib/decision_agent/simulation/errors.rb +20 -0
data/lib/decision_agent/simulation/impact_analyzer.rb +500 -0
data/lib/decision_agent/simulation/monte_carlo_simulator.rb +638 -0
data/lib/decision_agent/simulation/replay_engine.rb +488 -0
data/lib/decision_agent/simulation/scenario_engine.rb +320 -0
data/lib/decision_agent/simulation/scenario_library.rb +165 -0
data/lib/decision_agent/simulation/shadow_test_engine.rb +274 -0
data/lib/decision_agent/simulation/what_if_analyzer.rb +1008 -0
data/lib/decision_agent/simulation.rb +19 -0
data/lib/decision_agent/testing/batch_test_importer.rb +6 -2
data/lib/decision_agent/testing/batch_test_runner.rb +5 -2
data/lib/decision_agent/testing/test_coverage_analyzer.rb +2 -0
data/lib/decision_agent/testing/test_result_comparator.rb +2 -0
data/lib/decision_agent/testing/test_scenario.rb +2 -0
data/lib/decision_agent/version.rb +3 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +108 -43
data/lib/decision_agent/versioning/adapter.rb +9 -0
data/lib/decision_agent/versioning/file_storage_adapter.rb +19 -6
data/lib/decision_agent/versioning/version_manager.rb +9 -0
data/lib/decision_agent/web/dmn_editor/serialization.rb +74 -0
data/lib/decision_agent/web/dmn_editor/xml_builder.rb +107 -0
data/lib/decision_agent/web/dmn_editor.rb +8 -67
data/lib/decision_agent/web/middleware/auth_middleware.rb +2 -0
data/lib/decision_agent/web/middleware/permission_middleware.rb +3 -1
data/lib/decision_agent/web/public/app.js +186 -26
data/lib/decision_agent/web/public/batch_testing.html +80 -6
data/lib/decision_agent/web/public/dmn-editor.html +2 -2
data/lib/decision_agent/web/public/dmn-editor.js +74 -8
data/lib/decision_agent/web/public/index.html +69 -3
data/lib/decision_agent/web/public/login.html +1 -1
data/lib/decision_agent/web/public/sample_batch.csv +11 -0
data/lib/decision_agent/web/public/sample_impact.csv +11 -0
data/lib/decision_agent/web/public/sample_replay.csv +11 -0
data/lib/decision_agent/web/public/sample_rules.json +118 -0
data/lib/decision_agent/web/public/sample_shadow.csv +11 -0
data/lib/decision_agent/web/public/sample_whatif.csv +11 -0
data/lib/decision_agent/web/public/simulation.html +146 -0
data/lib/decision_agent/web/public/simulation_impact.html +495 -0
data/lib/decision_agent/web/public/simulation_replay.html +547 -0
data/lib/decision_agent/web/public/simulation_shadow.html +561 -0
data/lib/decision_agent/web/public/simulation_whatif.html +549 -0
data/lib/decision_agent/web/public/styles.css +65 -0
data/lib/decision_agent/web/public/users.html +1 -1
data/lib/decision_agent/web/rack_helpers.rb +106 -0
data/lib/decision_agent/web/rack_request_helpers.rb +196 -0
data/lib/decision_agent/web/server.rb +2126 -1374
data/lib/decision_agent.rb +19 -1
data/lib/generators/decision_agent/install/install_generator.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_test_assignment_model.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_test_model.rb +2 -0
data/lib/generators/decision_agent/install/templates/ab_testing_migration.rb +2 -0
data/lib/generators/decision_agent/install/templates/migration.rb +2 -0
data/lib/generators/decision_agent/install/templates/rule.rb +2 -0
data/lib/generators/decision_agent/install/templates/rule_version.rb +2 -0
metadata +103 -89
data/spec/ab_testing/ab_test_assignment_spec.rb +0 -253
data/spec/ab_testing/ab_test_manager_spec.rb +0 -612
data/spec/ab_testing/ab_test_spec.rb +0 -270
data/spec/ab_testing/ab_testing_agent_spec.rb +0 -655
data/spec/ab_testing/storage/adapter_spec.rb +0 -64
data/spec/ab_testing/storage/memory_adapter_spec.rb +0 -485
data/spec/activerecord_thread_safety_spec.rb +0 -553
data/spec/advanced_operators_spec.rb +0 -3150
data/spec/agent_spec.rb +0 -289
data/spec/api_contract_spec.rb +0 -430
data/spec/audit_adapters_spec.rb +0 -92
data/spec/auth/access_audit_logger_spec.rb +0 -394
data/spec/auth/authenticator_spec.rb +0 -112
data/spec/auth/password_reset_spec.rb +0 -294
data/spec/auth/permission_checker_spec.rb +0 -207
data/spec/auth/permission_spec.rb +0 -73
data/spec/auth/rbac_adapter_spec.rb +0 -778
data/spec/auth/rbac_config_spec.rb +0 -82
data/spec/auth/role_spec.rb +0 -51
data/spec/auth/session_manager_spec.rb +0 -172
data/spec/auth/session_spec.rb +0 -112
data/spec/auth/user_spec.rb +0 -130
data/spec/comprehensive_edge_cases_spec.rb +0 -1777
data/spec/context_spec.rb +0 -127
data/spec/decision_agent_spec.rb +0 -96
data/spec/decision_spec.rb +0 -423
data/spec/dmn/decision_graph_spec.rb +0 -282
data/spec/dmn/decision_tree_spec.rb +0 -203
data/spec/dmn/feel/errors_spec.rb +0 -18
data/spec/dmn/feel/functions_spec.rb +0 -400
data/spec/dmn/feel/simple_parser_spec.rb +0 -274
data/spec/dmn/feel/types_spec.rb +0 -176
data/spec/dmn/feel_parser_spec.rb +0 -489
data/spec/dmn/hit_policy_spec.rb +0 -202
data/spec/dmn/integration_spec.rb +0 -226
data/spec/dsl/condition_evaluator_spec.rb +0 -774
data/spec/dsl_validation_spec.rb +0 -648
data/spec/edge_cases_spec.rb +0 -353
data/spec/evaluation_spec.rb +0 -364
data/spec/evaluation_validator_spec.rb +0 -165
data/spec/examples/feedback_aware_evaluator_spec.rb +0 -460
data/spec/examples.txt +0 -1909
data/spec/fixtures/dmn/complex_decision.dmn +0 -81
data/spec/fixtures/dmn/invalid_structure.dmn +0 -31
data/spec/fixtures/dmn/simple_decision.dmn +0 -40
data/spec/issue_verification_spec.rb +0 -759
data/spec/json_rule_evaluator_spec.rb +0 -587
data/spec/monitoring/alert_manager_spec.rb +0 -378
data/spec/monitoring/metrics_collector_spec.rb +0 -501
data/spec/monitoring/monitored_agent_spec.rb +0 -225
data/spec/monitoring/prometheus_exporter_spec.rb +0 -242
data/spec/monitoring/storage/activerecord_adapter_spec.rb +0 -498
data/spec/monitoring/storage/base_adapter_spec.rb +0 -61
data/spec/monitoring/storage/memory_adapter_spec.rb +0 -247
data/spec/performance_optimizations_spec.rb +0 -493
data/spec/replay_edge_cases_spec.rb +0 -699
data/spec/replay_spec.rb +0 -210
data/spec/rfc8785_canonicalization_spec.rb +0 -215
data/spec/scoring_spec.rb +0 -225
data/spec/spec_helper.rb +0 -60
data/spec/testing/batch_test_importer_spec.rb +0 -693
data/spec/testing/batch_test_runner_spec.rb +0 -307
data/spec/testing/test_coverage_analyzer_spec.rb +0 -292
data/spec/testing/test_result_comparator_spec.rb +0 -392
data/spec/testing/test_scenario_spec.rb +0 -113
data/spec/thread_safety_spec.rb +0 -490
data/spec/thread_safety_spec.rb.broken +0 -878
data/spec/versioning/adapter_spec.rb +0 -156
data/spec/versioning_spec.rb +0 -1030
data/spec/web/middleware/auth_middleware_spec.rb +0 -133
data/spec/web/middleware/permission_middleware_spec.rb +0 -247
data/spec/web_ui_rack_spec.rb +0 -2134

data/spec/testing/test_result_comparator_spec.rb DELETED Viewed

@@ -1,392 +0,0 @@
-require "spec_helper"
-require "tempfile"
-RSpec.describe DecisionAgent::Testing::TestResultComparator do
-  let(:comparator) { DecisionAgent::Testing::TestResultComparator.new }
-  describe "#compare" do
-    let(:scenarios) do
-      [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        ),
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_2",
-          context: { user_id: 456 },
-          expected_decision: "reject",
-          expected_confidence: 0.80
-        )
-      ]
-    end
-    let(:results) do
-      [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.95
-        ),
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_2",
-          decision: "reject",
-          confidence: 0.80
-        )
-      ]
-    end
-    it "compares results with expected outcomes" do
-      summary = comparator.compare(results, scenarios)
-      expect(summary[:total]).to eq(2)
-      expect(summary[:matches]).to eq(2)
-      expect(summary[:mismatches]).to eq(0)
-      expect(summary[:accuracy_rate]).to eq(1.0)
-    end
-    it "identifies mismatches" do
-      mismatched_results = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "reject", # Wrong decision
-          confidence: 0.95
-        ),
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_2",
-          decision: "reject",
-          confidence: 0.50 # Wrong confidence
-        )
-      ]
-      summary = comparator.compare(mismatched_results, scenarios)
-      expect(summary[:matches]).to eq(0)
-      expect(summary[:mismatches]).to eq(2)
-      expect(summary[:accuracy_rate]).to eq(0.0)
-      expect(summary[:mismatches_detail].size).to eq(2)
-    end
-    it "handles confidence tolerance" do
-      comparator_with_tolerance = DecisionAgent::Testing::TestResultComparator.new(
-        confidence_tolerance: 0.1
-      )
-      results_with_tolerance = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.96 # Within 0.1 tolerance of 0.95
-        )
-      ]
-      scenarios_single = [scenarios[0]]
-      summary = comparator_with_tolerance.compare(results_with_tolerance, scenarios_single)
-      expect(summary[:matches]).to eq(1)
-      expect(summary[:confidence_accuracy]).to eq(1.0)
-    end
-    it "handles fuzzy matching" do
-      comparator_fuzzy = DecisionAgent::Testing::TestResultComparator.new(fuzzy_match: true)
-      scenarios_fuzzy = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "APPROVE", # Uppercase
-          expected_confidence: 0.95
-        )
-      ]
-      results_fuzzy = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve", # Lowercase - should match with fuzzy
-          confidence: 0.95
-        )
-      ]
-      summary = comparator_fuzzy.compare(results_fuzzy, scenarios_fuzzy)
-      expect(summary[:matches]).to eq(1)
-    end
-    it "handles fuzzy matching with whitespace" do
-      comparator_fuzzy = DecisionAgent::Testing::TestResultComparator.new(fuzzy_match: true)
-      scenarios_fuzzy = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: " approve ", # With spaces
-          expected_confidence: 0.95
-        )
-      ]
-      results_fuzzy = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve", # Without spaces - should match with fuzzy
-          confidence: 0.95
-        )
-      ]
-      summary = comparator_fuzzy.compare(results_fuzzy, scenarios_fuzzy)
-      expect(summary[:matches]).to eq(1)
-    end
-    it "handles nil expected confidence" do
-      scenarios_nil_conf = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: nil
-        )
-      ]
-      results_nil_conf = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.95
-        )
-      ]
-      summary = comparator.compare(results_nil_conf, scenarios_nil_conf)
-      expect(summary[:matches]).to eq(1)
-    end
-    it "handles nil actual confidence when expected is present" do
-      scenarios_with_conf = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        )
-      ]
-      results_no_conf = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: nil
-        )
-      ]
-      summary = comparator.compare(results_no_conf, scenarios_with_conf)
-      expect(summary[:matches]).to eq(0)
-      expect(summary[:mismatches]).to eq(1)
-    end
-    it "handles missing results for scenarios" do
-      scenarios_missing = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        ),
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_2",
-          context: { user_id: 456 },
-          expected_decision: "reject",
-          expected_confidence: 0.80
-        )
-      ]
-      # Only provide result for test_1
-      results_missing = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.95
-        )
-      ]
-      summary = comparator.compare(results_missing, scenarios_missing)
-      # Should only compare test_1 since test_2 has no result
-      expect(summary[:total]).to eq(1)
-    end
-    it "handles confidence outside tolerance" do
-      comparator_strict = DecisionAgent::Testing::TestResultComparator.new(
-        confidence_tolerance: 0.01
-      )
-      scenarios_strict = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        )
-      ]
-      results_outside = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.98 # Outside 0.01 tolerance
-        )
-      ]
-      summary = comparator_strict.compare(results_outside, scenarios_strict)
-      expect(summary[:matches]).to eq(0)
-      expect(summary[:confidence_accuracy]).to eq(0.0)
-    end
-    it "handles missing expected results" do
-      scenarios_no_expected = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 }
-          # No expected_decision
-        )
-      ]
-      summary = comparator.compare(results, scenarios_no_expected)
-      # Should not compare scenarios without expected results
-      expect(summary[:total]).to eq(0)
-    end
-    it "handles failed test results" do
-      failed_results = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          error: StandardError.new("Test failed")
-        )
-      ]
-      # Only compare scenarios that have expected results
-      scenarios_with_expected = scenarios.select(&:expected_result?)
-      summary = comparator.compare(failed_results, scenarios_with_expected)
-      expect(summary[:mismatches]).to eq(1)
-      expect(comparator.comparison_results[0].match).to be false
-    end
-  end
-  describe "#generate_summary" do
-    it "returns empty summary when no comparisons" do
-      summary = comparator.generate_summary
-      expect(summary[:total]).to eq(0)
-      expect(summary[:matches]).to eq(0)
-      expect(summary[:accuracy_rate]).to eq(0.0)
-    end
-  end
-  describe "#export_csv" do
-    it "exports comparison results to CSV" do
-      scenarios = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        )
-      ]
-      results = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.95
-        )
-      ]
-      comparator.compare(results, scenarios)
-      file = Tempfile.new(["comparison", ".csv"])
-      comparator.export_csv(file.path)
-      content = File.read(file.path)
-      expect(content).to include("scenario_id")
-      expect(content).to include("test_1")
-      expect(content).to include("true") # match
-      file.unlink
-    end
-  end
-  describe "#export_json" do
-    it "exports comparison results to JSON" do
-      scenarios = [
-        DecisionAgent::Testing::TestScenario.new(
-          id: "test_1",
-          context: { user_id: 123 },
-          expected_decision: "approve",
-          expected_confidence: 0.95
-        )
-      ]
-      results = [
-        DecisionAgent::Testing::TestResult.new(
-          scenario_id: "test_1",
-          decision: "approve",
-          confidence: 0.95
-        )
-      ]
-      comparator.compare(results, scenarios)
-      file = Tempfile.new(["comparison", ".json"])
-      comparator.export_json(file.path)
-      content = JSON.parse(File.read(file.path))
-      expect(content).to have_key("summary")
-      expect(content).to have_key("results")
-      expect(content["summary"]["total"]).to eq(1)
-      file.unlink
-    end
-    it "handles empty comparison results" do
-      file = Tempfile.new(["comparison", ".csv"])
-      comparator.export_csv(file.path)
-      content = File.read(file.path)
-      expect(content).to include("scenario_id")
-      file.unlink
-    end
-  end
-  describe "ComparisonResult" do
-    let(:comparison_result) do
-      DecisionAgent::Testing::ComparisonResult.new(
-        scenario_id: "test_1",
-        match: true,
-        decision_match: true,
-        confidence_match: true,
-        differences: [],
-        actual: { decision: "approve", confidence: 0.95 },
-        expected: { decision: "approve", confidence: 0.95 }
-      )
-    end
-    it "creates a comparison result" do
-      expect(comparison_result.scenario_id).to eq("test_1")
-      expect(comparison_result.match).to be true
-      expect(comparison_result.decision_match).to be true
-      expect(comparison_result.confidence_match).to be true
-    end
-    it "converts to hash" do
-      hash = comparison_result.to_h
-      expect(hash[:scenario_id]).to eq("test_1")
-      expect(hash[:match]).to be true
-      expect(hash[:actual][:decision]).to eq("approve")
-      expect(hash[:expected][:decision]).to eq("approve")
-    end
-    it "freezes the comparison result" do
-      expect(comparison_result.frozen?).to be true
-    end
-  end
-end

data/spec/testing/test_scenario_spec.rb DELETED Viewed

@@ -1,113 +0,0 @@
-require "spec_helper"
-RSpec.describe DecisionAgent::Testing::TestScenario do
-  describe "#initialize" do
-    it "creates a test scenario with required fields" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { user_id: 123, amount: 1000 }
-      )
-      expect(scenario.id).to eq("test_1")
-      expect(scenario.context).to eq({ user_id: 123, amount: 1000 })
-      expect(scenario.expected_decision).to be_nil
-      expect(scenario.expected_confidence).to be_nil
-    end
-    it "creates a test scenario with expected results" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_2",
-        context: { user_id: 456 },
-        expected_decision: "approve",
-        expected_confidence: 0.95
-      )
-      expect(scenario.expected_decision).to eq("approve")
-      expect(scenario.expected_confidence).to eq(0.95)
-    end
-    it "freezes the scenario for immutability" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_3",
-        context: { key: "value" }
-      )
-      expect(scenario.frozen?).to be true
-    end
-  end
-  describe "#expected_result?" do
-    it "returns true when expected_decision is set" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { key: "value" },
-        expected_decision: "approve"
-      )
-      expect(scenario.expected_result?).to be true
-    end
-    it "returns false when expected_decision is nil" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { key: "value" }
-      )
-      expect(scenario.expected_result?).to be false
-    end
-  end
-  describe "#to_h" do
-    it "converts scenario to hash" do
-      scenario = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { user_id: 123 },
-        expected_decision: "approve",
-        expected_confidence: 0.9,
-        metadata: { source: "csv" }
-      )
-      hash = scenario.to_h
-      expect(hash).to eq({
-                           id: "test_1",
-                           context: { user_id: 123 },
-                           expected_decision: "approve",
-                           expected_confidence: 0.9,
-                           metadata: { source: "csv" }
-                         })
-    end
-  end
-  describe "#==" do
-    it "returns true for equal scenarios" do
-      scenario1 = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { user_id: 123 },
-        expected_decision: "approve"
-      )
-      scenario2 = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { user_id: 123 },
-        expected_decision: "approve"
-      )
-      expect(scenario1).to eq(scenario2)
-    end
-    it "returns false for different scenarios" do
-      scenario1 = DecisionAgent::Testing::TestScenario.new(
-        id: "test_1",
-        context: { user_id: 123 }
-      )
-      scenario2 = DecisionAgent::Testing::TestScenario.new(
-        id: "test_2",
-        context: { user_id: 123 }
-      )
-      expect(scenario1).not_to eq(scenario2)
-    end
-  end
-end