RubyGems - decision_agent - Versions diffs - 0.1.3 → 0.1.6 - Mend

decision_agent 0.1.3 → 0.1.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (110) hide show

checksums.yaml +4 -4
data/README.md +84 -233
data/lib/decision_agent/ab_testing/ab_test.rb +197 -0
data/lib/decision_agent/ab_testing/ab_test_assignment.rb +76 -0
data/lib/decision_agent/ab_testing/ab_test_manager.rb +317 -0
data/lib/decision_agent/ab_testing/ab_testing_agent.rb +188 -0
data/lib/decision_agent/ab_testing/storage/activerecord_adapter.rb +155 -0
data/lib/decision_agent/ab_testing/storage/adapter.rb +67 -0
data/lib/decision_agent/ab_testing/storage/memory_adapter.rb +116 -0
data/lib/decision_agent/agent.rb +5 -3
data/lib/decision_agent/auth/access_audit_logger.rb +122 -0
data/lib/decision_agent/auth/authenticator.rb +127 -0
data/lib/decision_agent/auth/password_reset_manager.rb +57 -0
data/lib/decision_agent/auth/password_reset_token.rb +33 -0
data/lib/decision_agent/auth/permission.rb +29 -0
data/lib/decision_agent/auth/permission_checker.rb +43 -0
data/lib/decision_agent/auth/rbac_adapter.rb +278 -0
data/lib/decision_agent/auth/rbac_config.rb +51 -0
data/lib/decision_agent/auth/role.rb +56 -0
data/lib/decision_agent/auth/session.rb +33 -0
data/lib/decision_agent/auth/session_manager.rb +57 -0
data/lib/decision_agent/auth/user.rb +70 -0
data/lib/decision_agent/context.rb +24 -4
data/lib/decision_agent/decision.rb +10 -3
data/lib/decision_agent/dsl/condition_evaluator.rb +378 -1
data/lib/decision_agent/dsl/schema_validator.rb +8 -1
data/lib/decision_agent/errors.rb +38 -0
data/lib/decision_agent/evaluation.rb +10 -3
data/lib/decision_agent/evaluation_validator.rb +8 -13
data/lib/decision_agent/monitoring/dashboard_server.rb +1 -0
data/lib/decision_agent/monitoring/metrics_collector.rb +164 -7
data/lib/decision_agent/monitoring/storage/activerecord_adapter.rb +253 -0
data/lib/decision_agent/monitoring/storage/base_adapter.rb +90 -0
data/lib/decision_agent/monitoring/storage/memory_adapter.rb +222 -0
data/lib/decision_agent/testing/batch_test_importer.rb +373 -0
data/lib/decision_agent/testing/batch_test_runner.rb +244 -0
data/lib/decision_agent/testing/test_coverage_analyzer.rb +191 -0
data/lib/decision_agent/testing/test_result_comparator.rb +235 -0
data/lib/decision_agent/testing/test_scenario.rb +42 -0
data/lib/decision_agent/version.rb +10 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +1 -1
data/lib/decision_agent/versioning/file_storage_adapter.rb +96 -28
data/lib/decision_agent/web/middleware/auth_middleware.rb +45 -0
data/lib/decision_agent/web/middleware/permission_middleware.rb +94 -0
data/lib/decision_agent/web/public/app.js +184 -29
data/lib/decision_agent/web/public/batch_testing.html +640 -0
data/lib/decision_agent/web/public/index.html +37 -9
data/lib/decision_agent/web/public/login.html +298 -0
data/lib/decision_agent/web/public/users.html +679 -0
data/lib/decision_agent/web/server.rb +873 -7
data/lib/decision_agent.rb +59 -0
data/lib/generators/decision_agent/install/install_generator.rb +37 -0
data/lib/generators/decision_agent/install/templates/ab_test_assignment_model.rb +45 -0
data/lib/generators/decision_agent/install/templates/ab_test_model.rb +54 -0
data/lib/generators/decision_agent/install/templates/ab_testing_migration.rb +43 -0
data/lib/generators/decision_agent/install/templates/ab_testing_tasks.rake +189 -0
data/lib/generators/decision_agent/install/templates/decision_agent_tasks.rake +114 -0
data/lib/generators/decision_agent/install/templates/decision_log.rb +57 -0
data/lib/generators/decision_agent/install/templates/error_metric.rb +53 -0
data/lib/generators/decision_agent/install/templates/evaluation_metric.rb +43 -0
data/lib/generators/decision_agent/install/templates/monitoring_migration.rb +109 -0
data/lib/generators/decision_agent/install/templates/performance_metric.rb +76 -0
data/lib/generators/decision_agent/install/templates/rule_version.rb +1 -1
data/spec/ab_testing/ab_test_assignment_spec.rb +253 -0
data/spec/ab_testing/ab_test_manager_spec.rb +612 -0
data/spec/ab_testing/ab_test_spec.rb +270 -0
data/spec/ab_testing/ab_testing_agent_spec.rb +481 -0
data/spec/ab_testing/storage/adapter_spec.rb +64 -0
data/spec/ab_testing/storage/memory_adapter_spec.rb +485 -0
data/spec/advanced_operators_spec.rb +1003 -0
data/spec/agent_spec.rb +40 -0
data/spec/audit_adapters_spec.rb +18 -0
data/spec/auth/access_audit_logger_spec.rb +394 -0
data/spec/auth/authenticator_spec.rb +112 -0
data/spec/auth/password_reset_spec.rb +294 -0
data/spec/auth/permission_checker_spec.rb +207 -0
data/spec/auth/permission_spec.rb +73 -0
data/spec/auth/rbac_adapter_spec.rb +550 -0
data/spec/auth/rbac_config_spec.rb +82 -0
data/spec/auth/role_spec.rb +51 -0
data/spec/auth/session_manager_spec.rb +172 -0
data/spec/auth/session_spec.rb +112 -0
data/spec/auth/user_spec.rb +130 -0
data/spec/context_spec.rb +43 -0
data/spec/decision_agent_spec.rb +96 -0
data/spec/decision_spec.rb +423 -0
data/spec/dsl/condition_evaluator_spec.rb +774 -0
data/spec/evaluation_spec.rb +364 -0
data/spec/evaluation_validator_spec.rb +165 -0
data/spec/examples.txt +1542 -548
data/spec/issue_verification_spec.rb +95 -21
data/spec/monitoring/metrics_collector_spec.rb +221 -3
data/spec/monitoring/monitored_agent_spec.rb +1 -1
data/spec/monitoring/prometheus_exporter_spec.rb +1 -1
data/spec/monitoring/storage/activerecord_adapter_spec.rb +498 -0
data/spec/monitoring/storage/base_adapter_spec.rb +61 -0
data/spec/monitoring/storage/memory_adapter_spec.rb +247 -0
data/spec/performance_optimizations_spec.rb +486 -0
data/spec/spec_helper.rb +23 -0
data/spec/testing/batch_test_importer_spec.rb +693 -0
data/spec/testing/batch_test_runner_spec.rb +307 -0
data/spec/testing/test_coverage_analyzer_spec.rb +292 -0
data/spec/testing/test_result_comparator_spec.rb +392 -0
data/spec/testing/test_scenario_spec.rb +113 -0
data/spec/versioning/adapter_spec.rb +156 -0
data/spec/versioning_spec.rb +253 -0
data/spec/web/middleware/auth_middleware_spec.rb +133 -0
data/spec/web/middleware/permission_middleware_spec.rb +247 -0
data/spec/web_ui_rack_spec.rb +1705 -0
metadata +123 -6

data/spec/monitoring/storage/activerecord_adapter_spec.rb ADDED Viewed

@@ -0,0 +1,498 @@
+# frozen_string_literal: true
+require "spec_helper"
+require "active_record"
+require "decision_agent/monitoring/storage/activerecord_adapter"
+RSpec.describe DecisionAgent::Monitoring::Storage::ActiveRecordAdapter do
+  # Setup in-memory SQLite database for testing
+  before(:all) do
+    ActiveRecord::Base.establish_connection(
+      adapter: "sqlite3",
+      database: ":memory:"
+    )
+    # Create tables
+    ActiveRecord::Schema.define do
+      create_table :decision_logs, force: true do |t|
+        t.string :decision, null: false
+        t.float :confidence
+        t.integer :evaluations_count, default: 0
+        t.float :duration_ms
+        t.string :status
+        t.text :context
+        t.text :metadata
+        t.timestamps
+      end
+      create_table :evaluation_metrics, force: true do |t|
+        t.references :decision_log, foreign_key: true
+        t.string :evaluator_name, null: false
+        t.float :score
+        t.boolean :success
+        t.float :duration_ms
+        t.text :details
+        t.timestamps
+      end
+      create_table :performance_metrics, force: true do |t|
+        t.string :operation, null: false
+        t.float :duration_ms
+        t.string :status
+        t.text :metadata
+        t.timestamps
+      end
+      create_table :error_metrics, force: true do |t|
+        t.string :error_type, null: false
+        t.text :message
+        t.text :stack_trace
+        t.string :severity
+        t.text :context
+        t.timestamps
+      end
+    end
+    # Define models
+    # rubocop:disable Lint/ConstantDefinitionInBlock
+    class DecisionLog < ActiveRecord::Base
+      has_many :evaluation_metrics, dependent: :destroy
+      scope :recent, ->(time_range) { where("created_at >= ?", Time.now - time_range) }
+      def self.success_rate(time_range: 3600)
+        total = recent(time_range).where.not(status: nil).count
+        return 0.0 if total.zero?
+        recent(time_range).where(status: "success").count.to_f / total
+      end
+      def parsed_context
+        JSON.parse(context, symbolize_names: true)
+      rescue StandardError
+        {}
+      end
+    end
+    class EvaluationMetric < ActiveRecord::Base
+      belongs_to :decision_log, optional: true
+      scope :recent, ->(time_range) { where("created_at >= ?", Time.now - time_range) }
+      scope :successful, -> { where(success: true) }
+      def parsed_details
+        JSON.parse(details, symbolize_names: true)
+      rescue StandardError
+        {}
+      end
+    end
+    class PerformanceMetric < ActiveRecord::Base
+      scope :recent, ->(time_range) { where("created_at >= ?", Time.now - time_range) }
+      def self.average_duration(time_range: 3600)
+        recent(time_range).average(:duration_ms).to_f
+      end
+      def self.p50(time_range: 3600)
+        percentile(0.50, time_range: time_range)
+      end
+      def self.p95(time_range: 3600)
+        percentile(0.95, time_range: time_range)
+      end
+      def self.p99(time_range: 3600)
+        percentile(0.99, time_range: time_range)
+      end
+      def self.percentile(pct, time_range: 3600)
+        durations = recent(time_range).where.not(duration_ms: nil).order(:duration_ms).pluck(:duration_ms)
+        return 0.0 if durations.empty?
+        durations[(durations.length * pct).ceil - 1].to_f
+      end
+      def self.success_rate(time_range: 3600)
+        total = recent(time_range).where.not(status: nil).count
+        return 0.0 if total.zero?
+        recent(time_range).where(status: "success").count.to_f / total
+      end
+    end
+    class ErrorMetric < ActiveRecord::Base
+      scope :recent, ->(time_range) { where("created_at >= ?", Time.now - time_range) }
+      scope :critical, -> { where(severity: "critical") }
+      def parsed_context
+        JSON.parse(context, symbolize_names: true)
+      rescue StandardError
+        {}
+      end
+    end
+    # rubocop:enable Lint/ConstantDefinitionInBlock
+  end
+  before do
+    DecisionLog.delete_all
+    EvaluationMetric.delete_all
+    PerformanceMetric.delete_all
+    ErrorMetric.delete_all
+  end
+  let(:adapter) { described_class.new }
+  describe ".available?" do
+    it "returns true when ActiveRecord and models are defined" do
+      expect(described_class.available?).to be_truthy
+    end
+  end
+  describe "#record_decision" do
+    it "creates a decision log record" do
+      expect do
+        adapter.record_decision(
+          "approve_payment",
+          { user_id: 123, amount: 500 },
+          confidence: 0.85,
+          evaluations_count: 3,
+          duration_ms: 45.5,
+          status: "success"
+        )
+      end.to change(DecisionLog, :count).by(1)
+      log = DecisionLog.last
+      expect(log.decision).to eq("approve_payment")
+      expect(log.confidence).to eq(0.85)
+      expect(log.evaluations_count).to eq(3)
+      expect(log.duration_ms).to eq(45.5)
+      expect(log.status).to eq("success")
+      expect(log.parsed_context).to eq(user_id: 123, amount: 500)
+    end
+    it "handles database errors gracefully" do
+      allow(DecisionLog).to receive(:create!).and_raise(StandardError.new("DB error"))
+      expect do
+        adapter.record_decision("test", {})
+      end.not_to raise_error
+    end
+  end
+  describe "#record_evaluation" do
+    it "creates an evaluation metric record" do
+      expect do
+        adapter.record_evaluation(
+          "FraudDetector",
+          score: 0.92,
+          success: true,
+          duration_ms: 12.3,
+          details: { risk_level: "low" }
+        )
+      end.to change(EvaluationMetric, :count).by(1)
+      metric = EvaluationMetric.last
+      expect(metric.evaluator_name).to eq("FraudDetector")
+      expect(metric.score).to eq(0.92)
+      expect(metric.success).to be true
+      expect(metric.duration_ms).to eq(12.3)
+      expect(metric.parsed_details).to eq(risk_level: "low")
+    end
+    it "handles database errors gracefully" do
+      allow(EvaluationMetric).to receive(:create!).and_raise(StandardError.new("DB error"))
+      expect do
+        adapter.record_evaluation("test")
+      end.not_to raise_error
+    end
+  end
+  describe "#record_performance" do
+    it "creates a performance metric record" do
+      expect do
+        adapter.record_performance(
+          "api_call",
+          duration_ms: 250.5,
+          status: "success",
+          metadata: { endpoint: "/api/v1/users" }
+        )
+      end.to change(PerformanceMetric, :count).by(1)
+      metric = PerformanceMetric.last
+      expect(metric.operation).to eq("api_call")
+      expect(metric.duration_ms).to eq(250.5)
+      expect(metric.status).to eq("success")
+    end
+    it "handles database errors gracefully" do
+      allow(PerformanceMetric).to receive(:create!).and_raise(StandardError.new("DB error"))
+      expect do
+        adapter.record_performance("test")
+      end.not_to raise_error
+    end
+  end
+  describe "#record_error" do
+    it "creates an error metric record" do
+      expect do
+        adapter.record_error(
+          "RuntimeError",
+          message: "Something went wrong",
+          stack_trace: ["line 1", "line 2"],
+          severity: "critical",
+          context: { user_id: 456 }
+        )
+      end.to change(ErrorMetric, :count).by(1)
+      error = ErrorMetric.last
+      expect(error.error_type).to eq("RuntimeError")
+      expect(error.message).to eq("Something went wrong")
+      expect(error.severity).to eq("critical")
+      expect(error.parsed_context).to eq(user_id: 456)
+    end
+    it "handles nil stack_trace" do
+      adapter.record_error("TestError", stack_trace: nil)
+      error = ErrorMetric.last
+      expect(error.stack_trace).to be_nil
+    end
+    it "handles database errors gracefully" do
+      allow(ErrorMetric).to receive(:create!).and_raise(StandardError.new("DB error"))
+      expect do
+        adapter.record_error("test")
+      end.not_to raise_error
+    end
+  end
+  describe "#statistics" do
+    before do
+      # Create test data
+      3.times do |i|
+        adapter.record_decision(
+          "decision_#{i}",
+          { index: i },
+          confidence: 0.5 + (i * 0.1),
+          evaluations_count: 2,
+          duration_ms: 100 + (i * 10),
+          status: "success"
+        )
+      end
+      2.times do |i|
+        adapter.record_evaluation(
+          "Evaluator#{i}",
+          score: 0.8,
+          success: true,
+          duration_ms: 50
+        )
+      end
+      4.times do |i|
+        adapter.record_performance(
+          "operation_#{i}",
+          duration_ms: 100 + (i * 50),
+          status: i.even? ? "success" : "failure"
+        )
+      end
+      adapter.record_error("TestError", severity: "critical")
+    end
+    it "returns comprehensive statistics" do
+      stats = adapter.statistics(time_range: 3600)
+      expect(stats[:decisions][:total]).to eq(3)
+      expect(stats[:decisions][:average_confidence]).to be_within(0.01).of(0.6)
+      expect(stats[:evaluations][:total]).to eq(2)
+      expect(stats[:performance][:total]).to eq(4)
+      expect(stats[:errors][:total]).to eq(1)
+      expect(stats[:errors][:critical_count]).to eq(1)
+    end
+    it "handles empty statistics" do
+      DecisionLog.delete_all
+      EvaluationMetric.delete_all
+      PerformanceMetric.delete_all
+      ErrorMetric.delete_all
+      stats = adapter.statistics(time_range: 3600)
+      expect(stats[:decisions][:total]).to eq(0)
+      expect(stats[:decisions][:average_confidence]).to eq(0.0)
+      expect(stats[:evaluations][:total]).to eq(0)
+      expect(stats[:performance][:total]).to eq(0)
+      expect(stats[:errors][:total]).to eq(0)
+    end
+    it "handles decisions without confidence" do
+      DecisionLog.delete_all
+      adapter.record_decision("test", {}, confidence: nil)
+      stats = adapter.statistics(time_range: 3600)
+      expect(stats[:decisions][:average_confidence]).to eq(0.0)
+    end
+    it "handles database errors gracefully" do
+      allow(DecisionLog).to receive(:recent).and_raise(StandardError.new("DB error"))
+      stats = adapter.statistics(time_range: 3600)
+      expect(stats[:decisions][:total]).to eq(0)
+      expect(stats[:evaluations][:total]).to eq(0)
+    end
+  end
+  describe "#time_series" do
+    before do
+      # Create metrics at different times
+      [10, 70, 130].each do |seconds_ago|
+        travel_back = Time.now - seconds_ago
+        DecisionLog.create!(
+          decision: "test",
+          confidence: 0.8,
+          created_at: travel_back
+        )
+      end
+    end
+    it "returns time series data grouped by buckets for decisions" do
+      series = adapter.time_series(:decisions, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to be_an(Array)
+      expect(series[:data]).to be_an(Array)
+      expect(series[:data].sum).to eq(3)
+    end
+    it "returns time series data for evaluations" do
+      [10, 70].each do |seconds_ago|
+        travel_back = Time.now - seconds_ago
+        EvaluationMetric.create!(
+          evaluator_name: "test",
+          score: 0.8,
+          created_at: travel_back
+        )
+      end
+      series = adapter.time_series(:evaluations, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to be_an(Array)
+      expect(series[:data]).to be_an(Array)
+      expect(series[:data].sum).to eq(2)
+    end
+    it "returns time series data for performance" do
+      [10, 70].each do |seconds_ago|
+        travel_back = Time.now - seconds_ago
+        PerformanceMetric.create!(
+          operation: "test",
+          duration_ms: 100,
+          created_at: travel_back
+        )
+      end
+      series = adapter.time_series(:performance, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to be_an(Array)
+      expect(series[:data]).to be_an(Array)
+    end
+    it "returns time series data for errors" do
+      [10, 70].each do |seconds_ago|
+        travel_back = Time.now - seconds_ago
+        ErrorMetric.create!(
+          error_type: "TestError",
+          created_at: travel_back
+        )
+      end
+      series = adapter.time_series(:errors, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to be_an(Array)
+      expect(series[:data]).to be_an(Array)
+      expect(series[:data].sum).to eq(2)
+    end
+    it "returns empty data for unknown metric type" do
+      series = adapter.time_series(:unknown, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to eq([])
+      expect(series[:data]).to eq([])
+    end
+    it "handles database errors gracefully" do
+      allow(DecisionLog).to receive(:recent).and_raise(StandardError.new("DB error"))
+      series = adapter.time_series(:decisions, bucket_size: 60, time_range: 200)
+      expect(series[:timestamps]).to eq([])
+      expect(series[:data]).to eq([])
+    end
+  end
+  describe "#metrics_count" do
+    before do
+      adapter.record_decision("test", {}, confidence: 0.8)
+      adapter.record_evaluation("TestEval", score: 0.9)
+      adapter.record_performance("test_op", duration_ms: 100)
+      adapter.record_error("TestError")
+    end
+    it "returns count of all metric types" do
+      counts = adapter.metrics_count
+      expect(counts[:decisions]).to eq(1)
+      expect(counts[:evaluations]).to eq(1)
+      expect(counts[:performance]).to eq(1)
+      expect(counts[:errors]).to eq(1)
+    end
+    it "handles database errors gracefully" do
+      allow(DecisionLog).to receive(:count).and_raise(StandardError.new("DB error"))
+      counts = adapter.metrics_count
+      expect(counts[:decisions]).to eq(0)
+      expect(counts[:evaluations]).to eq(0)
+      expect(counts[:performance]).to eq(0)
+      expect(counts[:errors]).to eq(0)
+    end
+  end
+  describe "#cleanup" do
+    before do
+      # Create old metrics
+      old_time = Time.now - 8.days
+      DecisionLog.create!(decision: "old", confidence: 0.8, created_at: old_time)
+      EvaluationMetric.create!(evaluator_name: "old", created_at: old_time)
+      PerformanceMetric.create!(operation: "old", created_at: old_time)
+      ErrorMetric.create!(error_type: "old", created_at: old_time)
+      # Create recent metrics
+      adapter.record_decision("recent", {}, confidence: 0.8)
+      adapter.record_evaluation("recent", score: 0.9)
+      adapter.record_performance("recent", duration_ms: 100)
+      adapter.record_error("recent")
+    end
+    it "removes old metrics and keeps recent ones" do
+      count = adapter.cleanup(older_than: 7.days.to_i)
+      expect(count).to eq(4) # 4 old metrics removed
+      expect(DecisionLog.count).to eq(1)
+      expect(EvaluationMetric.count).to eq(1)
+      expect(PerformanceMetric.count).to eq(1)
+      expect(ErrorMetric.count).to eq(1)
+    end
+    it "handles database errors gracefully" do
+      allow(DecisionLog).to receive(:where).and_raise(StandardError.new("DB error"))
+      count = adapter.cleanup(older_than: 7.days.to_i)
+      expect(count).to eq(0)
+    end
+  end
+  describe "#initialize" do
+    it "validates required models exist" do
+      expect { described_class.new }.not_to raise_error
+    end
+  end
+end

data/spec/monitoring/storage/base_adapter_spec.rb ADDED Viewed

@@ -0,0 +1,61 @@
+require "spec_helper"
+RSpec.describe DecisionAgent::Monitoring::Storage::BaseAdapter do
+  let(:adapter) { described_class.new }
+  describe "abstract methods" do
+    it "raises NotImplementedError for record_decision" do
+      expect do
+        adapter.record_decision("approve", {})
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for record_evaluation" do
+      expect do
+        adapter.record_evaluation("evaluator1")
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for record_performance" do
+      expect do
+        adapter.record_performance("operation")
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for record_error" do
+      expect do
+        adapter.record_error("ErrorType")
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for statistics" do
+      expect do
+        adapter.statistics
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for time_series" do
+      expect do
+        adapter.time_series(:decisions)
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for metrics_count" do
+      expect do
+        adapter.metrics_count
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for cleanup" do
+      expect do
+        adapter.cleanup(older_than: 3600)
+      end.to raise_error(NotImplementedError)
+    end
+    it "raises NotImplementedError for available?" do
+      expect do
+        described_class.available?
+      end.to raise_error(NotImplementedError)
+    end
+  end
+end