RubyGems - decision_agent - Versions diffs - 0.1.2 → 0.1.4 - Mend

decision_agent 0.1.2 → 0.1.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

checksums.yaml +4 -4
data/README.md +212 -35
data/bin/decision_agent +3 -8
data/lib/decision_agent/ab_testing/ab_test.rb +197 -0
data/lib/decision_agent/ab_testing/ab_test_assignment.rb +76 -0
data/lib/decision_agent/ab_testing/ab_test_manager.rb +317 -0
data/lib/decision_agent/ab_testing/ab_testing_agent.rb +152 -0
data/lib/decision_agent/ab_testing/storage/activerecord_adapter.rb +155 -0
data/lib/decision_agent/ab_testing/storage/adapter.rb +67 -0
data/lib/decision_agent/ab_testing/storage/memory_adapter.rb +116 -0
data/lib/decision_agent/agent.rb +19 -26
data/lib/decision_agent/audit/null_adapter.rb +1 -2
data/lib/decision_agent/decision.rb +3 -1
data/lib/decision_agent/dsl/condition_evaluator.rb +4 -3
data/lib/decision_agent/dsl/rule_parser.rb +4 -6
data/lib/decision_agent/dsl/schema_validator.rb +27 -31
data/lib/decision_agent/errors.rb +11 -8
data/lib/decision_agent/evaluation.rb +3 -1
data/lib/decision_agent/evaluation_validator.rb +78 -0
data/lib/decision_agent/evaluators/json_rule_evaluator.rb +26 -0
data/lib/decision_agent/evaluators/static_evaluator.rb +2 -6
data/lib/decision_agent/monitoring/alert_manager.rb +282 -0
data/lib/decision_agent/monitoring/dashboard/public/dashboard.css +381 -0
data/lib/decision_agent/monitoring/dashboard/public/dashboard.js +471 -0
data/lib/decision_agent/monitoring/dashboard/public/index.html +161 -0
data/lib/decision_agent/monitoring/dashboard_server.rb +340 -0
data/lib/decision_agent/monitoring/metrics_collector.rb +423 -0
data/lib/decision_agent/monitoring/monitored_agent.rb +71 -0
data/lib/decision_agent/monitoring/prometheus_exporter.rb +247 -0
data/lib/decision_agent/monitoring/storage/activerecord_adapter.rb +253 -0
data/lib/decision_agent/monitoring/storage/base_adapter.rb +90 -0
data/lib/decision_agent/monitoring/storage/memory_adapter.rb +222 -0
data/lib/decision_agent/replay/replay.rb +12 -22
data/lib/decision_agent/scoring/base.rb +1 -1
data/lib/decision_agent/scoring/consensus.rb +5 -5
data/lib/decision_agent/scoring/weighted_average.rb +1 -1
data/lib/decision_agent/version.rb +1 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +69 -33
data/lib/decision_agent/versioning/adapter.rb +1 -3
data/lib/decision_agent/versioning/file_storage_adapter.rb +143 -35
data/lib/decision_agent/versioning/version_manager.rb +4 -12
data/lib/decision_agent/web/public/index.html +1 -1
data/lib/decision_agent/web/server.rb +19 -24
data/lib/decision_agent.rb +14 -0
data/lib/generators/decision_agent/install/install_generator.rb +42 -5
data/lib/generators/decision_agent/install/templates/ab_test_assignment_model.rb +45 -0
data/lib/generators/decision_agent/install/templates/ab_test_model.rb +54 -0
data/lib/generators/decision_agent/install/templates/ab_testing_migration.rb +43 -0
data/lib/generators/decision_agent/install/templates/ab_testing_tasks.rake +189 -0
data/lib/generators/decision_agent/install/templates/decision_agent_tasks.rake +114 -0
data/lib/generators/decision_agent/install/templates/decision_log.rb +57 -0
data/lib/generators/decision_agent/install/templates/error_metric.rb +53 -0
data/lib/generators/decision_agent/install/templates/evaluation_metric.rb +43 -0
data/lib/generators/decision_agent/install/templates/migration.rb +17 -6
data/lib/generators/decision_agent/install/templates/monitoring_migration.rb +109 -0
data/lib/generators/decision_agent/install/templates/performance_metric.rb +76 -0
data/lib/generators/decision_agent/install/templates/rule.rb +3 -3
data/lib/generators/decision_agent/install/templates/rule_version.rb +13 -7
data/spec/ab_testing/ab_test_manager_spec.rb +330 -0
data/spec/ab_testing/ab_test_spec.rb +270 -0
data/spec/activerecord_thread_safety_spec.rb +553 -0
data/spec/agent_spec.rb +13 -13
data/spec/api_contract_spec.rb +16 -16
data/spec/audit_adapters_spec.rb +3 -3
data/spec/comprehensive_edge_cases_spec.rb +86 -86
data/spec/dsl_validation_spec.rb +83 -83
data/spec/edge_cases_spec.rb +23 -23
data/spec/examples/feedback_aware_evaluator_spec.rb +7 -7
data/spec/examples.txt +612 -0
data/spec/issue_verification_spec.rb +759 -0
data/spec/json_rule_evaluator_spec.rb +15 -15
data/spec/monitoring/alert_manager_spec.rb +378 -0
data/spec/monitoring/metrics_collector_spec.rb +281 -0
data/spec/monitoring/monitored_agent_spec.rb +222 -0
data/spec/monitoring/prometheus_exporter_spec.rb +242 -0
data/spec/monitoring/storage/activerecord_adapter_spec.rb +346 -0
data/spec/monitoring/storage/memory_adapter_spec.rb +247 -0
data/spec/replay_edge_cases_spec.rb +58 -58
data/spec/replay_spec.rb +11 -11
data/spec/rfc8785_canonicalization_spec.rb +215 -0
data/spec/scoring_spec.rb +1 -1
data/spec/spec_helper.rb +9 -0
data/spec/thread_safety_spec.rb +482 -0
data/spec/thread_safety_spec.rb.broken +878 -0
data/spec/versioning_spec.rb +141 -37
data/spec/web_ui_rack_spec.rb +135 -0
metadata +93 -6

data/lib/decision_agent/monitoring/metrics_collector.rb ADDED Viewed

@@ -0,0 +1,423 @@
+require "monitor"
+require "time"
+require_relative "storage/memory_adapter"
+begin
+  require_relative "storage/activerecord_adapter"
+rescue LoadError, NameError
+  # ActiveRecord adapter not available
+end
+module DecisionAgent
+  module Monitoring
+    # Thread-safe metrics collector for decision analytics
+    class MetricsCollector
+      include MonitorMixin
+      attr_reader :metrics, :window_size, :storage_adapter
+      def initialize(window_size: 3600, storage: :auto)
+        super()
+        @window_size = window_size # Default: 1 hour window
+        @storage_adapter = initialize_storage_adapter(storage, window_size)
+        # Legacy in-memory metrics for backward compatibility with observers
+        @metrics = {
+          decisions: [],
+          evaluations: [],
+          performance: [],
+          errors: []
+        }
+        @observers = []
+        freeze_config
+      end
+      # Record a decision for analytics
+      def record_decision(decision, context, duration_ms: nil)
+        synchronize do
+          metric = {
+            timestamp: Time.now.utc,
+            decision: decision.decision,
+            confidence: decision.confidence,
+            evaluations_count: decision.evaluations.size,
+            context_size: context.to_h.size,
+            duration_ms: duration_ms,
+            evaluator_names: decision.evaluations.map(&:evaluator_name).uniq
+          }
+          # Store in-memory for observers (backward compatibility)
+          @metrics[:decisions] << metric
+          cleanup_old_metrics!
+          # Persist to storage adapter
+          @storage_adapter.record_decision(
+            decision.decision,
+            context.to_h,
+            confidence: decision.confidence,
+            evaluations_count: decision.evaluations.size,
+            duration_ms: duration_ms,
+            status: determine_decision_status(decision)
+          )
+          notify_observers(:decision, metric)
+          metric
+        end
+      end
+      # Record individual evaluation metrics
+      def record_evaluation(evaluation)
+        synchronize do
+          metric = {
+            timestamp: Time.now.utc,
+            decision: evaluation.decision,
+            weight: evaluation.weight,
+            evaluator_name: evaluation.evaluator_name
+          }
+          # Store in-memory for observers (backward compatibility)
+          @metrics[:evaluations] << metric
+          cleanup_old_metrics!
+          # Persist to storage adapter
+          @storage_adapter.record_evaluation(
+            evaluation.evaluator_name,
+            score: evaluation.weight,
+            success: evaluation.weight.positive?,
+            details: { decision: evaluation.decision }
+          )
+          notify_observers(:evaluation, metric)
+          metric
+        end
+      end
+      # Record performance metrics
+      def record_performance(operation:, duration_ms:, success: true, metadata: {})
+        synchronize do
+          metric = {
+            timestamp: Time.now.utc,
+            operation: operation,
+            duration_ms: duration_ms,
+            success: success,
+            metadata: metadata
+          }
+          # Store in-memory for observers (backward compatibility)
+          @metrics[:performance] << metric
+          cleanup_old_metrics!
+          # Persist to storage adapter
+          @storage_adapter.record_performance(
+            operation,
+            duration_ms: duration_ms,
+            status: success ? "success" : "failure",
+            metadata: metadata
+          )
+          notify_observers(:performance, metric)
+          metric
+        end
+      end
+      # Record error
+      def record_error(error, context: {})
+        synchronize do
+          metric = {
+            timestamp: Time.now.utc,
+            error_class: error.class.name,
+            error_message: error.message,
+            context: context
+          }
+          # Store in-memory for observers (backward compatibility)
+          @metrics[:errors] << metric
+          cleanup_old_metrics!
+          # Persist to storage adapter
+          @storage_adapter.record_error(
+            error.class.name,
+            message: error.message,
+            stack_trace: error.backtrace,
+            severity: determine_error_severity(error),
+            context: context
+          )
+          notify_observers(:error, metric)
+          metric
+        end
+      end
+      # Get aggregated statistics
+      def statistics(time_range: nil)
+        synchronize do
+          # Use in-memory metrics for MemoryAdapter (to maintain backward compatibility)
+          # Only delegate to ActiveRecordAdapter for persistent storage
+          use_storage = time_range &&
+                        @storage_adapter.respond_to?(:statistics) &&
+                        !@storage_adapter.is_a?(Storage::MemoryAdapter)
+          if use_storage
+            stats = @storage_adapter.statistics(time_range: time_range)
+            return stats.merge(timestamp: Time.now.utc, storage: @storage_adapter.class.name) if stats
+          end
+          # Use in-memory metrics
+          range_start = time_range ? Time.now.utc - time_range : nil
+          decisions = filter_by_time(@metrics[:decisions], range_start)
+          evaluations = filter_by_time(@metrics[:evaluations], range_start)
+          performance = filter_by_time(@metrics[:performance], range_start)
+          errors = filter_by_time(@metrics[:errors], range_start)
+          {
+            summary: {
+              total_decisions: decisions.size,
+              total_evaluations: evaluations.size,
+              total_errors: errors.size,
+              time_range: range_start ? "Last #{time_range}s" : "All time"
+            },
+            decisions: compute_decision_stats(decisions),
+            evaluations: compute_evaluation_stats(evaluations),
+            performance: compute_performance_stats(performance),
+            errors: compute_error_stats(errors),
+            timestamp: Time.now.utc,
+            storage: "memory (fallback)"
+          }
+        end
+      end
+      # Get time-series data for graphing
+      def time_series(metric_type:, bucket_size: 60, time_range: 3600)
+        synchronize do
+          # Use in-memory metrics for MemoryAdapter (to maintain backward compatibility)
+          # Only delegate to ActiveRecordAdapter for persistent storage
+          use_storage = @storage_adapter.respond_to?(:time_series) &&
+                        !@storage_adapter.is_a?(Storage::MemoryAdapter)
+          if use_storage
+            series = @storage_adapter.time_series(metric_type, bucket_size: bucket_size, time_range: time_range)
+            return series if series && series[:timestamps]
+          end
+          # Use in-memory metrics
+          data = @metrics[metric_type] || []
+          range_start = Time.now.utc - time_range
+          buckets = {}
+          data.each do |metric|
+            next if metric[:timestamp] < range_start
+            bucket_key = (metric[:timestamp].to_i / bucket_size) * bucket_size
+            buckets[bucket_key] ||= []
+            buckets[bucket_key] << metric
+          end
+          buckets.sort.map do |timestamp, metrics|
+            {
+              timestamp: Time.at(timestamp).utc,
+              count: metrics.size,
+              metrics: metrics
+            }
+          end
+        end
+      end
+      # Register observer for real-time updates
+      def add_observer(&block)
+        synchronize do
+          @observers << block
+        end
+      end
+      # Clear all metrics
+      def clear!
+        synchronize do
+          @metrics.each_value(&:clear)
+          # Also clear storage adapter if using MemoryAdapter
+          if @storage_adapter.is_a?(Storage::MemoryAdapter)
+            # Clear all by using a very large time period (100 years in seconds)
+            @storage_adapter.cleanup(older_than: 100 * 365 * 24 * 60 * 60)
+          end
+        end
+      end
+      # Get current metrics count
+      def metrics_count
+        synchronize do
+          # Use in-memory metrics for MemoryAdapter (to maintain backward compatibility)
+          # Only delegate to ActiveRecordAdapter for persistent storage
+          use_storage = @storage_adapter.respond_to?(:metrics_count) &&
+                        !@storage_adapter.is_a?(Storage::MemoryAdapter)
+          return @storage_adapter.metrics_count if use_storage
+          # Use in-memory
+          @metrics.transform_values(&:size)
+        end
+      end
+      # Cleanup old metrics from persistent storage
+      def cleanup_old_metrics_from_storage(older_than:)
+        synchronize do
+          return 0 unless @storage_adapter.respond_to?(:cleanup)
+          @storage_adapter.cleanup(older_than: older_than)
+        end
+      end
+      private
+      def freeze_config
+        @window_size.freeze
+      end
+      def initialize_storage_adapter(storage_option, window_size)
+        case storage_option
+        when :auto
+          # Auto-detect: prefer ActiveRecord if available
+          if defined?(DecisionAgent::Monitoring::Storage::ActiveRecordAdapter) &&
+             DecisionAgent::Monitoring::Storage::ActiveRecordAdapter.available?
+            DecisionAgent::Monitoring::Storage::ActiveRecordAdapter.new
+          else
+            DecisionAgent::Monitoring::Storage::MemoryAdapter.new(window_size: window_size)
+          end
+        when :activerecord, :database
+          unless defined?(DecisionAgent::Monitoring::Storage::ActiveRecordAdapter)
+            raise "ActiveRecord adapter not available. Install models or use :memory storage."
+          end
+          DecisionAgent::Monitoring::Storage::ActiveRecordAdapter.new
+        when :memory
+          DecisionAgent::Monitoring::Storage::MemoryAdapter.new(window_size: window_size)
+        when Symbol
+          raise ArgumentError, "Unknown storage option: #{storage_option}. Use :auto, :activerecord, or :memory"
+        else
+          # Custom adapter instance provided
+          storage_option
+        end
+      end
+      def determine_decision_status(decision)
+        return "success" if decision.confidence >= 0.7
+        return "failure" if decision.confidence < 0.3
+        "success" # Default for medium confidence
+      end
+      def determine_error_severity(error)
+        case error
+        when ArgumentError, TypeError
+          "medium"
+        when StandardError
+          "low"
+        when Exception
+          "critical"
+        else
+          "low"
+        end
+      end
+      def cleanup_old_metrics!
+        cutoff_time = Time.now.utc - @window_size
+        @metrics.each_value do |data|
+          data.delete_if { |m| m[:timestamp] < cutoff_time }
+        end
+      end
+      def filter_by_time(data, start_time)
+        return data unless start_time
+        data.select { |m| m[:timestamp] >= start_time }
+      end
+      def compute_decision_stats(decisions)
+        return {} if decisions.empty?
+        confidences = decisions.map { |d| d[:confidence] }
+        durations = decisions.map { |d| d[:duration_ms] }.compact
+        decision_distribution = decisions.group_by { |d| d[:decision] }
+                                         .transform_values(&:size)
+        {
+          total: decisions.size,
+          avg_confidence: (confidences.sum / confidences.size.to_f).round(4),
+          min_confidence: confidences.min.round(4),
+          max_confidence: confidences.max.round(4),
+          decision_distribution: decision_distribution,
+          avg_duration_ms: durations.empty? ? nil : (durations.sum / durations.size.to_f).round(2),
+          evaluators_used: decisions.flat_map { |d| d[:evaluator_names] }.uniq
+        }
+      end
+      def compute_evaluation_stats(evaluations)
+        return {} if evaluations.empty?
+        weights = evaluations.map { |e| e[:weight] }
+        evaluator_distribution = evaluations.group_by { |e| e[:evaluator_name] }
+                                            .transform_values(&:size)
+        {
+          total: evaluations.size,
+          avg_weight: (weights.sum / weights.size.to_f).round(4),
+          evaluator_distribution: evaluator_distribution,
+          decision_distribution: evaluations.group_by { |e| e[:decision] }
+                                            .transform_values(&:size)
+        }
+      end
+      def compute_performance_stats(performance)
+        return {} if performance.empty?
+        durations = performance.map { |p| p[:duration_ms] }
+        successes = performance.count { |p| p[:success] }
+        {
+          total_operations: performance.size,
+          successful: successes,
+          failed: performance.size - successes,
+          success_rate: (successes / performance.size.to_f).round(4),
+          avg_duration_ms: (durations.sum / durations.size.to_f).round(2),
+          min_duration_ms: durations.min.round(2),
+          max_duration_ms: durations.max.round(2),
+          p95_duration_ms: percentile(durations, 0.95).round(2),
+          p99_duration_ms: percentile(durations, 0.99).round(2)
+        }
+      end
+      def compute_error_stats(errors)
+        return {} if errors.empty?
+        {
+          total: errors.size,
+          by_type: errors.group_by { |e| e[:error_class] }.transform_values(&:size),
+          recent_errors: errors.last(10).map do |e|
+            {
+              timestamp: e[:timestamp],
+              error: e[:error_class],
+              message: e[:error_message]
+            }
+          end
+        }
+      end
+      def percentile(array, percentile)
+        return 0 if array.empty?
+        sorted = array.sort
+        index = (percentile * sorted.length).ceil - 1
+        sorted[[index, 0].max]
+      end
+      def notify_observers(event_type, metric)
+        @observers.each do |observer|
+          observer.call(event_type, metric)
+        rescue StandardError => e
+          # Silently fail observer notifications to prevent disruption
+          warn "Observer notification failed: #{e.message}"
+        end
+      end
+    end
+  end
+end

data/lib/decision_agent/monitoring/monitored_agent.rb ADDED Viewed

@@ -0,0 +1,71 @@
+module DecisionAgent
+  module Monitoring
+    # Wrapper around Agent that automatically records metrics
+    class MonitoredAgent
+      attr_reader :agent, :metrics_collector
+      def initialize(agent:, metrics_collector:)
+        @agent = agent
+        @metrics_collector = metrics_collector
+      end
+      # Make a decision and automatically record metrics
+      def decide(context:, feedback: {})
+        ctx = context.is_a?(Context) ? context : Context.new(context)
+        start_time = Time.now
+        begin
+          result = @agent.decide(context: ctx, feedback: feedback)
+          duration_ms = (Time.now - start_time) * 1000
+          # Record decision metrics
+          @metrics_collector.record_decision(result, ctx, duration_ms: duration_ms)
+          # Record each evaluation
+          result.evaluations.each do |evaluation|
+            @metrics_collector.record_evaluation(evaluation)
+          end
+          # Record successful performance
+          @metrics_collector.record_performance(
+            operation: "decide",
+            duration_ms: duration_ms,
+            success: true,
+            metadata: {
+              evaluators_count: result.evaluations.size,
+              decision: result.decision,
+              confidence: result.confidence
+            }
+          )
+          result
+        rescue StandardError => e
+          duration_ms = (Time.now - start_time) * 1000
+          # Record error
+          @metrics_collector.record_error(e, context: ctx.to_h)
+          # Record failed performance
+          @metrics_collector.record_performance(
+            operation: "decide",
+            duration_ms: duration_ms,
+            success: false,
+            metadata: { error_class: e.class.name }
+          )
+          raise
+        end
+      end
+      # Delegate other methods to the wrapped agent
+      def method_missing(method, ...)
+        @agent.send(method, ...)
+      end
+      def respond_to_missing?(method, include_private = false)
+        @agent.respond_to?(method, include_private) || super
+      end
+    end
+  end
+end