RubyGems - decision_agent - Versions diffs - 0.2.0 → 1.0.1 - Mend

decision_agent 0.2.0 → 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (126) hide show

checksums.yaml +4 -4
data/README.md +313 -8
data/bin/decision_agent +104 -0
data/lib/decision_agent/agent.rb +72 -1
data/lib/decision_agent/context.rb +1 -0
data/lib/decision_agent/data_enrichment/cache/memory_adapter.rb +86 -0
data/lib/decision_agent/data_enrichment/cache_adapter.rb +49 -0
data/lib/decision_agent/data_enrichment/circuit_breaker.rb +135 -0
data/lib/decision_agent/data_enrichment/client.rb +220 -0
data/lib/decision_agent/data_enrichment/config.rb +78 -0
data/lib/decision_agent/data_enrichment/errors.rb +36 -0
data/lib/decision_agent/decision.rb +102 -2
data/lib/decision_agent/dmn/adapter.rb +135 -0
data/lib/decision_agent/dmn/cache.rb +306 -0
data/lib/decision_agent/dmn/decision_graph.rb +327 -0
data/lib/decision_agent/dmn/decision_tree.rb +192 -0
data/lib/decision_agent/dmn/errors.rb +30 -0
data/lib/decision_agent/dmn/exporter.rb +217 -0
data/lib/decision_agent/dmn/feel/evaluator.rb +819 -0
data/lib/decision_agent/dmn/feel/functions.rb +420 -0
data/lib/decision_agent/dmn/feel/parser.rb +349 -0
data/lib/decision_agent/dmn/feel/simple_parser.rb +276 -0
data/lib/decision_agent/dmn/feel/transformer.rb +372 -0
data/lib/decision_agent/dmn/feel/types.rb +276 -0
data/lib/decision_agent/dmn/importer.rb +77 -0
data/lib/decision_agent/dmn/model.rb +197 -0
data/lib/decision_agent/dmn/parser.rb +191 -0
data/lib/decision_agent/dmn/testing.rb +333 -0
data/lib/decision_agent/dmn/validator.rb +315 -0
data/lib/decision_agent/dmn/versioning.rb +229 -0
data/lib/decision_agent/dmn/visualizer.rb +513 -0
data/lib/decision_agent/dsl/condition_evaluator.rb +984 -838
data/lib/decision_agent/dsl/schema_validator.rb +53 -14
data/lib/decision_agent/evaluators/dmn_evaluator.rb +308 -0
data/lib/decision_agent/evaluators/json_rule_evaluator.rb +69 -9
data/lib/decision_agent/explainability/condition_trace.rb +83 -0
data/lib/decision_agent/explainability/explainability_result.rb +52 -0
data/lib/decision_agent/explainability/rule_trace.rb +39 -0
data/lib/decision_agent/explainability/trace_collector.rb +24 -0
data/lib/decision_agent/monitoring/alert_manager.rb +5 -1
data/lib/decision_agent/simulation/errors.rb +18 -0
data/lib/decision_agent/simulation/impact_analyzer.rb +498 -0
data/lib/decision_agent/simulation/monte_carlo_simulator.rb +635 -0
data/lib/decision_agent/simulation/replay_engine.rb +486 -0
data/lib/decision_agent/simulation/scenario_engine.rb +318 -0
data/lib/decision_agent/simulation/scenario_library.rb +163 -0
data/lib/decision_agent/simulation/shadow_test_engine.rb +287 -0
data/lib/decision_agent/simulation/what_if_analyzer.rb +1002 -0
data/lib/decision_agent/simulation.rb +17 -0
data/lib/decision_agent/version.rb +1 -1
data/lib/decision_agent/versioning/activerecord_adapter.rb +23 -8
data/lib/decision_agent/web/dmn_editor.rb +426 -0
data/lib/decision_agent/web/public/app.js +119 -0
data/lib/decision_agent/web/public/dmn-editor.css +596 -0
data/lib/decision_agent/web/public/dmn-editor.html +250 -0
data/lib/decision_agent/web/public/dmn-editor.js +553 -0
data/lib/decision_agent/web/public/index.html +52 -0
data/lib/decision_agent/web/public/simulation.html +130 -0
data/lib/decision_agent/web/public/simulation_impact.html +478 -0
data/lib/decision_agent/web/public/simulation_replay.html +551 -0
data/lib/decision_agent/web/public/simulation_shadow.html +546 -0
data/lib/decision_agent/web/public/simulation_whatif.html +532 -0
data/lib/decision_agent/web/public/styles.css +86 -0
data/lib/decision_agent/web/server.rb +1059 -23
data/lib/decision_agent.rb +60 -2
metadata +105 -61
data/spec/ab_testing/ab_test_assignment_spec.rb +0 -253
data/spec/ab_testing/ab_test_manager_spec.rb +0 -612
data/spec/ab_testing/ab_test_spec.rb +0 -270
data/spec/ab_testing/ab_testing_agent_spec.rb +0 -481
data/spec/ab_testing/storage/adapter_spec.rb +0 -64
data/spec/ab_testing/storage/memory_adapter_spec.rb +0 -485
data/spec/activerecord_thread_safety_spec.rb +0 -553
data/spec/advanced_operators_spec.rb +0 -3150
data/spec/agent_spec.rb +0 -289
data/spec/api_contract_spec.rb +0 -430
data/spec/audit_adapters_spec.rb +0 -92
data/spec/auth/access_audit_logger_spec.rb +0 -394
data/spec/auth/authenticator_spec.rb +0 -112
data/spec/auth/password_reset_spec.rb +0 -294
data/spec/auth/permission_checker_spec.rb +0 -207
data/spec/auth/permission_spec.rb +0 -73
data/spec/auth/rbac_adapter_spec.rb +0 -550
data/spec/auth/rbac_config_spec.rb +0 -82
data/spec/auth/role_spec.rb +0 -51
data/spec/auth/session_manager_spec.rb +0 -172
data/spec/auth/session_spec.rb +0 -112
data/spec/auth/user_spec.rb +0 -130
data/spec/comprehensive_edge_cases_spec.rb +0 -1777
data/spec/context_spec.rb +0 -127
data/spec/decision_agent_spec.rb +0 -96
data/spec/decision_spec.rb +0 -423
data/spec/dsl/condition_evaluator_spec.rb +0 -774
data/spec/dsl_validation_spec.rb +0 -648
data/spec/edge_cases_spec.rb +0 -353
data/spec/evaluation_spec.rb +0 -364
data/spec/evaluation_validator_spec.rb +0 -165
data/spec/examples/feedback_aware_evaluator_spec.rb +0 -460
data/spec/examples.txt +0 -1633
data/spec/issue_verification_spec.rb +0 -759
data/spec/json_rule_evaluator_spec.rb +0 -587
data/spec/monitoring/alert_manager_spec.rb +0 -378
data/spec/monitoring/metrics_collector_spec.rb +0 -499
data/spec/monitoring/monitored_agent_spec.rb +0 -222
data/spec/monitoring/prometheus_exporter_spec.rb +0 -242
data/spec/monitoring/storage/activerecord_adapter_spec.rb +0 -498
data/spec/monitoring/storage/base_adapter_spec.rb +0 -61
data/spec/monitoring/storage/memory_adapter_spec.rb +0 -247
data/spec/performance_optimizations_spec.rb +0 -486
data/spec/replay_edge_cases_spec.rb +0 -699
data/spec/replay_spec.rb +0 -210
data/spec/rfc8785_canonicalization_spec.rb +0 -215
data/spec/scoring_spec.rb +0 -225
data/spec/spec_helper.rb +0 -60
data/spec/testing/batch_test_importer_spec.rb +0 -693
data/spec/testing/batch_test_runner_spec.rb +0 -307
data/spec/testing/test_coverage_analyzer_spec.rb +0 -292
data/spec/testing/test_result_comparator_spec.rb +0 -392
data/spec/testing/test_scenario_spec.rb +0 -113
data/spec/thread_safety_spec.rb +0 -482
data/spec/thread_safety_spec.rb.broken +0 -878
data/spec/versioning/adapter_spec.rb +0 -156
data/spec/versioning_spec.rb +0 -1030
data/spec/web/middleware/auth_middleware_spec.rb +0 -133
data/spec/web/middleware/permission_middleware_spec.rb +0 -247
data/spec/web_ui_rack_spec.rb +0 -1840

data/lib/decision_agent/simulation/shadow_test_engine.rb ADDED Viewed

@@ -0,0 +1,287 @@
+require_relative "errors"
+module DecisionAgent
+  module Simulation
+    # Engine for shadow testing - comparing new rules against production without affecting outcomes
+    class ShadowTestEngine
+      attr_reader :production_agent, :version_manager
+      def initialize(production_agent:, version_manager: nil)
+        @production_agent = production_agent
+        @version_manager = version_manager || Versioning::VersionManager.new
+      end
+      # Execute shadow test - compare shadow version against production
+      # @param context [Hash, Context] Context for decision
+      # @param shadow_version [String, Integer, Hash] Shadow rule version to test
+      # @param options [Hash] Test options
+      #   - :track_differences [Boolean] Track and return differences (default: true)
+      #   - :record_results [Boolean] Record results for later analysis (default: false)
+      # @return [Hash] Shadow test result
+      def test(context:, shadow_version:, options: {})
+        options = {
+          track_differences: true,
+          record_results: false
+        }.merge(options)
+        ctx = normalize_context(context)
+        production_decision = execute_production_decision(ctx)
+        shadow_decision = execute_shadow_decision(ctx, shadow_version)
+        result = build_comparison_result(ctx, production_decision, shadow_decision)
+        add_differences(result, production_decision, shadow_decision) if options[:track_differences] && !result[:matches]
+        record_result(result, shadow_version) if options[:record_results]
+        result
+      end
+      def normalize_context(context)
+        context.is_a?(Context) ? context : Context.new(context)
+      end
+      def execute_production_decision(context)
+        @production_agent.decide(context: context)
+      rescue NoEvaluationsError
+        nil
+      end
+      def execute_shadow_decision(context, shadow_version)
+        shadow_agent = build_shadow_agent(shadow_version)
+        shadow_agent.decide(context: context)
+      rescue NoEvaluationsError
+        nil
+      end
+      def build_comparison_result(context, production_decision, shadow_decision)
+        {
+          context: context.to_h,
+          production_decision: production_decision&.decision,
+          production_confidence: production_decision&.confidence || 0.0,
+          shadow_decision: shadow_decision&.decision,
+          shadow_confidence: shadow_decision&.confidence || 0.0,
+          matches: production_decision&.decision == shadow_decision&.decision,
+          confidence_delta: (shadow_decision&.confidence || 0.0) - (production_decision&.confidence || 0.0),
+          timestamp: Time.now.utc.iso8601
+        }
+      end
+      def add_differences(result, production_decision, shadow_decision)
+        result[:differences] = {
+          decision_mismatch: true,
+          production_explanations: production_decision&.explanations || [],
+          shadow_explanations: shadow_decision&.explanations || []
+        }
+      end
+      # Batch shadow test multiple contexts
+      # @param contexts [Array<Hash>] Array of contexts to test
+      # @param shadow_version [String, Integer, Hash] Shadow rule version
+      # @param options [Hash] Test options
+      #   - :parallel [Boolean] Use parallel execution (default: true)
+      #   - :thread_count [Integer] Number of threads (default: 4)
+      #   - :progress_callback [Proc] Progress callback
+      # @return [Hash] Batch shadow test results
+      def batch_test(contexts:, shadow_version:, options: {})
+        options = {
+          parallel: true,
+          thread_count: 4,
+          progress_callback: nil,
+          track_differences: true,
+          record_results: false
+        }.merge(options)
+        shadow_agent = build_shadow_agent(shadow_version)
+        results = execute_contexts_with_progress(contexts, shadow_version, shadow_agent, options)
+        build_batch_report(results)
+      end
+      def execute_contexts_with_progress(contexts, shadow_version, shadow_agent, options)
+        results = []
+        mutex = Mutex.new
+        progress_tracker = ProgressTracker.new(contexts.size, options[:progress_callback])
+        if options[:parallel] && contexts.size > 1
+          execute_parallel(contexts, shadow_agent, options, mutex) do |result|
+            mutex.synchronize do
+              results << result
+              progress_tracker.increment
+            end
+          end
+        else
+          execute_sequential_contexts(contexts, shadow_version, options, results, progress_tracker)
+        end
+        results
+      end
+      def execute_sequential_contexts(contexts, shadow_version, options, results, progress_tracker)
+        contexts.each_with_index do |context, _index|
+          result = test(context: context, shadow_version: shadow_version, options: options)
+          results << result
+          progress_tracker.increment
+        end
+      end
+      # Helper class for tracking progress
+      class ProgressTracker
+        def initialize(total, callback)
+          @total = total
+          @callback = callback
+          @completed = 0
+        end
+        def increment
+          @completed += 1
+          return unless @callback
+          @callback.call(
+            completed: @completed,
+            total: @total,
+            percentage: (@completed.to_f / @total * 100).round(2)
+          )
+        end
+      end
+      # Get shadow test summary statistics
+      # @param shadow_version [String, Integer, Hash] Shadow version ID
+      # @return [Hash] Summary statistics
+      def get_summary(_shadow_version)
+        # In a real implementation, this would query stored results
+        # For now, return empty summary
+        {
+          total_tests: 0,
+          matches: 0,
+          mismatches: 0,
+          match_rate: 0.0,
+          average_confidence_delta: 0.0
+        }
+      end
+      private
+      def build_shadow_agent(shadow_version)
+        version_hash = resolve_version(shadow_version)
+        evaluators = build_evaluators_from_version(version_hash)
+        Agent.new(
+          evaluators: evaluators,
+          scoring_strategy: @production_agent.scoring_strategy,
+          audit_adapter: Audit::NullAdapter.new
+        )
+      end
+      def resolve_version(version)
+        case version
+        when String, Integer
+          version_data = @version_manager.get_version(version_id: version)
+          raise InvalidShadowTestError, "Shadow version not found: #{version}" unless version_data
+          version_data
+        when Hash
+          version
+        else
+          raise InvalidShadowTestError, "Invalid shadow version format: #{version.class}"
+        end
+      end
+      def build_evaluators_from_version(version)
+        content = version[:content] || version["content"]
+        raise InvalidShadowTestError, "Shadow version has no content" unless content
+        if content.is_a?(Hash) && content[:evaluators]
+          build_evaluators_from_config(content[:evaluators])
+        elsif content.is_a?(Hash) && (content[:rules] || content["rules"])
+          [Evaluators::JsonRuleEvaluator.new(rules_json: content)]
+        else
+          raise InvalidShadowTestError, "Cannot build evaluators from shadow version"
+        end
+      end
+      def build_evaluators_from_config(configs)
+        Array(configs).map do |config|
+          case config[:type] || config["type"]
+          when "json_rule"
+            Evaluators::JsonRuleEvaluator.new(rules_json: config[:rules] || config["rules"])
+          when "dmn"
+            model = config[:model] || config["model"]
+            decision_id = config[:decision_id] || config["decision_id"]
+            Evaluators::DmnEvaluator.new(model: model, decision_id: decision_id)
+          else
+            raise InvalidShadowTestError, "Unknown evaluator type: #{config[:type]}"
+          end
+        end
+      end
+      def execute_parallel(contexts, shadow_agent, options, _mutex, &block)
+        thread_count = [options[:thread_count], contexts.size].min
+        queue = Queue.new
+        contexts.each { |c| queue << c }
+        threads = Array.new(thread_count) do
+          Thread.new do
+            process_contexts_from_queue(queue, shadow_agent, options, &block)
+          end
+        end
+        threads.each(&:join)
+      end
+      def process_contexts_from_queue(queue, shadow_agent, options)
+        loop do
+          context = dequeue_context(queue)
+          break unless context
+          ctx = normalize_context(context)
+          production_decision = execute_production_decision(ctx)
+          shadow_decision = execute_shadow_decision_in_parallel(ctx, shadow_agent)
+          result = build_comparison_result(ctx, production_decision, shadow_decision)
+          add_differences(result, production_decision, shadow_decision) if options[:track_differences] && !result[:matches]
+          yield result
+        end
+      end
+      def dequeue_context(queue)
+        queue.pop(true)
+      rescue StandardError
+        nil
+      end
+      def execute_shadow_decision_in_parallel(context, shadow_agent)
+        shadow_agent.decide(context: context)
+      rescue NoEvaluationsError
+        nil
+      end
+      def record_result(_result, shadow_version)
+        # In a real implementation, this would store results in a database or file
+        # For now, this is a placeholder
+        shadow_version.is_a?(Hash) ? shadow_version[:id] || shadow_version["id"] : shadow_version
+        # Store result for later analysis
+      end
+      def build_batch_report(results)
+        total = results.size
+        matches = results.count { |r| r[:matches] }
+        mismatches = total - matches
+        confidence_deltas = results.map { |r| r[:confidence_delta] }.compact
+        {
+          total_tests: total,
+          matches: matches,
+          mismatches: mismatches,
+          match_rate: total.positive? ? (matches.to_f / total) : 0,
+          average_confidence_delta: confidence_deltas.any? ? confidence_deltas.sum / confidence_deltas.size : 0,
+          max_confidence_delta: confidence_deltas.map(&:abs).max || 0,
+          decision_distribution: {
+            production: results.group_by { |r| r[:production_decision] }.transform_values(&:count),
+            shadow: results.group_by { |r| r[:shadow_decision] }.transform_values(&:count)
+          },
+          mismatched_results: results.reject { |r| r[:matches] },
+          results: results
+        }
+      end
+    end
+  end
+end