RubyGems - ace-review - Versions diffs - 0.49.0 - Mend

ace-review 0.49.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (108) hide show

checksums.yaml +7 -0
data/.ace-defaults/nav/protocols/guide-sources/ace-review.yml +10 -0
data/.ace-defaults/nav/protocols/prompt-sources/ace-review.yml +36 -0
data/.ace-defaults/nav/protocols/tmpl-sources/ace-review.yml +10 -0
data/.ace-defaults/nav/protocols/wfi-sources/ace-review.yml +19 -0
data/.ace-defaults/review/config.yml +79 -0
data/.ace-defaults/review/presets/code-fit.yml +64 -0
data/.ace-defaults/review/presets/code-shine.yml +44 -0
data/.ace-defaults/review/presets/code-valid.yml +39 -0
data/.ace-defaults/review/presets/docs.yml +42 -0
data/.ace-defaults/review/presets/spec.yml +37 -0
data/CHANGELOG.md +1780 -0
data/LICENSE +21 -0
data/README.md +42 -0
data/Rakefile +14 -0
data/exe/ace-review +27 -0
data/exe/ace-review-feedback +17 -0
data/handbook/guides/code-review-process.g.md +234 -0
data/handbook/prompts/base/sections.md +23 -0
data/handbook/prompts/base/system.md +60 -0
data/handbook/prompts/focus/architecture/atom.md +30 -0
data/handbook/prompts/focus/architecture/reflection.md +60 -0
data/handbook/prompts/focus/frameworks/rails.md +40 -0
data/handbook/prompts/focus/frameworks/vue-firebase.md +45 -0
data/handbook/prompts/focus/languages/ruby.md +50 -0
data/handbook/prompts/focus/phase/correctness.md +51 -0
data/handbook/prompts/focus/phase/polish.md +43 -0
data/handbook/prompts/focus/phase/quality.md +42 -0
data/handbook/prompts/focus/quality/performance.md +48 -0
data/handbook/prompts/focus/quality/security.md +47 -0
data/handbook/prompts/focus/scope/docs.md +38 -0
data/handbook/prompts/focus/scope/spec.md +58 -0
data/handbook/prompts/focus/scope/tests.md +36 -0
data/handbook/prompts/format/compact.md +12 -0
data/handbook/prompts/format/detailed.md +39 -0
data/handbook/prompts/format/standard.md +16 -0
data/handbook/prompts/guidelines/icons.md +19 -0
data/handbook/prompts/guidelines/tone.md +21 -0
data/handbook/prompts/synthesis-review-reports.system.md +318 -0
data/handbook/prompts/synthesize-feedback.system.md +147 -0
data/handbook/skills/as-review-apply-feedback/SKILL.md +39 -0
data/handbook/skills/as-review-package/SKILL.md +36 -0
data/handbook/skills/as-review-pr/SKILL.md +38 -0
data/handbook/skills/as-review-run/SKILL.md +30 -0
data/handbook/skills/as-review-verify-feedback/SKILL.md +31 -0
data/handbook/templates/review-tasks/task-review-summary.template.md +148 -0
data/handbook/workflow-instructions/review/apply-feedback.wf.md +212 -0
data/handbook/workflow-instructions/review/package.wf.md +16 -0
data/handbook/workflow-instructions/review/pr.wf.md +284 -0
data/handbook/workflow-instructions/review/run.wf.md +262 -0
data/handbook/workflow-instructions/review/verify-feedback.wf.md +286 -0
data/lib/ace/review/atoms/context_limit_resolver.rb +162 -0
data/lib/ace/review/atoms/diff_boundary_finder.rb +133 -0
data/lib/ace/review/atoms/feedback_id_generator.rb +66 -0
data/lib/ace/review/atoms/feedback_slug_generator.rb +61 -0
data/lib/ace/review/atoms/feedback_state_validator.rb +98 -0
data/lib/ace/review/atoms/pr_comment_formatter.rb +325 -0
data/lib/ace/review/atoms/preset_validator.rb +103 -0
data/lib/ace/review/atoms/priority_filter.rb +115 -0
data/lib/ace/review/atoms/retry_with_backoff.rb +75 -0
data/lib/ace/review/atoms/slug_generator.rb +50 -0
data/lib/ace/review/atoms/token_estimator.rb +86 -0
data/lib/ace/review/cli/commands/feedback/create.rb +173 -0
data/lib/ace/review/cli/commands/feedback/list.rb +280 -0
data/lib/ace/review/cli/commands/feedback/resolve.rb +109 -0
data/lib/ace/review/cli/commands/feedback/session_discovery.rb +70 -0
data/lib/ace/review/cli/commands/feedback/show.rb +177 -0
data/lib/ace/review/cli/commands/feedback/skip.rb +125 -0
data/lib/ace/review/cli/commands/feedback/verify.rb +149 -0
data/lib/ace/review/cli/commands/feedback.rb +79 -0
data/lib/ace/review/cli/commands/review.rb +378 -0
data/lib/ace/review/cli/feedback_cli.rb +71 -0
data/lib/ace/review/cli.rb +103 -0
data/lib/ace/review/errors.rb +146 -0
data/lib/ace/review/models/feedback_item.rb +216 -0
data/lib/ace/review/models/review_options.rb +208 -0
data/lib/ace/review/models/reviewer.rb +181 -0
data/lib/ace/review/molecules/context_composer.rb +123 -0
data/lib/ace/review/molecules/context_extractor.rb +159 -0
data/lib/ace/review/molecules/feedback_directory_manager.rb +183 -0
data/lib/ace/review/molecules/feedback_file_reader.rb +178 -0
data/lib/ace/review/molecules/feedback_file_writer.rb +210 -0
data/lib/ace/review/molecules/feedback_synthesizer.rb +588 -0
data/lib/ace/review/molecules/gh_cli_executor.rb +124 -0
data/lib/ace/review/molecules/gh_comment_poster.rb +205 -0
data/lib/ace/review/molecules/gh_comment_resolver.rb +199 -0
data/lib/ace/review/molecules/gh_pr_comment_fetcher.rb +408 -0
data/lib/ace/review/molecules/gh_pr_fetcher.rb +240 -0
data/lib/ace/review/molecules/llm_executor.rb +142 -0
data/lib/ace/review/molecules/multi_model_executor.rb +278 -0
data/lib/ace/review/molecules/nav_prompt_resolver.rb +145 -0
data/lib/ace/review/molecules/pr_task_spec_resolver.rb +58 -0
data/lib/ace/review/molecules/preset_manager.rb +494 -0
data/lib/ace/review/molecules/prompt_composer.rb +76 -0
data/lib/ace/review/molecules/prompt_resolver.rb +168 -0
data/lib/ace/review/molecules/strategies/adaptive_strategy.rb +193 -0
data/lib/ace/review/molecules/strategies/chunked_strategy.rb +459 -0
data/lib/ace/review/molecules/strategies/full_strategy.rb +114 -0
data/lib/ace/review/molecules/subject_extractor.rb +315 -0
data/lib/ace/review/molecules/subject_filter.rb +199 -0
data/lib/ace/review/molecules/subject_strategy.rb +96 -0
data/lib/ace/review/molecules/task_report_saver.rb +161 -0
data/lib/ace/review/molecules/task_resolver.rb +48 -0
data/lib/ace/review/organisms/feedback_manager.rb +386 -0
data/lib/ace/review/organisms/review_manager.rb +1059 -0
data/lib/ace/review/version.rb +7 -0
data/lib/ace/review.rb +135 -0
metadata +351 -0

data/lib/ace/review/molecules/subject_extractor.rb ADDED Viewed

@@ -0,0 +1,315 @@
+# frozen_string_literal: true
+require "yaml"
+require "open3"
+require "timeout"
+require "ace/support/config"
+require "ace/core/atoms/process_terminator" # Keep from ace-support-core for process cleanup
+require "ace/git"
+require_relative "../errors"
+module Ace
+  module Review
+    module Molecules
+      # Parses review subjects and returns ace-bundle configuration
+      # Delegates actual content extraction to ace-bundle
+      #
+      # == Config Passthrough API
+      #
+      # The primary API returns ace-bundle config hashes that ReviewManager
+      # passes directly to ace-bundle via user.context.md:
+      #
+      # - {#parse_typed_subject_config} - Single typed subject (pr:, diff:, files:, task:)
+      # - {#merge_typed_subject_configs} - Multiple subjects merged into one config
+      #
+      # This avoids extracting content only to save it to a file and re-read it.
+      #
+      class SubjectExtractor
+        # @param options [Hash] Configuration options
+        # @option options [Integer] :taskflow_timeout Timeout for ace-task subprocess (default: 10s)
+        def initialize(options = {})
+          @taskflow_timeout = options[:taskflow_timeout] || TASKFLOW_TIMEOUT
+        end
+        # Extract subject from configuration
+        # @param subject_config [String, Hash] subject configuration
+        # @return [String] extracted subject content
+        # @note Prefer parse_typed_subject_config or merge_typed_subject_configs for new code
+        def extract(subject_config)
+          return "" unless subject_config
+          case subject_config
+          when String
+            extract_from_string(subject_config)
+          when Hash
+            extract_from_hash(subject_config)
+          else
+            ""
+          end
+        end
+        # Parse typed subject string and return ace-bundle config
+        # Does NOT extract content - returns config for direct use with ace-bundle
+        # @param input [String] typed subject like "pr:77", "files:*.rb", "diff:HEAD~3"
+        # @return [Hash, nil] ace-bundle config hash or nil if not a typed subject
+        def parse_typed_subject_config(input)
+          return nil unless input.is_a?(String)
+          parse_typed_subject(input)
+        end
+        # Merge multiple subjects into unified ace-bundle config
+        # Does NOT extract content - returns merged config for direct use with ace-bundle
+        # Uses Config.merge() with :coerce_union strategy for consistent merge behavior
+        # @param subjects [Array<String, Hash>] array of subject configurations
+        # @return [Hash, nil] merged ace-bundle config hash or nil if empty
+        def merge_typed_subject_configs(subjects)
+          return nil unless subjects.is_a?(Array) && subjects.any?
+          # Use Config objects with :coerce_union strategy to progressively merge subjects
+          # This enables future per-key merge strategies via _merge directive
+          initial_config = Ace::Support::Config::Models::Config.new({}, merge_strategy: :coerce_union)
+          merged_config = subjects.reduce(initial_config) do |acc, subject|
+            config_hash = resolve_single_subject(subject)
+            acc.merge(config_hash)
+          end
+          merged_config.empty? ? nil : merged_config.to_h
+        end
+        private
+        # Deep merge configs with array concatenation, dedup, and recursive hash merging
+        # Uses Config.merge() with :coerce_union strategy for consistent merge behavior
+        #
+        # @param base [Hash] base configuration hash
+        # @param overlay [Hash] overlay configuration hash
+        # @return [Hash] merged configuration (new hash, does not mutate inputs)
+        def deep_merge_arrays(base, overlay)
+          Ace::Support::Config::Models::Config.new(base, merge_strategy: :coerce_union)
+            .merge(overlay)
+            .to_h
+        end
+        # Resolve a single subject to ace-bundle config
+        # @param subject [String, Hash] single subject configuration
+        # @return [Hash] ace-bundle config hash
+        def resolve_single_subject(subject)
+          case subject
+          when String
+            parse_typed_subject(subject) || parse_keyword_or_pattern(subject)
+          when Hash
+            subject
+          else
+            {}
+          end
+        end
+        def extract_from_string(input)
+          # Try typed subject first (new)
+          if (typed_config = parse_typed_subject(input))
+            return use_ace_bundle(typed_config)
+          end
+          # Try to parse as YAML first
+          begin
+            parsed = YAML.safe_load(input)
+            return extract_from_hash(parsed) if parsed.is_a?(Hash)
+          rescue Psych::SyntaxError
+            # Continue with string processing
+          end
+          use_ace_bundle(parse_keyword_or_pattern(input))
+        end
+        # Parse special keywords and auto-detect patterns
+        # @param input [String] input string to parse
+        # @return [Hash] ace-bundle config hash
+        def parse_keyword_or_pattern(input)
+          case input.downcase
+          when "staged"
+            {"diffs" => ["--staged"]}
+          when "working", "unstaged"
+            {"diffs" => [""]}
+          when "pr", "pull-request"
+            tracking = Ace::Git::Molecules::BranchReader.tracking_branch
+            range = tracking ? "#{tracking}...HEAD" : "origin/main...HEAD"
+            {"diffs" => [range]}
+          else
+            auto_detect_pattern(input)
+          end
+        end
+        # Auto-detect whether input is a git range or file pattern
+        # @param input [String] input string to analyze
+        # @return [Hash] ace-bundle config hash
+        def auto_detect_pattern(input)
+          if looks_like_git_range?(input)
+            {"diffs" => [input]}
+          elsif input.include?("*") || input.include?("/")
+            {"files" => [input]}
+          else
+            # Default to git diff
+            {"diffs" => [input]}
+          end
+        end
+        def extract_from_hash(config)
+          # Pass configuration directly to ace-bundle without transformation
+          use_ace_bundle(config)
+        end
+        def use_ace_bundle(config)
+          # Use ace-bundle for unified content extraction
+          # Pass config directly as inline YAML - ace-bundle's load_inline_yaml
+          # supports both flat keys (files, diffs, commands, pr) and nested
+          # structure (bundle: { diffs: [...] }) for typed subject compatibility
+          context_md = "#{YAML.dump(config).strip}\n---\n\n"
+          result = Ace::Bundle.load_auto(context_md, format: "markdown")
+          result.content
+        rescue => e
+          warn "ace-bundle extraction failed: #{e.message}" if Ace::Review.debug?
+          ""
+        end
+        def parse_typed_subject(input)
+          case input
+          when /^diff:(.+)$/
+            {"bundle" => {"diffs" => [::Regexp.last_match(1)]}}
+          when /^diff:$/
+            raise ArgumentError, "Empty value for diff: subject. Usage: diff:RANGE (e.g., diff:HEAD~3...HEAD)"
+          when /^pr:(.+)$/
+            pr_refs = ::Regexp.last_match(1).split(",").map(&:strip).reject(&:empty?).uniq
+            if pr_refs.empty?
+              raise ArgumentError, "No valid PR references provided. Usage: pr:REF (e.g., pr:123, pr:owner/repo#456)"
+            end
+            # Pre-validate PR refs for early error feedback using ace-git's parser
+            # Supports: simple numbers (123), qualified refs (owner/repo#456), GitHub URLs
+            pr_refs.each do |ref|
+              Ace::Git::Atoms::PrIdentifierParser.parse(ref)
+            end
+            {"bundle" => {"pr" => pr_refs}}
+          when /^pr:$/
+            raise ArgumentError, "Empty value for pr: subject. Usage: pr:NUMBER (e.g., pr:123)"
+          when /^files:(.+)$/
+            file_patterns = ::Regexp.last_match(1).split(",").map(&:strip).reject(&:empty?)
+            if file_patterns.empty?
+              raise ArgumentError, "No valid file patterns provided. Usage: files:PATTERN (e.g., files:src/**/*.rb)"
+            end
+            {"bundle" => {"files" => file_patterns}}
+          when /^files:$/
+            raise ArgumentError, "Empty value for files: subject. Usage: files:PATTERN (e.g., files:src/**/*.rb)"
+          when /^commit:(.+)$/
+            commit_hash = ::Regexp.last_match(1).strip
+            if commit_hash.empty?
+              raise ArgumentError, "Empty value for commit: subject. Usage: commit:HASH"
+            end
+            # Normalize to lowercase for validation (git hashes are lowercase)
+            commit_hash = commit_hash.downcase
+            # Validate hash format: 6-40 hexadecimal characters
+            unless commit_hash.match?(/\A[a-f0-9]{6,40}\z/)
+              raise ArgumentError, "Invalid commit hash format: '#{commit_hash}'. Must be 6-40 hexadecimal characters."
+            end
+            {"bundle" => {"diffs" => ["#{commit_hash}~1..#{commit_hash}"]}}
+          when /^commit:$/
+            raise ArgumentError, "Empty value for commit: subject. Usage: commit:HASH"
+          when /^task:(.+)$/
+            resolve_task_subject(::Regexp.last_match(1), timeout: @taskflow_timeout)
+          when /^task:$/
+            raise ArgumentError, "Empty value for task: subject. Usage: task:REF (e.g., task:145)"
+          else
+            nil  # Fall through to existing parsing
+          end
+        end
+        # Default timeout for ace-task subprocess (in seconds)
+        # Can be overridden via options for environments with slow I/O
+        TASKFLOW_TIMEOUT = 10
+        def resolve_task_subject(ref, timeout: TASKFLOW_TIMEOUT)
+          # Validate ref format to prevent injection (alphanumeric, dots, dashes, plus only)
+          # Plus is needed for qualified task refs like v.0.9.0+task.145
+          unless ref.match?(/\A[\w.\-+]+\z/)
+            raise ArgumentError, "Invalid task reference format: #{ref}"
+          end
+          # Use Open3.popen3 with PID tracking for proper timeout handling
+          # Ensures child process is terminated on timeout (prevents orphaned processes)
+          stdout, status = execute_taskflow_with_timeout(ref, timeout)
+          unless status&.success?
+            raise Errors::TaskNotFoundError, ref
+          end
+          task_path = stdout.strip
+          if task_path.empty?
+            raise Errors::TaskPathNotFoundError, ref
+          end
+          # ace-task 'task REF --path' returns the path to the main task file
+          # (e.g., .ace-task/v.0.9.0/tasks/145-feature/145.s.md).
+          # We use File.dirname to get the task's directory and glob for all
+          # solution files (*.s.md) within it - this includes the main task
+          # and any subtasks (145.01.s.md, 145.02.s.md, etc.)
+          {"bundle" => {"files" => ["#{File.dirname(task_path)}/**/*.s.md"]}}
+        end
+        # Execute ace-task with timeout and proper process cleanup
+        # @param ref [String] Task reference
+        # @param timeout_seconds [Integer] Timeout in seconds
+        # @return [Array] stdout, status
+        # @raise [Errors::MissingDependencyError] if ace-task not installed
+        # @raise [Errors::CommandTimeoutError] if command exceeds timeout
+        def execute_taskflow_with_timeout(ref, timeout_seconds)
+          pid = nil
+          stdout_str = ""
+          status = nil
+          begin
+            Timeout.timeout(timeout_seconds) do
+              stdout_str, _stderr, status, pid = run_taskflow_command(ref)
+            end
+          rescue Errno::ENOENT
+            raise Errors::MissingDependencyError.new("ace-task", install_command: "gem install ace-task")
+          rescue Timeout::Error
+            # Ensure child process is terminated on timeout
+            Ace::Core::Atoms::ProcessTerminator.terminate(pid) if pid
+            raise Errors::CommandTimeoutError.new("ace-task show #{ref} --path", timeout_seconds)
+          end
+          [stdout_str, status]
+        end
+        # Run ace-task command - can be stubbed in tests
+        # Uses Open3.popen3 with PID tracking for proper process cleanup on timeout
+        # @param ref [String] Task reference
+        # @return [Array] [stdout, stderr, status, pid]
+        def run_taskflow_command(ref)
+          stdout_str = ""
+          stderr_str = ""
+          status = nil
+          pid = nil
+          Open3.popen3("ace-task", "show", ref, "--path") do |_stdin, stdout, stderr, wait_thr|
+            pid = wait_thr.pid
+            stdout_str = stdout.read
+            stderr_str = stderr.read
+            status = wait_thr.value
+          end
+          [stdout_str, stderr_str, status, pid]
+        end
+        def looks_like_git_range?(input)
+          input.include?("..") ||
+            input.include?("HEAD") ||
+            input.include?("~") ||
+            input.include?("^") ||
+            input.match?(/^[a-f0-9]{6,40}/)
+        end
+      end
+    end
+  end
+end

data/lib/ace/review/molecules/subject_filter.rb ADDED Viewed

@@ -0,0 +1,199 @@
+# frozen_string_literal: true
+module Ace
+  module Review
+    module Molecules
+      # Pure module for filtering review subjects based on file patterns.
+      #
+      # Provides file pattern matching logic for filtering diff content,
+      # file lists, and bundle sections. Uses glob patterns with include/exclude
+      # semantics following the standard: include patterns whitelist files,
+      # exclude patterns blacklist them.
+      #
+      # @example Filtering a diff
+      #   patterns = { "include" => ["lib/**/*.rb"], "exclude" => ["**/*_test.rb"] }
+      #   SubjectFilter.filter(diff_string, patterns)
+      #
+      # @example Checking file match
+      #   SubjectFilter.matches_file?("lib/models/user.rb", patterns)
+      #   #=> true
+      #
+      module SubjectFilter
+        # File.fnmatch flags for glob pattern matching
+        FNMATCH_FLAGS = File::FNM_PATHNAME | File::FNM_EXTGLOB
+        # Filter subject content based on file patterns
+        #
+        # Dispatches to appropriate filter method based on subject type.
+        # Returns subject unchanged if no patterns configured.
+        #
+        # @param subject [String, Hash] Subject to filter (diff string or hash)
+        # @param file_patterns [Hash, nil] File patterns with include/exclude arrays
+        # @return [String, Hash] Filtered subject
+        def self.filter(subject, file_patterns)
+          return subject unless has_patterns?(file_patterns)
+          case subject
+          when String
+            filter_diff(subject, file_patterns)
+          when Hash
+            filter_hash(subject, file_patterns)
+          else
+            subject
+          end
+        end
+        # Filter diff content based on file patterns
+        #
+        # Splits diff into per-file chunks, filters by patterns, and rejoins.
+        # Uses the destination (b/) path for consistency with renamed files.
+        #
+        # @param diff_content [String] Git diff content
+        # @param file_patterns [Hash] File patterns with include/exclude arrays
+        # @return [String] Filtered diff with only matching files
+        def self.filter_diff(diff_content, file_patterns)
+          return diff_content unless has_patterns?(file_patterns)
+          # Split diff into file chunks
+          chunks = split_diff_into_chunks(diff_content)
+          # Filter chunks based on file patterns
+          filtered_chunks = chunks.select do |chunk|
+            file_path = extract_file_path_from_chunk(chunk)
+            file_path ? matches_file?(file_path, file_patterns) : true
+          end
+          filtered_chunks.join
+        end
+        # Filter subject hash based on file patterns
+        #
+        # Filters files arrays and bundle sections within the hash.
+        #
+        # @param subject [Hash] Subject hash with files or sections
+        # @param file_patterns [Hash] File patterns with include/exclude arrays
+        # @return [Hash] Filtered subject
+        def self.filter_hash(subject, file_patterns)
+          return subject unless has_patterns?(file_patterns)
+          result = normalize_keys(subject.dup)
+          # Filter files array if present
+          if result["files"].is_a?(Array)
+            result["files"] = result["files"].select { |f| matches_file?(f.to_s, file_patterns) }
+          end
+          # Filter bundle sections if present
+          if result["bundle"].is_a?(Hash) && result["bundle"]["sections"].is_a?(Hash)
+            result["bundle"] = normalize_keys(result["bundle"].dup)
+            result["bundle"]["sections"] = filter_bundle_sections(result["bundle"]["sections"], file_patterns)
+          end
+          result
+        end
+        # Filter bundle sections based on file patterns
+        #
+        # Recursively filters files arrays within each section.
+        #
+        # @param sections [Hash] Bundle sections
+        # @param file_patterns [Hash] File patterns with include/exclude arrays
+        # @return [Hash] Filtered sections
+        def self.filter_bundle_sections(sections, file_patterns)
+          filtered = {}
+          sections.each do |name, section|
+            section = normalize_keys(section) if section.is_a?(Hash)
+            if section.is_a?(Hash) && section["files"].is_a?(Array)
+              filtered_files = section["files"].select { |f| matches_file?(f.to_s, file_patterns) }
+              next if filtered_files.empty?
+              filtered[name] = section.merge("files" => filtered_files)
+            else
+              filtered[name] = section
+            end
+          end
+          filtered
+        end
+        # Check if a file path matches the given patterns
+        #
+        # Include patterns: file must match at least one (if any exist)
+        # Exclude patterns: file must not match any
+        #
+        # @param file_path [String] File path to check
+        # @param file_patterns [Hash] File patterns with include/exclude arrays
+        # @return [Boolean] True if file matches patterns
+        def self.matches_file?(file_path, file_patterns)
+          return true unless has_patterns?(file_patterns)
+          includes = file_patterns["include"] || []
+          excludes = file_patterns["exclude"] || []
+          # If include patterns exist, file must match at least one
+          if includes.any?
+            return false unless includes.any? { |pattern| File.fnmatch?(pattern, file_path, FNMATCH_FLAGS) }
+          end
+          # File must not match any exclude pattern
+          return false if excludes.any? { |pattern| File.fnmatch?(pattern, file_path, FNMATCH_FLAGS) }
+          true
+        end
+        # Check if file patterns are configured and non-empty
+        #
+        # @param file_patterns [Hash, nil] File patterns hash
+        # @return [Boolean] True if patterns are configured
+        def self.has_patterns?(file_patterns)
+          return false unless file_patterns.is_a?(Hash)
+          (file_patterns["include"].is_a?(Array) && file_patterns["include"].any?) ||
+            (file_patterns["exclude"].is_a?(Array) && file_patterns["exclude"].any?)
+        end
+        # Split diff content into per-file chunks
+        #
+        # @param diff_content [String] Git diff content
+        # @return [Array<String>] Array of diff chunks
+        def self.split_diff_into_chunks(diff_content)
+          chunks = diff_content.split(/(?=^diff --git )/m)
+          chunks.reject(&:empty?)
+        end
+        private_class_method :split_diff_into_chunks
+        # Extract file path from a diff chunk
+        #
+        # Uses the destination (b/) path for consistency with DiffBoundaryFinder.
+        # For renamed files, this ensures filtering uses the new name, not the old.
+        #
+        # @param chunk [String] Diff chunk
+        # @return [String, nil] File path or nil if not found
+        def self.extract_file_path_from_chunk(chunk)
+          # Match "diff --git a/path b/path" - use b/ side (destination path)
+          if chunk =~ /^diff --git a\/.+? b\/(.+?)$/m
+            return Regexp.last_match(1)
+          end
+          # Fallback to +++ header for edge cases
+          if chunk =~ /^\+\+\+ b\/(.+)$/
+            return Regexp.last_match(1)
+          end
+          nil
+        end
+        private_class_method :extract_file_path_from_chunk
+        # Normalize hash keys to strings
+        #
+        # @param hash [Hash] Hash with symbol or string keys
+        # @return [Hash] Hash with string keys
+        def self.normalize_keys(hash)
+          return {} unless hash.is_a?(Hash)
+          hash.transform_keys(&:to_s)
+        end
+        private_class_method :normalize_keys
+      end
+    end
+  end
+end

data/lib/ace/review/molecules/subject_strategy.rb ADDED Viewed

@@ -0,0 +1,96 @@
+# frozen_string_literal: true
+module Ace
+  module Review
+    module Molecules
+      # Factory and interface for subject splitting strategies
+      #
+      # The SubjectStrategy module provides a factory method for creating
+      # strategies that determine how review subjects are split or processed
+      # before being sent to an LLM for review.
+      #
+      # Available strategies:
+      # - :full - Pass-through strategy, no splitting (default)
+      # - :chunked - Split by logical boundaries (future)
+      # - :adaptive - Auto-select based on size (future)
+      #
+      # @example Factory usage
+      #   strategy = SubjectStrategy.for(:full, config)
+      #   strategy.can_handle?(subject_text, 128_000)
+      #   #=> true
+      #
+      # @example Strategy lifecycle
+      #   strategy = SubjectStrategy.for(:full)
+      #   if strategy.can_handle?(subject, model_limit)
+      #     units = strategy.prepare(subject, context)
+      #     units.each { |unit| execute_review(unit) }
+      #   end
+      module SubjectStrategy
+        # Registry of available strategy classes
+        STRATEGIES = {
+          full: "Ace::Review::Molecules::Strategies::FullStrategy",
+          chunked: "Ace::Review::Molecules::Strategies::ChunkedStrategy",
+          adaptive: "Ace::Review::Molecules::Strategies::AdaptiveStrategy"
+        }.freeze
+        # Factory method to create a strategy instance
+        #
+        # @param type [Symbol] Strategy type (:full, :chunked, :adaptive)
+        # @param config [Hash] Optional configuration for the strategy
+        # @return [Object] Strategy instance that responds to #can_handle? and #prepare
+        # @raise [UnknownStrategyError] if strategy type is not recognized
+        #
+        # @example
+        #   strategy = SubjectStrategy.for(:full)
+        #   strategy = SubjectStrategy.for(:chunked, chunk_size: 50_000)
+        def self.for(type, config = {})
+          type_sym = type.to_sym
+          class_name = STRATEGIES[type_sym]
+          unless class_name
+            available = STRATEGIES.keys.join(", ")
+            raise Ace::Review::Errors::UnknownStrategyError,
+              "Unknown strategy type '#{type}'. Available strategies: #{available}"
+          end
+          # Lazy require the strategy class
+          require_strategy(type_sym)
+          # Get the class and instantiate
+          klass = Object.const_get(class_name)
+          klass.new(config)
+        end
+        # Check if a strategy type is available
+        #
+        # @param type [Symbol, String] Strategy type to check
+        # @return [Boolean] true if strategy is available
+        def self.available?(type)
+          STRATEGIES.key?(type.to_sym)
+        end
+        # List available strategy types
+        #
+        # @return [Array<Symbol>] List of available strategy types
+        def self.available_strategies
+          STRATEGIES.keys
+        end
+        # Require the strategy file for a given type
+        # @param type [Symbol] Strategy type
+        # @api private
+        def self.require_strategy(type)
+          case type
+          when :full
+            require_relative "strategies/full_strategy"
+          when :chunked
+            require_relative "strategies/chunked_strategy"
+          when :adaptive
+            require_relative "strategies/adaptive_strategy"
+          end
+        end
+        private_class_method :require_strategy
+      end
+    end
+  end
+end