RubyGems - kumi - Versions diffs - 0.0.9 → 0.0.11 - Mend

kumi 0.0.9 → 0.0.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (103) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +18 -0
data/CLAUDE.md +18 -258
data/README.md +188 -121
data/docs/AST.md +1 -1
data/docs/FUNCTIONS.md +52 -8
data/docs/VECTOR_SEMANTICS.md +286 -0
data/docs/compiler_design_principles.md +86 -0
data/docs/features/README.md +15 -2
data/docs/features/hierarchical-broadcasting.md +349 -0
data/docs/features/javascript-transpiler.md +148 -0
data/docs/features/performance.md +1 -3
data/docs/features/s-expression-printer.md +2 -2
data/docs/schema_metadata.md +7 -7
data/examples/deep_schema_compilation_and_evaluation_benchmark.rb +21 -15
data/examples/game_of_life.rb +2 -4
data/lib/kumi/analyzer.rb +34 -14
data/lib/kumi/compiler.rb +4 -283
data/lib/kumi/core/analyzer/passes/broadcast_detector.rb +717 -66
data/lib/kumi/core/analyzer/passes/dependency_resolver.rb +1 -1
data/lib/kumi/core/analyzer/passes/input_access_planner_pass.rb +47 -0
data/lib/kumi/core/analyzer/passes/input_collector.rb +118 -99
data/lib/kumi/core/analyzer/passes/join_reduce_planning_pass.rb +293 -0
data/lib/kumi/core/analyzer/passes/lower_to_ir_pass.rb +993 -0
data/lib/kumi/core/analyzer/passes/pass_base.rb +2 -2
data/lib/kumi/core/analyzer/passes/scope_resolution_pass.rb +346 -0
data/lib/kumi/core/analyzer/passes/semantic_constraint_validator.rb +28 -0
data/lib/kumi/core/analyzer/passes/toposorter.rb +9 -3
data/lib/kumi/core/analyzer/passes/type_checker.rb +9 -5
data/lib/kumi/core/analyzer/passes/type_consistency_checker.rb +2 -2
data/lib/kumi/core/analyzer/passes/{type_inferencer.rb → type_inferencer_pass.rb} +4 -4
data/lib/kumi/core/analyzer/passes/unsat_detector.rb +92 -48
data/lib/kumi/core/analyzer/plans.rb +52 -0
data/lib/kumi/core/analyzer/structs/access_plan.rb +20 -0
data/lib/kumi/core/analyzer/structs/input_meta.rb +29 -0
data/lib/kumi/core/compiler/access_builder.rb +36 -0
data/lib/kumi/core/compiler/access_planner.rb +219 -0
data/lib/kumi/core/compiler/accessors/base.rb +69 -0
data/lib/kumi/core/compiler/accessors/each_indexed_accessor.rb +84 -0
data/lib/kumi/core/compiler/accessors/materialize_accessor.rb +55 -0
data/lib/kumi/core/compiler/accessors/ravel_accessor.rb +73 -0
data/lib/kumi/core/compiler/accessors/read_accessor.rb +41 -0
data/lib/kumi/core/compiler_base.rb +137 -0
data/lib/kumi/core/error_reporter.rb +6 -5
data/lib/kumi/core/errors.rb +4 -0
data/lib/kumi/core/explain.rb +157 -205
data/lib/kumi/core/export/node_builders.rb +2 -2
data/lib/kumi/core/export/node_serializers.rb +1 -1
data/lib/kumi/core/function_registry/collection_functions.rb +100 -6
data/lib/kumi/core/function_registry/conditional_functions.rb +14 -4
data/lib/kumi/core/function_registry/function_builder.rb +142 -53
data/lib/kumi/core/function_registry/logical_functions.rb +173 -3
data/lib/kumi/core/function_registry/stat_functions.rb +156 -0
data/lib/kumi/core/function_registry.rb +138 -98
data/lib/kumi/core/ir/execution_engine/combinators.rb +117 -0
data/lib/kumi/core/ir/execution_engine/interpreter.rb +336 -0
data/lib/kumi/core/ir/execution_engine/values.rb +46 -0
data/lib/kumi/core/ir/execution_engine.rb +50 -0
data/lib/kumi/core/ir.rb +58 -0
data/lib/kumi/core/ruby_parser/build_context.rb +2 -2
data/lib/kumi/core/ruby_parser/declaration_reference_proxy.rb +0 -12
data/lib/kumi/core/ruby_parser/dsl_cascade_builder.rb +37 -16
data/lib/kumi/core/ruby_parser/input_builder.rb +61 -8
data/lib/kumi/core/ruby_parser/parser.rb +1 -1
data/lib/kumi/core/ruby_parser/schema_builder.rb +2 -2
data/lib/kumi/core/ruby_parser/sugar.rb +7 -0
data/lib/kumi/errors.rb +2 -0
data/lib/kumi/js.rb +23 -0
data/lib/kumi/registry.rb +17 -22
data/lib/kumi/runtime/executable.rb +213 -0
data/lib/kumi/schema.rb +15 -4
data/lib/kumi/schema_metadata.rb +2 -2
data/lib/kumi/support/ir_dump.rb +491 -0
data/lib/kumi/support/s_expression_printer.rb +17 -16
data/lib/kumi/syntax/array_expression.rb +6 -6
data/lib/kumi/syntax/call_expression.rb +4 -4
data/lib/kumi/syntax/cascade_expression.rb +4 -4
data/lib/kumi/syntax/case_expression.rb +4 -4
data/lib/kumi/syntax/declaration_reference.rb +4 -4
data/lib/kumi/syntax/hash_expression.rb +4 -4
data/lib/kumi/syntax/input_declaration.rb +6 -5
data/lib/kumi/syntax/input_element_reference.rb +5 -5
data/lib/kumi/syntax/input_reference.rb +5 -5
data/lib/kumi/syntax/literal.rb +4 -4
data/lib/kumi/syntax/location.rb +5 -0
data/lib/kumi/syntax/node.rb +33 -34
data/lib/kumi/syntax/root.rb +6 -6
data/lib/kumi/syntax/trait_declaration.rb +4 -4
data/lib/kumi/syntax/value_declaration.rb +4 -4
data/lib/kumi/version.rb +1 -1
data/lib/kumi.rb +6 -15
data/scripts/analyze_broadcast_methods.rb +68 -0
data/scripts/analyze_cascade_methods.rb +74 -0
data/scripts/check_broadcasting_coverage.rb +51 -0
data/scripts/find_dead_code.rb +114 -0
metadata +36 -9
data/docs/features/array-broadcasting.md +0 -170
data/lib/kumi/cli.rb +0 -449
data/lib/kumi/core/compiled_schema.rb +0 -43
data/lib/kumi/core/evaluation_wrapper.rb +0 -40
data/lib/kumi/core/schema_instance.rb +0 -111
data/lib/kumi/core/vectorization_metadata.rb +0 -110
data/migrate_to_core_iterative.rb +0 -938

data/lib/kumi/core/analyzer/passes/broadcast_detector.rb CHANGED Viewed

@@ -5,21 +5,28 @@ module Kumi
     module Analyzer
       module Passes
         # Detects which operations should be broadcast over arrays
-        # DEPENDENCIES: :inputs, :declarations
+        # DEPENDENCIES: :input_metadata, :declarations
         # PRODUCES: :broadcasts
         class BroadcastDetector < PassBase
           def run(errors)
-            input_meta = get_state(:inputs) || {}
+            input_meta = get_state(:input_metadata) || {}
             definitions = get_state(:declarations) || {}
             # Find array fields with their element types
             array_fields = find_array_fields(input_meta)
+            # Build nested paths metadata for nested array traversal
+            nested_paths = build_nested_paths_metadata(input_meta)
             # Build compiler metadata
             compiler_metadata = {
               array_fields: array_fields,
               vectorized_operations: {},
-              reduction_operations: {}
+              reduction_operations: {},
+              nested_paths: nested_paths,
+              flattening_declarations: {},  # Track which declarations need flattening
+              cascade_strategies: {},       # Pre-computed cascade processing strategies
+              compilation_metadata: {}      # Pre-computed compilation decisions
             }
             # Track which values are vectorized for type inference
@@ -30,19 +37,36 @@ module Kumi
             values = definitions.select { |_name, decl| decl.is_a?(Kumi::Syntax::ValueDeclaration) }
             (traits.to_a + values.to_a).each do |name, decl|
-              result = analyze_value_vectorization(name, decl.expression, array_fields, vectorized_values, errors)
+              result = analyze_value_vectorization(name, decl.expression, array_fields, nested_paths, vectorized_values, errors,
+                                                   definitions)
+              if ENV["DEBUG_BROADCAST_CLEAN"]
+                puts "#{name}: #{result[:type]} #{format_broadcast_info(result)}"
+              end
               case result[:type]
               when :vectorized
                 compiler_metadata[:vectorized_operations][name] = result[:info]
+                # If this is a cascade with processing strategy, store it separately for easy compiler access
+                compiler_metadata[:cascade_strategies][name] = result[:info][:processing_strategy] if result[:info][:processing_strategy]
                 # Store array source information for dimension checking
                 array_source = extract_array_source(result[:info], array_fields)
                 vectorized_values[name] = { vectorized: true, array_source: array_source }
               when :reduction
                 compiler_metadata[:reduction_operations][name] = result[:info]
+                # Mark this specific declaration as needing flattening for its argument
+                compiler_metadata[:flattening_declarations][name] = result[:info]
                 # Reduction produces scalar, not vectorized
                 vectorized_values[name] = { vectorized: false }
               end
+              # Pre-compute compilation metadata for each declaration
+              compilation_meta = compute_compilation_metadata(
+                name, decl, compiler_metadata, vectorized_values, array_fields
+              )
+              compiler_metadata[:compilation_metadata][name] = compilation_meta
             end
             state.with(:broadcasts, compiler_metadata.freeze)
@@ -50,6 +74,113 @@ module Kumi
           private
+          def infer_argument_scope(arg, array_fields, nested_paths)
+            case arg
+            when Kumi::Syntax::InputElementReference
+              if nested_paths.key?(arg.path)
+                # Extract scope from path - each array dimension in the path
+                arg.path.select.with_index { |_seg, i| nested_paths[arg.path[0..i]] }
+              else
+                arg.path.select { |seg| array_fields.key?(seg) }
+              end
+            when Kumi::Syntax::CallExpression
+              # For nested calls, find the deepest input reference
+              deepest_scope = []
+              arg.args.each do |nested_arg|
+                scope = infer_argument_scope(nested_arg, array_fields, nested_paths)
+                deepest_scope = scope if scope.length > deepest_scope.length
+              end
+              deepest_scope
+            else
+              []
+            end
+          end
+          def format_broadcast_info(result)
+            case result[:type]
+            when :vectorized
+              info = result[:info]
+              "→ #{info[:source]} (path: #{info[:path]&.join('.')})"
+            when :reduction
+              info = result[:info]
+              "→ fn:#{info[:function]} (arg: #{info[:argument]&.class&.name&.split('::')&.last})"
+            when :scalar
+              "→ scalar"
+            else
+              "→ #{result[:info]}"
+            end
+          end
+          def compute_compilation_metadata(name, _decl, compiler_metadata, _vectorized_values, _array_fields)
+            metadata = {
+              operation_mode: :broadcast, # Default mode
+              is_vectorized: false,
+              vectorization_context: {},
+              cascade_info: {},
+              function_call_strategy: {}
+            }
+            # Check if this declaration is vectorized
+            if compiler_metadata[:vectorized_operations][name]
+              metadata[:is_vectorized] = true
+              vectorized_info = compiler_metadata[:vectorized_operations][name]
+              # Pre-compute vectorization context
+              metadata[:vectorization_context] = {
+                has_vectorized_args: true,
+                needs_broadcasting: true,
+                array_structure_depth: estimate_array_depth(vectorized_info, compiler_metadata[:nested_paths])
+              }
+              # If this is a cascade, pre-compute cascade processing strategy
+              if vectorized_info[:source] == :cascade_with_vectorized_conditions_or_results
+                strategy = compiler_metadata[:cascade_strategies][name]
+                metadata[:cascade_info] = {
+                  is_vectorized: true,
+                  processing_mode: strategy&.dig(:mode) || :hierarchical,
+                  needs_hierarchical_processing: needs_hierarchical_processing?(strategy)
+                }
+              end
+            end
+            # Check if this declaration needs flattening
+            if compiler_metadata[:flattening_declarations][name]
+              metadata[:operation_mode] = :flatten
+              flattening_info = compiler_metadata[:flattening_declarations][name]
+              metadata[:function_call_strategy] = {
+                flattening_required: true,
+                flatten_argument_indices: flattening_info[:flatten_argument_indices] || [0],
+                result_structure: :scalar
+              }
+            end
+            metadata
+          end
+          def estimate_array_depth(vectorized_info, nested_paths)
+            case vectorized_info[:source]
+            when :nested_array_access
+              path = vectorized_info[:path]
+              nested_paths[path]&.dig(:array_depth) || 1
+            when :array_field_access
+              1
+            else
+              1
+            end
+          end
+          def needs_hierarchical_processing?(strategy)
+            return false unless strategy
+            case strategy[:mode]
+            when :nested_array, :deep_nested_array
+              true
+            else
+              false
+            end
+          end
           def find_array_fields(input_meta)
             result = {}
             input_meta.each do |name, meta|
@@ -63,10 +194,62 @@ module Kumi
             result
           end
-          def analyze_value_vectorization(name, expr, array_fields, vectorized_values, errors)
+          def build_nested_paths_metadata(input_meta)
+            nested_paths = {}
+            # Recursively build all possible nested paths from input metadata
+            input_meta.each do |root_name, root_meta|
+              collect_nested_paths(nested_paths, [root_name], root_meta, 0, nil)
+            end
+            nested_paths
+          end
+          def collect_nested_paths(nested_paths, current_path, current_meta, array_depth, parent_access_mode = nil)
+            # If current field is an array, increment array depth and track its access_mode
+            current_access_mode = parent_access_mode
+            if current_meta[:type] == :array
+              array_depth += 1
+              current_access_mode = current_meta[:access_mode] || :field # Default to :field if not specified
+            end
+            # If this field has children, recurse into them
+            if current_meta[:children]
+              current_meta[:children].each do |child_name, child_meta|
+                child_path = current_path + [child_name]
+                # Create metadata for this path if it involves arrays
+                if array_depth.positive?
+                  nested_paths[child_path] =
+                    build_path_metadata(child_path, child_meta, array_depth, current_access_mode)
+                end
+                # Recurse into child's children
+                collect_nested_paths(nested_paths, child_path, child_meta, array_depth, current_access_mode)
+              end
+            elsif array_depth.positive?
+              # Leaf field - create metadata if it involves arrays
+              nested_paths[current_path] = build_path_metadata(current_path, current_meta, array_depth, current_access_mode)
+            end
+          end
+          def build_path_metadata(_path, field_meta, array_depth, parent_access_mode = nil)
+            {
+              array_depth: array_depth,
+              element_type: field_meta[:type] || :any,
+              operation_mode: :broadcast, # Default mode - may be overridden for aggregations
+              result_structure: array_depth > 1 ? :nested_array : :array,
+              access_mode: parent_access_mode # Access mode of the parent array field
+            }
+          end
+          def analyze_value_vectorization(name, expr, array_fields, nested_paths, vectorized_values, errors, definitions = nil)
             case expr
             when Kumi::Syntax::InputElementReference
-              if array_fields.key?(expr.path.first)
+              # Check if this path exists in nested_paths metadata (supports nested arrays)
+              if nested_paths.key?(expr.path)
+                { type: :vectorized, info: { source: :nested_array_access, path: expr.path, nested_metadata: nested_paths[expr.path] } }
+              elsif array_fields.key?(expr.path.first)
                 { type: :vectorized, info: { source: :array_field_access, path: expr.path } }
               else
                 { type: :scalar }
@@ -82,72 +265,132 @@ module Kumi
               end
             when Kumi::Syntax::CallExpression
-              analyze_call_vectorization(name, expr, array_fields, vectorized_values, errors)
+              analyze_call_vectorization(name, expr, array_fields, nested_paths, vectorized_values, errors, definitions)
             when Kumi::Syntax::CascadeExpression
-              analyze_cascade_vectorization(name, expr, array_fields, vectorized_values, errors)
+              analyze_cascade_vectorization(name, expr, array_fields, nested_paths, vectorized_values, errors, definitions)
             else
               { type: :scalar }
             end
           end
-          def analyze_call_vectorization(_name, expr, array_fields, vectorized_values, errors)
-            # Check if this is a reduction function using function registry metadata
-            if Kumi::Registry.reducer?(expr.fn_name)
-              # Only treat as reduction if the argument is actually vectorized
-              arg_info = analyze_argument_vectorization(expr.args.first, array_fields, vectorized_values)
-              if arg_info[:vectorized]
-                { type: :reduction, info: { function: expr.fn_name, source: arg_info[:source] } }
-              else
-                # Not a vectorized reduction - just a regular function call
-                { type: :scalar }
+          def analyze_call_vectorization(_name, expr, array_fields, nested_paths, vectorized_values, errors, definitions = nil)
+            entry         = Kumi::Registry.entry(expr.fn_name)
+            is_reducer    = entry&.reducer
+            is_structure  = entry&.structure_function
+            # 1) Analyze all args once
+            arg_infos = expr.args.map do |arg|
+              analyze_argument_vectorization(arg, array_fields, nested_paths, vectorized_values, definitions)
+            end
+            vec_idx   = arg_infos.each_index.select { |i| arg_infos[i][:vectorized] }
+            vec_any   = !vec_idx.empty?
+            # 2) Special form: cascade_and (vectorized if any trait arg is vectorized)
+            if expr.fn_name == :cascade_and
+              vectorized_trait = expr.args.find do |arg|
+                arg.is_a?(Kumi::Syntax::DeclarationReference) && vectorized_values[arg.name]&.[](:vectorized)
+              end
+              if vectorized_trait
+                return { type: :vectorized,
+                         info: { source: :cascade_condition_with_vectorized_trait, trait: vectorized_trait&.name } }
               end
-            else
-              # Special case: all?, any?, none? functions with vectorized trait arguments should be treated as vectorized
-              # for cascade condition purposes (they get transformed during compilation)
-              if %i[all? any? none?].include?(expr.fn_name) && expr.args.length == 1
-                arg = expr.args.first
-                if arg.is_a?(Kumi::Syntax::ArrayExpression) && arg.elements.length == 1
-                  trait_ref = arg.elements.first
-                  if trait_ref.is_a?(Kumi::Syntax::DeclarationReference) && vectorized_values[trait_ref.name]&.[](:vectorized)
-                    return { type: :vectorized, info: { source: :cascade_condition_with_vectorized_trait, trait: trait_ref.name } }
-                  end
+              return { type: :scalar }
+            end
+            # 3) Reducers: only reduce when the input is actually vectorized
+            if is_reducer
+              return { type: :scalar } unless vec_any
+              # which args were vectorized?
+              flatten_indices = vec_idx.dup
+              vectorized_arg_index = vec_idx.first
+              argument_ast = expr.args[vectorized_arg_index]
+              src_info = arg_infos[vectorized_arg_index]
+              return {
+                type: :reduction,
+                info: {
+                  function: expr.fn_name,
+                  source: src_info[:source],
+                  argument: argument_ast, # << keep AST of the vectorized argument
+                  flatten_argument_indices: flatten_indices
+                }
+              }
+            end
+            # 4) Structure (non-reducer) functions like `size`
+            if is_structure
+              # If any arg is itself a PURE reducer call (e.g., size(sum(x))), the inner collapses first ⇒ outer is scalar
+              # But dual-nature functions (both reducer AND structure) should be treated as structure functions when nested
+              return { type: :scalar } if expr.args.any? do |a|
+                if a.is_a?(Kumi::Syntax::CallExpression)
+                  arg_entry = Kumi::Registry.entry(a.fn_name)
+                  arg_entry&.reducer && !arg_entry&.structure_function # Pure reducer only
+                else
+                  false
                 end
               end
-              # ANY function with vectorized arguments becomes vectorized (with broadcasting)
-              arg_infos = expr.args.map { |arg| analyze_argument_vectorization(arg, array_fields, vectorized_values) }
+              # Structure fn over a vectorized element path ⇒ per-parent vectorization
+              return { type: :scalar } unless vec_any
-              if arg_infos.any? { |info| info[:vectorized] }
-                # Check for dimension mismatches when multiple arguments are vectorized
-                vectorized_sources = arg_infos.select { |info| info[:vectorized] }.filter_map { |info| info[:array_source] }.uniq
+              src_info     = arg_infos[vec_idx.first]
+              parent_scope = src_info[:parent_scope] || src_info[:source] # fallback if analyzer encodes parent separately
+              return {
+                type: :vectorized,
+                info: {
+                  operation: expr.fn_name,
+                  source: src_info[:source],
+                  parent_scope: parent_scope,
+                  vectorized_args: vec_idx.to_h { |i| [i, true] }
+                }
+              }
-                if vectorized_sources.length > 1
-                  # Multiple different array sources - this is a dimension mismatch
-                  # Generate enhanced error message with type information
-                  enhanced_message = build_dimension_mismatch_error(expr, arg_infos, array_fields, vectorized_sources)
+              # Structure fn over a scalar/materialized container ⇒ scalar
-                  report_error(errors, enhanced_message, location: expr.loc, type: :semantic)
-                  return { type: :scalar } # Treat as scalar to prevent further errors
-                end
+            end
-                # This is a vectorized operation - ANY function supports broadcasting
-                { type: :vectorized, info: {
-                  operation: expr.fn_name,
-                  vectorized_args: arg_infos.map.with_index { |info, i| [i, info[:vectorized]] }.to_h
-                } }
-              else
-                { type: :scalar }
+            # 5) Generic vectorized map (non-structure, non-reducer)
+            if vec_any
+              # Dimension / source compatibility check
+              sources = vec_idx.map { |i| arg_infos[i][:array_source] }.compact.uniq
+              if sources.size > 1
+                enhanced_message = build_dimension_mismatch_error(expr, arg_infos, array_fields, sources)
+                report_error(errors, enhanced_message, location: expr.loc, type: :semantic)
+                return { type: :scalar } # fail safe to prevent cascading errors
               end
+              return {
+                type: :vectorized,
+                info: {
+                  operation: expr.fn_name,
+                  source: arg_infos[vec_idx.first][:source],
+                  vectorized_args: vec_idx.to_h { |i| [i, true] }
+                }
+              }
             end
+            # 6) Pure scalar
+            { type: :scalar }
+          end
+          def structure_function?(fn_name)
+            # Check if function is marked as working on structure (not broadcast over elements)
+            Kumi::Registry.structure_function?(fn_name)
           end
-          def analyze_argument_vectorization(arg, array_fields, vectorized_values)
+          def analyze_argument_vectorization(arg, array_fields, nested_paths, vectorized_values, definitions = nil)
             case arg
             when Kumi::Syntax::InputElementReference
-              if array_fields.key?(arg.path.first)
+              # Check nested paths first (supports nested arrays)
+              if nested_paths.key?(arg.path)
+                { vectorized: true, source: :nested_array_field, array_source: arg.path.first }
+              # Fallback to old array_fields detection for backward compatibility
+              elsif array_fields.key?(arg.path.first)
                 { vectorized: true, source: :array_field, array_source: arg.path.first }
               else
                 { vectorized: false }
@@ -164,9 +407,32 @@ module Kumi
               end
             when Kumi::Syntax::CallExpression
-              # Recursively check
-              result = analyze_value_vectorization(nil, arg, array_fields, vectorized_values, [])
-              { vectorized: result[:type] == :vectorized, source: :expression }
+              # Recursively check nested call
+              result = analyze_value_vectorization(nil, arg, array_fields, nested_paths, vectorized_values, [], definitions)
+              # Handle different result types appropriately
+              case result[:type]
+              when :reduction
+                # Reductions can produce vectors if they preserve some dimensions
+                # This aligns with lower_to_ir logic for grouped reductions
+                info = result[:info]
+                if info && info[:argument]
+                  # Check if the reduction argument has array scope that would be preserved
+                  arg_scope = infer_argument_scope(info[:argument], array_fields, nested_paths)
+                  if arg_scope.length > 1
+                    # Multi-dimensional reduction - likely preserves outer dimension (per-player)
+                    { vectorized: true, source: :grouped_reduction, array_source: arg_scope.first }
+                  else
+                    # Single dimension or scalar reduction
+                    { vectorized: false, source: :scalar_from_reduction }
+                  end
+                else
+                  { vectorized: false, source: :scalar_from_reduction }
+                end
+              when :vectorized
+                { vectorized: true, source: :expression }
+              else
+                { vectorized: false, source: :scalar }
+              end
             else
               { vectorized: false }
@@ -183,30 +449,415 @@ module Kumi
             end
           end
-          def analyze_cascade_vectorization(_name, expr, array_fields, vectorized_values, errors)
-            # A cascade is vectorized if:
-            # 1. Any of its result expressions are vectorized, OR
-            # 2. Any of its conditions reference vectorized values (traits or arrays)
-            vectorized_results = []
-            vectorized_conditions = []
+          def analyze_cascade_vectorization(name, expr, array_fields, nested_paths, vectorized_values, errors, definitions = nil)
+            # Enhanced cascade analysis with dimensional intelligence
+            condition_sources = []
+            result_sources = []
+            condition_dimensions = []
+            result_dimensions = []
+            is_vectorized = false
+            if ENV["DEBUG_CASCADE"]
+              puts "DEBUG: analyze_cascade_vectorization for #{name}"
+              puts "  Expression: #{expr.inspect}"
+              puts "  Cases: #{expr.cases.length}"
+            end
             expr.cases.each do |case_expr|
-              # Check if result is vectorized
-              result_info = analyze_value_vectorization(nil, case_expr.result, array_fields, vectorized_values, errors)
-              vectorized_results << (result_info[:type] == :vectorized)
+              # Analyze result expression
+              result_info = analyze_value_vectorization(nil, case_expr.result, array_fields, nested_paths, vectorized_values, errors,
+                                                        definitions)
+              if result_info[:type] == :vectorized
+                is_vectorized = true
+                source, dimension = trace_dimensional_source(case_expr.result, result_info, vectorized_values, array_fields, definitions)
+                result_sources << source
+                result_dimensions << dimension
+              end
+              # Analyze condition expression
+              condition_info = analyze_value_vectorization(nil, case_expr.condition, array_fields, nested_paths, vectorized_values, errors,
+                                                           definitions)
+              next unless condition_info[:type] == :vectorized
+              is_vectorized = true
+              # Special handling for cascade_and to check all arguments for dimensional conflicts
+              if ENV["DEBUG_CASCADE"]
+                puts "  Checking condition type: #{case_expr.condition.class}"
+                puts "  Condition fn_name: #{case_expr.condition.fn_name}" if case_expr.condition.is_a?(Kumi::Syntax::CallExpression)
+              end
+              if case_expr.condition.is_a?(Kumi::Syntax::CallExpression) && case_expr.condition.fn_name == :cascade_and
+                puts "  -> ENTERING CASCADE_AND SPECIAL HANDLING" if ENV["DEBUG_CASCADE"]
+                # For cascade_and, check all individual trait references for dimensional conflicts
+                cascade_sources = []
+                cascade_dimensions = []
+                puts "  cascade_and args: #{case_expr.condition.args.map(&:class)}" if ENV["DEBUG_CASCADE"]
+                case_expr.condition.args.each do |arg|
+                  puts "  Processing arg: #{arg.inspect}" if ENV["DEBUG_CASCADE"]
+                  next unless arg.is_a?(Kumi::Syntax::DeclarationReference)
+                  puts "  Looking up declaration: #{arg.name}" if ENV["DEBUG_CASCADE"]
+                  decl = definitions[arg.name] if definitions
+                  if decl
+                    puts "  Found declaration, tracing source..." if ENV["DEBUG_CASCADE"]
+                    arg_source, arg_dimension = trace_dimensional_source(decl.expression, condition_info, vectorized_values,
+                                                                         array_fields, definitions)
+                    puts "  Traced source: #{arg_source}, dimension: #{arg_dimension}" if ENV["DEBUG_CASCADE"]
+                    cascade_sources << arg_source
+                    cascade_dimensions << arg_dimension
+                  elsif ENV["DEBUG_CASCADE"]
+                    puts "  Declaration not found: #{arg.name}"
+                  end
+                end
-              # Check if condition is vectorized
-              condition_info = analyze_value_vectorization(nil, case_expr.condition, array_fields, vectorized_values, errors)
-              vectorized_conditions << (condition_info[:type] == :vectorized)
+                # Check for conflicts between cascade_and arguments
+                unique_sources = cascade_sources.uniq
+                unique_dimensions = cascade_dimensions.uniq
+                if ENV["DEBUG_CASCADE"]
+                  puts "  cascade_sources: #{cascade_sources.inspect}"
+                  puts "  cascade_dimensions: #{cascade_dimensions.inspect}"
+                  puts "  unique_sources: #{unique_sources.inspect}"
+                  puts "  unique_dimensions: #{unique_dimensions.inspect}"
+                end
+                # Check for dimensional conflicts - either different sources OR incompatible dimensions
+                has_source_conflict = unique_sources.length > 1 && unique_sources.none? { |s| s.to_s.include?("unknown") }
+                has_dimension_conflict = unique_dimensions.length > 1 && !valid_hierarchical_broadcasting?(unique_dimensions)
+                if ENV["DEBUG_CASCADE"]
+                  puts "  has_source_conflict: #{has_source_conflict}"
+                  puts "  has_dimension_conflict: #{has_dimension_conflict}"
+                  if unique_dimensions.length > 1
+                    puts "  valid_hierarchical_broadcasting?: #{valid_hierarchical_broadcasting?(unique_dimensions)}"
+                  end
+                end
+                if has_source_conflict || has_dimension_conflict
+                  # Multiple different sources or incompatible dimensions in same cascade_and - this is invalid
+                  if ENV["DEBUG_CASCADE"]
+                    puts "  -> FOUND CASCADE_AND DIMENSIONAL CONFLICT:"
+                    puts "    Sources: #{unique_sources.inspect}"
+                    puts "    Dimensions: #{unique_dimensions.inspect}"
+                    puts "    Source conflict: #{has_source_conflict}"
+                    puts "    Dimension conflict: #{has_dimension_conflict}"
+                  end
+                  report_cascade_dimension_mismatch(errors, expr, unique_sources, unique_dimensions)
+                  return { type: :scalar }
+                end
+                # Use the first valid source as the overall condition source
+                condition_sources.concat(cascade_sources)
+                condition_dimensions.concat(cascade_dimensions)
+              else
+                source, dimension = trace_dimensional_source(case_expr.condition, condition_info, vectorized_values, array_fields,
+                                                             definitions)
+                condition_sources << source
+                condition_dimensions << dimension
+              end
             end
-            if vectorized_results.any? || vectorized_conditions.any?
-              { type: :vectorized, info: { source: :cascade_with_vectorized_conditions_or_results } }
+            if is_vectorized
+              # Validate dimensional compatibility
+              all_sources = (condition_sources + result_sources).compact.uniq
+              all_dimensions = (condition_dimensions + result_dimensions).compact.uniq
+              if ENV["DEBUG_CASCADE"]
+                puts "  is_vectorized: true"
+                puts "  condition_sources: #{condition_sources.inspect}"
+                puts "  result_sources: #{result_sources.inspect}"
+                puts "  condition_dimensions: #{condition_dimensions.inspect}"
+                puts "  result_dimensions: #{result_dimensions.inspect}"
+                puts "  all_sources: #{all_sources.inspect}"
+                puts "  all_dimensions: #{all_dimensions.inspect}"
+              end
+              # For now, be less strict about dimensional validation
+              # Only report mismatches for clearly incompatible sources
+              definite_sources = all_sources.reject { |s| s.to_s.include?("unknown") || s.to_s.include?("operation") }
+              if ENV["DEBUG_CASCADE"]
+                puts "  definite_sources: #{definite_sources.inspect}"
+                puts "  definite_sources.length: #{definite_sources.length}"
+              end
+              if definite_sources.length > 1
+                # Check if sources are in valid hierarchical relationship (parent-child broadcasting)
+                is_valid_hierarchical = valid_hierarchical_broadcasting?(all_dimensions)
+                puts "  valid_hierarchical_broadcasting?: #{is_valid_hierarchical}" if ENV["DEBUG_CASCADE"]
+                unless is_valid_hierarchical
+                  # Multiple definite dimensional sources - this is a real mismatch
+                  puts "  -> REPORTING DIMENSIONAL MISMATCH" if ENV["DEBUG_CASCADE"]
+                  report_cascade_dimension_mismatch(errors, expr, definite_sources, all_dimensions)
+                  return { type: :scalar } # Treat as scalar to prevent further errors
+                end
+              end
+              # Compute cascade processing strategy based on dimensional analysis
+              processing_strategy = compute_cascade_processing_strategy(all_dimensions.first, nested_paths)
+              { type: :vectorized, info: {
+                source: :cascade_with_vectorized_conditions_or_results,
+                dimensional_requirements: {
+                  conditions: { sources: condition_sources.uniq, dimensions: condition_dimensions.uniq },
+                  results: { sources: result_sources.uniq, dimensions: result_dimensions.uniq }
+                },
+                primary_dimension: all_dimensions.first,
+                nested_paths: extract_nested_paths_from_dimensions(all_dimensions.first, nested_paths),
+                processing_strategy: processing_strategy
+              } }
             else
               { type: :scalar }
             end
           end
+          def trace_dimensional_source(expr, info, vectorized_values, array_fields, definitions = nil)
+            # Trace dimensional source by examining the AST node directly
+            case expr
+            when Kumi::Syntax::InputElementReference
+              # Direct array field access
+              source = expr.path.first
+              dimension = expr.path
+              [source, dimension]
+            when Kumi::Syntax::DeclarationReference
+              # Reference to another declaration - look up its dimensional info
+              if vectorized_values[expr.name]
+                vectorized_info = vectorized_values[expr.name]
+                if vectorized_info[:array_source]
+                  [vectorized_info[:array_source], [vectorized_info[:array_source]]]
+                else
+                  # Need to trace through the declaration's expression to find the real source
+                  decl = definitions[expr.name] if definitions
+                  if decl
+                    # Recursively trace the declaration's expression
+                    trace_dimensional_source(decl.expression, info, vectorized_values, array_fields, definitions)
+                  else
+                    [:unknown_vectorized_operation, [:unknown_vectorized_operation]]
+                  end
+                end
+              else
+                [:unknown_declaration, [:unknown_declaration]]
+              end
+            when Kumi::Syntax::CallExpression
+              # For call expressions, trace through the arguments to find dimensional source
+              first_vectorized_arg = expr.args.find do |arg|
+                arg_info = analyze_argument_vectorization(arg, array_fields, {}, vectorized_values, definitions)
+                arg_info[:vectorized]
+              end
+              if first_vectorized_arg
+                trace_dimensional_source(first_vectorized_arg, info, vectorized_values, array_fields, definitions)
+              else
+                [:operation_unknown, [:operation_unknown]]
+              end
+            else
+              [:unknown_expr, [:unknown_expr]]
+            end
+          end
+          def extract_dimensional_info_with_context(info, _array_fields, _nested_paths, vectorized_values)
+            case info[:source]
+            when :array_field_access, :nested_array_access
+              # Direct array field access - use the path
+              source = info[:path]&.first
+              dimension = info[:path]
+              [source, dimension]
+            when :vectorized_declaration
+              # Reference to another vectorized declaration - look it up
+              if info[:name] && vectorized_values[info[:name]]
+                vectorized_info = vectorized_values[info[:name]]
+                if vectorized_info[:array_source]
+                  # This declaration references an array field, use that source
+                  [vectorized_info[:array_source], [vectorized_info[:array_source]]]
+                else
+                  # This is a derived vectorized value, try to trace its source
+                  [:vectorized_reference, [:vectorized_reference]]
+                end
+              else
+                [:unknown_declaration, [:unknown_declaration]]
+              end
+            else
+              # Operations and other cases - try to extract from operation args
+              if info[:operation] && info[:vectorized_args]
+                # This is an operation result - trace the vectorized arguments
+                # For now, assume operations inherit the dimension of their first vectorized arg
+                [:operation_result, [:operation_result]]
+              else
+                [:unknown, [:unknown]]
+              end
+            end
+          end
+          def extract_dimensional_source(info, _array_fields)
+            case info[:source]
+            when :array_field_access
+              info[:path]&.first
+            when :nested_array_access
+              info[:path]&.first
+            when :vectorized_declaration, :vectorized_value
+              # Try to extract from the vectorized value info if available
+              if info[:name] && info.dig(:info, :path)
+                info[:info][:path].first
+              else
+                :vectorized_reference
+              end
+            else
+              # For operations and other cases, try to infer from vectorized args
+              if info[:vectorized_args]
+                # This is likely an operation - we should look at its arguments
+                :operation_result
+              else
+                :unknown
+              end
+            end
+          end
+          def extract_dimensions(info, _array_fields, _nested_paths)
+            case info[:source]
+            when :array_field_access
+              info[:path]
+            when :nested_array_access
+              info[:path]
+            when :vectorized_declaration, :vectorized_value
+              # Try to extract from the vectorized value info if available
+              if info[:name] && info.dig(:info, :path)
+                info[:info][:path]
+              else
+                [:vectorized_reference]
+              end
+            else
+              # For operations, try to infer from the operation context
+              if info[:vectorized_args]
+                # This is likely an operation - we should trace its arguments
+                [:operation_result]
+              else
+                [:unknown]
+              end
+            end
+          end
+          def extract_nested_paths_from_dimensions(dimension, nested_paths)
+            return nil unless dimension.is_a?(Array)
+            nested_paths[dimension]
+          end
+          # Check if dimensions represent valid hierarchical broadcasting (parent-to-child)
+          # Example: [:regions, :offices, :teams] can broadcast to [:regions, :offices, :teams, :employees]
+          def valid_hierarchical_broadcasting?(dimensions)
+            puts "    DEBUG valid_hierarchical_broadcasting?: dimensions=#{dimensions.inspect}" if ENV["DEBUG_CASCADE"]
+            return true if dimensions.length <= 1
+            # Extract structural paths by removing the final field name from each dimension
+            # This allows us to identify that [:regions, :offices, :teams, :performance_score]
+            # and [:regions, :offices, :teams, :employees, :rating] both have the structural
+            # path [:regions, :offices, :teams] and [:regions, :offices, :teams, :employees] respectively
+            structural_paths = dimensions.map do |dim|
+              if dim.length > 1
+                dim[0..-2] # Remove the final field name
+              else
+                dim
+              end
+            end.uniq
+            puts "    structural_paths: #{structural_paths.inspect}" if ENV["DEBUG_CASCADE"]
+            # Group dimensions by their root (first element)
+            root_groups = structural_paths.group_by(&:first)
+            puts "    root_groups: #{root_groups.keys.inspect}" if ENV["DEBUG_CASCADE"]
+            # All dimensions must come from the same root
+            if root_groups.length > 1
+              puts "    -> REJECT: Multiple roots" if ENV["DEBUG_CASCADE"]
+              return false
+            end
+            # If all structural paths are the same, this is valid (same level)
+            if structural_paths.length == 1
+              puts "    -> ACCEPT: All dimensions at same structural level" if ENV["DEBUG_CASCADE"]
+              return true
+            end
+            # Within the same root, check if we have valid parent-child relationships
+            sorted_paths = structural_paths.sort_by(&:length)
+            puts "    sorted structural paths: #{sorted_paths.inspect}" if ENV["DEBUG_CASCADE"]
+            # Check if all structural paths form a valid hierarchical structure
+            # For valid hierarchical broadcasting, structural paths should be related by parent-child relationships
+            # Check if there are any actual parent-child relationships
+            has_real_hierarchy = false
+            (0...sorted_paths.length).each do |i|
+              ((i + 1)...sorted_paths.length).each do |j|
+                path1 = sorted_paths[i]
+                path2 = sorted_paths[j]
+                shorter, longer = [path1, path2].sort_by(&:length)
+                next unless longer[0, shorter.length] == shorter
+                puts "    Found parent-child relationship: #{shorter.inspect} → #{longer.inspect}" if ENV["DEBUG_CASCADE"]
+                has_real_hierarchy = true
+              end
+            end
+            puts "    has_real_hierarchy: #{has_real_hierarchy}" if ENV["DEBUG_CASCADE"]
+            # Allow same-level dimensions or hierarchical relationships
+            if !has_real_hierarchy && sorted_paths.length > 1
+              puts "    -> REJECT: No parent-child relationships found - these are sibling branches" if ENV["DEBUG_CASCADE"]
+              return false
+            end
+            puts "    -> ACCEPT: All dimensions compatible" if ENV["DEBUG_CASCADE"]
+            true
+          end
+          def compute_cascade_processing_strategy(primary_dimension, nested_paths)
+            return { mode: :scalar } unless primary_dimension
+            # Determine structure depth from the dimension path
+            structure_depth = primary_dimension.length
+            # Determine processing mode based on structure complexity
+            processing_mode = case structure_depth
+                              when 0, 1
+                                :simple_array     # Single-level array processing
+                              when 2, 3, 4
+                                :nested_array     # Multi-level nested array processing
+                              else
+                                :deep_nested_array # Very deep nesting (5+ levels)
+                              end
+            # Get nested path information for this dimension
+            nested_path_info = nested_paths[primary_dimension]
+            {
+              mode: processing_mode,
+              structure_depth: structure_depth,
+              dimension_path: primary_dimension,
+              element_processing: :cascade_conditional_logic,
+              nested_path_info: nested_path_info
+            }
+          end
+          def report_cascade_dimension_mismatch(errors, expr, sources, dimensions)
+            puts "DEBUG: Dimensional analysis details:" if ENV["DEBUG_CASCADE"]
+            puts "  Sources: #{sources.inspect}" if ENV["DEBUG_CASCADE"]
+            puts "  Dimensions: #{dimensions.inspect}" if ENV["DEBUG_CASCADE"]
+            puts "  Valid hierarchical? #{valid_hierarchical_broadcasting?(dimensions)}" if ENV["DEBUG_CASCADE"]
+            message = "Cascade dimensional mismatch: Cannot mix arrays from different sources (#{sources.join(', ')}) " \
+                      "with dimensions (#{dimensions.map(&:inspect).join(', ')}) in cascade conditions and results."
+            report_error(errors, message, location: expr.loc, type: :semantic)
+          end
           def build_dimension_mismatch_error(_expr, arg_infos, array_fields, vectorized_sources)
             # Build detailed error message with type information
             summary = "Cannot broadcast operation across arrays from different sources: #{vectorized_sources.join(', ')}. "