RubyGems - rattler - Versions diffs - 0.2.2 → 0.3.0 - Mend

rattler 0.2.2 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (56) hide show

data/README.rdoc +83 -64
data/features/grammar/comments.feature +24 -0
data/features/grammar/list_matching.feature +41 -0
data/features/grammar/symantic_action.feature +30 -12
data/lib/rattler/back_end/parser_generator/assert_generator.rb +27 -27
data/lib/rattler/back_end/parser_generator/choice_generator.rb +29 -29
data/lib/rattler/back_end/parser_generator/direct_action_generator.rb +17 -17
data/lib/rattler/back_end/parser_generator/disallow_generator.rb +27 -27
data/lib/rattler/back_end/parser_generator/dispatch_action_generator.rb +17 -17
data/lib/rattler/back_end/parser_generator/expr_generator.rb +129 -40
data/lib/rattler/back_end/parser_generator/label_generator.rb +15 -15
data/lib/rattler/back_end/parser_generator/list1_generator.rb +61 -0
data/lib/rattler/back_end/parser_generator/list_generating.rb +71 -0
data/lib/rattler/back_end/parser_generator/list_generator.rb +57 -0
data/lib/rattler/back_end/parser_generator/one_or_more_generator.rb +14 -15
data/lib/rattler/back_end/parser_generator/optional_generator.rb +24 -24
data/lib/rattler/back_end/parser_generator/predicate_propogating.rb +9 -9
data/lib/rattler/back_end/parser_generator/repeat_generating.rb +16 -16
data/lib/rattler/back_end/parser_generator/sequence_generator.rb +40 -40
data/lib/rattler/back_end/parser_generator/skip_generator.rb +18 -18
data/lib/rattler/back_end/parser_generator/skip_propogating.rb +5 -5
data/lib/rattler/back_end/parser_generator/sub_generating.rb +128 -0
data/lib/rattler/back_end/parser_generator/token_generator.rb +15 -15
data/lib/rattler/back_end/parser_generator/token_propogating.rb +1 -1
data/lib/rattler/back_end/parser_generator/zero_or_more_generator.rb +12 -13
data/lib/rattler/back_end/parser_generator.rb +10 -7
data/lib/rattler/grammar/grammar_parser.rb +16 -21
data/lib/rattler/grammar/metagrammar.rb +1039 -1035
data/lib/rattler/grammar/rattler.rtlr +28 -28
data/lib/rattler/parsers/action_code.rb +20 -9
data/lib/rattler/parsers/fail.rb +7 -1
data/lib/rattler/parsers/list.rb +57 -0
data/lib/rattler/parsers/list1.rb +58 -0
data/lib/rattler/parsers/parser_dsl.rb +60 -38
data/lib/rattler/parsers.rb +5 -3
data/lib/rattler/runtime/extended_packrat_parser.rb +88 -20
data/lib/rattler/runtime/packrat_parser.rb +21 -14
data/lib/rattler/runtime/parser.rb +74 -18
data/lib/rattler/runtime/recursive_descent_parser.rb +15 -46
data/spec/rattler/back_end/compiler_spec.rb +173 -107
data/spec/rattler/back_end/parser_generator/list1_generator_spec.rb +304 -0
data/spec/rattler/back_end/parser_generator/list_generator_spec.rb +288 -0
data/spec/rattler/grammar/grammar_parser_spec.rb +65 -76
data/spec/rattler/parsers/action_code_spec.rb +84 -34
data/spec/rattler/parsers/direct_action_spec.rb +56 -34
data/spec/rattler/parsers/fail_spec.rb +20 -0
data/spec/rattler/parsers/list1_spec.rb +82 -0
data/spec/rattler/parsers/list_spec.rb +82 -0
data/spec/rattler/parsers/parser_dsl_spec.rb +48 -19
data/spec/rattler/runtime/extended_packrat_parser_spec.rb +0 -1
metadata +92 -173
data/bin/rtlr.bat +0 -3
data/lib/rattler/back_end/parser_generator/generator_helper.rb +0 -130
data/lib/rattler/back_end/parser_generator/generators.rb +0 -86
data/lib/rattler/back_end/parser_generator/nested_generators.rb +0 -15
data/lib/rattler/back_end/parser_generator/top_level_generators.rb +0 -15

data/lib/rattler/runtime/extended_packrat_parser.rb CHANGED Viewed

@@ -11,52 +11,120 @@ module Rattler::Runtime
   #
   # +ExtendedPackratParser+ implements the algorithm described by Alessandro
   # Warth, James R. Douglass, and Todd Millstein for extending packrat parsing
-  # to support left-recursive grammars. It currently only implements the first
-  # part to support direct left recursion.
+  # to support left-recursive grammars.
   #
   # @author Jason Arhart
   #
   class ExtendedPackratParser < PackratParser
+    # Create a new extended packrat parser to parse +source+.
+    #
+    # @param (see PackratParser#initialize)
+    # @option (see PackratParser#initialize)
+    #
+    def initialize(source, options={})
+      super
+      @heads = {}
+      @lr_stack = []
+    end
     private
     # @private
-    def apply!(rule_name, key, start_pos) #:nodoc:
-      lr = LR.new
-      m = @memo[key] = MemoEntry.new(lr, start_pos, nil, nil)
+    def apply!(rule_name, start_pos) #:nodoc:
+      lr = LR.new(false, rule_name, nil)
+      @lr_stack.push lr
+      m = inject_memo rule_name, start_pos, lr, start_pos, nil, nil
       result = eval_rule rule_name
-      memorize m, result
-      result = grow_lr(rule_name, start_pos, m) if result and lr.detected
-      result
+      @lr_stack.pop
+      if lr.head
+        m.end_pos = @scanner.pos
+        lr.seed = result
+        lr_answer rule_name, start_pos, m
+      else
+        memorize m, result
+      end
+    end
+    # @private
+    def memo(rule_name, start_pos) #:nodoc:
+      m = super
+      head = @heads[start_pos] or return m
+      if !m && !head.involves?(rule_name)
+        return inject_memo rule_name, start_pos, false, start_pos, nil, nil
+      end
+      if head.eval_set.delete(rule_name)
+        memorize m, eval_rule(rule_name)
+      end
+      return m
     end
-    def recall(m)
+    # @private
+    def recall(m, rule_name) #:nodoc:
       if (result = m.result).is_a? LR
-        result.detected = true
-        false
+        setup_lr rule_name, result
+        result.seed
       else
         super
       end
     end
     # @private
-    def grow_lr(rule_name, start_pos, m) #:nodoc:
+    def setup_lr(rule_name, lr) #:nodoc:
+      lr.head ||= Head.new(rule_name)
+      @lr_stack.reverse_each do |_|
+        return if _.head == lr.head
+        lr.head.involved_set[_.rule_name] = _.rule_name
+      end
+    end
+    # @private
+    def lr_answer(rule_name, start_pos, m) #:nodoc:
+      head = m.result.head
+      if head.rule_name == rule_name
+        grow_lr(rule_name, start_pos, m, head) if m.result = m.result.seed
+      else
+        memorize m, m.result.seed
+      end
+    end
+    # @private
+    def grow_lr(rule_name, start_pos, m, head) #:nodoc:
+      @heads[start_pos] = head
       loop do
         @scanner.pos = start_pos
+        head.eval_set.replace(head.involved_set)
         result = eval_rule(rule_name)
-        return recall(m) if !result or @scanner.pos <= m.end_pos
+        if !result or @scanner.pos <= m.end_pos
+          @heads.delete(start_pos)
+          return recall m, rule_name
+        end
         memorize m, result
       end
     end
     # @private
-    class LR
-      def initialize(detected = false)
-        @detected = detected
+    class LR #:nodoc:
+      def initialize(seed, rule_name, head)
+        @seed = seed
+        @rule_name = rule_name
+        @head = head
       end
-      attr_accessor :detected
+      attr_accessor :seed, :rule_name, :head
     end
-  end
+    # @private
+    class Head #:nodoc:
+      def initialize(rule_name)
+        @rule_name = rule_name
+        @involved_set = {}
+        @eval_set = {}
+      end
+      attr_accessor :rule_name, :involved_set, :eval_set
+      def involves?(rule_name)
+        rule_name == self.rule_name or involved_set.has_key? rule_name
+      end
+    end
+  end
 end

data/lib/rattler/runtime/packrat_parser.rb CHANGED Viewed

@@ -16,7 +16,7 @@ module Rattler::Runtime
   # @author Jason Arhart
   #
   class PackratParser < RecursiveDescentParser
     # Create a new packrat parser to parse +source+.
     #
     # @param (see RecursiveDescentParser#initialize)
@@ -24,15 +24,15 @@ module Rattler::Runtime
     #
     def initialize(source, options={})
       super
-      @memo = {}
+      @memo = Hash.new {|h, rule_name| h[rule_name] = {} }
     end
     # @private
     alias_method :eval_rule, :apply
     private :eval_rule
     protected
     # Apply a rule by dispatching to the method associated with the given rule
     # name, which is named by <tt>"match_#{rule_name}"<tt>, and if the match
     # fails set a parse error. The result of applying the rule is memoized
@@ -44,22 +44,29 @@ module Rattler::Runtime
     #
     def apply(rule_name)
       start_pos = @scanner.pos
-      key = [rule_name, start_pos]
-      if @memo.has_key? key
-        recall @memo[key]
+      if m = memo(rule_name, start_pos)
+        recall m, rule_name
       else
-        apply! rule_name, key, start_pos
+        apply! rule_name, start_pos
       end
     end
     private
     # @private
-    def apply!(rule_name, key, start_pos) #:nodoc:
-      m = @memo[key] = MemoEntry.new(false, start_pos, start_pos, 'left-recursion detected')
+    def apply!(rule_name, start_pos) #:nodoc:
+      m = inject_memo rule_name, start_pos, false, start_pos, start_pos, 'left-recursion detected'
       memorize m, eval_rule(rule_name)
     end
+    def memo(rule_name, start_pos)
+      @memo[rule_name][start_pos]
+    end
+    def inject_memo(rule_name, start_pos, result, end_pos, failure_pos, failure_msg)
+      @memo[rule_name][start_pos] = MemoEntry.new(result, end_pos, failure_pos, failure_msg)
+    end
     # @private
     def memorize(m, result) #:nodoc:
       m.end_pos = @scanner.pos
@@ -69,7 +76,7 @@ module Rattler::Runtime
     end
     # @private
-    def recall(m) #:nodoc:
+    def recall(m, rule_name) #:nodoc:
       @scanner.pos = m.end_pos
       @failure_pos = m.failure_pos
       @failure_msg = m.failure_msg
@@ -77,7 +84,7 @@ module Rattler::Runtime
     end
     # @private
-    class MemoEntry
+    class MemoEntry #:nodoc:
       def initialize(result, end_pos, failure_pos, failure_msg)
         @result = result
         @end_pos = end_pos

data/lib/rattler/runtime/parser.rb CHANGED Viewed

@@ -15,7 +15,16 @@ module Rattler::Runtime
   # @author Jason Arhart
   #
   class Parser
+    # Parse +source+ and raise a {SyntaxError} if the parse fails.
+    #
+    # @param (see #initialize)
+    # @raise (see #parse!)
+    # @return (see #parse!)
+    def self.parse!(source, options={})
+      self.new(source, options).parse!
+    end
     # Create a new parser to parse +source+.
     #
     # @param [String] source the source to parse
@@ -26,24 +35,58 @@ module Rattler::Runtime
       @scanner = StringScanner.new(source)
       @tab_size = options[:tab_size]
     end
     # The source that this parser parses
     # @return [String] the source that this parser parses
     attr_reader :source
+    # Parse or register a parse failure
+    #
+    # @return the parse result
+    def parse
+      catch(:parse_failed) { return finish __parse__ }
+      false
+    end
+    # Parse or raise a {SyntaxError}
+    #
+    # @raise [SyntaxError] a {SyntaxError} if the parse fails
+    #
+    # @return (see #parse)
+    def parse!
+      parse or raise_error
+    end
+    # Parse the entire source or register a parse failure
+    #
+    # @return the parse result if the entire source was matched
+    def parse_fully
+      (result = parse) && (@scanner.eos? || fail { :EOF }) && result
+    end
+    # Parse the entire source or raise a {SyntaxError}
+    #
+    # @raise [SyntaxError] a {SyntaxError} if the parse fails or the entire
+    #   source is not matched
+    #
+    # @return (see #parse_fully)
+    def parse_fully!
+      parse_full or raise_error
+    end
     # The current parse position
     # @return [Integer] the current parse position
     def pos
       @scanner.pos
     end
     # Set the current parse position
     # @param [Integer] n the new parse position
     # @return [Integer] n
     def pos=(n)
       @scanner.pos = n
     end
     # Fail and register a parse failure, unless a failure has already
     # occurred at the same or later position in the source.
     #
@@ -58,28 +101,41 @@ module Rattler::Runtime
         register_failure pos, (block_given? ? yield : nil)
       end
     end
     # Fail and register a parse failure, unless a failure has already
     # occurred at a later position in the source.
     #
-    # @yieldreturn [String, Symbol] a failure message or rule name
-    #
-    # @see ParseFailure
+    # @yieldreturn (see #fail)
     #
-    # @return [false]
+    # @return (see #fail)
     def fail! # :yield:
       pos = @scanner.pos
       unless failure? and @failure_pos > pos
         register_failure pos, (block_given? ? yield : nil)
       end
     end
+    # Fail the same as <tt>#fail</tt> but cause the entire parse to fail
+    # immediately.
+    #
+    # @yieldreturn (see #fail)
+    #
+    # @return (see #fail)
+    def fail_parse
+      if block_given?
+        fail! { yield }
+      else
+        fail!
+      end
+      throw :parse_failed
+    end
     # Return true if there is a parse failure
     # @return [Boolean] true if there is a parse failure
     def failure?
       !@failure_pos.nil?
     end
     # Return the last parse failure
     # @return [ParseFailure] the last parse failure
     def failure
@@ -87,9 +143,9 @@ module Rattler::Runtime
         @__failure__ ||= ParseFailure.new(source, @failure_pos, @failure_msg)
       end
     end
     protected
     # Finish any necessary clean-up based on the final parse result.
     # @param final_result the final parse result
     # @return final_result
@@ -97,7 +153,7 @@ module Rattler::Runtime
       clear_failure if final_result
       final_result
     end
     # Register a parse failure
     #
     # @param [Integer] position the position of the failure
@@ -110,20 +166,20 @@ module Rattler::Runtime
       @__failure__ = nil
       false
     end
     # Clear the registered failure
     def clear_failure
       @failure_pos = nil
       @failure_msg = nil
       @__failure__ = nil
     end
     # Raise a {SyntaxError} for the last parse failure
     # @raise [SyntaxError] a {SyntaxError} for the last parse failure
     # @return [nothing]
     def raise_error
       raise SyntaxError, failure.to_s
     end
   end
 end

data/lib/rattler/runtime/recursive_descent_parser.rb CHANGED Viewed

@@ -19,17 +19,7 @@ module Rattler::Runtime
   class RecursiveDescentParser < Parser
     include ParserHelper
     include Rattler::Grammar::GrammarDSL
-    # Parse +source+ by matching the start rule and raise a {SyntaxError} if
-    # the parse fails.
-    #
-    # @param (see #initialize)
-    # @raise (see #parse!)
-    # @return (see #parse!)
-    def self.parse!(source, options={})
-      self.new(source, options).parse!
-    end
     # Create a new recursive descent parser to parse +source+.
     #
     # @param (see Parser#initialize)
@@ -39,26 +29,7 @@ module Rattler::Runtime
       super
       @rule_method_names = Hash.new {|h, name| h[name] = :"match_#{name}" }
     end
-    # Parse by matching the rule returned by <tt>#start_rule</tt> or
-    # <tt>:start</tt> if <tt>#start_rule</tt> is not defined.
-    #
-    # @return the result of applying the start rule
-    def parse
-      catch(:parse_failed) { return finish(match(start_rule)) }
-      false
-    end
-    # Parse by matching the start rule and raise a {SyntaxError} if the parse
-    # fails.
-    #
-    # @raise [SyntaxError] a {SyntaxError} if the parse fails
-    #
-    # @return the result of applying the start rule if successful
-    def parse!
-      parse or raise_error
-    end
     # Apply a rule by dispatching to the method associated with +rule_name+
     # which is named by <tt>"match_#{rule_name}"<tt>, and if the match fails
     # register a parse failure.
@@ -69,17 +40,25 @@ module Rattler::Runtime
     def match(rule_name)
       apply(rule_name) or fail { rule_name }
     end
     def method_missing(symbol, *args)
       (symbol == :start_rule) ? :start : super
     end
     def respond_to?(symbol)
       super or (symbol == :start_rule)
     end
     protected
+    # Parse by matching the rule returned by <tt>#start_rule</tt> or
+    # <tt>:start</tt> if <tt>#start_rule</tt> is not defined.
+    #
+    # @return the result of applying the start rule
+    def __parse__
+      match start_rule
+    end
     # Apply a rule by dispatching to the method associated with the given rule
     # name, which is named by <tt>"match_#{rule_name}"<tt>. This method is
     # called by +match+ and should not be called directly.
@@ -91,16 +70,6 @@ module Rattler::Runtime
     def apply(rule_name)
       send @rule_method_names[rule_name]
     end
-    # Fail the same as <tt>#fail</tt> but cause the entire parse to fail.
-    def fail_parse
-      if block_given?
-        fail! { yield }
-      else
-        fail!
-      end
-      throw :parse_failed
-    end
   end
 end