RubyGems - lrama - Versions diffs - 0.5.12 → 0.6.0 - Mend

lrama 0.5.12 → 0.6.0

Files changed (39) hide show

checksums.yaml +4 -4
data/.github/workflows/test.yaml +1 -1
data/Gemfile +1 -1
data/NEWS.md +20 -0
data/README.md +14 -3
data/Steepfile +3 -0
data/lib/lrama/grammar/code/printer_code.rb +1 -1
data/lib/lrama/grammar/code/rule_action.rb +1 -1
data/lib/lrama/grammar/code.rb +19 -7
data/lib/lrama/grammar/parameterizing_rule.rb +6 -0
data/lib/lrama/grammar/parameterizing_rule_builder.rb +34 -0
data/lib/lrama/grammar/parameterizing_rule_resolver.rb +30 -0
data/lib/lrama/grammar/parameterizing_rule_rhs_builder.rb +53 -0
data/lib/lrama/grammar/rule_builder.rb +26 -22
data/lib/lrama/grammar.rb +15 -41
data/lib/lrama/lexer/grammar_file.rb +21 -0
data/lib/lrama/lexer/location.rb +77 -2
data/lib/lrama/lexer/token/instantiate_rule.rb +18 -0
data/lib/lrama/lexer/token/user_code.rb +10 -10
data/lib/lrama/lexer/token.rb +1 -1
data/lib/lrama/lexer.rb +21 -11
data/lib/lrama/parser.rb +619 -454
data/lib/lrama/states_reporter.rb +1 -1
data/lib/lrama/version.rb +1 -1
data/parser.y +95 -30
data/sig/lrama/grammar/code/printer_code.rbs +1 -1
data/sig/lrama/grammar/code.rbs +5 -5
data/sig/lrama/grammar/parameterizing_rule.rbs +10 -0
data/sig/lrama/grammar/parameterizing_rule_builder.rbs +19 -0
data/sig/lrama/grammar/parameterizing_rule_resolver.rbs +16 -0
data/sig/lrama/grammar/parameterizing_rule_rhs_builder.rbs +18 -0
data/sig/lrama/grammar/parameterizing_rules/builder/base.rbs +2 -2
data/sig/lrama/grammar/parameterizing_rules/builder.rbs +1 -1
data/sig/lrama/grammar/rule_builder.rbs +2 -4
data/sig/lrama/lexer/grammar_file.rbs +15 -0
data/sig/lrama/lexer/location.rbs +13 -1
data/sig/lrama/lexer/token/{parameterizing.rbs → instantiate_rule.rbs} +2 -7
metadata +15 -5
data/lib/lrama/lexer/token/parameterizing.rb +0 -34

data/lib/lrama/lexer/token/user_code.rb CHANGED Viewed

@@ -35,27 +35,27 @@ module Lrama
           # It need to wrap an identifier with brackets to use ".-" for identifiers
           when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?\$/) # $$, $<long>$
             tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
-            return Lrama::Grammar::Reference.new(type: :dollar, name: "$", ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :dollar, name: "$", ex_tag: tag, first_column: start, last_column: scanner.pos)
           when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?(\d+)/) # $1, $2, $<long>1
             tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
-            return Lrama::Grammar::Reference.new(type: :dollar, index: Integer(scanner[2]), ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :dollar, index: Integer(scanner[2]), ex_tag: tag, first_column: start, last_column: scanner.pos)
           when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?([a-zA-Z_][a-zA-Z0-9_]*)/) # $foo, $expr, $<long>program (named reference without brackets)
             tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
-            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
-          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # $expr.right, $expr-right, $<long>program (named reference with brackets)
+            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos)
+          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # $[expr.right], $[expr-right], $<long>[expr.right] (named reference with brackets)
             tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
-            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos)
           # @ references
           # It need to wrap an identifier with brackets to use ".-" for identifiers
           when scanner.scan(/@\$/) # @$
-            return Lrama::Grammar::Reference.new(type: :at, name: "$", first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :at, name: "$", first_column: start, last_column: scanner.pos)
           when scanner.scan(/@(\d+)/) # @1
-            return Lrama::Grammar::Reference.new(type: :at, index: Integer(scanner[1]), first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :at, index: Integer(scanner[1]), first_column: start, last_column: scanner.pos)
           when scanner.scan(/@([a-zA-Z][a-zA-Z0-9_]*)/) # @foo, @expr (named reference without brackets)
-            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos - 1)
-          when scanner.scan(/@\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # @expr.right, @expr-right  (named reference with brackets)
-            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos - 1)
+            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos)
+          when scanner.scan(/@\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # @[expr.right], @[expr-right]  (named reference with brackets)
+            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos)
           end
         end
       end

data/lib/lrama/lexer/token.rb CHANGED Viewed

@@ -1,6 +1,6 @@
 require 'lrama/lexer/token/char'
 require 'lrama/lexer/token/ident'
-require 'lrama/lexer/token/parameterizing'
+require 'lrama/lexer/token/instantiate_rule'
 require 'lrama/lexer/token/tag'
 require 'lrama/lexer/token/user_code'

data/lib/lrama/lexer.rb CHANGED Viewed

@@ -1,4 +1,5 @@
 require "strscan"
+require "lrama/lexer/grammar_file"
 require "lrama/lexer/location"
 require "lrama/lexer/token"
@@ -28,10 +29,12 @@ module Lrama
       %error-token
       %empty
       %code
+      %rule
     )
-    def initialize(text)
-      @scanner = StringScanner.new(text)
+    def initialize(grammar_file)
+      @grammar_file = grammar_file
+      @scanner = StringScanner.new(grammar_file.text)
       @head_column = @head = @scanner.pos
       @head_line = @line = 1
       @status = :initial
@@ -57,8 +60,9 @@ module Lrama
     def location
       Location.new(
+        grammar_file: @grammar_file,
         first_line: @head_line, first_column: @head_column,
-        last_line: @line, last_column: column
+        last_line: line, last_column: column
       )
     end
@@ -78,8 +82,7 @@ module Lrama
         end
       end
-      @head_line = line
-      @head_column = column
+      reset_first_position
       case
       when @scanner.eos?
@@ -117,6 +120,8 @@ module Lrama
     def lex_c_code
       nested = 0
       code = ''
+      reset_first_position
       while !@scanner.eos? do
         case
         when @scanner.scan(/{/)
@@ -140,12 +145,12 @@ module Lrama
           @line += @scanner.matched.count("\n")
         when @scanner.scan(/'.*?'/)
           code += %Q(#{@scanner.matched})
+        when @scanner.scan(/[^\"'\{\}\n]+/)
+          code += @scanner.matched
+        when @scanner.scan(/#{Regexp.escape(@end_symbol)}/)
+          code += @scanner.matched
         else
-          if @scanner.scan(/[^\"'\{\}\n#{@end_symbol}]+/)
-            code += @scanner.matched
-          else
-            code += @scanner.getch
-          end
+          code += @scanner.getch
         end
       end
       raise ParseError, "Unexpected code: #{code}."
@@ -166,9 +171,14 @@ module Lrama
       end
     end
+    def reset_first_position
+      @head_line = line
+      @head_column = column
+    end
     def newline
       @line += 1
-      @head = @scanner.pos + 1
+      @head = @scanner.pos
     end
   end
 end