RubyGems - lrama - Versions diffs - 0.5.9 → 0.5.11 - Mend

lrama 0.5.9 → 0.5.11

Files changed (74) hide show

checksums.yaml +4 -4
data/.github/workflows/test.yaml +25 -0
data/.gitignore +7 -4
data/Gemfile +9 -5
data/Rakefile +13 -0
data/Steepfile +13 -11
data/lib/lrama/context.rb +1 -3
data/lib/lrama/counterexamples/path.rb +0 -46
data/lib/lrama/counterexamples/production_path.rb +17 -0
data/lib/lrama/counterexamples/start_path.rb +21 -0
data/lib/lrama/counterexamples/transition_path.rb +17 -0
data/lib/lrama/counterexamples.rb +3 -0
data/lib/lrama/grammar/code/initial_action_code.rb +28 -0
data/lib/lrama/grammar/code/no_reference_code.rb +24 -0
data/lib/lrama/grammar/code/printer_code.rb +34 -0
data/lib/lrama/grammar/code/rule_action.rb +62 -0
data/lib/lrama/grammar/code.rb +9 -93
data/lib/lrama/grammar/counter.rb +15 -0
data/lib/lrama/grammar/error_token.rb +3 -3
data/lib/lrama/grammar/parameterizing_rules/builder/base.rb +36 -0
data/lib/lrama/grammar/parameterizing_rules/builder/list.rb +28 -0
data/lib/lrama/grammar/parameterizing_rules/builder/nonempty_list.rb +28 -0
data/lib/lrama/grammar/parameterizing_rules/builder/option.rb +28 -0
data/lib/lrama/grammar/parameterizing_rules/builder/separated_list.rb +39 -0
data/lib/lrama/grammar/parameterizing_rules/builder/separated_nonempty_list.rb +34 -0
data/lib/lrama/grammar/parameterizing_rules/builder.rb +60 -0
data/lib/lrama/grammar/printer.rb +3 -3
data/lib/lrama/grammar/reference.rb +7 -16
data/lib/lrama/grammar/rule.rb +19 -2
data/lib/lrama/grammar/rule_builder.rb +177 -0
data/lib/lrama/grammar/symbol.rb +16 -2
data/lib/lrama/grammar/type.rb +6 -0
data/lib/lrama/grammar.rb +115 -325
data/lib/lrama/lexer/location.rb +22 -0
data/lib/lrama/lexer/token/parameterizing.rb +18 -3
data/lib/lrama/lexer/token/tag.rb +4 -0
data/lib/lrama/lexer/token/user_code.rb +54 -4
data/lib/lrama/lexer/token.rb +35 -10
data/lib/lrama/lexer.rb +32 -31
data/lib/lrama/options.rb +1 -2
data/lib/lrama/output.rb +2 -2
data/lib/lrama/parser.rb +514 -424
data/lib/lrama/report/profile.rb +1 -12
data/lib/lrama/version.rb +1 -1
data/lib/lrama.rb +0 -1
data/parser.y +111 -52
data/rbs_collection.lock.yaml +6 -8
data/rbs_collection.yaml +1 -0
data/sig/lrama/grammar/code/printer_code.rbs +15 -0
data/sig/lrama/grammar/code.rbs +24 -0
data/sig/lrama/grammar/counter.rbs +11 -0
data/sig/lrama/grammar/error_token.rbs +11 -0
data/sig/lrama/grammar/parameterizing_rules/builder/base.rbs +26 -0
data/sig/lrama/grammar/parameterizing_rules/builder/list.rbs +10 -0
data/sig/lrama/grammar/parameterizing_rules/builder/nonempty_list.rbs +10 -0
data/sig/lrama/grammar/parameterizing_rules/builder/option.rbs +10 -0
data/sig/lrama/grammar/parameterizing_rules/builder/separated_list.rbs +11 -0
data/sig/lrama/grammar/parameterizing_rules/builder/separated_nonempty_list.rbs +11 -0
data/sig/lrama/grammar/parameterizing_rules/builder.rbs +23 -0
data/sig/lrama/grammar/precedence.rbs +11 -0
data/sig/lrama/grammar/printer.rbs +11 -0
data/sig/lrama/grammar/reference.rbs +6 -6
data/sig/lrama/grammar/rule.rbs +13 -0
data/sig/lrama/grammar/rule_builder.rbs +42 -0
data/sig/lrama/grammar/symbol.rbs +37 -0
data/sig/lrama/lexer/location.rbs +14 -0
data/sig/lrama/lexer/token/parameterizing.rbs +9 -0
data/sig/lrama/lexer/token/tag.rbs +1 -0
data/sig/lrama/lexer/token/user_code.rbs +8 -1
data/sig/lrama/lexer/token.rbs +9 -4
data/sig/stdlib/strscan/string_scanner.rbs +5 -0
data/template/bison/yacc.c +5 -2
metadata +38 -3
data/lib/lrama/type.rb +0 -4

data/lib/lrama/lexer/token/user_code.rb CHANGED Viewed

@@ -1,12 +1,62 @@
+require "strscan"
 module Lrama
   class Lexer
     class Token
       class UserCode < Token
-        attr_accessor :references
+        def references
+          @references ||= _references
+        end
+        private
+        def _references
+          scanner = StringScanner.new(s_value)
+          references = []
+          while !scanner.eos? do
+            case
+            when reference = scan_reference(scanner)
+              references << reference
+            when scanner.scan(/\/\*/)
+              scanner.scan_until(/\*\//)
+            else
+              scanner.getch
+            end
+          end
+          references
+        end
+        def scan_reference(scanner)
+          start = scanner.pos
+          case
+          # $ references
+          # It need to wrap an identifier with brackets to use ".-" for identifiers
+          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?\$/) # $$, $<long>$
+            tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
+            return Lrama::Grammar::Reference.new(type: :dollar, name: "$", ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?(\d+)/) # $1, $2, $<long>1
+            tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
+            return Lrama::Grammar::Reference.new(type: :dollar, index: Integer(scanner[2]), ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?([a-zA-Z_][a-zA-Z0-9_]*)/) # $foo, $expr, $<long>program (named reference without brackets)
+            tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
+            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/\$(<[a-zA-Z0-9_]+>)?\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # $expr.right, $expr-right, $<long>program (named reference with brackets)
+            tag = scanner[1] ? Lrama::Lexer::Token::Tag.new(s_value: scanner[1]) : nil
+            return Lrama::Grammar::Reference.new(type: :dollar, name: scanner[2], ex_tag: tag, first_column: start, last_column: scanner.pos - 1)
-        def initialize(s_value: nil, alias_name: nil)
-          super
-          self.references = []
+          # @ references
+          # It need to wrap an identifier with brackets to use ".-" for identifiers
+          when scanner.scan(/@\$/) # @$
+            return Lrama::Grammar::Reference.new(type: :at, name: "$", first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/@(\d+)/) # @1
+            return Lrama::Grammar::Reference.new(type: :at, index: Integer(scanner[1]), first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/@([a-zA-Z][a-zA-Z0-9_]*)/) # @foo, @expr (named reference without brackets)
+            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos - 1)
+          when scanner.scan(/@\[([a-zA-Z_.][-a-zA-Z0-9_.]*)\]/) # @expr.right, @expr-right  (named reference with brackets)
+            return Lrama::Grammar::Reference.new(type: :at, name: scanner[1], first_column: start, last_column: scanner.pos - 1)
+          end
         end
       end
     end

data/lib/lrama/lexer/token.rb CHANGED Viewed

@@ -1,26 +1,51 @@
+require 'lrama/lexer/token/char'
+require 'lrama/lexer/token/ident'
+require 'lrama/lexer/token/parameterizing'
+require 'lrama/lexer/token/tag'
+require 'lrama/lexer/token/user_code'
 module Lrama
   class Lexer
-    class Token < Struct.new(:s_value, :alias_name, keyword_init: true)
+    class Token
+      attr_reader :s_value, :location
+      attr_accessor :alias_name, :referred
-      attr_accessor :line, :column, :referred
+      def initialize(s_value:, alias_name: nil, location: nil)
+        s_value.freeze
+        @s_value = s_value
+        @alias_name = alias_name
+        @location = location
+      end
       def to_s
-        "#{super} line: #{line}, column: #{column}"
+        "#{super} location: #{location}"
       end
       def referred_by?(string)
-        [self.s_value, self.alias_name].include?(string)
+        [self.s_value, self.alias_name].compact.include?(string)
       end
       def ==(other)
         self.class == other.class && self.s_value == other.s_value
       end
+      def first_line
+        location.first_line
+      end
+      alias :line :first_line
+      def first_column
+        location.first_column
+      end
+      alias :column :first_column
+      def last_line
+        location.last_line
+      end
+      def last_column
+        location.last_column
+      end
     end
   end
 end
-require 'lrama/lexer/token/char'
-require 'lrama/lexer/token/ident'
-require 'lrama/lexer/token/parameterizing'
-require 'lrama/lexer/token/tag'
-require 'lrama/lexer/token/user_code'

data/lib/lrama/lexer.rb CHANGED Viewed

@@ -1,4 +1,5 @@
 require "strscan"
+require "lrama/lexer/location"
 require "lrama/lexer/token"
 module Lrama
@@ -7,7 +8,7 @@ module Lrama
     attr_accessor :status
     attr_accessor :end_symbol
-    SYMBOLS = %w(%{ %} %% { } \[ \] : \| ;)
+    SYMBOLS = ['%{', '%}', '%%', '{', '}', '\[', '\]', '\(', '\)', '\,', ':', '\|', ';']
     PERCENT_TOKENS = %w(
       %union
       %token
@@ -31,8 +32,8 @@ module Lrama
     def initialize(text)
       @scanner = StringScanner.new(text)
-      @head = @scanner.pos
-      @line = 1
+      @head_column = @head = @scanner.pos
+      @head_line = @line = 1
       @status = :initial
       @end_symbol = nil
     end
@@ -54,6 +55,13 @@ module Lrama
       @scanner.pos - @head
     end
+    def location
+      Location.new(
+        first_line: @head_line, first_column: @head_column,
+        last_line: @line, last_column: column
+      )
+    end
     def lex_token
       while !@scanner.eos? do
         case
@@ -63,9 +71,8 @@ module Lrama
           # noop
         when @scanner.scan(/\/\*/)
           lex_comment
-        when @scanner.scan(/\/\//)
-          @scanner.scan_until(/\n/)
-          newline
+        when @scanner.scan(/\/\/.*(?<newline>\n)?/)
+          newline if @scanner[:newline]
         else
           break
         end
@@ -84,17 +91,17 @@ module Lrama
       when @scanner.scan(/[\?\+\*]/)
         return [@scanner.matched, @scanner.matched]
       when @scanner.scan(/<\w+>/)
-        return [:TAG, setup_token(Lrama::Lexer::Token::Tag.new(s_value: @scanner.matched))]
+        return [:TAG, Lrama::Lexer::Token::Tag.new(s_value: @scanner.matched, location: location)]
       when @scanner.scan(/'.'/)
-        return [:CHARACTER, setup_token(Lrama::Lexer::Token::Char.new(s_value: @scanner.matched))]
+        return [:CHARACTER, Lrama::Lexer::Token::Char.new(s_value: @scanner.matched, location: location)]
       when @scanner.scan(/'\\\\'|'\\b'|'\\t'|'\\f'|'\\r'|'\\n'|'\\v'|'\\13'/)
-        return [:CHARACTER, setup_token(Lrama::Lexer::Token::Char.new(s_value: @scanner.matched))]
-      when @scanner.scan(/"/)
-        return [:STRING, %Q("#{@scanner.scan_until(/"/)})]
+        return [:CHARACTER, Lrama::Lexer::Token::Char.new(s_value: @scanner.matched, location: location)]
+      when @scanner.scan(/".*?"/)
+        return [:STRING, %Q(#{@scanner.matched})]
       when @scanner.scan(/\d+/)
         return [:INTEGER, Integer(@scanner.matched)]
       when @scanner.scan(/([a-zA-Z_.][-a-zA-Z0-9_.]*)/)
-        token = setup_token(Lrama::Lexer::Token::Ident.new(s_value: @scanner.matched))
+        token = Lrama::Lexer::Token::Ident.new(s_value: @scanner.matched, location: location)
         type =
           if @scanner.check(/\s*(\[\s*[a-zA-Z_.][-a-zA-Z0-9_.]*\s*\])?\s*:/)
             :IDENT_COLON
@@ -118,25 +125,27 @@ module Lrama
         when @scanner.scan(/}/)
           if nested == 0 && @end_symbol == '}'
             @scanner.unscan
-            return [:C_DECLARATION, setup_token(Lrama::Lexer::Token::UserCode.new(s_value: code))]
+            return [:C_DECLARATION, Lrama::Lexer::Token::UserCode.new(s_value: code, location: location)]
           else
             code += @scanner.matched
             nested -= 1
           end
         when @scanner.check(/#{@end_symbol}/)
-          return [:C_DECLARATION, setup_token(Lrama::Lexer::Token::UserCode.new(s_value: code))]
+          return [:C_DECLARATION, Lrama::Lexer::Token::UserCode.new(s_value: code, location: location)]
         when @scanner.scan(/\n/)
           code += @scanner.matched
           newline
-        when @scanner.scan(/"/)
-          matched = @scanner.scan_until(/"/)
-          code += %Q("#{matched})
-          @line += matched.count("\n")
-        when @scanner.scan(/'/)
-          matched = @scanner.scan_until(/'/)
-          code += %Q('#{matched})
+        when @scanner.scan(/".*?"/)
+          code += %Q(#{@scanner.matched})
+          @line += @scanner.matched.count("\n")
+        when @scanner.scan(/'.*?'/)
+          code += %Q(#{@scanner.matched})
         else
-          code += @scanner.getch
+          if @scanner.scan(/[^\"'\{\}\n#{@end_symbol}]+/)
+            code += @scanner.matched
+          else
+            code += @scanner.getch
+          end
         end
       end
       raise ParseError, "Unexpected code: #{code}."
@@ -148,8 +157,7 @@ module Lrama
       while !@scanner.eos? do
         case
         when @scanner.scan(/\n/)
-          @line += 1
-          @head = @scanner.pos + 1
+          newline
         when @scanner.scan(/\*\//)
           return
         else
@@ -158,13 +166,6 @@ module Lrama
       end
     end
-    def setup_token(token)
-      token.line = @head_line
-      token.column = @head_column
-      token
-    end
     def newline
       @line += 1
       @head = @scanner.pos + 1

data/lib/lrama/options.rb CHANGED Viewed

@@ -4,7 +4,7 @@ module Lrama
     attr_accessor :skeleton, :header, :header_file,
                   :report_file, :outfile,
                   :error_recovery, :grammar_file,
-                  :report_file, :trace_opts, :report_opts, :y,
+                  :trace_opts, :report_opts, :y,
                   :debug
     def initialize
@@ -15,7 +15,6 @@ module Lrama
       @outfile = "y.tab.c"
       @error_recovery = false
       @grammar_file = nil
-      @report_file = nil
       @trace_opts = nil
       @report_opts = nil
       @y = STDIN

data/lib/lrama/output.rb CHANGED Viewed

@@ -186,9 +186,9 @@ module Lrama
       str = ""
       @context.states.rules.each do |rule|
-        next unless rule.code
+        next unless rule.token_code
-        code = rule.code
+        code = rule.token_code
         spaces = " " * (code.column - 1)
         str << <<-STR