RubyGems - lrama - Versions diffs - 0.7.0 → 0.7.1 - Mend

lrama 0.7.0 → 0.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (260) hide show

checksums.yaml +4 -4
data/.gitattributes +2 -0
data/.github/workflows/codespell.yaml +1 -1
data/.github/workflows/gh-pages.yml +5 -6
data/.github/workflows/test.yaml +25 -14
data/Gemfile +4 -3
data/NEWS.md +370 -35
data/README.md +7 -88
data/Rakefile +3 -2
data/Steepfile +11 -5
data/doc/Index.md +1 -1
data/doc/development/compressed_state_table/parser.rb +2 -0
data/doc/development/profiling.md +44 -0
data/exe/lrama +1 -1
data/lib/lrama/bitmap.rb +18 -5
data/lib/lrama/command.rb +95 -43
data/lib/lrama/context.rb +22 -24
data/lib/lrama/counterexamples/derivation.rb +14 -4
data/lib/lrama/counterexamples/example.rb +47 -22
data/lib/lrama/counterexamples/node.rb +30 -0
data/lib/lrama/counterexamples/path.rb +12 -14
data/lib/lrama/counterexamples/state_item.rb +24 -1
data/lib/lrama/counterexamples/triple.rb +27 -9
data/lib/lrama/counterexamples.rb +216 -88
data/lib/lrama/diagram.rb +77 -0
data/lib/lrama/digraph.rb +28 -7
data/lib/lrama/erb.rb +29 -0
data/lib/lrama/grammar/auxiliary.rb +6 -1
data/lib/lrama/grammar/binding.rb +37 -25
data/lib/lrama/grammar/code/destructor_code.rb +11 -0
data/lib/lrama/grammar/code/initial_action_code.rb +3 -0
data/lib/lrama/grammar/code/no_reference_code.rb +3 -0
data/lib/lrama/grammar/code/printer_code.rb +11 -0
data/lib/lrama/grammar/code/rule_action.rb +17 -0
data/lib/lrama/grammar/code.rb +16 -1
data/lib/lrama/grammar/counter.rb +10 -0
data/lib/lrama/grammar/destructor.rb +14 -1
data/lib/lrama/grammar/error_token.rb +14 -1
data/lib/lrama/grammar/inline/resolver.rb +80 -0
data/lib/lrama/grammar/inline.rb +3 -0
data/lib/lrama/grammar/{parameterizing_rule → parameterized}/resolver.rb +19 -8
data/lib/lrama/grammar/{parameterizing_rule → parameterized}/rhs.rb +7 -2
data/lib/lrama/grammar/parameterized/rule.rb +36 -0
data/lib/lrama/grammar/parameterized.rb +5 -0
data/lib/lrama/grammar/percent_code.rb +12 -1
data/lib/lrama/grammar/precedence.rb +43 -1
data/lib/lrama/grammar/printer.rb +9 -0
data/lib/lrama/grammar/reference.rb +13 -0
data/lib/lrama/grammar/rule.rb +61 -1
data/lib/lrama/grammar/rule_builder.rb +84 -69
data/lib/lrama/grammar/stdlib.y +68 -48
data/lib/lrama/grammar/symbol.rb +63 -19
data/lib/lrama/grammar/symbols/resolver.rb +64 -3
data/lib/lrama/grammar/type.rb +13 -1
data/lib/lrama/grammar/union.rb +12 -1
data/lib/lrama/grammar.rb +231 -35
data/lib/lrama/lexer/location.rb +25 -8
data/lib/lrama/lexer/token/base.rb +73 -0
data/lib/lrama/lexer/token/char.rb +15 -2
data/lib/lrama/lexer/token/empty.rb +14 -0
data/lib/lrama/lexer/token/ident.rb +2 -2
data/lib/lrama/lexer/token/instantiate_rule.rb +4 -4
data/lib/lrama/lexer/token/int.rb +14 -0
data/lib/lrama/lexer/token/str.rb +11 -0
data/lib/lrama/lexer/token/tag.rb +2 -2
data/lib/lrama/lexer/token/token.rb +11 -0
data/lib/lrama/lexer/token/user_code.rb +63 -37
data/lib/lrama/lexer/token.rb +6 -56
data/lib/lrama/lexer.rb +51 -23
data/lib/lrama/logger.rb +12 -2
data/lib/lrama/option_parser.rb +63 -9
data/lib/lrama/options.rb +25 -7
data/lib/lrama/output.rb +4 -11
data/lib/lrama/parser.rb +854 -723
data/lib/lrama/reporter/conflicts.rb +44 -0
data/lib/lrama/reporter/grammar.rb +39 -0
data/lib/lrama/reporter/precedences.rb +54 -0
data/lib/lrama/reporter/profile/call_stack.rb +45 -0
data/lib/lrama/reporter/profile/memory.rb +44 -0
data/lib/lrama/reporter/profile.rb +4 -0
data/lib/lrama/reporter/rules.rb +43 -0
data/lib/lrama/reporter/states.rb +387 -0
data/lib/lrama/reporter/terms.rb +44 -0
data/lib/lrama/reporter.rb +39 -0
data/lib/lrama/state/action/goto.rb +33 -0
data/lib/lrama/state/action/reduce.rb +71 -0
data/lib/lrama/state/action/shift.rb +39 -0
data/lib/lrama/state/action.rb +5 -0
data/lib/lrama/state/inadequacy_annotation.rb +140 -0
data/lib/lrama/{states → state}/item.rb +33 -4
data/lib/lrama/state/reduce_reduce_conflict.rb +14 -1
data/lib/lrama/state/resolved_conflict.rb +38 -4
data/lib/lrama/state/shift_reduce_conflict.rb +14 -1
data/lib/lrama/state.rb +301 -200
data/lib/lrama/states.rb +447 -175
data/lib/lrama/tracer/actions.rb +22 -0
data/lib/lrama/tracer/closure.rb +30 -0
data/lib/lrama/tracer/duration.rb +38 -0
data/lib/lrama/tracer/only_explicit_rules.rb +24 -0
data/lib/lrama/tracer/rules.rb +23 -0
data/lib/lrama/tracer/state.rb +33 -0
data/lib/lrama/tracer.rb +51 -0
data/lib/lrama/version.rb +2 -1
data/lib/lrama/warnings/conflicts.rb +27 -0
data/lib/lrama/warnings/implicit_empty.rb +29 -0
data/lib/lrama/warnings/name_conflicts.rb +63 -0
data/lib/lrama/warnings/redefined_rules.rb +23 -0
data/lib/lrama/warnings/required.rb +23 -0
data/lib/lrama/warnings/useless_precedence.rb +25 -0
data/lib/lrama/warnings.rb +33 -0
data/lib/lrama.rb +5 -5
data/parser.y +495 -404
data/rbs_collection.lock.yaml +27 -3
data/rbs_collection.yaml +2 -0
data/sig/generated/lrama/bitmap.rbs +12 -4
data/sig/generated/lrama/counterexamples/derivation.rbs +36 -0
data/sig/generated/lrama/counterexamples/example.rbs +58 -0
data/sig/generated/lrama/counterexamples/node.rbs +18 -0
data/sig/generated/lrama/counterexamples/path.rbs +23 -0
data/sig/generated/lrama/counterexamples/state_item.rbs +19 -0
data/sig/generated/lrama/counterexamples/triple.rbs +32 -0
data/sig/generated/lrama/counterexamples.rbs +98 -0
data/sig/generated/lrama/diagram.rbs +34 -0
data/sig/generated/lrama/digraph.rbs +26 -6
data/sig/generated/lrama/erb.rbs +14 -0
data/sig/generated/lrama/grammar/auxiliary.rbs +16 -0
data/sig/generated/lrama/grammar/binding.rbs +18 -12
data/sig/generated/lrama/grammar/code/destructor_code.rbs +26 -0
data/sig/{lrama → generated/lrama}/grammar/code/initial_action_code.rbs +6 -0
data/sig/{lrama → generated/lrama}/grammar/code/no_reference_code.rbs +6 -0
data/sig/generated/lrama/grammar/code/printer_code.rbs +26 -0
data/sig/generated/lrama/grammar/code/rule_action.rbs +63 -0
data/sig/generated/lrama/grammar/code.rbs +38 -0
data/sig/{lrama → generated/lrama}/grammar/counter.rbs +4 -0
data/sig/generated/lrama/grammar/destructor.rbs +19 -0
data/sig/generated/lrama/grammar/error_token.rbs +19 -0
data/sig/generated/lrama/grammar/inline/resolver.rbs +26 -0
data/sig/generated/lrama/grammar/parameterized/resolver.rbs +42 -0
data/sig/generated/lrama/grammar/parameterized/rhs.rbs +21 -0
data/sig/generated/lrama/grammar/parameterized/rule.rbs +28 -0
data/sig/{lrama → generated/lrama}/grammar/percent_code.rbs +8 -0
data/sig/generated/lrama/grammar/precedence.rbs +45 -0
data/sig/{lrama/grammar/error_token.rbs → generated/lrama/grammar/printer.rbs} +8 -3
data/sig/generated/lrama/grammar/reference.rbs +31 -0
data/sig/generated/lrama/grammar/rule.rbs +83 -0
data/sig/generated/lrama/grammar/rule_builder.rbs +91 -0
data/sig/generated/lrama/grammar/symbol.rbs +89 -0
data/sig/generated/lrama/grammar/symbols/resolver.rbs +131 -0
data/sig/generated/lrama/grammar/type.rbs +21 -0
data/sig/generated/lrama/grammar/union.rbs +17 -0
data/sig/generated/lrama/grammar.rbs +289 -0
data/sig/generated/lrama/lexer/location.rbs +12 -3
data/sig/generated/lrama/lexer/token/base.rbs +53 -0
data/sig/generated/lrama/lexer/token/char.rbs +9 -2
data/sig/generated/lrama/lexer/token/empty.rbs +11 -0
data/sig/generated/lrama/lexer/token/ident.rbs +2 -2
data/sig/generated/lrama/lexer/token/instantiate_rule.rbs +5 -5
data/sig/generated/lrama/lexer/token/int.rbs +13 -0
data/sig/generated/lrama/lexer/token/str.rbs +10 -0
data/sig/generated/lrama/lexer/token/tag.rbs +2 -2
data/sig/generated/lrama/lexer/token/token.rbs +10 -0
data/sig/generated/lrama/lexer/token/user_code.rbs +2 -2
data/sig/generated/lrama/lexer/token.rbs +1 -39
data/sig/generated/lrama/lexer.rbs +54 -0
data/sig/generated/lrama/logger.rbs +6 -0
data/sig/generated/lrama/option_parser.rbs +52 -0
data/sig/{lrama → generated/lrama}/options.rbs +27 -3
data/sig/generated/lrama/reporter/conflicts.rbs +18 -0
data/sig/generated/lrama/reporter/grammar.rbs +13 -0
data/sig/generated/lrama/reporter/precedences.rbs +15 -0
data/sig/generated/lrama/reporter/profile/call_stack.rbs +19 -0
data/sig/generated/lrama/reporter/profile/memory.rbs +19 -0
data/sig/generated/lrama/reporter/rules.rbs +13 -0
data/sig/generated/lrama/reporter/states.rbs +69 -0
data/sig/generated/lrama/reporter/terms.rbs +13 -0
data/sig/generated/lrama/reporter.rbs +13 -0
data/sig/generated/lrama/state/action/goto.rbs +28 -0
data/sig/generated/lrama/state/action/reduce.rbs +49 -0
data/sig/generated/lrama/state/action/shift.rbs +33 -0
data/sig/generated/lrama/state/inadequacy_annotation.rbs +45 -0
data/sig/generated/lrama/state/item.rbs +75 -0
data/sig/generated/lrama/state/reduce_reduce_conflict.rbs +19 -0
data/sig/generated/lrama/state/resolved_conflict.rbs +38 -0
data/sig/generated/lrama/state/shift_reduce_conflict.rbs +19 -0
data/sig/generated/lrama/state.rbs +231 -0
data/sig/generated/lrama/states.rbs +215 -0
data/sig/generated/lrama/tracer/actions.rbs +13 -0
data/sig/generated/lrama/tracer/closure.rbs +13 -0
data/sig/generated/lrama/tracer/duration.rbs +18 -0
data/sig/generated/lrama/tracer/only_explicit_rules.rbs +13 -0
data/sig/generated/lrama/tracer/rules.rbs +13 -0
data/sig/generated/lrama/tracer/state.rbs +16 -0
data/sig/generated/lrama/tracer.rbs +23 -0
data/sig/generated/lrama/version.rbs +5 -0
data/sig/generated/lrama/warnings/conflicts.rbs +13 -0
data/sig/generated/lrama/warnings/implicit_empty.rbs +17 -0
data/sig/generated/lrama/warnings/name_conflicts.rbs +31 -0
data/sig/generated/lrama/warnings/redefined_rules.rbs +13 -0
data/sig/generated/lrama/warnings/required.rbs +13 -0
data/sig/generated/lrama/warnings/useless_precedence.rbs +13 -0
data/sig/generated/lrama/warnings.rbs +11 -0
data/sig/railroad_diagrams/railroad_diagrams.rbs +16 -0
data/template/bison/_yacc.h +8 -0
data/template/diagram/diagram.html +102 -0
metadata +126 -66
data/lib/lrama/counterexamples/production_path.rb +0 -19
data/lib/lrama/counterexamples/start_path.rb +0 -23
data/lib/lrama/counterexamples/transition_path.rb +0 -19
data/lib/lrama/diagnostics.rb +0 -36
data/lib/lrama/grammar/parameterizing_rule/rule.rb +0 -24
data/lib/lrama/grammar/parameterizing_rule.rb +0 -5
data/lib/lrama/grammar_validator.rb +0 -37
data/lib/lrama/report/duration.rb +0 -27
data/lib/lrama/report/profile.rb +0 -16
data/lib/lrama/report.rb +0 -4
data/lib/lrama/state/reduce.rb +0 -37
data/lib/lrama/state/shift.rb +0 -15
data/lib/lrama/states_reporter.rb +0 -362
data/lib/lrama/trace_reporter.rb +0 -45
data/sig/generated/lrama/trace_reporter.rbs +0 -25
data/sig/lrama/counterexamples/derivation.rbs +0 -33
data/sig/lrama/counterexamples/example.rbs +0 -45
data/sig/lrama/counterexamples/path.rbs +0 -21
data/sig/lrama/counterexamples/production_path.rbs +0 -11
data/sig/lrama/counterexamples/start_path.rbs +0 -13
data/sig/lrama/counterexamples/state_item.rbs +0 -10
data/sig/lrama/counterexamples/transition_path.rbs +0 -11
data/sig/lrama/counterexamples/triple.rbs +0 -20
data/sig/lrama/counterexamples.rbs +0 -29
data/sig/lrama/grammar/auxiliary.rbs +0 -10
data/sig/lrama/grammar/code/destructor_code.rbs +0 -14
data/sig/lrama/grammar/code/printer_code.rbs +0 -14
data/sig/lrama/grammar/code/rule_action.rbs +0 -19
data/sig/lrama/grammar/code.rbs +0 -24
data/sig/lrama/grammar/destructor.rbs +0 -13
data/sig/lrama/grammar/parameterizing_rule/resolver.rbs +0 -24
data/sig/lrama/grammar/parameterizing_rule/rhs.rbs +0 -14
data/sig/lrama/grammar/parameterizing_rule/rule.rbs +0 -16
data/sig/lrama/grammar/parameterizing_rule.rbs +0 -6
data/sig/lrama/grammar/precedence.rbs +0 -13
data/sig/lrama/grammar/printer.rbs +0 -13
data/sig/lrama/grammar/reference.rbs +0 -22
data/sig/lrama/grammar/rule.rbs +0 -45
data/sig/lrama/grammar/rule_builder.rbs +0 -47
data/sig/lrama/grammar/symbol.rbs +0 -38
data/sig/lrama/grammar/symbols/resolver.rbs +0 -60
data/sig/lrama/grammar/type.rbs +0 -11
data/sig/lrama/grammar/union.rbs +0 -12
data/sig/lrama/grammar.rbs +0 -108
data/sig/lrama/report/duration.rbs +0 -11
data/sig/lrama/report/profile.rbs +0 -7
data/sig/lrama/state/reduce.rbs +0 -20
data/sig/lrama/state/reduce_reduce_conflict.rbs +0 -13
data/sig/lrama/state/resolved_conflict.rbs +0 -14
data/sig/lrama/state/shift.rbs +0 -14
data/sig/lrama/state/shift_reduce_conflict.rbs +0 -13
data/sig/lrama/state.rbs +0 -79
data/sig/lrama/states/item.rbs +0 -30
data/sig/lrama/states.rbs +0 -101
data/sig/lrama/warning.rbs +0 -16

data/lib/lrama/grammar.rb CHANGED Viewed

@@ -1,3 +1,4 @@
+# rbs_inline: enabled
 # frozen_string_literal: true
 require "forwardable"
@@ -7,7 +8,8 @@ require_relative "grammar/code"
 require_relative "grammar/counter"
 require_relative "grammar/destructor"
 require_relative "grammar/error_token"
-require_relative "grammar/parameterizing_rule"
+require_relative "grammar/inline"
+require_relative "grammar/parameterized"
 require_relative "grammar/percent_code"
 require_relative "grammar/precedence"
 require_relative "grammar/printer"
@@ -23,19 +25,89 @@ require_relative "lexer"
 module Lrama
   # Grammar is the result of parsing an input grammar file
   class Grammar
+    # @rbs!
+    #
+    #   interface _DelegatedMethods
+    #     def rules: () -> Array[Rule]
+    #     def accept_symbol: () -> Grammar::Symbol
+    #     def eof_symbol: () -> Grammar::Symbol
+    #     def undef_symbol: () -> Grammar::Symbol
+    #     def precedences: () -> Array[Precedence]
+    #
+    #     # delegate to @symbols_resolver
+    #     def symbols: () -> Array[Grammar::Symbol]
+    #     def terms: () -> Array[Grammar::Symbol]
+    #     def nterms: () -> Array[Grammar::Symbol]
+    #     def find_symbol_by_s_value!: (::String s_value) -> Grammar::Symbol
+    #     def ielr_defined?: () -> bool
+    #   end
+    #
+    #   include Symbols::Resolver::_DelegatedMethods
+    #
+    #   @rule_counter: Counter
+    #   @percent_codes: Array[PercentCode]
+    #   @printers: Array[Printer]
+    #   @destructors: Array[Destructor]
+    #   @error_tokens: Array[ErrorToken]
+    #   @symbols_resolver: Symbols::Resolver
+    #   @types: Array[Type]
+    #   @rule_builders: Array[RuleBuilder]
+    #   @rules: Array[Rule]
+    #   @sym_to_rules: Hash[Integer, Array[Rule]]
+    #   @parameterized_resolver: Parameterized::Resolver
+    #   @empty_symbol: Grammar::Symbol
+    #   @eof_symbol: Grammar::Symbol
+    #   @error_symbol: Grammar::Symbol
+    #   @undef_symbol: Grammar::Symbol
+    #   @accept_symbol: Grammar::Symbol
+    #   @aux: Auxiliary
+    #   @no_stdlib: bool
+    #   @locations: bool
+    #   @define: Hash[String, String]
+    #   @required: bool
+    #   @union: Union
+    #   @precedences: Array[Precedence]
+    #   @start_nterm: Lrama::Lexer::Token::Base?
     extend Forwardable
-    attr_reader :percent_codes, :eof_symbol, :error_symbol, :undef_symbol, :accept_symbol, :aux, :parameterizing_rule_resolver
-    attr_accessor :union, :expect, :printers, :error_tokens, :lex_param, :parse_param, :initial_action,
-                  :after_shift, :before_reduce, :after_reduce, :after_shift_error_token, :after_pop_stack,
-                  :symbols_resolver, :types, :rules, :rule_builders, :sym_to_rules, :no_stdlib, :locations, :define
+    attr_reader :percent_codes #: Array[PercentCode]
+    attr_reader :eof_symbol #: Grammar::Symbol
+    attr_reader :error_symbol #: Grammar::Symbol
+    attr_reader :undef_symbol #: Grammar::Symbol
+    attr_reader :accept_symbol #: Grammar::Symbol
+    attr_reader :aux #: Auxiliary
+    attr_reader :parameterized_resolver #: Parameterized::Resolver
+    attr_reader :precedences #: Array[Precedence]
+    attr_accessor :union #: Union
+    attr_accessor :expect #: Integer
+    attr_accessor :printers #: Array[Printer]
+    attr_accessor :error_tokens #: Array[ErrorToken]
+    attr_accessor :lex_param #: String
+    attr_accessor :parse_param #: String
+    attr_accessor :initial_action #: Grammar::Code::InitialActionCode
+    attr_accessor :after_shift #: Lexer::Token::Base
+    attr_accessor :before_reduce #: Lexer::Token::Base
+    attr_accessor :after_reduce #: Lexer::Token::Base
+    attr_accessor :after_shift_error_token #: Lexer::Token::Base
+    attr_accessor :after_pop_stack #: Lexer::Token::Base
+    attr_accessor :symbols_resolver #: Symbols::Resolver
+    attr_accessor :types #: Array[Type]
+    attr_accessor :rules #: Array[Rule]
+    attr_accessor :rule_builders #: Array[RuleBuilder]
+    attr_accessor :sym_to_rules #: Hash[Integer, Array[Rule]]
+    attr_accessor :no_stdlib #: bool
+    attr_accessor :locations #: bool
+    attr_accessor :define #: Hash[String, String]
+    attr_accessor :required #: bool
     def_delegators "@symbols_resolver", :symbols, :nterms, :terms, :add_nterm, :add_term, :find_term_by_s_value,
                                         :find_symbol_by_number!, :find_symbol_by_id!, :token_to_symbol,
                                         :find_symbol_by_s_value!, :fill_symbol_number, :fill_nterm_type,
                                         :fill_printer, :fill_destructor, :fill_error_token, :sort_by_number!
-    def initialize(rule_counter, define = {})
+    # @rbs (Counter rule_counter, bool locations, Hash[String, String] define) -> void
+    def initialize(rule_counter, locations, define = {})
       @rule_counter = rule_counter
       # Code defined by "%code"
@@ -48,7 +120,7 @@ module Lrama
       @rule_builders = []
       @rules = []
       @sym_to_rules = {}
-      @parameterizing_rule_resolver = ParameterizingRule::Resolver.new
+      @parameterized_resolver = Parameterized::Resolver.new
       @empty_symbol = nil
       @eof_symbol = nil
       @error_symbol = nil
@@ -56,93 +128,131 @@ module Lrama
       @accept_symbol = nil
       @aux = Auxiliary.new
       @no_stdlib = false
-      @locations = false
-      @define = define.map {|d| d.split('=') }.to_h
+      @locations = locations
+      @define = define
+      @required = false
+      @precedences = []
+      @start_nterm = nil
       append_special_symbols
     end
+    # @rbs (Counter rule_counter, Counter midrule_action_counter) -> RuleBuilder
     def create_rule_builder(rule_counter, midrule_action_counter)
-      RuleBuilder.new(rule_counter, midrule_action_counter, @parameterizing_rule_resolver)
+      RuleBuilder.new(rule_counter, midrule_action_counter, @parameterized_resolver)
     end
+    # @rbs (id: Lexer::Token::Base, code: Lexer::Token::UserCode) -> Array[PercentCode]
     def add_percent_code(id:, code:)
       @percent_codes << PercentCode.new(id.s_value, code.s_value)
     end
+    # @rbs (ident_or_tags: Array[Lexer::Token::Ident|Lexer::Token::Tag], token_code: Lexer::Token::UserCode, lineno: Integer) -> Array[Destructor]
     def add_destructor(ident_or_tags:, token_code:, lineno:)
       @destructors << Destructor.new(ident_or_tags: ident_or_tags, token_code: token_code, lineno: lineno)
     end
+    # @rbs (ident_or_tags: Array[Lexer::Token::Ident|Lexer::Token::Tag], token_code: Lexer::Token::UserCode, lineno: Integer) -> Array[Printer]
     def add_printer(ident_or_tags:, token_code:, lineno:)
       @printers << Printer.new(ident_or_tags: ident_or_tags, token_code: token_code, lineno: lineno)
     end
+    # @rbs (ident_or_tags: Array[Lexer::Token::Ident|Lexer::Token::Tag], token_code: Lexer::Token::UserCode, lineno: Integer) -> Array[ErrorToken]
     def add_error_token(ident_or_tags:, token_code:, lineno:)
       @error_tokens << ErrorToken.new(ident_or_tags: ident_or_tags, token_code: token_code, lineno: lineno)
     end
+    # @rbs (id: Lexer::Token::Base, tag: Lexer::Token::Tag) -> Array[Type]
     def add_type(id:, tag:)
       @types << Type.new(id: id, tag: tag)
     end
-    def add_nonassoc(sym, precedence)
-      set_precedence(sym, Precedence.new(type: :nonassoc, precedence: precedence))
+    # @rbs (Grammar::Symbol sym, Integer precedence, String s_value, Integer lineno) -> Precedence
+    def add_nonassoc(sym, precedence, s_value, lineno)
+      set_precedence(sym, Precedence.new(symbol: sym, s_value: s_value, type: :nonassoc, precedence: precedence, lineno: lineno))
+    end
+    # @rbs (Grammar::Symbol sym, Integer precedence, String s_value, Integer lineno) -> Precedence
+    def add_left(sym, precedence, s_value, lineno)
+      set_precedence(sym, Precedence.new(symbol: sym, s_value: s_value, type: :left, precedence: precedence, lineno: lineno))
     end
-    def add_left(sym, precedence)
-      set_precedence(sym, Precedence.new(type: :left, precedence: precedence))
+    # @rbs (Grammar::Symbol sym, Integer precedence, String s_value, Integer lineno) -> Precedence
+    def add_right(sym, precedence, s_value, lineno)
+      set_precedence(sym, Precedence.new(symbol: sym, s_value: s_value, type: :right, precedence: precedence, lineno: lineno))
     end
-    def add_right(sym, precedence)
-      set_precedence(sym, Precedence.new(type: :right, precedence: precedence))
+    # @rbs (Grammar::Symbol sym, Integer precedence, String s_value, Integer lineno) -> Precedence
+    def add_precedence(sym, precedence, s_value, lineno)
+      set_precedence(sym, Precedence.new(symbol: sym, s_value: s_value, type: :precedence, precedence: precedence, lineno: lineno))
     end
-    def add_precedence(sym, precedence)
-      set_precedence(sym, Precedence.new(type: :precedence, precedence: precedence))
+    # @rbs (Lrama::Lexer::Token::Base id) -> Lrama::Lexer::Token::Base
+    def set_start_nterm(id)
+      # When multiple `%start` directives are defined, Bison does not generate an error,
+      # whereas Lrama does generate an error.
+      # Related Bison's specification are
+      #   refs: https://www.gnu.org/software/bison/manual/html_node/Multiple-start_002dsymbols.html
+      if @start_nterm.nil?
+        @start_nterm = id
+      else
+        start = @start_nterm #: Lrama::Lexer::Token::Base
+        raise "Start non-terminal is already set to #{start.s_value} (line: #{start.first_line}). Cannot set to #{id.s_value} (line: #{id.first_line})."
+      end
     end
+    # @rbs (Grammar::Symbol sym, Precedence precedence) -> (Precedence | bot)
     def set_precedence(sym, precedence)
-      raise "" if sym.nterm?
+      @precedences << precedence
       sym.precedence = precedence
     end
+    # @rbs (Grammar::Code::NoReferenceCode code, Integer lineno) -> Union
     def set_union(code, lineno)
       @union = Union.new(code: code, lineno: lineno)
     end
+    # @rbs (RuleBuilder builder) -> Array[RuleBuilder]
     def add_rule_builder(builder)
       @rule_builders << builder
     end
-    def add_parameterizing_rule(rule)
-      @parameterizing_rule_resolver.add_parameterizing_rule(rule)
+    # @rbs (Parameterized::Rule rule) -> Array[Parameterized::Rule]
+    def add_parameterized_rule(rule)
+      @parameterized_resolver.add_rule(rule)
     end
-    def parameterizing_rules
-      @parameterizing_rule_resolver.rules
+    # @rbs () -> Array[Parameterized::Rule]
+    def parameterized_rules
+      @parameterized_resolver.rules
     end
-    def insert_before_parameterizing_rules(rules)
-      @parameterizing_rule_resolver.rules = rules + @parameterizing_rule_resolver.rules
+    # @rbs (Array[Parameterized::Rule] rules) -> Array[Parameterized::Rule]
+    def prepend_parameterized_rules(rules)
+      @parameterized_resolver.rules = rules + @parameterized_resolver.rules
     end
+    # @rbs (Integer prologue_first_lineno) -> Integer
     def prologue_first_lineno=(prologue_first_lineno)
       @aux.prologue_first_lineno = prologue_first_lineno
     end
+    # @rbs (String prologue) -> String
     def prologue=(prologue)
       @aux.prologue = prologue
     end
+    # @rbs (Integer epilogue_first_lineno) -> Integer
     def epilogue_first_lineno=(epilogue_first_lineno)
       @aux.epilogue_first_lineno = epilogue_first_lineno
     end
+    # @rbs (String epilogue) -> String
     def epilogue=(epilogue)
       @aux.epilogue = epilogue
     end
+    # @rbs () -> void
     def prepare
       resolve_inline_rules
       normalize_rules
@@ -151,6 +261,7 @@ module Lrama
       fill_default_precedence
       fill_symbols
       fill_sym_to_rules
+      sort_precedence
       compute_nullable
       compute_first_set
       set_locations
@@ -159,25 +270,51 @@ module Lrama
     # TODO: More validation methods
     #
     # * Validation for no_declared_type_reference
+    #
+    # @rbs () -> void
     def validate!
       @symbols_resolver.validate!
+      validate_no_precedence_for_nterm!
       validate_rule_lhs_is_nterm!
+      validate_duplicated_precedence!
     end
+    # @rbs (Grammar::Symbol sym) -> Array[Rule]
     def find_rules_by_symbol!(sym)
       find_rules_by_symbol(sym) || (raise "Rules for #{sym} not found")
     end
+    # @rbs (Grammar::Symbol sym) -> Array[Rule]?
     def find_rules_by_symbol(sym)
       @sym_to_rules[sym.number]
     end
+    # @rbs (String s_value) -> Array[Rule]
+    def select_rules_by_s_value(s_value)
+      @rules.select {|rule| rule.lhs.id.s_value == s_value }
+    end
+    # @rbs () -> Array[String]
+    def unique_rule_s_values
+      @rules.map {|rule| rule.lhs.id.s_value }.uniq
+    end
+    # @rbs () -> bool
     def ielr_defined?
       @define.key?('lr.type') && @define['lr.type'] == 'ielr'
     end
     private
+    # @rbs () -> void
+    def sort_precedence
+      @precedences.sort_by! do |prec|
+        prec.symbol.number
+      end
+      @precedences.freeze
+    end
+    # @rbs () -> Array[Grammar::Symbol]
     def compute_nullable
       @rules.each do |rule|
         case
@@ -227,6 +364,7 @@ module Lrama
       end
     end
+    # @rbs () -> Array[Grammar::Symbol]
     def compute_first_set
       terms.each do |term|
         term.first_set = Set.new([term]).freeze
@@ -262,12 +400,14 @@ module Lrama
       end
     end
+    # @rbs () -> Array[RuleBuilder]
     def setup_rules
       @rule_builders.each do |builder|
         builder.setup_rules
       end
     end
+    # @rbs () -> Grammar::Symbol
     def append_special_symbols
       # YYEMPTY (token_id: -2, number: -2) is added when a template is evaluated
       # term = add_term(id: Token.new(Token::Ident, "YYEMPTY"), token_id: -2)
@@ -298,11 +438,12 @@ module Lrama
       @accept_symbol = term
     end
+    # @rbs () -> void
     def resolve_inline_rules
       while @rule_builders.any?(&:has_inline_rules?) do
         @rule_builders = @rule_builders.flat_map do |builder|
           if builder.has_inline_rules?
-            builder.resolve_inline_rules
+            Inline::Resolver.new(builder).resolve
           else
             builder
           end
@@ -310,14 +451,10 @@ module Lrama
       end
     end
+    # @rbs () -> void
     def normalize_rules
-      # Add $accept rule to the top of rules
-      rule_builder = @rule_builders.first # : RuleBuilder
-      lineno = rule_builder ? rule_builder.line : 0
-      @rules << Rule.new(id: @rule_counter.increment, _lhs: @accept_symbol.id, _rhs: [rule_builder.lhs, @eof_symbol.id], token_code: nil, lineno: lineno)
+      add_accept_rule
       setup_rules
       @rule_builders.each do |builder|
         builder.rules.each do |rule|
           add_nterm(id: rule._lhs, tag: rule.lhs_tag)
@@ -325,23 +462,42 @@ module Lrama
         end
       end
-      @rules.sort_by!(&:id)
+      nterms.freeze
+      @rules.sort_by!(&:id).freeze
+    end
+    # Add $accept rule to the top of rules
+    def add_accept_rule
+      if @start_nterm
+        start = @start_nterm #: Lrama::Lexer::Token::Base
+        @rules << Rule.new(id: @rule_counter.increment, _lhs: @accept_symbol.id, _rhs: [start, @eof_symbol.id], token_code: nil, lineno: start.line)
+      else
+        rule_builder = @rule_builders.first #: RuleBuilder
+        lineno = rule_builder ? rule_builder.line : 0
+        lhs = rule_builder.lhs #: Lexer::Token::Base
+        @rules << Rule.new(id: @rule_counter.increment, _lhs: @accept_symbol.id, _rhs: [lhs, @eof_symbol.id], token_code: nil, lineno: lineno)
+      end
     end
     # Collect symbols from rules
+    #
+    # @rbs () -> void
     def collect_symbols
       @rules.flat_map(&:_rhs).each do |s|
         case s
         when Lrama::Lexer::Token::Char
           add_term(id: s)
-        when Lrama::Lexer::Token
+        when Lrama::Lexer::Token::Base
           # skip
         else
           raise "Unknown class: #{s}"
         end
       end
+      terms.freeze
     end
+    # @rbs () -> void
     def set_lhs_and_rhs
       @rules.each do |rule|
         rule.lhs = token_to_symbol(rule._lhs) if rule._lhs
@@ -355,6 +511,8 @@ module Lrama
     # Rule inherits precedence from the last term in RHS.
     #
     # https://www.gnu.org/software/bison/manual/html_node/How-Precedence.html
+    #
+    # @rbs () -> void
     def fill_default_precedence
       @rules.each do |rule|
         # Explicitly specified precedence has the highest priority
@@ -369,6 +527,7 @@ module Lrama
       end
     end
+    # @rbs () -> Array[Grammar::Symbol]
     def fill_symbols
       fill_symbol_number
       fill_nterm_type(@types)
@@ -378,6 +537,7 @@ module Lrama
       sort_by_number!
     end
+    # @rbs () -> Array[Rule]
     def fill_sym_to_rules
       @rules.each do |rule|
         key = rule.lhs.number
@@ -386,13 +546,48 @@ module Lrama
       end
     end
+    # @rbs () -> void
+    def validate_no_precedence_for_nterm!
+      errors = [] #: Array[String]
+      nterms.each do |nterm|
+        next if nterm.precedence.nil?
+        errors << "[BUG] Precedence #{nterm.name} (line: #{nterm.precedence.lineno}) is defined for nonterminal symbol (line: #{nterm.id.first_line}). Precedence can be defined for only terminal symbol."
+      end
+      return if errors.empty?
+      raise errors.join("\n")
+    end
+    # @rbs () -> void
     def validate_rule_lhs_is_nterm!
       errors = [] #: Array[String]
       rules.each do |rule|
         next if rule.lhs.nterm?
-        errors << "[BUG] LHS of #{rule.display_name} (line: #{rule.lineno}) is term. It should be nterm."
+        errors << "[BUG] LHS of #{rule.display_name} (line: #{rule.lineno}) is terminal symbol. It should be nonterminal symbol."
+      end
+      return if errors.empty?
+      raise errors.join("\n")
+    end
+    # # @rbs () -> void
+    def validate_duplicated_precedence!
+      errors = [] #: Array[String]
+      seen = {} #: Hash[String, Precedence]
+      precedences.each do |prec|
+        s_value = prec.s_value
+        if first = seen[s_value]
+          errors << "%#{prec.type} redeclaration for #{s_value} (line: #{prec.lineno}) previous declaration was %#{first.type} (line: #{first.lineno})"
+        else
+          seen[s_value] = prec
+        end
       end
       return if errors.empty?
@@ -400,6 +595,7 @@ module Lrama
       raise errors.join("\n")
     end
+    # @rbs () -> void
     def set_locations
       @locations = @locations || @rules.any? {|rule| rule.contains_at_reference? }
     end

data/lib/lrama/lexer/location.rb CHANGED Viewed

@@ -69,15 +69,15 @@ module Lrama
       def generate_error_message(error_message)
         <<~ERROR.chomp
           #{path}:#{first_line}:#{first_column}: #{error_message}
-          #{line_with_carets}
+          #{error_with_carets}
         ERROR
       end
       # @rbs () -> String
-      def line_with_carets
+      def error_with_carets
         <<~TEXT
-          #{text}
-          #{carets}
+          #{formatted_first_lineno} | #{text}
+          #{line_number_padding} | #{carets_line}
         TEXT
       end
@@ -89,13 +89,30 @@ module Lrama
       end
       # @rbs () -> String
-      def blanks
-        (text[0...first_column] or raise "#{first_column} is invalid").gsub(/[^\t]/, ' ')
+      def carets_line
+        leading_whitespace + highlight_marker
       end
       # @rbs () -> String
-      def carets
-        blanks + '^' * (last_column - first_column)
+      def leading_whitespace
+        (text[0...first_column] or raise "Invalid first_column: #{first_column}")
+          .gsub(/[^\t]/, ' ')
+      end
+      # @rbs () -> String
+      def highlight_marker
+        length = last_column - first_column
+        '^' + '~' * [0, length - 1].max
+      end
+      # @rbs () -> String
+      def formatted_first_lineno
+        first_line.to_s.rjust(4)
+      end
+      # @rbs () -> String
+      def line_number_padding
+        ' ' * formatted_first_lineno.length
       end
       # @rbs () -> String

data/lib/lrama/lexer/token/base.rb ADDED Viewed

@@ -0,0 +1,73 @@
+# rbs_inline: enabled
+# frozen_string_literal: true
+module Lrama
+  class Lexer
+    module Token
+      class Base
+        attr_reader :s_value #: String
+        attr_reader :location #: Location
+        attr_accessor :alias_name #: String
+        attr_accessor :referred #: bool
+        attr_reader :errors #: Array[String]
+        # @rbs (s_value: String, ?alias_name: String, ?location: Location) -> void
+        def initialize(s_value:, alias_name: nil, location: nil)
+          s_value.freeze
+          @s_value = s_value
+          @alias_name = alias_name
+          @location = location
+          @errors = []
+        end
+        # @rbs () -> String
+        def to_s
+          "value: `#{s_value}`, location: #{location}"
+        end
+        # @rbs (String string) -> bool
+        def referred_by?(string)
+          [self.s_value, self.alias_name].compact.include?(string)
+        end
+        # @rbs (Lexer::Token::Base other) -> bool
+        def ==(other)
+          self.class == other.class && self.s_value == other.s_value
+        end
+        # @rbs () -> Integer
+        def first_line
+          location.first_line
+        end
+        alias :line :first_line
+        # @rbs () -> Integer
+        def first_column
+          location.first_column
+        end
+        alias :column :first_column
+        # @rbs () -> Integer
+        def last_line
+          location.last_line
+        end
+        # @rbs () -> Integer
+        def last_column
+          location.last_column
+        end
+        # @rbs (Lrama::Grammar::Reference ref, String message) -> bot
+        def invalid_ref(ref, message)
+          location = self.location.partial_location(ref.first_column, ref.last_column)
+          raise location.generate_error_message(message)
+        end
+        # @rbs () -> bool
+        def validate
+          true
+        end
+      end
+    end
+  end
+end

data/lib/lrama/lexer/token/char.rb CHANGED Viewed

@@ -3,8 +3,21 @@
 module Lrama
   class Lexer
-    class Token
-      class Char < Token
+    module Token
+      class Char < Base
+        # @rbs () -> void
+        def validate
+          validate_ascii_code_range
+        end
+        private
+        # @rbs () -> void
+        def validate_ascii_code_range
+          unless s_value.ascii_only?
+            errors << "Invalid character: `#{s_value}`. Only ASCII characters are allowed."
+          end
+        end
       end
     end
   end

data/lib/lrama/lexer/token/empty.rb ADDED Viewed

@@ -0,0 +1,14 @@
+# rbs_inline: enabled
+# frozen_string_literal: true
+module Lrama
+  class Lexer
+    module Token
+      class Empty < Base
+        def initialize(location: nil)
+          super(s_value: '%empty', location: location)
+        end
+      end
+    end
+  end
+end

data/lib/lrama/lexer/token/ident.rb CHANGED Viewed

@@ -3,8 +3,8 @@
 module Lrama
   class Lexer
-    class Token
-      class Ident < Token
+    module Token
+      class Ident < Base
       end
     end
   end