RubyGems - regexp_parser - Versions diffs - 2.6.0 → 2.10.0 - Mend

regexp_parser 2.6.0 → 2.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

checksums.yaml +4 -4
data/Gemfile +5 -5
data/LICENSE +1 -1
data/lib/regexp_parser/expression/base.rb +0 -7
data/lib/regexp_parser/expression/classes/alternation.rb +1 -1
data/lib/regexp_parser/expression/classes/backreference.rb +5 -10
data/lib/regexp_parser/expression/classes/character_set/range.rb +2 -7
data/lib/regexp_parser/expression/classes/character_set.rb +4 -8
data/lib/regexp_parser/expression/classes/conditional.rb +2 -20
data/lib/regexp_parser/expression/classes/escape_sequence.rb +21 -91
data/lib/regexp_parser/expression/classes/free_space.rb +3 -1
data/lib/regexp_parser/expression/classes/group.rb +0 -22
data/lib/regexp_parser/expression/classes/keep.rb +1 -1
data/lib/regexp_parser/expression/classes/posix_class.rb +5 -5
data/lib/regexp_parser/expression/classes/unicode_property.rb +11 -11
data/lib/regexp_parser/expression/methods/construct.rb +2 -4
data/lib/regexp_parser/expression/methods/escape_sequence_char.rb +5 -0
data/lib/regexp_parser/expression/methods/escape_sequence_codepoint.rb +68 -0
data/lib/regexp_parser/expression/methods/match_length.rb +8 -4
data/lib/regexp_parser/expression/methods/negative.rb +20 -0
data/lib/regexp_parser/expression/methods/parts.rb +23 -0
data/lib/regexp_parser/expression/methods/printing.rb +26 -0
data/lib/regexp_parser/expression/methods/referenced_expressions.rb +28 -0
data/lib/regexp_parser/expression/methods/tests.rb +40 -3
data/lib/regexp_parser/expression/methods/traverse.rb +35 -19
data/lib/regexp_parser/expression/quantifier.rb +30 -17
data/lib/regexp_parser/expression/sequence.rb +5 -10
data/lib/regexp_parser/expression/sequence_operation.rb +4 -9
data/lib/regexp_parser/expression/shared.rb +37 -20
data/lib/regexp_parser/expression/subexpression.rb +20 -15
data/lib/regexp_parser/expression.rb +37 -31
data/lib/regexp_parser/lexer.rb +76 -36
data/lib/regexp_parser/parser.rb +107 -103
data/lib/regexp_parser/scanner/errors/premature_end_error.rb +8 -0
data/lib/regexp_parser/scanner/errors/scanner_error.rb +6 -0
data/lib/regexp_parser/scanner/errors/validation_error.rb +63 -0
data/lib/regexp_parser/scanner/properties/long.csv +29 -0
data/lib/regexp_parser/scanner/properties/short.csv +3 -0
data/lib/regexp_parser/scanner/property.rl +2 -2
data/lib/regexp_parser/scanner/scanner.rl +101 -172
data/lib/regexp_parser/scanner.rb +1171 -1365
data/lib/regexp_parser/syntax/token/backreference.rb +3 -0
data/lib/regexp_parser/syntax/token/character_set.rb +3 -0
data/lib/regexp_parser/syntax/token/escape.rb +3 -1
data/lib/regexp_parser/syntax/token/meta.rb +9 -2
data/lib/regexp_parser/syntax/token/unicode_property.rb +35 -1
data/lib/regexp_parser/syntax/token/virtual.rb +11 -0
data/lib/regexp_parser/syntax/token.rb +13 -13
data/lib/regexp_parser/syntax/version_lookup.rb +0 -8
data/lib/regexp_parser/syntax/versions.rb +3 -1
data/lib/regexp_parser/syntax.rb +1 -1
data/lib/regexp_parser/version.rb +1 -1
data/lib/regexp_parser.rb +6 -6
data/regexp_parser.gemspec +5 -5
metadata +17 -8
data/CHANGELOG.md +0 -601
data/README.md +0 -503

data/lib/regexp_parser/syntax/token/backreference.rb CHANGED Viewed

@@ -26,5 +26,8 @@ module Regexp::Syntax
     Map[Backreference::Type] = Backreference::All +
                                SubexpressionCall::All
+    # alias for symmetry between token symbol and Expression class name
+    Backref = Backreference
   end
 end

data/lib/regexp_parser/syntax/token/character_set.rb CHANGED Viewed

@@ -9,5 +9,8 @@ module Regexp::Syntax
     end
     Map[CharacterSet::Type] = CharacterSet::All
+    # alias for symmetry between token symbol and Token module name
+    Set = CharacterSet
   end
 end

data/lib/regexp_parser/syntax/token/escape.rb CHANGED Viewed

@@ -1,6 +1,5 @@
 module Regexp::Syntax
   module Token
-    # TODO: unify naming with RE::EscapeSequence, one way or the other, in v3.0.0
     module Escape
       Basic = %i[backslash literal]
@@ -27,5 +26,8 @@ module Regexp::Syntax
     end
     Map[Escape::Type] = Escape::All
+    # alias for symmetry between Token::* and Expression::*
+    EscapeSequence = Escape
   end
 end

data/lib/regexp_parser/syntax/token/meta.rb CHANGED Viewed

@@ -1,13 +1,20 @@
 module Regexp::Syntax
   module Token
     module Meta
-      Basic    = %i[dot]
-      Extended = Basic + %i[alternation]
+      Basic       = %i[dot]
+      Alternation = %i[alternation]
+      Extended    = Basic + Alternation
       All = Extended
       Type = :meta
     end
     Map[Meta::Type] = Meta::All
+    # alias for symmetry between Token::* and Expression::*
+    module Alternation
+      All  = Meta::Alternation
+      Type = Meta::Type
+    end
   end
 end

data/lib/regexp_parser/syntax/token/unicode_property.rb CHANGED Viewed

@@ -59,7 +59,7 @@ module Regexp::Syntax
       Age_V3_1_0 = %i[age=13.0]
-      Age_V3_2_0 = %i[age=14.0]
+      Age_V3_2_0 = %i[age=14.0 age=15.0]
       Age = all[:Age_V]
@@ -321,6 +321,8 @@ module Regexp::Syntax
       Script_V3_2_0 = %i[
         cypro_minoan
+        kawi
+        nag_mundari
         old_uyghur
         tangsa
         toto
@@ -667,11 +669,18 @@ module Regexp::Syntax
       UnicodeBlock_V3_2_0 = %i[
         in_arabic_extended_b
+        in_arabic_extended_c
+        in_cjk_unified_ideographs_extension_h
         in_cypro_minoan
+        in_cyrillic_extended_d
+        in_devanagari_extended_a
         in_ethiopic_extended_b
+        in_kaktovik_numerals
         in_kana_extended_b
+        in_kawi
         in_latin_extended_f
         in_latin_extended_g
+        in_nag_mundari
         in_old_uyghur
         in_tangsa
         in_toto
@@ -690,6 +699,28 @@ module Regexp::Syntax
         emoji_presentation
       ]
+      Emoji_V2_6_0 = %i[
+        extended_pictographic
+      ]
+      Enumerated_V2_4_0 = %i[
+        grapheme_cluster_break=control
+        grapheme_cluster_break=cr
+        grapheme_cluster_break=extend
+        grapheme_cluster_break=l
+        grapheme_cluster_break=lf
+        grapheme_cluster_break=lv
+        grapheme_cluster_break=lvt
+        grapheme_cluster_break=prepend
+        grapheme_cluster_break=regional_indicator
+        grapheme_cluster_break=spacingmark
+        grapheme_cluster_break=t
+        grapheme_cluster_break=v
+        grapheme_cluster_break=zwj
+      ]
+      Enumerated = all[:Enumerated_V]
       Emoji = all[:Emoji_V]
       V1_9_0 = Category::All + POSIX + all[:V1_9_0]
@@ -713,5 +744,8 @@ module Regexp::Syntax
     Map[UnicodeProperty::Type] = UnicodeProperty::All
     Map[UnicodeProperty::NonType] = UnicodeProperty::All
+    # alias for symmetry between token symbol and Token module name
+    Property = UnicodeProperty
   end
 end

data/lib/regexp_parser/syntax/token/virtual.rb ADDED Viewed

@@ -0,0 +1,11 @@
+module Regexp::Syntax
+  module Token
+    module Virtual
+      Root     = %i[root]
+      Sequence = %i[sequence]
+      All  = %i[root sequence]
+      Type = :expression
+    end
+  end
+end

data/lib/regexp_parser/syntax/token.rb CHANGED Viewed

@@ -20,19 +20,19 @@ end
 # Load all the token files, they will populate the Map constant.
-require 'regexp_parser/syntax/token/anchor'
-require 'regexp_parser/syntax/token/assertion'
-require 'regexp_parser/syntax/token/backreference'
-require 'regexp_parser/syntax/token/posix_class'
-require 'regexp_parser/syntax/token/character_set'
-require 'regexp_parser/syntax/token/character_type'
-require 'regexp_parser/syntax/token/conditional'
-require 'regexp_parser/syntax/token/escape'
-require 'regexp_parser/syntax/token/group'
-require 'regexp_parser/syntax/token/keep'
-require 'regexp_parser/syntax/token/meta'
-require 'regexp_parser/syntax/token/quantifier'
-require 'regexp_parser/syntax/token/unicode_property'
+require_relative 'token/anchor'
+require_relative 'token/assertion'
+require_relative 'token/backreference'
+require_relative 'token/posix_class'
+require_relative 'token/character_set'
+require_relative 'token/character_type'
+require_relative 'token/conditional'
+require_relative 'token/escape'
+require_relative 'token/group'
+require_relative 'token/keep'
+require_relative 'token/meta'
+require_relative 'token/quantifier'
+require_relative 'token/unicode_property'
 # After loading all the tokens the map is full. Extract all tokens and types

data/lib/regexp_parser/syntax/version_lookup.rb CHANGED Viewed

@@ -37,7 +37,6 @@ module Regexp::Syntax
     return Regexp::Syntax::Any if ['*', 'any'].include?(version.to_s)
     version =~ VERSION_REGEXP || raise(InvalidVersionNameError, version)
-    warn_if_future_version(version)
     version_const_name = "V#{version.to_s.scan(/\d+/).join('_')}"
     const_get(version_const_name) || raise(UnknownSyntaxNameError, version)
   end
@@ -63,11 +62,4 @@ module Regexp::Syntax
     # add .99 to treat versions without a patch value as latest patch version
     Gem::Version.new((name.to_s.scan(/\d+/) << 99).join('.'))
   end
-  def warn_if_future_version(const_name)
-    return if comparable(const_name) < comparable('4.0.0')
-    warn('This library has only been tested up to Ruby 3.x, '\
-         "but you are running with #{const_name}")
-  end
 end

data/lib/regexp_parser/syntax/versions.rb CHANGED Viewed

@@ -3,4 +3,6 @@
 #
 # Aliases for the latest patch version are provided as 'ruby/n.n',
 # e.g. 'ruby/1.9' refers to Ruby v1.9.3.
-Dir[File.expand_path('../versions/*.rb', __FILE__)].sort.each { |f| require f }
+Dir[File.expand_path('../versions/*.rb', __FILE__)].sort.each { |f| require_relative f }
+Regexp::Syntax::CURRENT = Regexp::Syntax.for("ruby/#{RUBY_VERSION}")

data/lib/regexp_parser/syntax.rb CHANGED Viewed

@@ -1,4 +1,4 @@
-require 'regexp_parser/error'
+require_relative 'error'
 module Regexp::Syntax
   class SyntaxError < Regexp::Parser::Error; end

data/lib/regexp_parser/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 class Regexp
   class Parser
-    VERSION = '2.6.0'
+    VERSION = '2.10.0'
   end
 end

data/lib/regexp_parser.rb CHANGED Viewed

@@ -1,6 +1,6 @@
-require 'regexp_parser/version'
-require 'regexp_parser/token'
-require 'regexp_parser/scanner'
-require 'regexp_parser/syntax'
-require 'regexp_parser/lexer'
-require 'regexp_parser/parser'
+require_relative 'regexp_parser/version'
+require_relative 'regexp_parser/token'
+require_relative 'regexp_parser/scanner'
+require_relative 'regexp_parser/syntax'
+require_relative 'regexp_parser/lexer'
+require_relative 'regexp_parser/parser'

data/regexp_parser.gemspec CHANGED Viewed

@@ -16,17 +16,17 @@ Gem::Specification.new do |spec|
   spec.metadata['source_code_uri'] = spec.homepage
   spec.metadata['wiki_uri']        = "#{spec.homepage}/wiki"
-  spec.authors       = ['Ammar Ali']
-  spec.email         = ['ammarabuali@gmail.com']
+  spec.metadata['rubygems_mfa_required'] = 'true'
+  spec.authors       = ['Ammar Ali', 'Janosch Müller']
+  spec.email         = ['ammarabuali@gmail.com', 'janosch84@gmail.com']
   spec.license       = 'MIT'
   spec.require_paths = ['lib']
   spec.files         = Dir.glob('lib/**/*.{csv,rb,rl}') +
-                       %w[Gemfile Rakefile LICENSE README.md CHANGELOG.md regexp_parser.gemspec]
-  spec.rdoc_options  = ["--inline-source", "--charset=UTF-8"]
+                       %w[Gemfile Rakefile LICENSE regexp_parser.gemspec]
   spec.platform      = Gem::Platform::RUBY

metadata CHANGED Viewed

@@ -1,26 +1,26 @@
 --- !ruby/object:Gem::Specification
 name: regexp_parser
 version: !ruby/object:Gem::Version
-  version: 2.6.0
+  version: 2.10.0
 platform: ruby
 authors:
 - Ammar Ali
+- Janosch Müller
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2022-09-26 00:00:00.000000000 Z
+date: 2024-12-25 00:00:00.000000000 Z
 dependencies: []
 description: A library for tokenizing, lexing, and parsing Ruby regular expressions.
 email:
 - ammarabuali@gmail.com
+- janosch84@gmail.com
 executables: []
 extensions: []
 extra_rdoc_files: []
 files:
-- CHANGELOG.md
 - Gemfile
 - LICENSE
-- README.md
 - Rakefile
 - lib/regexp_parser.rb
 - lib/regexp_parser/error.rb
@@ -43,10 +43,16 @@ files:
 - lib/regexp_parser/expression/classes/root.rb
 - lib/regexp_parser/expression/classes/unicode_property.rb
 - lib/regexp_parser/expression/methods/construct.rb
+- lib/regexp_parser/expression/methods/escape_sequence_char.rb
+- lib/regexp_parser/expression/methods/escape_sequence_codepoint.rb
 - lib/regexp_parser/expression/methods/human_name.rb
 - lib/regexp_parser/expression/methods/match.rb
 - lib/regexp_parser/expression/methods/match_length.rb
+- lib/regexp_parser/expression/methods/negative.rb
 - lib/regexp_parser/expression/methods/options.rb
+- lib/regexp_parser/expression/methods/parts.rb
+- lib/regexp_parser/expression/methods/printing.rb
+- lib/regexp_parser/expression/methods/referenced_expressions.rb
 - lib/regexp_parser/expression/methods/strfregexp.rb
 - lib/regexp_parser/expression/methods/tests.rb
 - lib/regexp_parser/expression/methods/traverse.rb
@@ -59,6 +65,9 @@ files:
 - lib/regexp_parser/parser.rb
 - lib/regexp_parser/scanner.rb
 - lib/regexp_parser/scanner/char_type.rl
+- lib/regexp_parser/scanner/errors/premature_end_error.rb
+- lib/regexp_parser/scanner/errors/scanner_error.rb
+- lib/regexp_parser/scanner/errors/validation_error.rb
 - lib/regexp_parser/scanner/properties/long.csv
 - lib/regexp_parser/scanner/properties/short.csv
 - lib/regexp_parser/scanner/property.rl
@@ -80,6 +89,7 @@ files:
 - lib/regexp_parser/syntax/token/posix_class.rb
 - lib/regexp_parser/syntax/token/quantifier.rb
 - lib/regexp_parser/syntax/token/unicode_property.rb
+- lib/regexp_parser/syntax/token/virtual.rb
 - lib/regexp_parser/syntax/version_lookup.rb
 - lib/regexp_parser/syntax/versions.rb
 - lib/regexp_parser/syntax/versions/1.8.6.rb
@@ -108,10 +118,9 @@ metadata:
   homepage_uri: https://github.com/ammar/regexp_parser
   source_code_uri: https://github.com/ammar/regexp_parser
   wiki_uri: https://github.com/ammar/regexp_parser/wiki
+  rubygems_mfa_required: 'true'
 post_install_message:
-rdoc_options:
-- "--inline-source"
-- "--charset=UTF-8"
+rdoc_options: []
 require_paths:
 - lib
 required_ruby_version: !ruby/object:Gem::Requirement
@@ -125,7 +134,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
     - !ruby/object:Gem::Version
       version: '0'
 requirements: []
-rubygems_version: 3.3.3
+rubygems_version: 3.4.13
 signing_key:
 specification_version: 4
 summary: Scanner, lexer, parser for ruby's regular expressions