RubyGems - regexp_parser - Versions diffs - 1.3.0 → 1.7.1 - Mend

regexp_parser 1.3.0 → 1.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (172) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +72 -1
data/Gemfile +3 -3
data/README.md +12 -19
data/Rakefile +3 -4
data/lib/regexp_parser/expression.rb +28 -53
data/lib/regexp_parser/expression/classes/backref.rb +18 -10
data/lib/regexp_parser/expression/classes/conditional.rb +7 -2
data/lib/regexp_parser/expression/classes/escape.rb +0 -4
data/lib/regexp_parser/expression/classes/group.rb +4 -2
data/lib/regexp_parser/expression/classes/keep.rb +1 -3
data/lib/regexp_parser/expression/methods/match.rb +13 -0
data/lib/regexp_parser/expression/methods/match_length.rb +172 -0
data/lib/regexp_parser/expression/methods/options.rb +35 -0
data/lib/regexp_parser/expression/methods/strfregexp.rb +0 -1
data/lib/regexp_parser/expression/methods/tests.rb +6 -15
data/lib/regexp_parser/expression/methods/traverse.rb +3 -1
data/lib/regexp_parser/expression/quantifier.rb +2 -2
data/lib/regexp_parser/expression/sequence.rb +3 -6
data/lib/regexp_parser/expression/sequence_operation.rb +2 -6
data/lib/regexp_parser/expression/subexpression.rb +3 -5
data/lib/regexp_parser/lexer.rb +30 -44
data/lib/regexp_parser/parser.rb +47 -24
data/lib/regexp_parser/scanner.rb +1228 -1367
data/lib/regexp_parser/scanner/char_type.rl +0 -3
data/lib/regexp_parser/scanner/properties/long.yml +34 -1
data/lib/regexp_parser/scanner/properties/short.yml +12 -0
data/lib/regexp_parser/scanner/scanner.rl +101 -194
data/lib/regexp_parser/syntax/tokens.rb +2 -10
data/lib/regexp_parser/syntax/tokens/unicode_property.rb +72 -21
data/lib/regexp_parser/syntax/versions/2.6.0.rb +10 -0
data/lib/regexp_parser/syntax/versions/2.6.2.rb +10 -0
data/lib/regexp_parser/syntax/versions/2.6.3.rb +10 -0
data/lib/regexp_parser/version.rb +1 -1
data/regexp_parser.gemspec +3 -3
data/spec/expression/base_spec.rb +94 -0
data/spec/expression/clone_spec.rb +120 -0
data/spec/expression/conditional_spec.rb +89 -0
data/spec/expression/free_space_spec.rb +27 -0
data/spec/expression/methods/match_length_spec.rb +161 -0
data/spec/expression/methods/match_spec.rb +25 -0
data/spec/expression/methods/strfregexp_spec.rb +224 -0
data/spec/expression/methods/tests_spec.rb +99 -0
data/spec/expression/methods/traverse_spec.rb +161 -0
data/spec/expression/options_spec.rb +128 -0
data/spec/expression/root_spec.rb +9 -0
data/spec/expression/sequence_spec.rb +9 -0
data/spec/expression/subexpression_spec.rb +50 -0
data/spec/expression/to_h_spec.rb +26 -0
data/spec/expression/to_s_spec.rb +100 -0
data/spec/lexer/all_spec.rb +22 -0
data/spec/lexer/conditionals_spec.rb +53 -0
data/spec/lexer/delimiters_spec.rb +68 -0
data/spec/lexer/escapes_spec.rb +14 -0
data/spec/lexer/keep_spec.rb +10 -0
data/spec/lexer/literals_spec.rb +89 -0
data/spec/lexer/nesting_spec.rb +99 -0
data/spec/lexer/refcalls_spec.rb +55 -0
data/spec/parser/all_spec.rb +43 -0
data/spec/parser/alternation_spec.rb +88 -0
data/spec/parser/anchors_spec.rb +17 -0
data/spec/parser/conditionals_spec.rb +179 -0
data/spec/parser/errors_spec.rb +30 -0
data/spec/parser/escapes_spec.rb +121 -0
data/spec/parser/free_space_spec.rb +130 -0
data/spec/parser/groups_spec.rb +108 -0
data/spec/parser/keep_spec.rb +6 -0
data/spec/parser/posix_classes_spec.rb +8 -0
data/spec/parser/properties_spec.rb +115 -0
data/spec/parser/quantifiers_spec.rb +52 -0
data/spec/parser/refcalls_spec.rb +112 -0
data/spec/parser/set/intersections_spec.rb +127 -0
data/spec/parser/set/ranges_spec.rb +111 -0
data/spec/parser/sets_spec.rb +178 -0
data/spec/parser/types_spec.rb +18 -0
data/spec/scanner/all_spec.rb +18 -0
data/spec/scanner/anchors_spec.rb +21 -0
data/spec/scanner/conditionals_spec.rb +128 -0
data/spec/scanner/delimiters_spec.rb +52 -0
data/spec/scanner/errors_spec.rb +67 -0
data/spec/scanner/escapes_spec.rb +53 -0
data/spec/scanner/free_space_spec.rb +133 -0
data/spec/scanner/groups_spec.rb +52 -0
data/spec/scanner/keep_spec.rb +10 -0
data/spec/scanner/literals_spec.rb +49 -0
data/spec/scanner/meta_spec.rb +18 -0
data/spec/scanner/properties_spec.rb +64 -0
data/spec/scanner/quantifiers_spec.rb +20 -0
data/spec/scanner/refcalls_spec.rb +36 -0
data/spec/scanner/sets_spec.rb +102 -0
data/spec/scanner/types_spec.rb +14 -0
data/spec/spec_helper.rb +15 -0
data/{test → spec}/support/runner.rb +9 -8
data/spec/support/shared_examples.rb +77 -0
data/{test → spec}/support/warning_extractor.rb +5 -7
data/spec/syntax/syntax_spec.rb +48 -0
data/spec/syntax/syntax_token_map_spec.rb +23 -0
data/spec/syntax/versions/1.8.6_spec.rb +17 -0
data/spec/syntax/versions/1.9.1_spec.rb +10 -0
data/spec/syntax/versions/1.9.3_spec.rb +9 -0
data/spec/syntax/versions/2.0.0_spec.rb +13 -0
data/spec/syntax/versions/2.2.0_spec.rb +9 -0
data/spec/syntax/versions/aliases_spec.rb +37 -0
data/spec/token/token_spec.rb +85 -0
metadata +151 -146
data/test/expression/test_all.rb +0 -12
data/test/expression/test_base.rb +0 -90
data/test/expression/test_clone.rb +0 -89
data/test/expression/test_conditionals.rb +0 -113
data/test/expression/test_free_space.rb +0 -35
data/test/expression/test_set.rb +0 -84
data/test/expression/test_strfregexp.rb +0 -230
data/test/expression/test_subexpression.rb +0 -58
data/test/expression/test_tests.rb +0 -99
data/test/expression/test_to_h.rb +0 -59
data/test/expression/test_to_s.rb +0 -104
data/test/expression/test_traverse.rb +0 -161
data/test/helpers.rb +0 -10
data/test/lexer/test_all.rb +0 -41
data/test/lexer/test_conditionals.rb +0 -127
data/test/lexer/test_keep.rb +0 -24
data/test/lexer/test_literals.rb +0 -130
data/test/lexer/test_nesting.rb +0 -132
data/test/lexer/test_refcalls.rb +0 -56
data/test/parser/set/test_intersections.rb +0 -127
data/test/parser/set/test_ranges.rb +0 -111
data/test/parser/test_all.rb +0 -64
data/test/parser/test_alternation.rb +0 -92
data/test/parser/test_anchors.rb +0 -34
data/test/parser/test_conditionals.rb +0 -187
data/test/parser/test_errors.rb +0 -63
data/test/parser/test_escapes.rb +0 -134
data/test/parser/test_free_space.rb +0 -139
data/test/parser/test_groups.rb +0 -289
data/test/parser/test_keep.rb +0 -21
data/test/parser/test_posix_classes.rb +0 -27
data/test/parser/test_properties.rb +0 -133
data/test/parser/test_quantifiers.rb +0 -301
data/test/parser/test_refcalls.rb +0 -186
data/test/parser/test_sets.rb +0 -179
data/test/parser/test_types.rb +0 -50
data/test/scanner/test_all.rb +0 -38
data/test/scanner/test_anchors.rb +0 -38
data/test/scanner/test_conditionals.rb +0 -184
data/test/scanner/test_errors.rb +0 -91
data/test/scanner/test_escapes.rb +0 -56
data/test/scanner/test_free_space.rb +0 -200
data/test/scanner/test_groups.rb +0 -79
data/test/scanner/test_keep.rb +0 -35
data/test/scanner/test_literals.rb +0 -89
data/test/scanner/test_meta.rb +0 -40
data/test/scanner/test_properties.rb +0 -312
data/test/scanner/test_quantifiers.rb +0 -37
data/test/scanner/test_refcalls.rb +0 -52
data/test/scanner/test_scripts.rb +0 -53
data/test/scanner/test_sets.rb +0 -119
data/test/scanner/test_types.rb +0 -35
data/test/scanner/test_unicode_blocks.rb +0 -30
data/test/support/disable_autotest.rb +0 -8
data/test/syntax/test_all.rb +0 -6
data/test/syntax/test_syntax.rb +0 -61
data/test/syntax/test_syntax_token_map.rb +0 -25
data/test/syntax/versions/test_1.8.rb +0 -55
data/test/syntax/versions/test_1.9.1.rb +0 -36
data/test/syntax/versions/test_1.9.3.rb +0 -32
data/test/syntax/versions/test_2.0.0.rb +0 -37
data/test/syntax/versions/test_2.2.0.rb +0 -32
data/test/syntax/versions/test_aliases.rb +0 -129
data/test/syntax/versions/test_all.rb +0 -5
data/test/test_all.rb +0 -5
data/test/token/test_all.rb +0 -2
data/test/token/test_token.rb +0 -107

data/spec/parser/alternation_spec.rb ADDED

@@ -0,0 +1,88 @@
+require 'spec_helper'
+RSpec.describe('Alternation parsing') do
+  let(:root) { RP.parse('(ab??|cd*|ef+)*|(gh|ij|kl)?') }
+  specify('parse alternation root') do
+    e = root[0]
+    expect(e).to be_a(Alternation)
+  end
+  specify('parse alternation alts') do
+    alts = root[0].alternatives
+    expect(alts[0]).to be_a(Alternative)
+    expect(alts[1]).to be_a(Alternative)
+    expect(alts[0][0]).to be_a(Group::Capture)
+    expect(alts[1][0]).to be_a(Group::Capture)
+    expect(alts.length).to eq 2
+  end
+  specify('parse alternation nested') do
+    e = root[0].alternatives[0][0][0]
+    expect(e).to be_a(Alternation)
+  end
+  specify('parse alternation nested sequence') do
+    alts = root[0][0]
+    nested = alts[0][0][0]
+    expect(nested).to be_a(Alternative)
+    expect(nested[0]).to be_a(Literal)
+    expect(nested[1]).to be_a(Literal)
+    expect(nested.expressions.length).to eq 2
+  end
+  specify('parse alternation nested groups') do
+    root = RP.parse('(i|ey|([ougfd]+)|(ney))')
+    alts = root[0][0].alternatives
+    expect(alts.length).to eq 4
+  end
+  specify('parse alternation grouped alts') do
+    root = RP.parse('ca((n)|(t)|(ll)|(b))')
+    alts = root[1][0].alternatives
+    expect(alts.length).to eq 4
+    expect(alts[0]).to be_a(Alternative)
+    expect(alts[1]).to be_a(Alternative)
+    expect(alts[2]).to be_a(Alternative)
+    expect(alts[3]).to be_a(Alternative)
+  end
+  specify('parse alternation nested grouped alts') do
+    root = RP.parse('ca((n|t)|(ll|b))')
+    alts = root[1][0].alternatives
+    expect(alts.length).to eq 2
+    expect(alts[0]).to be_a(Alternative)
+    expect(alts[1]).to be_a(Alternative)
+    subalts = root[1][0][0][0][0].alternatives
+    expect(alts.length).to eq 2
+    expect(subalts[0]).to be_a(Alternative)
+    expect(subalts[1]).to be_a(Alternative)
+  end
+  specify('parse alternation continues after nesting') do
+    root = RP.parse(/a|(b)c/)
+    seq = root[0][1].expressions
+    expect(seq.length).to eq 2
+    expect(seq[0]).to be_a(Group::Capture)
+    expect(seq[1]).to be_a(Literal)
+  end
+end

data/spec/parser/anchors_spec.rb ADDED

@@ -0,0 +1,17 @@
+require 'spec_helper'
+RSpec.describe('Anchor parsing') do
+  include_examples 'parse', /^a/,   0 =>  [:anchor,   :bol,               Anchor::BOL]
+  include_examples 'parse', /a$/,   1 =>  [:anchor,   :eol,               Anchor::EOL]
+  include_examples 'parse', /\Aa/,  0 =>  [:anchor,   :bos,               Anchor::BOS]
+  include_examples 'parse', /a\z/,  1 =>  [:anchor,   :eos,               Anchor::EOS]
+  include_examples 'parse', /a\Z/,  1 =>  [:anchor,   :eos_ob_eol,        Anchor::EOSobEOL]
+  include_examples 'parse', /a\b/,  1 =>  [:anchor,   :word_boundary,     Anchor::WordBoundary]
+  include_examples 'parse', /a\B/,  1 =>  [:anchor,   :nonword_boundary,  Anchor::NonWordBoundary]
+  include_examples 'parse', /a\G/,  1 =>  [:anchor,   :match_start,       Anchor::MatchStart]
+  include_examples 'parse', /\\A/,  0 =>  [:escape,   :backslash,         EscapeSequence::Literal]
+end

data/spec/parser/conditionals_spec.rb ADDED

@@ -0,0 +1,179 @@
+require 'spec_helper'
+RSpec.describe('Conditional parsing') do
+  specify('parse conditional') do
+    regexp = /(?<A>a)(?(<A>)T|F)/
+    root = RP.parse(regexp, 'ruby/2.0')
+    exp = root[1]
+    expect(exp).to be_a(Conditional::Expression)
+    expect(exp.type).to eq :conditional
+    expect(exp.token).to eq :open
+    expect(exp.to_s).to eq '(?(<A>)T|F)'
+    expect(exp.reference).to eq 'A'
+  end
+  specify('parse conditional condition') do
+    regexp = /(?<A>a)(?(<A>)T|F)/
+    root = RP.parse(regexp, 'ruby/2.0')
+    exp = root[1].condition
+    expect(exp).to be_a(Conditional::Condition)
+    expect(exp.type).to eq :conditional
+    expect(exp.token).to eq :condition
+    expect(exp.to_s).to eq '(<A>)'
+    expect(exp.reference).to eq 'A'
+    expect(exp.referenced_expression.to_s).to eq '(?<A>a)'
+  end
+  specify('parse conditional condition with number ref') do
+    regexp = /(a)(?(1)T|F)/
+    root = RP.parse(regexp, 'ruby/2.0')
+    exp = root[1].condition
+    expect(exp).to be_a(Conditional::Condition)
+    expect(exp.type).to eq :conditional
+    expect(exp.token).to eq :condition
+    expect(exp.to_s).to eq '(1)'
+    expect(exp.reference).to eq 1
+    expect(exp.referenced_expression.to_s).to eq '(a)'
+  end
+  specify('parse conditional nested groups') do
+    regexp = /((a)|(b)|((?(2)(c(d|e)+)?|(?(3)f|(?(4)(g|(h)(i)))))))/
+    root = RP.parse(regexp, 'ruby/2.0')
+    expect(root.to_s).to eq regexp.source
+    group = root.first
+    expect(group).to be_instance_of(Group::Capture)
+    alt = group.first
+    expect(alt).to be_instance_of(Alternation)
+    expect(alt.length).to eq 3
+    expect(alt.map(&:first)).to all(be_a Group::Capture)
+    subgroup = alt[2].first
+    conditional = subgroup.first
+    expect(conditional).to be_instance_of(Conditional::Expression)
+    expect(conditional.length).to eq 3
+    expect(conditional[0]).to be_instance_of(Conditional::Condition)
+    expect(conditional[0].to_s).to eq '(2)'
+    condition = conditional.condition
+    expect(condition).to be_instance_of(Conditional::Condition)
+    expect(condition.to_s).to eq '(2)'
+    branches = conditional.branches
+    expect(branches.length).to eq 2
+    expect(branches).to be_instance_of(Array)
+  end
+  specify('parse conditional nested') do
+    regexp = /(a(b(c(d)(e))))(?(1)(?(2)d|(?(3)e|f))|(?(4)(?(5)g|h)))/
+    root = RP.parse(regexp, 'ruby/2.0')
+    expect(root.to_s).to eq regexp.source
+    {
+      1 => [2, root[1]],
+      2 => [2, root[1][1][0]],
+      3 => [2, root[1][1][0][2][0]],
+      4 => [1, root[1][2][0]],
+      5 => [2, root[1][2][0][1][0]]
+    }.each do |index, example|
+      branch_count, exp = example
+      expect(exp).to be_instance_of(Conditional::Expression)
+      expect(exp.condition.to_s).to eq "(#{index})"
+      expect(exp.branches.length).to eq branch_count
+    end
+  end
+  specify('parse conditional nested alternation') do
+    regexp = /(a)(?(1)(b|c|d)|(e|f|g))(h)(?(2)(i|j|k)|(l|m|n))|o|p/
+    root = RP.parse(regexp, 'ruby/2.0')
+    expect(root.to_s).to eq regexp.source
+    expect(root.first).to be_instance_of(Alternation)
+    [
+      [3, 'b|c|d', root[0][0][1][1][0][0]],
+      [3, 'e|f|g', root[0][0][1][2][0][0]],
+      [3, 'i|j|k', root[0][0][3][1][0][0]],
+      [3, 'l|m|n', root[0][0][3][2][0][0]]
+    ].each do |example|
+      alt_count, alt_text, exp = example
+      expect(exp).to be_instance_of(Alternation)
+      expect(exp.to_s).to eq alt_text
+      expect(exp.alternatives.length).to eq alt_count
+    end
+  end
+  specify('parse conditional extra separator') do
+    regexp = /(?<A>a)(?(<A>)T|)/
+    root = RP.parse(regexp, 'ruby/2.0')
+    branches = root[1].branches
+    expect(branches.length).to eq 2
+    seq_1, seq_2 = branches
+    [seq_1, seq_2].each do |seq|
+      expect(seq).to be_a(Sequence)
+      expect(seq.type).to eq :expression
+      expect(seq.token).to eq :sequence
+    end
+    expect(seq_1.to_s).to eq 'T'
+    expect(seq_2.to_s).to eq ''
+  end
+  specify('parse conditional quantified') do
+    regexp = /(foo)(?(1)\d|(\w)){42}/
+    root = RP.parse(regexp, 'ruby/2.0')
+    conditional = root[1]
+    expect(conditional).to be_quantified
+    expect(conditional.quantifier.to_s).to eq '{42}'
+    expect(conditional.to_s).to eq '(?(1)\\d|(\\w)){42}'
+    expect(conditional.branches.any?(&:quantified?)).to be false
+  end
+  specify('parse conditional branch content quantified') do
+    regexp = /(foo)(?(1)\d{23}|(\w){42})/
+    root = RP.parse(regexp, 'ruby/2.0')
+    conditional = root[1]
+    expect(conditional).not_to be_quantified
+    expect(conditional.branches.any?(&:quantified?)).to be false
+    expect(conditional.branches[0][0]).to be_quantified
+    expect(conditional.branches[0][0].quantifier.to_s).to eq '{23}'
+    expect(conditional.branches[1][0]).to be_quantified
+    expect(conditional.branches[1][0].quantifier.to_s).to eq '{42}'
+  end
+  specify('parse conditional excessive branches') do
+    regexp = '(?<A>a)(?(<A>)T|F|X)'
+    expect { RP.parse(regexp, 'ruby/2.0') }.to raise_error(Conditional::TooManyBranches)
+  end
+end

data/spec/parser/errors_spec.rb ADDED

@@ -0,0 +1,30 @@
+require 'spec_helper'
+RSpec.describe('Parsing errors') do
+  let(:parser) { Regexp::Parser.new }
+  before { parser.parse(/foo/) } # initializes ivars
+  it('raises UnknownTokenTypeError for unknown token types') do
+    expect { parser.send(:parse_token, Regexp::Token.new(:foo, :bar)) }
+      .to raise_error(Regexp::Parser::UnknownTokenTypeError)
+  end
+  RSpec.shared_examples 'UnknownTokenError' do |type, token|
+    it "raises for unkown tokens of type #{type}" do
+      expect { parser.send(:parse_token, Regexp::Token.new(type, :foo)) }
+        .to raise_error(Regexp::Parser::UnknownTokenError)
+    end
+  end
+  include_examples 'UnknownTokenError', :anchor
+  include_examples 'UnknownTokenError', :backref
+  include_examples 'UnknownTokenError', :conditional
+  include_examples 'UnknownTokenError', :free_space
+  include_examples 'UnknownTokenError', :group
+  include_examples 'UnknownTokenError', :meta
+  include_examples 'UnknownTokenError', :nonproperty
+  include_examples 'UnknownTokenError', :property
+  include_examples 'UnknownTokenError', :quantifier
+  include_examples 'UnknownTokenError', :set
+  include_examples 'UnknownTokenError', :type
+end

data/spec/parser/escapes_spec.rb ADDED

@@ -0,0 +1,121 @@
+require 'spec_helper'
+RSpec.describe('EscapeSequence parsing') do
+  include_examples 'parse', /a\ac/,          1 => [:escape, :bell,              EscapeSequence::Bell]
+  include_examples 'parse', /a\ec/,          1 => [:escape, :escape,            EscapeSequence::AsciiEscape]
+  include_examples 'parse', /a\fc/,          1 => [:escape, :form_feed,         EscapeSequence::FormFeed]
+  include_examples 'parse', /a\nc/,          1 => [:escape, :newline,           EscapeSequence::Newline]
+  include_examples 'parse', /a\rc/,          1 => [:escape, :carriage,          EscapeSequence::Return]
+  include_examples 'parse', /a\tc/,          1 => [:escape, :tab,               EscapeSequence::Tab]
+  include_examples 'parse', /a\vc/,          1 => [:escape, :vertical_tab,      EscapeSequence::VerticalTab]
+  # meta character escapes
+  include_examples 'parse', /a\.c/,          1 => [:escape, :dot,               EscapeSequence::Literal]
+  include_examples 'parse', /a\?c/,          1 => [:escape, :zero_or_one,       EscapeSequence::Literal]
+  include_examples 'parse', /a\*c/,          1 => [:escape, :zero_or_more,      EscapeSequence::Literal]
+  include_examples 'parse', /a\+c/,          1 => [:escape, :one_or_more,       EscapeSequence::Literal]
+  include_examples 'parse', /a\|c/,          1 => [:escape, :alternation,       EscapeSequence::Literal]
+  include_examples 'parse', /a\(c/,          1 => [:escape, :group_open,        EscapeSequence::Literal]
+  include_examples 'parse', /a\)c/,          1 => [:escape, :group_close,       EscapeSequence::Literal]
+  include_examples 'parse', /a\{c/,          1 => [:escape, :interval_open,     EscapeSequence::Literal]
+  include_examples 'parse', /a\}c/,          1 => [:escape, :interval_close,    EscapeSequence::Literal]
+  # unicode escapes
+  include_examples 'parse', /a\u0640/,       1 => [:escape, :codepoint,         EscapeSequence::Codepoint]
+  include_examples 'parse', /a\u{41 1F60D}/, 1 => [:escape, :codepoint_list,    EscapeSequence::CodepointList]
+  include_examples 'parse', /a\u{10FFFF}/,   1 => [:escape, :codepoint_list,    EscapeSequence::CodepointList]
+    # hex escapes
+  include_examples 'parse', /a\xFF/n,        1 => [:escape, :hex,               EscapeSequence::Hex]
+  # octal escapes
+  include_examples 'parse', /a\177/n,        1 => [:escape, :octal,             EscapeSequence::Octal]
+  specify('parse chars and codepoints') do
+    root = RP.parse(/\n\?\101\x42\u0043\u{44 45}/)
+    expect(root[0].char).to eq "\n"
+    expect(root[0].codepoint).to eq 10
+    expect(root[1].char).to eq '?'
+    expect(root[1].codepoint).to eq 63
+    expect(root[2].char).to eq 'A'
+    expect(root[2].codepoint).to eq 65
+    expect(root[3].char).to eq 'B'
+    expect(root[3].codepoint).to eq 66
+    expect(root[4].char).to eq 'C'
+    expect(root[4].codepoint).to eq 67
+    expect(root[5].chars).to eq %w[D E]
+    expect(root[5].codepoints).to eq [68, 69]
+    expect { root[5].char }.to raise_error(/#chars/)
+    expect { root[5].codepoint }.to raise_error(/#codepoints/)
+  end
+  specify('parse escape control sequence lower') do
+    root = RP.parse(/a\\\c2b/)
+    expect(root[2]).to be_instance_of(EscapeSequence::Control)
+    expect(root[2].text).to eq '\\c2'
+    expect(root[2].char).to eq "\x12"
+    expect(root[2].codepoint).to eq 18
+  end
+  specify('parse escape control sequence upper') do
+    root = RP.parse(/\d\\\C-C\w/)
+    expect(root[2]).to be_instance_of(EscapeSequence::Control)
+    expect(root[2].text).to eq '\\C-C'
+    expect(root[2].char).to eq "\x03"
+    expect(root[2].codepoint).to eq 3
+  end
+  specify('parse escape meta sequence') do
+    root = RP.parse(/\Z\\\M-Z/n)
+    expect(root[2]).to be_instance_of(EscapeSequence::Meta)
+    expect(root[2].text).to eq '\\M-Z'
+    expect(root[2].char).to eq "\u00DA"
+    expect(root[2].codepoint).to eq 218
+  end
+  specify('parse escape meta control sequence') do
+    root = RP.parse(/\A\\\M-\C-X/n)
+    expect(root[2]).to be_instance_of(EscapeSequence::MetaControl)
+    expect(root[2].text).to eq '\\M-\\C-X'
+    expect(root[2].char).to eq "\u0098"
+    expect(root[2].codepoint).to eq 152
+  end
+  specify('parse lower c meta control sequence') do
+    root = RP.parse(/\A\\\M-\cX/n)
+    expect(root[2]).to be_instance_of(EscapeSequence::MetaControl)
+    expect(root[2].text).to eq '\\M-\\cX'
+    expect(root[2].char).to eq "\u0098"
+    expect(root[2].codepoint).to eq 152
+  end
+  specify('parse escape reverse meta control sequence') do
+    root = RP.parse(/\A\\\C-\M-X/n)
+    expect(root[2]).to be_instance_of(EscapeSequence::MetaControl)
+    expect(root[2].text).to eq '\\C-\\M-X'
+    expect(root[2].char).to eq "\u0098"
+    expect(root[2].codepoint).to eq 152
+  end
+  specify('parse escape reverse lower c meta control sequence') do
+    root = RP.parse(/\A\\\c\M-X/n)
+    expect(root[2]).to be_instance_of(EscapeSequence::MetaControl)
+    expect(root[2].text).to eq '\\c\\M-X'
+    expect(root[2].char).to eq "\u0098"
+    expect(root[2].codepoint).to eq 152
+  end
+end

data/spec/parser/free_space_spec.rb ADDED

@@ -0,0 +1,130 @@
+require 'spec_helper'
+RSpec.describe('FreeSpace parsing') do
+  specify('parse free space spaces') do
+    regexp = /a ? b * c + d{2,4}/x
+    root = RP.parse(regexp)
+    0.upto(6) do |i|
+      if i.odd?
+        expect(root[i]).to be_instance_of(WhiteSpace)
+        expect(root[i].text).to eq '  '
+      else
+        expect(root[i]).to be_instance_of(Literal)
+        expect(root[i]).to be_quantified
+      end
+    end
+  end
+  specify('parse non free space literals') do
+    regexp = /a b c d/
+    root = RP.parse(regexp)
+    expect(root.first).to be_instance_of(Literal)
+    expect(root.first.text).to eq 'a b c d'
+  end
+  specify('parse free space comments') do
+    regexp = /
+      a   ?     # One letter
+      b {2,5}   # Another one
+      [c-g]  +  # A set
+      (h|i|j) | # A group
+      klm *
+      nop +
+    /x
+    root = RP.parse(regexp)
+    alt = root.first
+    expect(alt).to be_instance_of(Alternation)
+    alt_1 = alt.alternatives.first
+    expect(alt_1).to be_instance_of(Alternative)
+    expect(alt_1.length).to eq 15
+    [0, 2, 4, 6, 8, 12, 14].each do |i|
+      expect(alt_1[i]).to be_instance_of(WhiteSpace)
+    end
+    [3, 7, 11].each { |i| expect(alt_1[i].class).to eq Comment }
+    alt_2 = alt.alternatives.last
+    expect(alt_2).to be_instance_of(Alternative)
+    expect(alt_2.length).to eq 7
+    [0, 2, 4, 6].each { |i| expect(alt_2[i].class).to eq WhiteSpace }
+    expect(alt_2[1]).to be_instance_of(Comment)
+  end
+  specify('parse free space nested comments') do
+    regexp = /
+      # Group one
+      (
+       abc  # Comment one
+       \d?  # Optional \d
+      )+
+      # Group two
+      (
+       def  # Comment two
+       \s?  # Optional \s
+      )?
+    /x
+    root = RP.parse(regexp)
+    top_comment_1 = root[1]
+    expect(top_comment_1).to be_instance_of(Comment)
+    expect(top_comment_1.text).to eq "# Group one\n"
+    expect(top_comment_1.starts_at).to eq 7
+    top_comment_2 = root[5]
+    expect(top_comment_2).to be_instance_of(Comment)
+    expect(top_comment_2.text).to eq "# Group two\n"
+    expect(top_comment_2.starts_at).to eq 95
+    [3, 7].each do |g,|
+      group = root[g]
+      [3, 7].each do |c|
+        comment = group[c]
+        expect(comment).to be_instance_of(Comment)
+        expect(comment.text.length).to eq 14
+      end
+    end
+  end
+  specify('parse free space quantifiers') do
+    regexp = /
+      a
+      # comment 1
+      ?
+      (
+       b # comment 2
+       # comment 3
+       +
+      )
+      # comment 4
+      *
+    /x
+    root = RP.parse(regexp)
+    literal_1 = root[1]
+    expect(literal_1).to be_instance_of(Literal)
+    expect(literal_1).to be_quantified
+    expect(literal_1.quantifier.token).to eq :zero_or_one
+    group = root[5]
+    expect(group).to be_instance_of(Group::Capture)
+    expect(group).to be_quantified
+    expect(group.quantifier.token).to eq :zero_or_more
+    literal_2 = group[1]
+    expect(literal_2).to be_instance_of(Literal)
+    expect(literal_2).to be_quantified
+    expect(literal_2.quantifier.token).to eq :one_or_more
+  end
+end