RubyGems - plain_text - Versions diffs - 0.1 - Mend

plain_text 0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (20) hide show

checksums.yaml +7 -0
data/.gitignore +51 -0
data/ChangeLog +5 -0
data/Makefile +23 -0
data/README.en.rdoc +172 -0
data/Rakefile +9 -0
data/bin/countchar +89 -0
data/lib/plain_text/parse_rule.rb +474 -0
data/lib/plain_text/part/boundary.rb +44 -0
data/lib/plain_text/part/paragraph.rb +35 -0
data/lib/plain_text/part.rb +973 -0
data/lib/plain_text/split.rb +103 -0
data/lib/plain_text/util.rb +104 -0
data/lib/plain_text.rb +839 -0
data/plain_text.gemspec +49 -0
data/test/test_plain_text.rb +280 -0
data/test/test_plain_text_parse_rule.rb +146 -0
data/test/test_plain_text_part.rb +353 -0
data/test/test_plain_text_split.rb +78 -0
metadata +72 -0

data/test/test_plain_text_part.rb ADDED Viewed

@@ -0,0 +1,353 @@
+# -*- encoding: utf-8 -*-
+# Author: M. Sakano (Wise Babel Ltd)
+require 'plain_text'
+$stdout.sync=true
+$stderr.sync=true
+# print '$LOAD_PATH=';p $LOAD_PATH
+#################################################
+# Unit Test
+#################################################
+#if $0 == __FILE__
+gem "minitest"
+# require 'minitest/unit'
+require 'minitest/autorun'
+# MiniTest::Unit.autorun
+class TestUnitPlainTextPart < MiniTest::Test
+  T = true
+  F = false
+  SCFNAME = File.basename(__FILE__)
+  Pt = PlainText::Part
+  def setup
+  end
+  def teardown
+  end
+  def test_new01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    ap1 = ["a",           "b",           "c"]
+    ab1 = [     "\n\n\n",      "\n\n\n",      "\n\n"]
+    a2  = ["a", "\n\n\n", "b", "\n\n\n", "c"]
+    ap2 = ap1
+    ab2 = [     "\n\n\n",      "\n\n\n",      ""]
+    pt1 = Pt.new(a1)
+    # p a1
+    # p a1.class
+    # p a1.object_id
+    # p pt1
+    # p pt1.class
+    # p pt1.object_id
+    # p pt1.to_a
+    # p pt1.to_a.object_id
+    # p pt1.to_a.class
+    assert_equal a1[0], pt1[0]
+    assert_equal a1[1], pt1[1]
+    assert_equal ap1,   pt1.parts
+    assert_equal ab1,   pt1.boundaries
+    assert_equal a1,    pt1.to_a
+    assert_operator a1,  '!=', pt1
+    assert_operator pt1, '!=', a1
+    pt2 = Pt.new(a2)
+    assert_equal a2[0], pt2[0]
+    assert_equal a2[2], pt2[2]
+    assert_equal ap2,   pt2.parts
+    assert_equal ab2,   pt2.boundaries
+    assert_equal a2+[""], pt2.to_a  # An empty String is appended.
+    assert_operator a2,  '!=', pt2
+    assert_operator pt2, '!=', a2
+  end
+  def test_new02
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    ap1 = ["a",           "b",           "c"]
+    ab1 = [     "\n\n\n",      "\n\n\n",      "\n\n"]
+    a2  = ["a", "\n\n\n", "b", "\n\n\n", "c"]
+    ap2 = ap1
+    ab2 = [     "\n\n\n",      "\n\n\n",      ""]
+    pt11 = Pt.new(a1)
+    pt12 = Pt.new(ap1, ab1)
+    assert_equal pt11, pt12
+    pt21 = Pt.new(a2)
+    pt22 = Pt.new(ap2, ab2)
+    assert_equal pt21, pt22
+  end
+  def test_size2extract01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    pt1 = Pt.new(a1)
+    assert_equal 1, pt1.send(:size2extract, 0,   1,  ignore_error: false, skip_renormalize: false)
+    assert_equal 0, pt1.send(:size2extract, 9,   1,  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, -1,  1,  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, -1,  5,  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, 5,   9,  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, -1,  9,  ignore_error: false, skip_renormalize: false)
+    assert_equal 0, pt1.send(:size2extract, 8,   9,  ignore_error: false, skip_renormalize: false)
+    assert_equal 2, pt1.send(:size2extract, (0..1),  ignore_error: false, skip_renormalize: false)
+    assert_equal 2, pt1.send(:size2extract, (0...2), ignore_error: false, skip_renormalize: false)
+    assert_equal 6, pt1.send(:size2extract, (0..-1), ignore_error: false, skip_renormalize: false)
+    assert_equal 0, pt1.send(:size2extract, (0..-1), ignore_error: false, skip_renormalize: true)
+    assert_equal 4, pt1.send(:size2extract, (0...-2), ignore_error: false, skip_renormalize: false)
+    assert_equal 0, pt1.send(:size2extract, (2..1),  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, (5..9),  ignore_error: false, skip_renormalize: false)
+    assert_equal 1, pt1.send(:size2extract, (5...9), ignore_error: false, skip_renormalize: false)
+    assert_equal 0, pt1.send(:size2extract, (8..9),  ignore_error: false, skip_renormalize: false)
+    assert_nil                 pt1.send(:size2extract, (-9..-1), ignore_error: true,  skip_renormalize: false)
+    assert_raises(IndexError){ pt1.send(:size2extract, (-9..-1), ignore_error: false, skip_renormalize: false) }
+    assert_raises(IndexError){ pt1.send(:size2extract, (1..-9),  ignore_error: false, skip_renormalize: false) }
+    assert_raises(IndexError){ pt1.send(:size2extract, (-9..-9), ignore_error: false, skip_renormalize: false) }
+  end
+  def test_equal01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    pt1 = Pt.new(a1)
+    a2  = ["a", "\n\n\n", "b", "\n\n\n", "c"]
+    pt2 = Pt.new(a2)
+    assert_operator pt1, '==', Pt.new(a1)
+    assert_operator a1,  '==', pt1.to_a
+    assert_operator a1,  '!=', pt1
+    assert_operator pt1, '!=', a1
+    assert_operator a1,  '!=', ?a
+    assert_operator ?a,  '!=', a1
+    assert_operator pt1, '!=', pt2
+    assert_operator pt2, '!=', pt1
+    assert_operator pt1, '!=', ?a
+    assert_operator ?a,  '!=', pt1
+  end
+  def test_nomethoderror01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    pt1 = Pt.new(a1)
+    assert_raises(NoMethodError){ pt1 << 'abc' }
+    assert_raises(NoMethodError){ pt1.delete_at(2) }
+  end
+  def test_plus01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    pt1 = Pt.new(a1)
+    a3  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n", "d", ""]
+    pt3 = pt1 + ["d"]  # PlainText::Part + Array => PlainText::Part
+    assert_raises(TypeError){ pt1 + "s" }
+    assert_equal a1+["d", ""], pt3.to_a
+    assert_equal pt1.class,    pt3.class
+    assert_equal Pt.new(a3),   pt3    # Boundary("") is appended.
+    assert_equal Pt::Boundary, pt3.to_a[-1].class
+    assert_equal pt3, pt1 + ["d", ""]
+    assert_equal a3.class, ([]+pt3).class  # The latter, too, is an Array (NOT PlainText::Part)
+    assert_equal a3,        []+pt3
+    assert_equal pt3.class, (pt1 + Pt.new(["d", ""])).class  # PtP + PtP => PtP
+    assert_equal pt3,        pt1 + Pt.new(["d", ""])
+  end
+  # Tests of [prm], [prm1, prm2], [prm1..prm2] and "equal" operator
+  def test_bracket01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    pt1 = Pt.new(a1)
+    assert_equal pt1.to_a[0],   pt1[0]
+    assert_equal Pt::Paragraph, pt1[0].class
+    assert_equal a1[0],         pt1[0]
+    assert_equal Pt::Paragraph.new(a1[0]), pt1[0]
+    # negative or too-big out-of-bound begin
+    assert_nil   pt1[-99]
+    assert_nil   pt1[98]
+    assert_equal pt1.class, pt1[0, 6].class
+    assert_equal a1,        pt1[0, 6].to_a
+    assert_equal a1[0, 6],  pt1[0, 6].to_a
+    assert_operator pt1[0, 6], :!=, a1
+    assert_operator a1,        :!=, pt1[0, 6]
+    assert_equal a1[0, 2],  pt1[0, 2].to_a
+    assert_equal a1,        pt1[0, 98].to_a
+    assert_equal a1[0, 99], pt1[0, 98].to_a
+    assert_equal pt1.class, pt1[0..1].class
+    assert_equal a1[0..1],  pt1[0..1].to_a
+    assert_equal a1[0, 2],  pt1[0..1].to_a
+    assert_equal a1[0..5],  pt1[0..5].to_a
+    assert_equal a1,        pt1[0..5].to_a
+    assert_equal a1[0..99], pt1[0..99].to_a
+    assert_equal a1,        pt1[0..99].to_a
+    assert_equal a1,        pt1[0..-1].to_a
+    assert_equal a1[-6..-1],pt1[-6..-1].to_a
+    assert_equal a1,        pt1[-6..-1].to_a
+    assert_equal a1[-6..3], pt1[-6..3].to_a
+    assert_equal a1[-6...4],pt1[-6...4].to_a
+    assert_equal pt1[0..-1], pt1[0..99]
+    assert_equal pt1[0, 6],  pt1[0..-1]
+    assert_equal pt1,        pt1[0..99]
+    pt2 = pt1[0, 4]
+    assert_equal pt1.class,            pt2.class
+    assert_equal pt1.parts[0, 2],      pt2.parts
+    assert_equal pt1.boundaries[0, 2], pt2.boundaries
+    # negative or too-big out-of-bound begin
+    assert_nil   a1[-99..2]
+    assert_nil   pt1[-99..2]
+    assert_nil   pt1[-99..-1]
+    assert_nil   pt1[98..99]
+    # other out-of-bounds: Empty
+    assert_equal Pt.new([]),  pt1[2..1]
+    assert_equal a1[-2..2],   pt1[-2..2].to_a
+    assert_equal a1[-2...3],  pt1[-2...3].to_a
+    # Exception (Error)
+    assert_raises(TypeError){ pt1['abc'] }
+    assert_raises(TypeError){ a1[(?a)..(?c)] }
+    assert_raises(TypeError){ pt1[(?a)..(?c)] }
+    assert_raises(ArgumentError){ pt1[0, 1] }
+    assert_raises(ArgumentError){ pt1[1, 2] }
+    # Special cases, where the first index (or begin) is equal to size (as described in the reference)
+    # @see https://docs.ruby-lang.org/ja/latest/class/Array.html#I_--5B--5D
+    assert_nil   pt1[pt1.size]
+    assert_nil   pt1[pt1.size, -2]
+    assert_raises(TypeError){ pt1[pt1.size, ?a] }
+    assert_equal Pt.new([]), pt1[pt1.size, 2]
+    assert_equal Pt.new([]), pt1[pt1.size, 98]
+    assert_equal Pt.new([]), pt1[pt1.size..99]
+    assert_equal Pt.new([]), pt1[pt1.size..1]
+  end
+  # Tests of slice! to delete
+  def test_slice01
+    a1  = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]
+    a11 = ["a", "\n\n\n", "b", "\n\n\n", "c", "\n\n"]  # a1.clone
+    pt1 = Pt.new(a1.clone)
+    pt2 = Pt.new(a11.clone)
+    assert_equal pt1.to_a[0],   pt1[0]
+    # negative or too-big out-of-bound begin
+    assert_nil   a1.slice!( -98, 2)
+    assert_nil   pt1.slice!(-98, 2)
+    assert_nil   a1.slice!( 98, 2)
+    assert_nil   pt1.slice!(98, 2)
+    assert_equal a11,   a1
+    assert_equal pt2,   pt1
+    assert_equal a11[4, 2],  a1.slice!(4, 2)
+    ptp =                   pt1.slice!(4, 2)
+    assert_equal    pt1.class, ptp.class  # PlainText::Part
+    assert_equal    a11[4, 2], ptp.to_a
+    assert_operator a11[4, 2], :!=, ptp   # PlainText::Part != Array
+    assert_equal a11[0..3],  a1
+    assert_equal a11[0..3], pt1.to_a
+    assert_equal pt2[0..3], pt1
+    # Negative size (Index, Size)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_nil  a1.slice!(4, -1)
+    ptp =      pt1.slice!(4, -1)
+    assert_nil  ptp
+    assert_equal a11,  a1
+    assert_equal a11, pt1.to_a
+    # Range exceeding (Index, Size)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_equal a11[4, 6],  a1.slice!(4, 6)
+    ptp =                   pt1.slice!(4, 6)
+    assert_equal    pt1.class, ptp.class  # PlainText::Part
+    assert_equal    a11[4, 2], ptp.to_a
+    assert_operator a11[4, 2], :!=, ptp   # PlainText::Part != Array
+    assert_equal a11[0..3],  a1
+    # Range exceeding (Range)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_equal a11[4..9],  a1.slice!(4..9)
+    ptp =                   pt1.slice!(4..9)
+    assert_equal    pt1.class, ptp.class  # PlainText::Part
+    assert_equal    a11[4..-1],ptp.to_a
+    assert_equal    a11[4..9], ptp.to_a
+    assert_operator a11[4..9], :!=, ptp   # PlainText::Part != Array
+    assert_equal a11[0..3],  a1
+    assert_equal a11[0..3], pt1.to_a
+    # Null Range (Range)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_equal [],  a1.slice!(4..0)
+    ptp =            pt1.slice!(4..0)
+    # assert_equal    pt1.class, ptp.class  # PlainText::Part  -- No! In Ruby's specification (2.5), ptp is Array, not its subClass.
+    assert_equal    [], ptp.to_a
+    # assert_operator [], :!=, ptp   # PlainText::Part != Array  -- The same
+    assert_equal a11,  a1
+    assert_equal a11, pt1.to_a
+    # Negative index (Index, size)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_equal a11[-6, 2],  a1.slice!(-6, 2)
+    ptp =                    pt1.slice!(-6, 2)
+    assert_equal    pt1.class, ptp.class  # PlainText::Part
+    assert_equal    a11[0..1], ptp.to_a
+    assert_operator a11[0..1], :!=, ptp   # PlainText::Part != Array
+    assert_equal a11[2..-1],  a1
+    assert_equal a11[2..-1], pt1.to_a
+    # Negative index (Range)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_equal a11[-6..-5],  a1.slice!(-6..-5)
+    ptp =                     pt1.slice!(-6..-5)
+    assert_equal    pt1.class, ptp.class  # PlainText::Part
+    assert_equal    a11[0..1], ptp.to_a
+    assert_operator a11[0..1], :!=, ptp   # PlainText::Part != Array
+    assert_equal a11[2..-1],  a1
+    assert_equal a11[2..-1], pt1.to_a
+    # Exception (Error)
+    a1  = a11.clone
+    pt1 = Pt.new(a11.clone)
+    assert_raises(TypeError){ pt1['abc'] }
+    assert_raises(TypeError){ a1[ (?a)..(?c)] }
+    assert_raises(TypeError){ pt1[(?a)..(?c)] }
+    assert_raises(ArgumentError){ pt1.slice!(0) }     # Single element forbidden.
+    assert_raises(ArgumentError){ pt1.slice!(0, 3) }  # Odd-number elements forbidden.
+    assert_raises(ArgumentError){ pt1.slice!(-1, 2) } # Odd-number elements forbidden.
+    assert_raises(ArgumentError){ pt1.slice!(1, 2) }  # Odd starting index.
+    assert_raises(ArgumentError){ pt1.slice!(1..2) }  # Odd starting index.
+  end
+  # Tests of Part.parse
+  def test_parse01
+    s1 = "a\n\n\nb\n\n\nc\n\n"
+    pt1 = Pt.parse s1
+    assert_equal 6, pt1.size
+    assert_equal 3, pt1.parts.size
+    assert_equal %w(a b c), pt1.parts
+    assert_equal Pt::Paragraph, pt1[0].class
+    assert_equal Pt::Boundary,  pt1[1].class
+    assert_equal s1,  pt1.join
+  end
+    #assert ( /_rails_db\.sql$/ =~ s1.outfile )
+    #assert_nil            fkeys
+    #assert_match(/^\s*ADD CONSTRAINT/ , s1.instance_eval{ @strall })
+end	# class TestUnitPlainTextPart < MiniTest::Test
+#end	# if $0 == __FILE__

data/test/test_plain_text_split.rb ADDED Viewed

@@ -0,0 +1,78 @@
+# -*- encoding: utf-8 -*-
+# Author: M. Sakano (Wise Babel Ltd)
+require 'plain_text'
+$stdout.sync=true
+$stderr.sync=true
+# print '$LOAD_PATH=';p $LOAD_PATH
+#################################################
+# Unit Test
+#################################################
+#if $0 == __FILE__
+gem "minitest"
+# require 'minitest/unit'
+require 'minitest/autorun'
+# MiniTest::Unit.autorun
+class TestUnitPlainTextSplit < MiniTest::Test
+  T = true
+  F = false
+  SCFNAME = File.basename(__FILE__)
+  PTS = PlainText::Split
+  class ChString < String
+    # Test sub-class.
+  end
+  def setup
+  end
+  def teardown
+  end
+  def test_split_with_delimiter01
+    s1 = "XabXXc"
+    s2 = "XabXXcX"
+    assert_equal [],  PTS.split_with_delimiter("", //)
+    assert_equal [],  PTS.split_with_delimiter("", /g/)
+    assert_equal [],  "".split_with_delimiter(/g/)
+    assert_equal s1,  s1.split_with_delimiter(/X/).join
+    assert_equal s2,  s2.split_with_delimiter(/X/).join
+    assert_equal s1,  s1.split_with_delimiter(/_/).join
+    assert_equal s2,  s2.split_with_delimiter(/_/).join
+    a11 = ["", ?X, "ab", ?X, "", ?X, ?c]
+    a12 = a11+[?X]
+    assert_equal a11, PTS.split_with_delimiter(s1, /X/)
+    assert_equal a11, s1.split_with_delimiter(/X/)
+    assert_equal a11, s1.split_with_delimiter('X')
+    assert_equal a12, s2.split_with_delimiter(/X/)
+    assert_equal a12, s2.split_with_delimiter('X')
+    a21 = ["", ?X, "ab", "XX", ?c]
+    a22 = a21+[?X]
+    assert_equal a21, s1.split_with_delimiter(/X+/)
+    assert_equal a21, s1.split_with_delimiter(/X+(Y?)/)  # With grouping in the argument
+    assert_equal a21, s1.split_with_delimiter(/(X+)((Y?)(Z?))/) # Even number of groupings
+    assert_equal a22, s2.split_with_delimiter(/X+/)
+    assert_equal a22, s2.split_with_delimiter(/X+(Y?)/)  # With grouping in the argument
+    assert_equal a22, s2.split_with_delimiter(/(X+)((Y?)(Z?))/) # Even number of groupings
+  end
+  def test_split_with_delimiter02
+    # As in the embedded comment
+    s  = "XYabXXcXY"
+    assert_equal ["", "ab", "c"],                   s.split(/X+Y?/)
+    assert_equal ["", "ab", "c", ""],               s.split(/X+Y?/, -1)
+    assert_equal ["", "Y", "ab", "", "c", "Y"],     s.split(/X+(Y?)/)
+    assert_equal ["", "Y", "ab", "", "c", "Y", ""], s.split(/X+(Y?)/, -1)
+    assert_equal ["", "XY", "Y", "ab", "XX", "", "c", "XY", "Y", ""], s.split(/(X+(Y?))/, -1)
+    assert_equal ["", "XY", "ab", "XX", "c", "XY"], s.split_with_delimiter(/X+(Y?)/)
+  end
+end # class TestUnitPlainTextSplit < MiniTest::Test

metadata ADDED Viewed

@@ -0,0 +1,72 @@
+--- !ruby/object:Gem::Specification
+name: plain_text
+version: !ruby/object:Gem::Version
+  version: '0.1'
+platform: ruby
+authors:
+- Masa Sakano
+autorequire:
+bindir: bin
+cert_chain: []
+date: 2019-10-25 00:00:00.000000000 Z
+dependencies: []
+description: This module provides utility functions and methods to handle plain text,
+  classes Part/Paragraph/Boundary to represent the logical structure of a document
+  and ParseRule to describe the rules to parse plain text to produce a Part-type Ruby
+  instance.
+email:
+executables:
+- countchar
+extensions: []
+extra_rdoc_files:
+- README.en.rdoc
+files:
+- ".gitignore"
+- ChangeLog
+- Makefile
+- README.en.rdoc
+- Rakefile
+- bin/countchar
+- lib/plain_text.rb
+- lib/plain_text/parse_rule.rb
+- lib/plain_text/part.rb
+- lib/plain_text/part/boundary.rb
+- lib/plain_text/part/paragraph.rb
+- lib/plain_text/split.rb
+- lib/plain_text/util.rb
+- plain_text.gemspec
+- test/test_plain_text.rb
+- test/test_plain_text_parse_rule.rb
+- test/test_plain_text_part.rb
+- test/test_plain_text_split.rb
+homepage: https://www.wisebabel.com
+licenses:
+- MIT
+metadata:
+  yard.run: yri
+post_install_message:
+rdoc_options:
+- "--charset=UTF-8"
+require_paths:
+- lib
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '2.0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubyforge_project:
+rubygems_version: 2.7.3
+signing_key:
+specification_version: 4
+summary: Module to handle Plain-Text
+test_files:
+- test/test_plain_text_parse_rule.rb
+- test/test_plain_text_part.rb
+- test/test_plain_text.rb
+- test/test_plain_text_split.rb