RubyGems - character_set - Versions diffs - 1.4.1-java → 1.5.0-java - Mend

character_set 1.4.1-java → 1.5.0-java

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (18) hide show

checksums.yaml +4 -4
data/.github/workflows/gouteur.yml +20 -0
data/.gitignore +1 -0
data/.gouteur.yml +2 -0
data/.rubocop.yml +7 -1
data/CHANGELOG.md +17 -0
data/README.md +14 -1
data/character_set.gemspec +2 -1
data/ext/character_set/character_set.c +10 -5
data/ext/character_set/unicode_casefold_table.h +44 -1
data/lib/character_set/expression_converter.rb +23 -23
data/lib/character_set/predefined_sets/assigned.cps +51 -40
data/lib/character_set/predefined_sets/emoji.cps +12 -11
data/lib/character_set/ruby_fallback/character_set_methods.rb +7 -3
data/lib/character_set/set_method_adapters.rb +4 -3
data/lib/character_set/shared_methods.rb +9 -1
data/lib/character_set/version.rb +1 -1
metadata +21 -5

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: ea526d8837bf86cb0f983b04c116dd2e1d54e43efc92cc922515d3621c1031c8
-  data.tar.gz: 83ab9e34f04f3008440dc124e30a0dd87a6671967c081e68929ca83acfd9e3a0
+  metadata.gz: 52823f4f35cdec44378c3828b4b38eba1f9f5bce402a70962eae1fb786132d8c
+  data.tar.gz: b1d6419575a3614675c194cbfde8530be02195cc73365a8c6ca446dd6ea909e6
 SHA512:
-  metadata.gz: 2e6ac6cfdb82133126209f383cbce459d93ee5183c49cb9b3fa8e9c8e3a3c97dbbe42d0b11136602a5b3e32654a925f6a138a1666b50ca18244103f74c4f8d07
-  data.tar.gz: ed0515b677589cdef16e2b1d20f3acdcb53b8f01349fcb09f640f6f63fae31eeab295763a3b5d3505f2530e95b7a6642ba35224f8b1452c5a12e17a1ff3ac07c
+  metadata.gz: c021975f912100174a5274454cfc6099a0955262e7e5fac619989a0a2aa5d624e048fe8b5f68b167157aca425c771df1bf137be12924b609b8d30dff1608142e
+  data.tar.gz: 1b702ea538bc5a5209c3544c88c9b38d328080db52640bb4a5780454d296970d8c2557ebe9c3cdd014e3a20af254c77fe694a9f56f09f3f29c039aef81dc381f

data/.github/workflows/gouteur.yml ADDED Viewed

@@ -0,0 +1,20 @@
+name: gouteur
+on: [push, pull_request]
+jobs:
+  build:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v2
+      - name: Set up Ruby
+        uses: ruby/setup-ruby@v1
+        with:
+          ruby-version: 2.7
+      - name: Prepare
+        run: |
+          bundle install --jobs 4
+          bundle exec rake compile
+      - name: Test
+        run: bundle exec gouteur

data/.gitignore CHANGED Viewed

@@ -15,6 +15,7 @@
 .ruby-version
 .tags
 .tags1
+.tool-versions
 .vscode
 bbin/
 binstubs/*

data/.gouteur.yml ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ repos:
2	+ - uri: https://github.com/jaynetics/js_regex

data/.rubocop.yml CHANGED Viewed

@@ -8,4 +8,10 @@ AllCops:
   RubyInterpreters:
     - ruby
     - rake
-  TargetRubyVersion: 2.4 # really 2.1, but 2.4 is lowest supported by rubocop
+  TargetRubyVersion: 2.5 # really 2.1, but 2.5 is lowest supported by rubocop
+Lint/AmbiguousOperatorPrecedence:
+  Enabled: false
+Lint/AmbiguousRegexpLiteral:
+  Enabled: false

data/CHANGELOG.md CHANGED Viewed

@@ -4,6 +4,23 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](http://keepachangelog.com/en/1.0.0/)
 and this project adheres to [Semantic Versioning](http://semver.org/spec/v2.0.0.html).
+## [1.5.0] - 2021-12-05
+### Added
+- new codepoints for `::assigned` and `::emoji` predefined sets, as in Ruby 3.1.0
+- latest unicode case-folding data (for `#case_insensitive`)
+- support for passing any Enumerable to `#disjoint?`, `#intersect?`
+  - this matches recent broadening of these methods in `ruby/set`
+- new instance method `#secure_token` (see README)
+- class method `::of` now accepts more than one `String`
+- `CharacterSet::ExpressionConverter` can now build output of any Set-like class
+### Fixed
+- `CharacterSet::Pure::of_expression` now returns a `CharacterSet::Pure`
+  - it used to return a regular `CharacterSet`
 ## [1.4.1] - 2020-01-10
 ### Fixed

data/README.md CHANGED Viewed

@@ -2,6 +2,7 @@
 [![Gem Version](https://badge.fury.io/rb/character_set.svg)](http://badge.fury.io/rb/character_set)
 [![Build Status](https://github.com/jaynetics/character_set/workflows/tests/badge.svg)](https://github.com/jaynetics/character_set/actions)
+[![Build Status](https://github.com/jaynetics/character_set/workflows/gouteur/badge.svg)](https://github.com/jaynetics/character_set/actions)
 [![codecov](https://codecov.io/gh/jaynetics/character_set/branch/master/graph/badge.svg)](https://codecov.io/gh/jaynetics/character_set)
 This is a C-extended Ruby gem to work with sets of Unicode codepoints. It can read and write these sets in various formats and implements the stdlib `Set` interface for them.
@@ -10,6 +11,7 @@ It also offers an alternate paradigm of `String` processing which grants much be
 Many parts can be used independently, e.g.:
 - `CharacterSet::Character`
+- `CharacterSet::ExpressionConverter`
 - `CharacterSet::Parser`
 - `CharacterSet::Writer`
 - [`RangeCompressor`](https://github.com/jaynetics/range_compressor)
@@ -181,7 +183,18 @@ set.to_s_with_surrogate_alternation
 # => '(?:[ab]|\uD83E\uDD29|\uD83E\uDD2A|\uD83E\uDD2B)'
 ```
-### Unicode plane methods
+### Other features
+#### Secure tokens
+Generate secure random strings of characters from a set:
+```ruby
+CharacterSet.new('a'..'z').secure_token(8) # => "ugwpujmt"
+CharacterSet.crypt.secure_token # => "8.1w7aBT737/pMfcMoO4y2y8/=0xtmo:"
+```
+#### Unicode planes
 There are some methods to check for planes and to handle ASCII, [BMP](https://en.wikipedia.org/wiki/Plane_%28Unicode%29#Basic_Multilingual_Plane) and astral parts:
 ```Ruby

data/character_set.gemspec CHANGED Viewed

@@ -34,11 +34,12 @@ Gem::Specification.new do |s|
   s.add_development_dependency 'rake', '~> 13.0'
   s.add_development_dependency 'rake-compiler', '~> 1.1'
   s.add_development_dependency 'range_compressor', '~> 1.0'
-  s.add_development_dependency 'regexp_parser', '~> 1.6'
+  s.add_development_dependency 'regexp_parser', '~> 2.1'
   s.add_development_dependency 'regexp_property_values', '~> 1.0'
   s.add_development_dependency 'rspec', '~> 3.8'
   if RUBY_VERSION.to_f >= 2.7
     s.add_development_dependency 'codecov', '~> 0.2.12'
+    s.add_development_dependency 'gouteur', '~> 1.0.0'
     s.add_development_dependency 'rubocop', '~> 1.8'
   end
 end

data/ext/character_set/character_set.c CHANGED Viewed

@@ -705,7 +705,8 @@ cs_method_ranges(VALUE self)
       if (!previous_cp_num) {
         current_start = cp_num;
-      } else if (previous_cp_num + 2 != cp_num) {
+      } else if (previous_cp_num + 2 != cp_num)
+      {
         // gap found, finalize previous range
         rb_ary_push(ranges, rb_range_new(current_start, current_end, 0));
         current_start = cp_num;
@@ -1046,13 +1047,17 @@ raise_arg_err_unless_string(VALUE val)
 }
 static VALUE
-cs_class_method_of(VALUE self, VALUE str)
+cs_class_method_of(int argc, VALUE *argv, VALUE self)
 {
   VALUE new_cs;
   struct cs_data *new_data;
+  int i;
   new_cs = cs_alloc(self, &new_data);
-  raise_arg_err_unless_string(str);
-  each_cp(str, add_str_cp_to_arr, 0, 0, new_data, 0);
+  for (i = 0; i < argc; i++)
+  {
+    raise_arg_err_unless_string(argv[i]);
+    each_cp(argv[i], add_str_cp_to_arr, 0, 0, new_data, 0);
+  }
   return new_cs;
 }
@@ -1338,7 +1343,7 @@ void Init_character_set()
   // `CharacterSet`-specific methods
   rb_define_singleton_method(cs, "from_ranges", cs_class_method_from_ranges, -2);
-  rb_define_singleton_method(cs, "of", cs_class_method_of, 1);
+  rb_define_singleton_method(cs, "of", cs_class_method_of, -1);
   rb_define_method(cs, "ranges", cs_method_ranges, 0);
   rb_define_method(cs, "sample", cs_method_sample, -1);

data/ext/character_set/unicode_casefold_table.h CHANGED Viewed

@@ -6,7 +6,7 @@ typedef struct casefold_mapping {
   unsigned long to;
 } casefold_mapping;
-#define CASEFOLD_COUNT 1383
+#define CASEFOLD_COUNT 1426
 static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x0041,0x0061},
@@ -564,6 +564,41 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x104D1,0x104F9},
 {0x104D2,0x104FA},
 {0x104D3,0x104FB},
+{0x10570,0x10597},
+{0x10571,0x10598},
+{0x10572,0x10599},
+{0x10573,0x1059A},
+{0x10574,0x1059B},
+{0x10575,0x1059C},
+{0x10576,0x1059D},
+{0x10577,0x1059E},
+{0x10578,0x1059F},
+{0x10579,0x105A0},
+{0x1057A,0x105A1},
+{0x1057C,0x105A3},
+{0x1057D,0x105A4},
+{0x1057E,0x105A5},
+{0x1057F,0x105A6},
+{0x10580,0x105A7},
+{0x10581,0x105A8},
+{0x10582,0x105A9},
+{0x10583,0x105AA},
+{0x10584,0x105AB},
+{0x10585,0x105AC},
+{0x10586,0x105AD},
+{0x10587,0x105AE},
+{0x10588,0x105AF},
+{0x10589,0x105B0},
+{0x1058A,0x105B1},
+{0x1058C,0x105B3},
+{0x1058D,0x105B4},
+{0x1058E,0x105B5},
+{0x1058F,0x105B6},
+{0x10590,0x105B7},
+{0x10591,0x105B8},
+{0x10592,0x105B9},
+{0x10594,0x105BB},
+{0x10595,0x105BC},
 {0x10A0,0x2D00},
 {0x10A1,0x2D01},
 {0x10A2,0x2D02},
@@ -1102,6 +1137,7 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x2C2C,0x2C5C},
 {0x2C2D,0x2C5D},
 {0x2C2E,0x2C5E},
+{0x2C2F,0x2C5F},
 {0x2C60,0x2C61},
 {0x2C62,0x026B},
 {0x2C63,0x1D7D},
@@ -1282,10 +1318,17 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0xA7BA,0xA7BB},
 {0xA7BC,0xA7BD},
 {0xA7BE,0xA7BF},
+{0xA7C0,0xA7C1},
 {0xA7C2,0xA7C3},
 {0xA7C4,0xA794},
 {0xA7C5,0x0282},
 {0xA7C6,0x1D8E},
+{0xA7C7,0xA7C8},
+{0xA7C9,0xA7CA},
+{0xA7D0,0xA7D1},
+{0xA7D6,0xA7D7},
+{0xA7D8,0xA7D9},
+{0xA7F5,0xA7F6},
 {0xAB70,0x13A0},
 {0xAB71,0x13A1},
 {0xAB72,0x13A2},

data/lib/character_set/expression_converter.rb CHANGED Viewed

@@ -4,7 +4,7 @@ class CharacterSet
     Error = Class.new(ArgumentError)
-    def convert(expression)
+    def convert(expression, to = CharacterSet)
       CharacterSet.require_optional_dependency('regexp_parser', __method__)
       case expression
@@ -12,49 +12,49 @@ class CharacterSet
         if expression.count != 1
           raise Error, 'Pass a Regexp with exactly one expression, e.g. /[a-z]/'
         end
-        convert(expression[0])
+        convert(expression[0], to)
       when Regexp::Expression::CharacterSet
-        content = expression.map { |subexp| convert(subexp) }.reduce(:+)
-        content ||= CharacterSet[]
+        content = expression.map { |subexp| convert(subexp, to) }.reduce(:+)
+        content ||= to[]
         expression.negative? ? content.inversion : content
       when Regexp::Expression::CharacterSet::Intersection
-        expression.map { |subexp| convert(subexp) }.reduce(:&)
+        expression.map { |subexp| convert(subexp, to) }.reduce(:&)
       when Regexp::Expression::CharacterSet::IntersectedSequence
-        expression.map { |subexp| convert(subexp) }.reduce(:+) || CharacterSet[]
+        expression.map { |subexp| convert(subexp, to) }.reduce(:+) || to[]
       when Regexp::Expression::CharacterSet::Range
-        start, finish = expression.map { |subexp| convert(subexp) }
-        CharacterSet.new((start.min)..(finish.max))
+        start, finish = expression.map { |subexp| convert(subexp, to) }
+        to.new((start.min)..(finish.max))
       when Regexp::Expression::CharacterType::Any
-        CharacterSet.unicode
+        to.unicode
       when Regexp::Expression::CharacterType::Base
         /(?<negative>non)?(?<base_name>.+)/ =~ expression.token
         content =
           if expression.unicode_classes?
             # in u-mode, type shortcuts match the same as \p{<long type name>}
-            CharacterSet.of_property(base_name)
+            to.of_property(base_name)
           else
             # in normal mode, types match only ascii chars
             case base_name.to_sym
-            when :digit then CharacterSet.from_ranges(48..57)
-            when :hex   then CharacterSet.from_ranges(48..57, 65..70, 97..102)
-            when :space then CharacterSet.from_ranges(9..13, 32..32)
-            when :word  then CharacterSet.from_ranges(48..57, 65..90, 95..95, 97..122)
+            when :digit then to.from_ranges(48..57)
+            when :hex   then to.from_ranges(48..57, 65..70, 97..102)
+            when :space then to.from_ranges(9..13, 32..32)
+            when :word  then to.from_ranges(48..57, 65..90, 95..95, 97..122)
             else raise Error, "Unsupported CharacterType #{base_name}"
             end
           end
         negative ? content.inversion : content
       when Regexp::Expression::EscapeSequence::CodepointList
-        CharacterSet.new(expression.codepoints)
+        to.new(expression.codepoints)
       when Regexp::Expression::EscapeSequence::Base
-        CharacterSet[expression.codepoint]
+        to[expression.codepoint]
       when Regexp::Expression::Group::Capture,
            Regexp::Expression::Group::Passive,
@@ -62,19 +62,19 @@ class CharacterSet
            Regexp::Expression::Group::Atomic,
            Regexp::Expression::Group::Options
         case expression.count
-        when 0 then CharacterSet[]
-        when 1 then convert(expression.first)
+        when 0 then to[]
+        when 1 then convert(expression.first, to)
         else
           raise Error, 'Groups must contain exactly one expression, e.g. ([a-z])'
         end
       when Regexp::Expression::Alternation # rubocop:disable Lint/DuplicateBranch
-        expression.map { |subexp| convert(subexp) }.reduce(:+)
+        expression.map { |subexp| convert(subexp, to) }.reduce(:+)
       when Regexp::Expression::Alternative
         case expression.count
-        when 0 then CharacterSet[]
-        when 1 then convert(expression.first)
+        when 0 then to[]
+        when 1 then convert(expression.first, to)
         else
           raise Error, 'Alternatives must contain exactly one expression'
         end
@@ -83,11 +83,11 @@ class CharacterSet
         if expression.set_level == 0 && expression.text.size != 1
           raise Error, 'Literal runs outside of sets are codepoint *sequences*'
         end
-        CharacterSet[expression.text.ord]
+        to[expression.text.ord]
       when Regexp::Expression::UnicodeProperty::Base,
            Regexp::Expression::PosixClass
-        content = CharacterSet.of_property(expression.token)
+        content = to.of_property(expression.token)
         if expression.type == :posixclass && expression.ascii_classes?
           content = content.ascii_part
         end

data/lib/character_set/predefined_sets/assigned.cps CHANGED Viewed

@@ -21,7 +21,7 @@
 85E,85E
 860,86A
 8A0,8B4
-8B6,8BD
+8B6,8C7
 8D3,983
 985,98C
 98F,990
@@ -76,7 +76,7 @@ B35,B39
 B3C,B44
 B47,B48
 B4B,B4D
-B56,B57
+B55,B57
 B5C,B5D
 B5F,B63
 B66,B77
@@ -120,15 +120,14 @@ CDE,CDE
 CE0,CE3
 CE6,CEF
 CF1,CF2
-D00,D03
-D05,D0C
+D00,D0C
 D0E,D10
 D12,D44
 D46,D48
 D4A,D4F
 D54,D63
 D66,D7F
-D82,D83
+D81,D83
 D85,D96
 D9A,DB1
 DB3,DBB
@@ -214,7 +213,7 @@ FCE,FDA
 1A7F,1A89
 1A90,1A99
 1AA0,1AAD
-1AB0,1ABE
+1AB0,1AC0
 1B00,1B4B
 1B50,1B7C
 1B80,1BF3
@@ -252,7 +251,7 @@ FCE,FDA
 2440,244A
 2460,2B73
 2B76,2B95
-2B98,2C2E
+2B97,2C2E
 2C30,2C5E
 2C60,2CF3
 2CF9,2D25
@@ -269,7 +268,7 @@ FCE,FDA
 2DC8,2DCE
 2DD0,2DD6
 2DD8,2DDE
-2DE0,2E4F
+2DE0,2E52
 2E80,2E99
 2E9B,2EF3
 2F00,2FD5
@@ -279,18 +278,16 @@ FCE,FDA
 3099,30FF
 3105,312F
 3131,318E
-3190,31BA
-31C0,31E3
+3190,31E3
 31F0,321E
-3220,4DB5
-4DC0,9FEF
+3220,9FFC
 A000,A48C
 A490,A4C6
 A4D0,A62B
 A640,A6F7
 A700,A7BF
-A7C2,A7C6
-A7F7,A82B
+A7C2,A7CA
+A7F5,A82C
 A830,A839
 A840,A877
 A880,A8C5
@@ -310,7 +307,7 @@ AB09,AB0E
 AB11,AB16
 AB20,AB26
 AB28,AB2E
-AB30,AB67
+AB30,AB6B
 AB70,ABED
 ABF0,ABF9
 AC00,D7A3
@@ -355,7 +352,7 @@ FFF9,FFFD
 10100,10102
 10107,10133
 10137,1018E
-10190,1019B
+10190,1019C
 101A0,101A0
 101D0,101FD
 10280,1029C
@@ -415,8 +412,12 @@ FFF9,FFFD
 10CFA,10D27
 10D30,10D39
 10E60,10E7E
+10E80,10EA9
+10EAB,10EAD
+10EB0,10EB1
 10F00,10F27
 10F30,10F59
+10FB0,10FCB
 10FE0,10FF6
 11000,1104D
 11052,1106F
@@ -425,10 +426,9 @@ FFF9,FFFD
 110D0,110E8
 110F0,110F9
 11100,11134
-11136,11146
+11136,11147
 11150,11176
-11180,111CD
-111D0,111DF
+11180,111DF
 111E1,111F4
 11200,11211
 11213,1123E
@@ -454,9 +454,8 @@ FFF9,FFFD
 1135D,11363
 11366,1136C
 11370,11374
-11400,11459
-1145B,1145B
-1145D,1145F
+11400,1145B
+1145D,11461
 11480,114C7
 114D0,114D9
 11580,115B5
@@ -471,7 +470,14 @@ FFF9,FFFD
 11730,1173F
 11800,1183B
 118A0,118F2
-118FF,118FF
+118FF,11906
+11909,11909
+1190C,11913
+11915,11916
+11918,11935
+11937,11938
+1193B,11946
+11950,11959
 119A0,119A7
 119AA,119D7
 119DA,119E4
@@ -499,6 +505,7 @@ FFF9,FFFD
 11D93,11D98
 11DA0,11DA9
 11EE0,11EF8
+11FB0,11FB0
 11FC0,11FF1
 11FFF,12399
 12400,1246E
@@ -522,9 +529,11 @@ FFF9,FFFD
 16F00,16F4A
 16F4F,16F87
 16F8F,16F9F
-16FE0,16FE3
+16FE0,16FE4
+16FF0,16FF1
 17000,187F7
-18800,18AF2
+18800,18CD5
+18D00,18D08
 1B000,1B11E
 1B150,1B152
 1B164,1B167
@@ -622,17 +631,15 @@ FFF9,FFFD
 1F0B1,1F0BF
 1F0C1,1F0CF
 1F0D1,1F0F5
-1F100,1F10C
-1F110,1F16C
-1F170,1F1AC
+1F100,1F1AD
 1F1E6,1F202
 1F210,1F23B
 1F240,1F248
 1F250,1F251
 1F260,1F265
-1F300,1F6D5
+1F300,1F6D7
 1F6E0,1F6EC
-1F6F0,1F6FA
+1F6F0,1F6FC
 1F700,1F773
 1F780,1F7D8
 1F7E0,1F7EB
@@ -641,24 +648,28 @@ FFF9,FFFD
 1F850,1F859
 1F860,1F887
 1F890,1F8AD
-1F900,1F90B
-1F90D,1F971
-1F973,1F976
-1F97A,1F9A2
-1F9A5,1F9AA
-1F9AE,1F9CA
+1F8B0,1F8B1
+1F900,1F978
+1F97A,1F9CB
 1F9CD,1FA53
 1FA60,1FA6D
-1FA70,1FA73
+1FA70,1FA74
 1FA78,1FA7A
-1FA80,1FA82
-1FA90,1FA95
-20000,2A6D6
+1FA80,1FA86
+1FA90,1FAA8
+1FAB0,1FAB6
+1FAC0,1FAC2
+1FAD0,1FAD6
+1FB00,1FB92
+1FB94,1FBCA
+1FBF0,1FBF9
+20000,2A6DD
 2A700,2B734
 2B740,2B81D
 2B820,2CEA1
 2CEB0,2EBE0
 2F800,2FA1D
+30000,3134A
 E0001,E0001
 E0020,E007F
 E0100,E01EF

data/lib/character_set/predefined_sets/emoji.cps CHANGED Viewed

@@ -44,6 +44,7 @@ AE,AE
 2699,2699
 269B,269C
 26A0,26A1
+26A7,26A7
 26AA,26AB
 26B0,26B1
 26BD,26BE
@@ -130,22 +131,22 @@ AE,AE
 1F5FA,1F64F
 1F680,1F6C5
 1F6CB,1F6D2
-1F6D5,1F6D5
+1F6D5,1F6D7
 1F6E0,1F6E5
 1F6E9,1F6E9
 1F6EB,1F6EC
 1F6F0,1F6F0
-1F6F3,1F6FA
+1F6F3,1F6FC
 1F7E0,1F7EB
-1F90D,1F93A
+1F90C,1F93A
 1F93C,1F945
-1F947,1F971
-1F973,1F976
-1F97A,1F9A2
-1F9A5,1F9AA
-1F9AE,1F9CA
+1F947,1F978
+1F97A,1F9CB
 1F9CD,1F9FF
-1FA70,1FA73
+1FA70,1FA74
 1FA78,1FA7A
-1FA80,1FA82
-1FA90,1FA95
+1FA80,1FA86
+1FA90,1FAA8
+1FAB0,1FAB6
+1FAC0,1FAC2
+1FAD0,1FAD6

data/lib/character_set/ruby_fallback/character_set_methods.rb CHANGED Viewed

@@ -6,9 +6,13 @@ class CharacterSet
           new(Array(ranges).flat_map(&:to_a))
         end
-        def of(string)
-          raise ArgumentError, 'pass a String' unless string.is_a?(String)
-          new(string.codepoints)
+        def of(*strings)
+          new_set = new
+          strings.each do |str|
+            raise ArgumentError, 'pass a String' unless str.respond_to?(:codepoints)
+            str.codepoints.each { |cp| new_set << cp }
+          end
+          new_set
         end
       end

data/lib/character_set/set_method_adapters.rb CHANGED Viewed

@@ -22,13 +22,14 @@ class CharacterSet
     # Allow some methods to take an Enum just as well as another CharacterSet.
     # Tested by ruby-spec.
-    %w[& + - ^ | difference intersection subtract union].each do |method|
+    %w[& + - ^ | difference disjoint? intersect? intersection
+       subtract union].each do |method|
       class_eval <<-RUBY, __FILE__, __LINE__ + 1
         def #{method}(arg)
           if arg.is_a?(CharacterSet)
-            super
+            super(arg)
           elsif arg.respond_to?(:each)
-            super(CharacterSet.new(arg.to_a))
+            super(self.class.new(arg.to_a))
           else
             raise ArgumentError, 'pass an enumerable'
           end

data/lib/character_set/shared_methods.rb CHANGED Viewed

@@ -36,7 +36,7 @@ class CharacterSet
           end
           def of_expression(expression)
-            ExpressionConverter.convert(expression)
+            ExpressionConverter.convert(expression, self)
           end
           def require_optional_dependency(name, method)
@@ -90,6 +90,14 @@ class CharacterSet
           Writer.write_surrogate_alternation(bmp_part.ranges, astral_part.ranges)
         end
+        def secure_token(length = 32)
+          CharacterSet.require_optional_dependency('securerandom', __method__)
+          cps = to_a
+          len = cps.count
+          1.upto(length).map { cps[SecureRandom.random_number(len)] }.pack('U*')
+        end
+        alias random_token secure_token
         def inspect
           len = length
           "#<#{klass.name}: {\#{first(5) * ', '}\#{'...' if len > 5}} (size: \#{len})>"

data/lib/character_set/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 class CharacterSet
-  VERSION = '1.4.1'
+  VERSION = '1.5.0'
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: character_set
 version: !ruby/object:Gem::Version
-  version: 1.4.1
+  version: 1.5.0
 platform: java
 authors:
 - Janosch Müller
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2021-01-11 00:00:00.000000000 Z
+date: 2021-12-05 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: sorted_set
@@ -100,14 +100,14 @@ dependencies:
     requirements:
     - - "~>"
       - !ruby/object:Gem::Version
-        version: '1.6'
+        version: '2.1'
   type: :development
   prerelease: false
   version_requirements: !ruby/object:Gem::Requirement
     requirements:
     - - "~>"
       - !ruby/object:Gem::Version
-        version: '1.6'
+        version: '2.1'
 - !ruby/object:Gem::Dependency
   name: regexp_property_values
   requirement: !ruby/object:Gem::Requirement
@@ -150,6 +150,20 @@ dependencies:
     - - "~>"
       - !ruby/object:Gem::Version
         version: 0.2.12
+- !ruby/object:Gem::Dependency
+  name: gouteur
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 1.0.0
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 1.0.0
 - !ruby/object:Gem::Dependency
   name: rubocop
   requirement: !ruby/object:Gem::Requirement
@@ -186,9 +200,11 @@ extensions: []
 extra_rdoc_files: []
 files:
 - ".gitattributes"
+- ".github/workflows/gouteur.yml"
 - ".github/workflows/lint.yml"
 - ".github/workflows/tests.yml"
 - ".gitignore"
+- ".gouteur.yml"
 - ".rspec"
 - ".rubocop.yml"
 - BENCHMARK.md
@@ -266,7 +282,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
     - !ruby/object:Gem::Version
       version: '0'
 requirements: []
-rubygems_version: 3.2.3
+rubygems_version: 3.3.0.dev
 signing_key:
 specification_version: 4
 summary: Build, read, write and compare sets of Unicode codepoints.