RubyGems - character_set - Versions diffs - 1.4.1-java → 1.5.0-java - Mend

character_set 1.4.1-java → 1.5.0-java

Files changed (18) hide show

checksums.yaml +4 -4
data/.github/workflows/gouteur.yml +20 -0
data/.gitignore +1 -0
data/.gouteur.yml +2 -0
data/.rubocop.yml +7 -1
data/CHANGELOG.md +17 -0
data/README.md +14 -1
data/character_set.gemspec +2 -1
data/ext/character_set/character_set.c +10 -5
data/ext/character_set/unicode_casefold_table.h +44 -1
data/lib/character_set/expression_converter.rb +23 -23
data/lib/character_set/predefined_sets/assigned.cps +51 -40
data/lib/character_set/predefined_sets/emoji.cps +12 -11
data/lib/character_set/ruby_fallback/character_set_methods.rb +7 -3
data/lib/character_set/set_method_adapters.rb +4 -3
data/lib/character_set/shared_methods.rb +9 -1
data/lib/character_set/version.rb +1 -1
metadata +21 -5

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: ea526d8837bf86cb0f983b04c116dd2e1d54e43efc92cc922515d3621c1031c8
-  data.tar.gz: 83ab9e34f04f3008440dc124e30a0dd87a6671967c081e68929ca83acfd9e3a0
+  metadata.gz: 52823f4f35cdec44378c3828b4b38eba1f9f5bce402a70962eae1fb786132d8c
+  data.tar.gz: b1d6419575a3614675c194cbfde8530be02195cc73365a8c6ca446dd6ea909e6
 SHA512:
-  metadata.gz: 2e6ac6cfdb82133126209f383cbce459d93ee5183c49cb9b3fa8e9c8e3a3c97dbbe42d0b11136602a5b3e32654a925f6a138a1666b50ca18244103f74c4f8d07
-  data.tar.gz: ed0515b677589cdef16e2b1d20f3acdcb53b8f01349fcb09f640f6f63fae31eeab295763a3b5d3505f2530e95b7a6642ba35224f8b1452c5a12e17a1ff3ac07c
+  metadata.gz: c021975f912100174a5274454cfc6099a0955262e7e5fac619989a0a2aa5d624e048fe8b5f68b167157aca425c771df1bf137be12924b609b8d30dff1608142e
+  data.tar.gz: 1b702ea538bc5a5209c3544c88c9b38d328080db52640bb4a5780454d296970d8c2557ebe9c3cdd014e3a20af254c77fe694a9f56f09f3f29c039aef81dc381f

data/.github/workflows/gouteur.yml ADDED Viewed

@@ -0,0 +1,20 @@
+name: gouteur
+on: [push, pull_request]
+jobs:
+  build:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v2
+      - name: Set up Ruby
+        uses: ruby/setup-ruby@v1
+        with:
+          ruby-version: 2.7
+      - name: Prepare
+        run: |
+          bundle install --jobs 4
+          bundle exec rake compile
+      - name: Test
+        run: bundle exec gouteur

data/.gitignore CHANGED Viewed

@@ -15,6 +15,7 @@
 .ruby-version
 .tags
 .tags1
+.tool-versions
 .vscode
 bbin/
 binstubs/*

data/.gouteur.yml ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ repos:
2	+ - uri: https://github.com/jaynetics/js_regex

data/.rubocop.yml CHANGED Viewed

@@ -8,4 +8,10 @@ AllCops:
   RubyInterpreters:
     - ruby
     - rake
-  TargetRubyVersion: 2.4 # really 2.1, but 2.4 is lowest supported by rubocop
+  TargetRubyVersion: 2.5 # really 2.1, but 2.5 is lowest supported by rubocop
+Lint/AmbiguousOperatorPrecedence:
+  Enabled: false
+Lint/AmbiguousRegexpLiteral:
+  Enabled: false

data/CHANGELOG.md CHANGED Viewed

@@ -4,6 +4,23 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](http://keepachangelog.com/en/1.0.0/)
 and this project adheres to [Semantic Versioning](http://semver.org/spec/v2.0.0.html).
+## [1.5.0] - 2021-12-05
+### Added
+- new codepoints for `::assigned` and `::emoji` predefined sets, as in Ruby 3.1.0
+- latest unicode case-folding data (for `#case_insensitive`)
+- support for passing any Enumerable to `#disjoint?`, `#intersect?`
+  - this matches recent broadening of these methods in `ruby/set`
+- new instance method `#secure_token` (see README)
+- class method `::of` now accepts more than one `String`
+- `CharacterSet::ExpressionConverter` can now build output of any Set-like class
+### Fixed
+- `CharacterSet::Pure::of_expression` now returns a `CharacterSet::Pure`
+  - it used to return a regular `CharacterSet`
 ## [1.4.1] - 2020-01-10
 ### Fixed

data/README.md CHANGED Viewed

@@ -2,6 +2,7 @@
 [![Gem Version](https://badge.fury.io/rb/character_set.svg)](http://badge.fury.io/rb/character_set)
 [![Build Status](https://github.com/jaynetics/character_set/workflows/tests/badge.svg)](https://github.com/jaynetics/character_set/actions)
+[![Build Status](https://github.com/jaynetics/character_set/workflows/gouteur/badge.svg)](https://github.com/jaynetics/character_set/actions)
 [![codecov](https://codecov.io/gh/jaynetics/character_set/branch/master/graph/badge.svg)](https://codecov.io/gh/jaynetics/character_set)
 This is a C-extended Ruby gem to work with sets of Unicode codepoints. It can read and write these sets in various formats and implements the stdlib `Set` interface for them.
@@ -10,6 +11,7 @@ It also offers an alternate paradigm of `String` processing which grants much be
 Many parts can be used independently, e.g.:
 - `CharacterSet::Character`
+- `CharacterSet::ExpressionConverter`
 - `CharacterSet::Parser`
 - `CharacterSet::Writer`
 - [`RangeCompressor`](https://github.com/jaynetics/range_compressor)
@@ -181,7 +183,18 @@ set.to_s_with_surrogate_alternation
 # => '(?:[ab]|\uD83E\uDD29|\uD83E\uDD2A|\uD83E\uDD2B)'
 ```
-### Unicode plane methods
+### Other features
+#### Secure tokens
+Generate secure random strings of characters from a set:
+```ruby
+CharacterSet.new('a'..'z').secure_token(8) # => "ugwpujmt"
+CharacterSet.crypt.secure_token # => "8.1w7aBT737/pMfcMoO4y2y8/=0xtmo:"
+```
+#### Unicode planes
 There are some methods to check for planes and to handle ASCII, [BMP](https://en.wikipedia.org/wiki/Plane_%28Unicode%29#Basic_Multilingual_Plane) and astral parts:
 ```Ruby

data/character_set.gemspec CHANGED Viewed

@@ -34,11 +34,12 @@ Gem::Specification.new do |s|
   s.add_development_dependency 'rake', '~> 13.0'
   s.add_development_dependency 'rake-compiler', '~> 1.1'
   s.add_development_dependency 'range_compressor', '~> 1.0'
-  s.add_development_dependency 'regexp_parser', '~> 1.6'
+  s.add_development_dependency 'regexp_parser', '~> 2.1'
   s.add_development_dependency 'regexp_property_values', '~> 1.0'
   s.add_development_dependency 'rspec', '~> 3.8'
   if RUBY_VERSION.to_f >= 2.7
     s.add_development_dependency 'codecov', '~> 0.2.12'
+    s.add_development_dependency 'gouteur', '~> 1.0.0'
     s.add_development_dependency 'rubocop', '~> 1.8'
   end
 end

data/ext/character_set/character_set.c CHANGED Viewed

@@ -705,7 +705,8 @@ cs_method_ranges(VALUE self)
       if (!previous_cp_num) {
         current_start = cp_num;
-      } else if (previous_cp_num + 2 != cp_num) {
+      } else if (previous_cp_num + 2 != cp_num)
+      {
         // gap found, finalize previous range
         rb_ary_push(ranges, rb_range_new(current_start, current_end, 0));
         current_start = cp_num;
@@ -1046,13 +1047,17 @@ raise_arg_err_unless_string(VALUE val)
 }
 static VALUE
-cs_class_method_of(VALUE self, VALUE str)
+cs_class_method_of(int argc, VALUE *argv, VALUE self)
 {
   VALUE new_cs;
   struct cs_data *new_data;
+  int i;
   new_cs = cs_alloc(self, &new_data);
-  raise_arg_err_unless_string(str);
-  each_cp(str, add_str_cp_to_arr, 0, 0, new_data, 0);
+  for (i = 0; i < argc; i++)
+  {
+    raise_arg_err_unless_string(argv[i]);
+    each_cp(argv[i], add_str_cp_to_arr, 0, 0, new_data, 0);
+  }
   return new_cs;
 }
@@ -1338,7 +1343,7 @@ void Init_character_set()
   // `CharacterSet`-specific methods
   rb_define_singleton_method(cs, "from_ranges", cs_class_method_from_ranges, -2);
-  rb_define_singleton_method(cs, "of", cs_class_method_of, 1);
+  rb_define_singleton_method(cs, "of", cs_class_method_of, -1);
   rb_define_method(cs, "ranges", cs_method_ranges, 0);
   rb_define_method(cs, "sample", cs_method_sample, -1);

data/ext/character_set/unicode_casefold_table.h CHANGED Viewed

@@ -6,7 +6,7 @@ typedef struct casefold_mapping {
   unsigned long to;
 } casefold_mapping;
-#define CASEFOLD_COUNT 1383
+#define CASEFOLD_COUNT 1426
 static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x0041,0x0061},
@@ -564,6 +564,41 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x104D1,0x104F9},
 {0x104D2,0x104FA},
 {0x104D3,0x104FB},
+{0x10570,0x10597},
+{0x10571,0x10598},
+{0x10572,0x10599},
+{0x10573,0x1059A},
+{0x10574,0x1059B},
+{0x10575,0x1059C},
+{0x10576,0x1059D},
+{0x10577,0x1059E},
+{0x10578,0x1059F},
+{0x10579,0x105A0},
+{0x1057A,0x105A1},
+{0x1057C,0x105A3},
+{0x1057D,0x105A4},
+{0x1057E,0x105A5},
+{0x1057F,0x105A6},
+{0x10580,0x105A7},
+{0x10581,0x105A8},
+{0x10582,0x105A9},
+{0x10583,0x105AA},
+{0x10584,0x105AB},
+{0x10585,0x105AC},
+{0x10586,0x105AD},
+{0x10587,0x105AE},
+{0x10588,0x105AF},
+{0x10589,0x105B0},
+{0x1058A,0x105B1},
+{0x1058C,0x105B3},
+{0x1058D,0x105B4},
+{0x1058E,0x105B5},
+{0x1058F,0x105B6},
+{0x10590,0x105B7},
+{0x10591,0x105B8},
+{0x10592,0x105B9},
+{0x10594,0x105BB},
+{0x10595,0x105BC},
 {0x10A0,0x2D00},
 {0x10A1,0x2D01},
 {0x10A2,0x2D02},
@@ -1102,6 +1137,7 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0x2C2C,0x2C5C},
 {0x2C2D,0x2C5D},
 {0x2C2E,0x2C5E},
+{0x2C2F,0x2C5F},
 {0x2C60,0x2C61},
 {0x2C62,0x026B},
 {0x2C63,0x1D7D},
@@ -1282,10 +1318,17 @@ static const casefold_mapping unicode_casefold_table[CASEFOLD_COUNT] = {
 {0xA7BA,0xA7BB},
 {0xA7BC,0xA7BD},
 {0xA7BE,0xA7BF},
+{0xA7C0,0xA7C1},
 {0xA7C2,0xA7C3},
 {0xA7C4,0xA794},
 {0xA7C5,0x0282},
 {0xA7C6,0x1D8E},
+{0xA7C7,0xA7C8},
+{0xA7C9,0xA7CA},
+{0xA7D0,0xA7D1},
+{0xA7D6,0xA7D7},
+{0xA7D8,0xA7D9},
+{0xA7F5,0xA7F6},
 {0xAB70,0x13A0},
 {0xAB71,0x13A1},
 {0xAB72,0x13A2},

data/lib/character_set/expression_converter.rb CHANGED Viewed

@@ -4,7 +4,7 @@ class CharacterSet
     Error = Class.new(ArgumentError)
-    def convert(expression)
+    def convert(expression, to = CharacterSet)
       CharacterSet.require_optional_dependency('regexp_parser', __method__)
       case expression
@@ -12,49 +12,49 @@ class CharacterSet
         if expression.count != 1
           raise Error, 'Pass a Regexp with exactly one expression, e.g. /[a-z]/'
         end
-        convert(expression[0])
+        convert(expression[0], to)
       when Regexp::Expression::CharacterSet
-        content = expression.map { |subexp| convert(subexp) }.reduce(:+)
-        content ||= CharacterSet[]
+        content = expression.map { |subexp| convert(subexp, to) }.reduce(:+)
+        content ||= to[]
         expression.negative? ? content.inversion : content
       when Regexp::Expression::CharacterSet::Intersection
-        expression.map { |subexp| convert(subexp) }.reduce(:&)
+        expression.map { |subexp| convert(subexp, to) }.reduce(:&)
       when Regexp::Expression::CharacterSet::IntersectedSequence
-        expression.map { |subexp| convert(subexp) }.reduce(:+) || CharacterSet[]
+        expression.map { |subexp| convert(subexp, to) }.reduce(:+) || to[]
       when Regexp::Expression::CharacterSet::Range
-        start, finish = expression.map { |subexp| convert(subexp) }
-        CharacterSet.new((start.min)..(finish.max))
+        start, finish = expression.map { |subexp| convert(subexp, to) }
+        to.new((start.min)..(finish.max))
       when Regexp::Expression::CharacterType::Any
-        CharacterSet.unicode
+        to.unicode
       when Regexp::Expression::CharacterType::Base
         /(?<negative>non)?(?<base_name>.+)/ =~ expression.token
         content =
           if expression.unicode_classes?
             # in u-mode, type shortcuts match the same as \p{<long type name>}
-            CharacterSet.of_property(base_name)
+            to.of_property(base_name)
           else
             # in normal mode, types match only ascii chars
             case base_name.to_sym
-            when :digit then CharacterSet.from_ranges(48..57)
-            when :hex   then CharacterSet.from_ranges(48..57, 65..70, 97..102)
-            when :space then CharacterSet.from_ranges(9..13, 32..32)
-            when :word  then CharacterSet.from_ranges(48..57, 65..90, 95..95, 97..122)
+            when :digit then to.from_ranges(48..57)
+            when :hex   then to.from_ranges(48..57, 65..70, 97..102)
+            when :space then to.from_ranges(9..13, 32..32)
+            when :word  then to.from_ranges(48..57, 65..90, 95..95, 97..122)
             else raise Error, "Unsupported CharacterType #{base_name}"
             end
           end
         negative ? content.inversion : content
       when Regexp::Expression::EscapeSequence::CodepointList
-        CharacterSet.new(expression.codepoints)
+        to.new(expression.codepoints)
       when Regexp::Expression::EscapeSequence::Base
-        CharacterSet[expression.codepoint]
+        to[expression.codepoint]
       when Regexp::Expression::Group::Capture,
            Regexp::Expression::Group::Passive,
@@ -62,19 +62,19 @@ class CharacterSet
            Regexp::Expression::Group::Atomic,
            Regexp::Expression::Group::Options
         case expression.count
-        when 0 then CharacterSet[]
-        when 1 then convert(expression.first)
+        when 0 then to[]
+        when 1 then convert(expression.first, to)
         else
           raise Error, 'Groups must contain exactly one expression, e.g. ([a-z])'
         end
       when Regexp::Expression::Alternation # rubocop:disable Lint/DuplicateBranch
-        expression.map { |subexp| convert(subexp) }.reduce(:+)
+        expression.map { |subexp| convert(subexp, to) }.reduce(:+)
       when Regexp::Expression::Alternative
         case expression.count
-        when 0 then CharacterSet[]
-        when 1 then convert(expression.first)
+        when 0 then to[]
+        when 1 then convert(expression.first, to)
         else
           raise Error, 'Alternatives must contain exactly one expression'
         end
@@ -83,11 +83,11 @@ class CharacterSet
         if expression.set_level == 0 && expression.text.size != 1
           raise Error, 'Literal runs outside of sets are codepoint *sequences*'
         end
-        CharacterSet[expression.text.ord]
+        to[expression.text.ord]
       when Regexp::Expression::UnicodeProperty::Base,
            Regexp::Expression::PosixClass
-        content = CharacterSet.of_property(expression.token)
+        content = to.of_property(expression.token)
         if expression.type == :posixclass && expression.ascii_classes?
           content = content.ascii_part
         end

data/lib/character_set/predefined_sets/assigned.cps CHANGED Viewed

@@ -21,7 +21,7 @@
 85E,85E
 860,86A
 8A0,8B4
-8B6,8BD
+8B6,8C7
 8D3,983
 985,98C
 98F,990
@@ -76,7 +76,7 @@ B35,B39
 B3C,B44
 B47,B48
 B4B,B4D
-B56,B57
+B55,B57
 B5C,B5D
 B5F,B63
 B66,B77
@@ -120,15 +120,14 @@ CDE,CDE
 CE0,CE3
 CE6,CEF
 CF1,CF2
-D00,D03
-D05,D0C
+D00,D0C
 D0E,D10
 D12,D44
 D46,D48
 D4A,D4F
 D54,D63
 D66,D7F
-D82,D83
+D81,D83
 D85,D96
 D9A,DB1
 DB3,DBB
@@ -214,7 +213,7 @@ FCE,FDA
 1A7F,1A89
 1A90,1A99
 1AA0,1AAD
-1AB0,1ABE
+1AB0,1AC0
 1B00,1B4B
 1B50,1B7C
 1B80,1BF3
@@ -252,7 +251,7 @@ FCE,FDA
 2440,244A
 2460,2B73
 2B76,2B95
-2B98,2C2E
+2B97,2C2E
 2C30,2C5E
 2C60,2CF3
 2CF9,2D25
@@ -269,7 +268,7 @@ FCE,FDA
 2DC8,2DCE
 2DD0,2DD6
 2DD8,2DDE
-2DE0,2E4F
+2DE0,2E52
 2E80,2E99
 2E9B,2EF3
 2F00,2FD5
@@ -279,18 +278,16 @@ FCE,FDA
 3099,30FF
 3105,312F
 3131,318E
-3190,31BA
-31C0,31E3
+3190,31E3
 31F0,321E
-3220,4DB5
-4DC0,9FEF
+3220,9FFC
 A000,A48C
 A490,A4C6
 A4D0,A62B
 A640,A6F7
 A700,A7BF
-A7C2,A7C6
-A7F7,A82B
+A7C2,A7CA
+A7F5,A82C
 A830,A839
 A840,A877
 A880,A8C5
@@ -310,7 +307,7 @@ AB09,AB0E
 AB11,AB16
 AB20,AB26
 AB28,AB2E
-AB30,AB67
+AB30,AB6B
 AB70,ABED
 ABF0,ABF9
 AC00,D7A3
@@ -355,7 +352,7 @@ FFF9,FFFD
 10100,10102
 10107,10133
 10137,1018E
-10190,1019B
+10190,1019C
 101A0,101A0
 101D0,101FD
 10280,1029C
@@ -415,8 +412,12 @@ FFF9,FFFD
 10CFA,10D27
 10D30,10D39
 10E60,10E7E
+10E80,10EA9
+10EAB,10EAD
+10EB0,10EB1
 10F00,10F27
 10F30,10F59
+10FB0,10FCB
 10FE0,10FF6
 11000,1104D
 11052,1106F
@@ -425,10 +426,9 @@ FFF9,FFFD
 110D0,110E8
 110F0,110F9
 11100,11134
-11136,11146
+11136,11147
 11150,11176
-11180,111CD
-111D0,111DF
+11180,111DF
 111E1,111F4
 11200,11211
 11213,1123E
@@ -454,9 +454,8 @@ FFF9,FFFD
 1135D,11363
 11366,1136C
 11370,11374
-11400,11459
-1145B,1145B
-1145D,1145F
+11400,1145B
+1145D,11461
 11480,114C7
 114D0,114D9
 11580,115B5
@@ -471,7 +470,14 @@ FFF9,FFFD
 11730,1173F
 11800,1183B
 118A0,118F2
-118FF,118FF
+118FF,11906
+11909,11909
+1190C,11913
+11915,11916
+11918,11935
+11937,11938
+1193B,11946
+11950,11959
 119A0,119A7
 119AA,119D7
 119DA,119E4
@@ -499,6 +505,7 @@ FFF9,FFFD
 11D93,11D98
 11DA0,11DA9
 11EE0,11EF8
+11FB0,11FB0
 11FC0,11FF1
 11FFF,12399
 12400,1246E
@@ -522,9 +529,11 @@ FFF9,FFFD
 16F00,16F4A
 16F4F,16F87
 16F8F,16F9F
-16FE0,16FE3
+16FE0,16FE4
+16FF0,16FF1
 17000,187F7
-18800,18AF2
+18800,18CD5
+18D00,18D08
 1B000,1B11E
 1B150,1B152
 1B164,1B167
@@ -622,17 +631,15 @@ FFF9,FFFD
 1F0B1,1F0BF
 1F0C1,1F0CF
 1F0D1,1F0F5
-1F100,1F10C
-1F110,1F16C
-1F170,1F1AC
+1F100,1F1AD
 1F1E6,1F202
 1F210,1F23B
 1F240,1F248
 1F250,1F251
 1F260,1F265
-1F300,1F6D5
+1F300,1F6D7
 1F6E0,1F6EC
-1F6F0,1F6FA
+1F6F0,1F6FC
 1F700,1F773
 1F780,1F7D8
 1F7E0,1F7EB
@@ -641,24 +648,28 @@ FFF9,FFFD
 1F850,1F859
 1F860,1F887
 1F890,1F8AD
-1F900,1F90B
-1F90D,1F971
-1F973,1F976
-1F97A,1F9A2
-1F9A5,1F9AA
-1F9AE,1F9CA
+1F8B0,1F8B1
+1F900,1F978
+1F97A,1F9CB
 1F9CD,1FA53
 1FA60,1FA6D
-1FA70,1FA73
+1FA70,1FA74
 1FA78,1FA7A
-1FA80,1FA82
-1FA90,1FA95
-20000,2A6D6
+1FA80,1FA86
+1FA90,1FAA8
+1FAB0,1FAB6
+1FAC0,1FAC2
+1FAD0,1FAD6
+1FB00,1FB92
+1FB94,1FBCA
+1FBF0,1FBF9
+20000,2A6DD
 2A700,2B734
 2B740,2B81D
 2B820,2CEA1
 2CEB0,2EBE0
 2F800,2FA1D
+30000,3134A
 E0001,E0001
 E0020,E007F
 E0100,E01EF

data/lib/character_set/predefined_sets/emoji.cps CHANGED Viewed

@@ -44,6 +44,7 @@ AE,AE
 2699,2699
 269B,269C
 26A0,26A1
+26A7,26A7
 26AA,26AB
 26B0,26B1
 26BD,26BE
@@ -130,22 +131,22 @@ AE,AE
 1F5FA,1F64F
 1F680,1F6C5
 1F6CB,1F6D2
-1F6D5,1F6D5
+1F6D5,1F6D7
 1F6E0,1F6E5
 1F6E9,1F6E9
 1F6EB,1F6EC
 1F6F0,1F6F0
-1F6F3,1F6FA
+1F6F3,1F6FC
 1F7E0,1F7EB
-1F90D,1F93A
+1F90C,1F93A
 1F93C,1F945
-1F947,1F971
-1F973,1F976
-1F97A,1F9A2
-1F9A5,1F9AA
-1F9AE,1F9CA
+1F947,1F978
+1F97A,1F9CB
 1F9CD,1F9FF
-1FA70,1FA73
+1FA70,1FA74
 1FA78,1FA7A
-1FA80,1FA82
-1FA90,1FA95
+1FA80,1FA86
+1FA90,1FAA8
+1FAB0,1FAB6
+1FAC0,1FAC2
+1FAD0,1FAD6

data/lib/character_set/ruby_fallback/character_set_methods.rb CHANGED Viewed

@@ -6,9 +6,13 @@ class CharacterSet
           new(Array(ranges).flat_map(&:to_a))
         end
-        def of(string)
-          raise ArgumentError, 'pass a String' unless string.is_a?(String)
-          new(string.codepoints)
+        def of(*strings)
+          new_set = new
+          strings.each do |str|
+            raise ArgumentError, 'pass a String' unless str.respond_to?(:codepoints)
+            str.codepoints.each { |cp| new_set << cp }
+          end
+          new_set
         end
       end

data/lib/character_set/set_method_adapters.rb CHANGED Viewed

@@ -22,13 +22,14 @@ class CharacterSet
     # Allow some methods to take an Enum just as well as another CharacterSet.
     # Tested by ruby-spec.
-    %w[& + - ^ | difference intersection subtract union].each do |method|
+    %w[& + - ^ | difference disjoint? intersect? intersection
+       subtract union].each do |method|
       class_eval <<-RUBY, __FILE__, __LINE__ + 1
         def #{method}(arg)
           if arg.is_a?(CharacterSet)
-            super
+            super(arg)
           elsif arg.respond_to?(:each)
-            super(CharacterSet.new(arg.to_a))
+            super(self.class.new(arg.to_a))
           else
             raise ArgumentError, 'pass an enumerable'
           end

data/lib/character_set/shared_methods.rb CHANGED Viewed

@@ -36,7 +36,7 @@ class CharacterSet
           end
           def of_expression(expression)
-            ExpressionConverter.convert(expression)
+            ExpressionConverter.convert(expression, self)
           end
           def require_optional_dependency(name, method)
@@ -90,6 +90,14 @@ class CharacterSet
           Writer.write_surrogate_alternation(bmp_part.ranges, astral_part.ranges)
         end
+        def secure_token(length = 32)
+          CharacterSet.require_optional_dependency('securerandom', __method__)
+          cps = to_a
+          len = cps.count
+          1.upto(length).map { cps[SecureRandom.random_number(len)] }.pack('U*')
+        end
+        alias random_token secure_token
         def inspect
           len = length
           "#<#{klass.name}: {\#{first(5) * ', '}\#{'...' if len > 5}} (size: \#{len})>"

data/lib/character_set/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 class CharacterSet
-  VERSION = '1.4.1'
+  VERSION = '1.5.0'
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: character_set
 version: !ruby/object:Gem::Version
-  version: 1.4.1
+  version: 1.5.0
 platform: java
 authors:
 - Janosch Müller
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2021-01-11 00:00:00.000000000 Z
+date: 2021-12-05 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: sorted_set
@@ -100,14 +100,14 @@ dependencies:
     requirements:
     - - "~>"
       - !ruby/object:Gem::Version
-        version: '1.6'
+        version: '2.1'
   type: :development
   prerelease: false
   version_requirements: !ruby/object:Gem::Requirement
     requirements:
     - - "~>"
       - !ruby/object:Gem::Version
-        version: '1.6'
+        version: '2.1'
 - !ruby/object:Gem::Dependency
   name: regexp_property_values
   requirement: !ruby/object:Gem::Requirement
@@ -150,6 +150,20 @@ dependencies:
     - - "~>"
       - !ruby/object:Gem::Version
         version: 0.2.12
+- !ruby/object:Gem::Dependency
+  name: gouteur
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 1.0.0
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 1.0.0
 - !ruby/object:Gem::Dependency
   name: rubocop
   requirement: !ruby/object:Gem::Requirement
@@ -186,9 +200,11 @@ extensions: []
 extra_rdoc_files: []
 files:
 - ".gitattributes"
+- ".github/workflows/gouteur.yml"
 - ".github/workflows/lint.yml"
 - ".github/workflows/tests.yml"
 - ".gitignore"
+- ".gouteur.yml"
 - ".rspec"
 - ".rubocop.yml"
 - BENCHMARK.md
@@ -266,7 +282,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
     - !ruby/object:Gem::Version
       version: '0'
 requirements: []
-rubygems_version: 3.2.3
+rubygems_version: 3.3.0.dev
 signing_key:
 specification_version: 4
 summary: Build, read, write and compare sets of Unicode codepoints.