RubyGems - u - Versions diffs - 0.5.0 - Mend

u 0.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (59) hide show

data/README +38 -0
data/Rakefile +64 -0
data/ext/encoding/character/utf-8/break.c +25 -0
data/ext/encoding/character/utf-8/data/break.h +22931 -0
data/ext/encoding/character/utf-8/data/character-tables.h +14358 -0
data/ext/encoding/character/utf-8/data/compose.h +1607 -0
data/ext/encoding/character/utf-8/data/decompose.h +10926 -0
data/ext/encoding/character/utf-8/data/generate-unicode-data.rb +1070 -0
data/ext/encoding/character/utf-8/decompose.c +444 -0
data/ext/encoding/character/utf-8/depend +65 -0
data/ext/encoding/character/utf-8/extconf.rb +67 -0
data/ext/encoding/character/utf-8/private.c +62 -0
data/ext/encoding/character/utf-8/private.h +51 -0
data/ext/encoding/character/utf-8/properties.c +1056 -0
data/ext/encoding/character/utf-8/rb_includes.h +19 -0
data/ext/encoding/character/utf-8/rb_methods.h +49 -0
data/ext/encoding/character/utf-8/rb_private.h +52 -0
data/ext/encoding/character/utf-8/rb_utf_aref.c +111 -0
data/ext/encoding/character/utf-8/rb_utf_aset.c +105 -0
data/ext/encoding/character/utf-8/rb_utf_casecmp.c +24 -0
data/ext/encoding/character/utf-8/rb_utf_chomp.c +114 -0
data/ext/encoding/character/utf-8/rb_utf_chop.c +44 -0
data/ext/encoding/character/utf-8/rb_utf_collate.c +13 -0
data/ext/encoding/character/utf-8/rb_utf_count.c +30 -0
data/ext/encoding/character/utf-8/rb_utf_delete.c +60 -0
data/ext/encoding/character/utf-8/rb_utf_downcase.c +13 -0
data/ext/encoding/character/utf-8/rb_utf_each_char.c +27 -0
data/ext/encoding/character/utf-8/rb_utf_foldcase.c +13 -0
data/ext/encoding/character/utf-8/rb_utf_hex.c +14 -0
data/ext/encoding/character/utf-8/rb_utf_index.c +50 -0
data/ext/encoding/character/utf-8/rb_utf_insert.c +48 -0
data/ext/encoding/character/utf-8/rb_utf_internal_bignum.c +332 -0
data/ext/encoding/character/utf-8/rb_utf_internal_bignum.h +12 -0
data/ext/encoding/character/utf-8/rb_utf_internal_tr.c +142 -0
data/ext/encoding/character/utf-8/rb_utf_internal_tr.h +41 -0
data/ext/encoding/character/utf-8/rb_utf_justify.c +96 -0
data/ext/encoding/character/utf-8/rb_utf_length.c +14 -0
data/ext/encoding/character/utf-8/rb_utf_lstrip.c +41 -0
data/ext/encoding/character/utf-8/rb_utf_normalize.c +51 -0
data/ext/encoding/character/utf-8/rb_utf_oct.c +14 -0
data/ext/encoding/character/utf-8/rb_utf_reverse.c +13 -0
data/ext/encoding/character/utf-8/rb_utf_rindex.c +88 -0
data/ext/encoding/character/utf-8/rb_utf_rstrip.c +51 -0
data/ext/encoding/character/utf-8/rb_utf_squeeze.c +70 -0
data/ext/encoding/character/utf-8/rb_utf_strip.c +27 -0
data/ext/encoding/character/utf-8/rb_utf_to_i.c +25 -0
data/ext/encoding/character/utf-8/rb_utf_tr.c +250 -0
data/ext/encoding/character/utf-8/rb_utf_upcase.c +13 -0
data/ext/encoding/character/utf-8/tables.h +38 -0
data/ext/encoding/character/utf-8/unicode.c +319 -0
data/ext/encoding/character/utf-8/unicode.h +216 -0
data/ext/encoding/character/utf-8/utf.c +1334 -0
data/lib/encoding/character/utf-8.rb +201 -0
data/lib/u.rb +16 -0
data/lib/u/string.rb +185 -0
data/lib/u/version.rb +5 -0
data/test/unit/u.rb +5 -0
data/test/unit/u/string.rb +91 -0
metadata +174 -0

data/lib/encoding/character/utf-8.rb ADDED Viewed

@@ -0,0 +1,201 @@
+# contents: UTF-8 String methods.
+#
+# Copyright © 2006 Nikolai Weibull <now@bitwi.se>
+require 'encoding/character/utf-8/utf8'
+# TODO: Rework this to use a dispatch object instead, so that the encoding can
+# be changed on the fly.
+# TODO: Add String#encoding.
+module U::String
+  def self.def_thunk_replacing_variant(method)
+    define_method(:"#{method}!") do
+      replace(send(method))
+    end
+  end
+  def <=>(other)
+    Encoding::Character::UTF8.collate(self, other)
+  end
+  def [](*args)
+    Encoding::Character::UTF8.aref(self, *args)
+  end
+  def slice(*args)
+    Encoding::Character::UTF8.aref(self, *args)
+  end
+  def []=(*args)
+    Encoding::Character::UTF8.aset(self, *args)
+  end
+  def casecmp(other)
+    Encoding::Character::UTF8.casecmp(self, other)
+  end
+  def center(*args)
+    Encoding::Character::UTF8.center(self, *args)
+  end
+  def chomp(*args)
+    Encoding::Character::UTF8.chomp(self, *args)
+  end
+  def chomp!(*args)
+    Encoding::Character::UTF8.chomp!(self, *args)
+  end
+  def chop
+    Encoding::Character::UTF8.chop(self)
+  end
+  def chop!
+    Encoding::Character::UTF8.chop!(self)
+  end
+  def count(*args)
+    Encoding::Character::UTF8.count(self, *args)
+  end
+  def delete(*args)
+    Encoding::Character::UTF8.delete(self, *args)
+  end
+  def delete!(*args)
+    Encoding::Character::UTF8.delete!(self, *args)
+  end
+  def downcase
+    Encoding::Character::UTF8.downcase(self)
+  end
+  def_thunk_replacing_variant :downcase
+  def each_char(&block)
+    Encoding::Character::UTF8.each_char(self, &block)
+  end
+  def index(*args)
+    Encoding::Character::UTF8.index(self, *args)
+  end
+  def insert(index, other)
+    Encoding::Character::UTF8.insert(self, index, other)
+  end
+  def length
+    Encoding::Character::UTF8.length(self)
+  end
+  def lstrip
+    Encoding::Character::UTF8.lstrip(self)
+  end
+  def lstrip!
+    Encoding::Character::UTF8.lstrip!(self)
+  end
+  def normalize(*args)
+    Encoding::Character::UTF8.normalize(self, *args)
+  end
+  def rindex(*args)
+    Encoding::Character::UTF8.rindex(self, *args)
+  end
+  def rstrip
+    Encoding::Character::UTF8.rstrip(self)
+  end
+  def rstrip!
+    Encoding::Character::UTF8.rstrip!(self)
+  end
+  def reverse
+    Encoding::Character::UTF8.reverse(self)
+  end
+  def_thunk_replacing_variant :reverse
+  def squeeze
+    Encoding::Character::UTF8.squeeze(self)
+  end
+  def squeeze!
+    Encoding::Character::UTF8.squeeze!(self)
+  end
+  def strip
+    Encoding::Character::UTF8.strip(self)
+  end
+  def strip!
+    Encoding::Character::UTF8.strip!(self)
+  end
+  def to_i(*args)
+    Encoding::Character::UTF8.to_i(self, *args)
+  end
+  def tr(from, to)
+    Encoding::Character::UTF8.tr(self, from, to)
+  end
+  def tr!(from, to)
+    replace(tr(from, to))
+  end
+  def tr_s(from, to)
+    Encoding::Character::UTF8.tr_s(self, from, to)
+  end
+  def tr_s!(from, to)
+    replace(tr_s(from, to))
+  end
+  def inspect
+    "u#{_inspect}"
+  end
+  def ljust(*args)
+    Encoding::Character::UTF8.ljust(self, *args)
+  end
+  def rjust(*args)
+    Encoding::Character::UTF8.rjust(self, *args)
+  end
+  def upcase
+    Encoding::Character::UTF8.upcase(self)
+  end
+  def_thunk_replacing_variant :upcase
+  def capitalize
+    self[0].upcase + self[1..-1].downcase
+  end
+  def_thunk_replacing_variant :capitalize
+  def foldcase
+    Encoding::Character::UTF8.foldcase(self)
+  end
+  def_thunk_replacing_variant :foldcase
+private
+  Inspect = String.instance_method(:inspect)
+  def _inspect
+    Inspect.bind(self).call
+  end
+end
+class String
+  def +@
+    self.extend(Encoding::Character::UTF8::Methods)
+  end
+end
+module Kernel
+  def u(str)
+    str.extend(Encoding::Character::UTF8::Methods)
+  end
+end

data/lib/u.rb ADDED Viewed

@@ -0,0 +1,16 @@
+# -*- coding: utf-8 -*-
+module U
+  require 'u/string'
+  require 'u/version'
+end
+class String
+  def u
+    dup.u!
+  end
+  def u!
+    self.extend(U::String)
+  end
+end

data/lib/u/string.rb ADDED Viewed

@@ -0,0 +1,185 @@
+# -*- coding: utf-8 -*-
+require 'encoding/character/utf-8/utf8'
+module U::String
+  def <=>(other)
+    Encoding::Character::UTF8.collate(self, other)
+  end
+  def [](*args)
+    Encoding::Character::UTF8.aref(self, *args)
+  end
+  def slice(*args)
+    Encoding::Character::UTF8.aref(self, *args)
+  end
+  def []=(*args)
+    Encoding::Character::UTF8.aset(self, *args)
+  end
+  def casecmp(other)
+    Encoding::Character::UTF8.casecmp(self, other)
+  end
+  def center(*args)
+    Encoding::Character::UTF8.center(self, *args)
+  end
+  def chomp(*args)
+    Encoding::Character::UTF8.chomp(self, *args)
+  end
+  def chomp!(*args)
+    Encoding::Character::UTF8.chomp!(self, *args)
+  end
+  def chop
+    Encoding::Character::UTF8.chop(self)
+  end
+  def chop!
+    Encoding::Character::UTF8.chop!(self)
+  end
+  def count(*args)
+    Encoding::Character::UTF8.count(self, *args)
+  end
+  def delete(*args)
+    Encoding::Character::UTF8.delete(self, *args)
+  end
+  def delete!(*args)
+    Encoding::Character::UTF8.delete!(self, *args)
+  end
+  def downcase
+    Encoding::Character::UTF8.downcase(self)
+  end
+  def downcase!
+    replace(downcase)
+  end
+  def each_char(&block)
+    Encoding::Character::UTF8.each_char(self, &block)
+  end
+  def index(*args)
+    Encoding::Character::UTF8.index(self, *args)
+  end
+  def insert(index, other)
+    Encoding::Character::UTF8.insert(self, index, other)
+  end
+  def length
+    Encoding::Character::UTF8.length(self)
+  end
+  def lstrip
+    Encoding::Character::UTF8.lstrip(self)
+  end
+  def lstrip!
+    Encoding::Character::UTF8.lstrip!(self)
+  end
+  def normalize(*args)
+    Encoding::Character::UTF8.normalize(self, *args)
+  end
+  def rindex(*args)
+    Encoding::Character::UTF8.rindex(self, *args)
+  end
+  def rstrip
+    Encoding::Character::UTF8.rstrip(self)
+  end
+  def rstrip!
+    Encoding::Character::UTF8.rstrip!(self)
+  end
+  def reverse
+    Encoding::Character::UTF8.reverse(self)
+  end
+  def reverse!
+    replace(reverse)
+  end
+  def squeeze
+    Encoding::Character::UTF8.squeeze(self)
+  end
+  def squeeze!
+    Encoding::Character::UTF8.squeeze!(self)
+  end
+  def strip
+    Encoding::Character::UTF8.strip(self)
+  end
+  def strip!
+    Encoding::Character::UTF8.strip!(self)
+  end
+  def to_i(*args)
+    Encoding::Character::UTF8.to_i(self, *args)
+  end
+  def tr(from, to)
+    Encoding::Character::UTF8.tr(self, from, to)
+  end
+  def tr!(from, to)
+    replace(tr(from, to))
+  end
+  def tr_s(from, to)
+    Encoding::Character::UTF8.tr_s(self, from, to)
+  end
+  def tr_s!(from, to)
+    replace(tr_s(from, to))
+  end
+  def inspect
+    'u%s' % super
+  end
+  def ljust(*args)
+    Encoding::Character::UTF8.ljust(self, *args)
+  end
+  def rjust(*args)
+    Encoding::Character::UTF8.rjust(self, *args)
+  end
+  def upcase
+    Encoding::Character::UTF8.upcase(self)
+  end
+  def upcase!
+    replace(upcase)
+  end
+  def capitalize
+    self[0].upcase + self[1..-1].downcase
+  end
+  def capitalize!
+    replace(capitalize)
+  end
+  def foldcase
+    Encoding::Character::UTF8.foldcase(self)
+  end
+  def foldcase!
+    replace(foldcase)
+  end
+end

data/lib/u/version.rb ADDED Viewed

@@ -0,0 +1,5 @@
+# -*- coding: utf-8 -*-
+module U
+  Version = '0.5.0'
+end

data/test/unit/u.rb ADDED Viewed

@@ -0,0 +1,5 @@
+# -*- coding: utf-8 -*-
+Expectations do
+end

data/test/unit/u/string.rb ADDED Viewed

@@ -0,0 +1,91 @@
+# -*- coding: utf-8 -*-
+Expectations do
+  expect ''.u[0, -2].to.be.nil?
+  expect ''.u[0, -1].to.be.nil?
+  expect '' do ''.u[0, 0] end
+  expect '' do ''.u[0, 1] end
+  expect '' do ''.u[0, 2] end
+  expect ''.u[-1, -2].to.be.nil?
+  expect ''.u[-1, -1].to.be.nil?
+  expect ''.u[-1, 0].to.be.nil?
+  expect ''.u[-1, 1].to.be.nil?
+  expect ''.u[-1, 2].to.be.nil?
+  expect ''.u[1, -2].to.be.nil?
+  expect ''.u[1, -1].to.be.nil?
+  expect ''.u[1, 0].to.be.nil?
+  expect ''.u[1, 1].to.be.nil?
+  expect ''.u[1, 2].to.be.nil?
+  expect 'hë' do 'hëllö'.u[0, 2] end
+  expect 'lö' do 'hëllö'.u[3, 2] end
+  expect 0 do ''.u.count('whatever') end
+  expect 1 do 'helo'.u.count('l') end
+  expect 1 do 'helo'.u.count('wrld') end
+  expect 2 do 'helo'.u.count('world') end
+  expect 3 do 'hello'.u.count('world') end
+  expect ''.u.delete('whatever').to.be.empty?
+  expect 'hëll' do 'hëllö'.u.delete('ö') end
+  expect 0 do
+    i = 0
+    ''.u.each_char{ i += 1 }
+    i
+  end
+  expect %w[h ë l l ö] do
+    [].tap{ |cs| 'hëllö'.u.each_char{ |c| cs << c } }
+  end
+  expect 0 do ''.u.index('') end
+  expect nil do ''.u.index('', 1) end
+  expect nil do ''.u.index('', -1) end
+  expect 0 do 'hëllö'.u.index('hë') end
+  expect 3 do 'hëllö'.u.index('lö') end
+  expect 3 do 'hëllö'.u.index('lö', 3) end
+  expect '' do ''.u.insert(0, '') end
+  expect IndexError do ''.u.insert(1, '') end
+  expect 'äbc' do ''.u.insert(0, 'äbc') end
+  expect 'hëöll' do 'hëö'.u.insert(3, 'll') end
+  expect 'hëöll' do 'hëö'.u.insert(-1, 'll') end
+  expect 'hëllö' do 'hëö'.u.insert(2, 'll') end
+  expect 'hëllö' do 'hëö'.u.insert(-2, 'll') end
+  expect 'llhëö' do 'hëö'.u.insert(0, 'll') end
+  #expect 'llhëö' do 'hëö'.u.insert(-4, 'll') end
+  expect 0 do ''.u.length end
+  expect 5 do 'hëllö'.u.length end
+  expect 11 do "hëllö\0agäin".u.length end
+  # TODO: Why not throw an error here?
+  expect 11 do "hëllö\0agäin\303".u.length end
+  expect 0 do ''.u.rindex('') end
+  expect 0 do 'hëllö'.u.rindex('hë') end
+  expect 3 do 'hëllö'.u.rindex('lö') end
+  expect 3 do 'hëllö'.u.rindex('lö', 3) end
+  expect 5 do 'hëllölö'.u.rindex('lö') end
+  expect 5 do 'hëllölö'.u.rindex('lö', 5) end
+  expect 3 do 'hëllölö'.u.rindex('lö', 4) end
+  expect ''.u.squeeze.to.be.empty?
+  expect 'hëlö' do 'hëllö'.u.squeeze end
+  expect 0 do ''.u.to_i end
+  expect 0 do ''.u.to_i(0) end
+  expect ArgumentError do ''.u.to_i(-1) end
+  expect ArgumentError do ''.u.to_i(1) end
+  expect ArgumentError do ''.u.to_i(37) end
+  expect 1 do '1'.u.to_i end
+  expect 1 do '1'.u.to_i(2) end
+  expect 1 do '١'.u.to_i end
+  expect ''.u.tr('abc', 'def').to.be.empty?
+  expect 'abcde' do 'äbcdë'.u.tr('äë', 'ae') end
+  expect 'ëëëëë' do 'äbcdë'.u.tr('a-zäë', 'ë') end
+  expect 'ëëëëë' do 'aaaaa'.u.tr('a', 'ä-ë') end
+end