RubyGems - igo-ruby - Versions diffs - 0.1.0 → 0.1.1 - Mend

igo-ruby 0.1.0 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

data/Rakefile CHANGED

@@ -16,7 +16,11 @@ Jeweler::Tasks.new do |gem|
   gem.homepage = "http://github.com/kyow/igo-ruby"
   gem.license = "MIT"
   gem.summary = %Q{Ruby port of Igo Japanese morphological analyzer.}
-  gem.description = %Q{Ruby port of Igo Japanese morphological analyzer.}
+  gem.description = %Q{
+    Ruby port of Igo Japanese morphological analyzer. Igo-ruby needs Igo's binary dictionary files.
+    These files created by Java programs.
+    See: http://igo.sourceforge.jp/
+  }
   gem.email = "24signals@gmail.com"
   gem.authors = ["K.Nishi"]
   # Include your dependencies below. Runtime dependencies are required when using your gem,
@@ -26,6 +30,7 @@ Jeweler::Tasks.new do |gem|
   gem.files = Rake::FileList.new('lib/**/*.rb', '[A-Z]*')
   gem.required_rubygems_version = ">1.3.6"
+  gem.rdoc_options << '-c UTF-8' << '-S' << '-U'
 end
 Jeweler::RubygemsDotOrgTasks.new
@@ -50,4 +55,6 @@ Rake::RDocTask.new do |rdoc|
   rdoc.title = "igo-ruby #{version}"
   rdoc.rdoc_files.include('README*')
   rdoc.rdoc_files.include('lib/**/*.rb')
+  rdoc.options << '-c UTF-8' << '-S' << '-U'
 end

data/VERSION CHANGED

	@@ -1 +1 @@
1	- 0.1.0
1	+ 0.1.1

data/lib/igo-ruby.rb CHANGED

@@ -1,9 +1,39 @@
+#
+#= 形態素解析エンジンIgoのRuby実装
+#解析結果がほぼMeCab互換の形態素解析エンジン"Igo"のRuby実装
+#
+#Copyright:: Copyright (C) K.Nishi, 2010. All rights reserved.
+#Authors:: K.Nishi
+#License:: MIT License ただし、使用する辞書のライセンスに関しては、辞書配布元のそれに準ずる
+#
+#== 注意
+#igo-rubyには辞書ファイルを生成する機能はありません。
+#Igoで生成した辞書ファイルを使用してください。
+#
+#== 公開
+#* RubyGems
+#  * igo-ruby[https://rubygems.org/gems/igo-ruby]
+#* ソース(github)
+#  * {kyow/igo-ruby}[https://github.com/kyow/igo-ruby]
+#
+#== 参照
+#* Igo
+#  1. {Igo - Java形態素解析器}[http://igo.sourceforge.jp/index.html]
+#  2. {Igo}[http://sourceforge.jp/projects/igo/releases/]
+#* Igo-python
+#  1. {igo-python 0.3a}[http://pypi.python.org/pypi/igo-python/0.3a]
+#  2. {Igo Japanease morphological analyzer for python}[https://launchpad.net/igo-python/]
+#
 $:.unshift(File.dirname(__FILE__))
 require 'nkf'
 require 'jcode'
 require 'kconv'
+#
+#== Igoモジュール
+#
 module Igo
   autoload :Tagger, 'igo/tagger'
 end

data/lib/igo/dictionary.rb CHANGED

@@ -1,21 +1,19 @@
-#require 'trie'
-#require 'util'
-#require 'nkf'
-# 辞書
+#辞書クラス群
+#
+# Viterbiアルゴリズムで使用されるノードクラス
+#
 class ViterbiNode
   attr_accessor :cost, :prev, :word_id, :start, :length, :left_id, :right_id, :is_space
   def initialize(word_id, start, length, left_id, right_id, is_space)
-    @cost = 0
-    @prev = nil
-    @word_id = word_id
-    @start = start
-    @length = length
-    @left_id = left_id
-    @right_id = right_id
-    @is_space = is_space
-#   puts "==viterbinode #{word_id} #{start} #{length} #{left_id} #{right_id} #{is_space}"
+    @cost = 0            # 始点からノードまでの総コスト
+    @prev = nil          # コスト最小の前方のノードへのリンク
+    @word_id = word_id   # 単語ID
+    @start = start       # 入力テキスト内での形態素の開始位置
+    @length = length     # 形態素の表層形の長さ(文字数)
+    @left_id = left_id   # 左文脈ID
+    @right_id = right_id # 右文脈ID
+    @is_space = is_space # 形態素の文字種(文字カテゴリ)が空白かどうか
   end
   def self.make_BOSEOS
@@ -37,7 +35,6 @@ class CharCategory
   end
   def compatible?(code1, code2)
-#   puts @eql_masks[code1] & @eql_masks[code2]
     return (@eql_masks[code1] & @eql_masks[code2]) != 0
   end
@@ -59,11 +56,15 @@ class Category
     @length = l
     @invoke = iv
     @group = g
-#   puts "==category #{i} #{l} #{iv} #{g}"
   end
 end
+#
+# 形態素の連接コスト表クラス
+#
 class Matrix
+  # コンストラクタ
+  # data_dir:: 辞書ファイルのディレクトリパス
   def initialize(data_dir)
     fmis = FileMappedInputStream.new(data_dir + "/matrix.bin")
     @left_size = fmis.get_int
@@ -72,40 +73,44 @@ class Matrix
     fmis.close
   end
+  # 形態素同士の連接コストを求める
+  # left_id:: 左文脈ID
+  # right_id:: 右文脈ID
   def link_cost(left_id, right_id)
     return @matrix[right_id * @right_size + left_id]
   end
 end
+#
+# 未知語の検索を行うクラス
+#
 class Unknown
+  # コンストラクタ
+  #data_dir:: 辞書ファイルのディレクトリパス
   def initialize(data_dir)
+    # 文字カテゴリ管理クラス
     @category = CharCategory.new(data_dir)
+    # 文字カテゴリが空白の文字のID
     @space_id = @category.category(' '.unpack("U*")[0]).id
   end
+  # 検索
   def search(text, start, wdic, result)
     txt = text.unpack("U*")
     length = txt.size
     ch = txt[start]
     ct = @category.category(ch)
-#   puts "Unknown.search ch=#{ch} length=#{length} start=#{start}"
-#   p ct
-#   p result
-#   p ct.invoke
     if !result.empty? and !ct.invoke
-#     puts "result return"
       return
     end
-#   puts "---i"
     is_space = (ct.id == @space_id)
     limit = [length, ct.length + start].min
-#   puts "limit = #{limit} #{length} #{ct.length}"
     for i in start..(limit - 1)
-#     puts "[a]"
       wdic.search_from_trie_id(ct.id, start, (i - start) + 1, is_space, result)
       if((i + 1) != limit and !(@category.compatible?(ch, text[i + 1])))
@@ -114,23 +119,20 @@ class Unknown
     end
     if ct.group and limit < length
-#     puts "[b]"
       for i in limit..(length - 1)
-#       puts "[c] COMPATIBLE? #{ch} #{txt[i + 1]}"
         if not @category.compatible?(ch, txt[i])
-#         puts "[d] #{i} #{start}"
           wdic.search_from_trie_id(ct.id, start, i - start, is_space, result)
           return
         end
       end
-#     puts "[e] #{length} #{start}"
       wdic.search_from_trie_id(ct.id, start, length - start, is_space, result)
     end
   end
 end
 class WordDic
+  # コンストラクタ
+  #data_dir:: 辞書ファイルのディレクトリパス
   def initialize(data_dir)
     @trie = Searcher.new(data_dir + "/word2id")
     @data = FileMappedInputStream.get_string(data_dir + "/word.dat")
@@ -138,10 +140,10 @@ class WordDic
     fmis = FileMappedInputStream.new(data_dir + "/word.inf")
     word_count = fmis.size / (4 + 2 + 2 + 2)
-    @data_offsets = fmis.get_int_array(word_count)
-    @left_ids     = fmis.get_short_array(word_count)
-    @right_ids    = fmis.get_short_array(word_count)
-    @costs        = fmis.get_short_array(word_count)
+    @data_offsets = fmis.get_int_array(word_count)   # 単語の素性データの開始位置
+    @left_ids     = fmis.get_short_array(word_count) # 単語の左文脈ID
+    @right_ids    = fmis.get_short_array(word_count) # 単語の右文脈ID
+    @costs        = fmis.get_short_array(word_count) # 単語のコスト
     fmis.close
   end
@@ -171,17 +173,7 @@ class WordDic
   end
   def word_data(word_id)
-#  s = UTFConverter.utf16to8(@data)
-#   st = format("%x", @data_offsets[word_id] * 2)
-#   ed = format("%x", @data_offsets[word_id + 1] * 2)
-#   puts "WORD DATA: #{word_id} = #{st} : #{ed}"
-#   p   s
-#   puts "nkf= " + NKF.nkf('-W16L0 --utf8', s)
-#   p [s].pack("U*")
     return @data.slice(@data_offsets[word_id]*2..@data_offsets[word_id + 1]*2 - 1)
-#   return NKF.nkf('-W16L0 --utf8', s)
   end
 end

data/lib/igo/tagger.rb CHANGED

@@ -1,144 +1,133 @@
+#形態素解析と分かち書きを行う機能の実装
 require 'igo/dictionary'
 require 'igo/trie'
 module Igo
-class Morpheme
-  attr_accessor :surface, :feature, :start
-  def initialize(surface, feature, start)
-    @surface = surface
-    @feature = feature
-    @start = start
-  end
+  #
+  #形態素クラス
+  #
+  class Morpheme
+    attr_accessor :surface, :feature, :start
+    #surface:: 形態素の表層形
+    #feature:: 形態素の素性
+    #start:: テキスト内でも形態素の出現開始位置
+    def initialize(surface, feature, start)
+      @surface = surface
+      @feature = feature
+      @start = start
+    end
 end
-# 形態素解析を行う
-class Tagger
-  def self.__BOS_NODES
-    return [ViterbiNode.make_BOSEOS]
-  end
-  def initialize(dir)
-    @wdc = WordDic.new(dir)
-    @unk = Unknown.new(dir)
-    @mtx = Matrix.new(dir)
-  end
-  #
-  def parse(text, result=[])
-    vn = impl(text, result)
-    txt = text.unpack("U*")
-    while vn
-      surface = txt.slice(vn.start, vn.length).pack("U*")
+  #
+  #形態素解析を行うクラス
+  #
+  class Tagger
+    def self.__BOS_NODES
+      return [ViterbiNode.make_BOSEOS]
+    end
+    #dir:: 辞書ファイルのディレクトリパス
+    def initialize(dir)
+      @wdc = WordDic.new(dir)
+      @unk = Unknown.new(dir)
+      @mtx = Matrix.new(dir)
+    end
+    #形態素解析を行う
+    #text:: 解析対象テキスト
+    #result:: 解析結果の形態素が追加される配列
+    #return:: 解析結果の形態素配列
+    def parse(text, result=[])
+      vn = impl(text, result)
+      txt = text.unpack("U*")
+      while vn
+        surface = txt.slice(vn.start, vn.length).pack("U*")
-      s = @wdc.word_data(vn.word_id)
+        s = @wdc.word_data(vn.word_id)
-#     puts s.size
-      feature = NKF.nkf('-W16L0 --utf8', s)
-#     feature = @wdc.word_data(vn.word_id)
-      result.push(Morpheme.new(surface, feature, vn.start))
-      vn = vn.prev
+        feature = NKF.nkf('-W16L0 --utf8', s)
+        result.push(Morpheme.new(surface, feature, vn.start))
+        vn = vn.prev
+      end
+      return result
     end
-    return result
-  end
-  # 分かち書きを行う
-  def wakati(text, result=[])
-    vn = impl(text, result)
-    txt = text.unpack("U*")
+    #分かち書きを行う
+    #text:: 分かち書きされるテキスト
+    #result:: 分かち書き結果の文字列が追加される配列
+    #return:: 分かち書き結果の文字列の配列
+    def wakati(text, result=[])
+      vn = impl(text, result)
+      txt = text.unpack("U*")
-    while vn
-#     puts "s:#{vn.start} len:#{vn.length}"
-      a = txt.slice(vn.start, vn.length).pack("U*")
-      result.push(a)
-      vn = vn.prev
+      while vn
+        a = txt.slice(vn.start, vn.length).pack("U*")
+        result.push(a)
+        vn = vn.prev
+      end
+      return result
     end
-    return result
-  end
-  private
+    private
-  def impl(text, result=[])
-    txs = text.unpack("U*")
-    len = txs.size
-#   puts "len=#{len}"
+    def impl(text, result=[])
+      txs = text.unpack("U*")
+      len = txs.size
-    node_ary = [Tagger.__BOS_NODES]
-    for i in 0..(len-1)
-      node_ary.push([])
-    end
+      node_ary = [Tagger.__BOS_NODES]
+      for i in 0..(len-1)
+        node_ary.push([])
+      end
-    for i in 0..(len-1)
-      per_result = []
+      for i in 0..(len-1)
+        per_result = []
-#     puts "==> node_ary[#{i}].length = #{!node_ary[i].empty?}"
-#     p node_ary
-      unless node_ary[i].empty?
-        @wdc.search(text, i, per_result)
-#       puts "---WDC---"
-#       p per_result
-        @unk.search(text, i, @wdc, per_result)
-#       puts "---UNK---"
-#       p per_result
-        prevs = node_ary[i]
+        unless node_ary[i].empty?
+          @wdc.search(text, i, per_result)
+          @unk.search(text, i, @wdc, per_result)
+          prevs = node_ary[i]
-        for j in 0..(per_result.size - 1)
-          vn = per_result[j]
-#         p vn
-          if(vn.is_space)
-#           puts "#{j} is space (#{i + vn.length}) i=#{i} len=#{vn.length}"
-            node_ary[i + vn.length] = prevs
-#           p node_ary
-#           node_ary[i + vn.length].push(prevs)
-          else
-#           puts "#{j} is NOT space (#{i + vn.length}) i=#{i} len=#{vn.length}"
-            node_ary[i + vn.length].push(set_min_cost_node(vn, prevs))
-#           p node_ary
-#           node_ary[i + vn.length] + set_min_cost_node(vn, prevs)
+          for j in 0..(per_result.size - 1)
+            vn = per_result[j]
+            if(vn.is_space)
+              node_ary[i + vn.length] = prevs
+            else
+              node_ary[i + vn.length].push(set_min_cost_node(vn, prevs))
+            end
           end
-#         p node_ary
         end
       end
-    end
-    cur = set_min_cost_node(ViterbiNode.make_BOSEOS, node_ary[len]).prev
+      cur = set_min_cost_node(ViterbiNode.make_BOSEOS, node_ary[len]).prev
-    # reverse
-    head = nil
-    while cur.prev
-      tmp = cur.prev
-      cur.prev = head
-      head = cur
-      cur = tmp
+      # reverse
+      head = nil
+      while cur.prev
+        tmp = cur.prev
+        cur.prev = head
+        head = cur
+        cur = tmp
+      end
+      return head
     end
-    return head
-#   return cur.reverse
-  end
-  def set_min_cost_node(vn, prevs)
-    f = vn.prev = prevs[0]
-#   puts "=> set_min_cost_node"
-#   p f
-    vn.cost = f.cost + @mtx.link_cost(f.right_id, vn.left_id)
+    def set_min_cost_node(vn, prevs)
+      f = vn.prev = prevs[0]
+      vn.cost = f.cost + @mtx.link_cost(f.right_id, vn.left_id)
-#   puts "#{vn.cost} #{f.cost} #{f.right_id} #{vn.left_id} #{@mtx.link_cost(f.right_id, vn.left_id)} #{}"
-    for i in 1..(prevs.size - 1)
-      p = prevs[i]
-      cost = p.cost + @mtx.link_cost(p.right_id, vn.left_id)
-      if(cost < vn.cost)
-        vn.cost = cost
-        vn.prev = p
+      for i in 1..(prevs.size - 1)
+        p = prevs[i]
+        cost = p.cost + @mtx.link_cost(p.right_id, vn.left_id)
+        if(cost < vn.cost)
+          vn.cost = cost
+          vn.prev = p
+        end
       end
+      vn.cost += @wdc.cost(vn.word_id)
+      return vn
     end
-    vn.cost += @wdc.cost(vn.word_id)
-    return vn
   end
-end
 end

data/lib/igo/trie.rb CHANGED

@@ -7,21 +7,41 @@ class String
   end
 end
+#
+#DoubleArrayのノード用の定数などが定義されているクラス
+#
 class Node
+  #
+  #BASEノード用のメソッドが定義されているクラス
+  #
   class Base
+    #BASEノードに格納するID値をエンコードする
     def self.ids(nid)
       return (-1 * nid) - 1
     end
   end
+  #
+  #CHECKノード用の定数が定義されているクラス
+  #
   class Chck
+    #文字列の終端文字コード
+    #この文字はシステムにより予約されており、辞書内の形態素の表層形および解析対象テキストに含まれていた場合の動作は未定義
     TERMINATE_CODE = 0
+    #文字列の終端を表す文字定数
     TERMINATE_CHAR = TERMINATE_CODE.chr
+    #CHECKノードが未使用であることを示す文字コード
+    #この文字はシステムにより予約されており、辞書内の形態素の表層形および解析対象テキストに含まれていた場合の動作は未定義
     VACANT_CODE = 1
+    #使用可能な文字の最大値
     CODE_LIMIT = 0xffff
   end
 end
+#
+#文字列を文字のストリームとして扱うためのクラス
+#* readメソッドで個々の文字を順に読み込み、文字列の終端に達した場合にはNode::Chck::TERMINATE_CODEが返される。
+#
 class KeyStream
   def initialize(key, start = 0)
@@ -34,22 +54,21 @@ class KeyStream
     return rest.compare_to(ks.rest)
   end
+  #このメソッドは動作的には、rest().starts_with?(prefix.substring(beg, len))と等価。
+  #ほんの若干だが、パフォーマンスを改善するために導入。
+  #簡潔性のためになくしても良いかもしれない。
   def start_with(prefix, beg, len)
     s = @s
     c = @cur
     if @len - c < len
       return false
     end
-#   puts "c = #{c} len = #{len}"
-#   p s.unpack("U*")[c]
-#   p [s.unpack("U*")[c]].pack("U*")
     word = s.unpack("U*")[c]
     if word.nil?
       return (prefix.slice(beg, len-beg) == nil)
     else
       [word].pack("U*").starts_with?(prefix.slice(beg, len-beg))
     end
-#   return [s.unpack("U*")[c]].pack("U*").starts_with?(prefix.slice(beg, len-beg))
   end
   def rest
@@ -57,32 +76,28 @@ class KeyStream
   end
   def read
-#   puts "CUR=#{@cur}"
     if eos?
-#     puts "EOS!!"
       return Node::Chck::TERMINATE_CODE
     else
       r = @s.unpack("U*")[@cur]
-#     puts [r].pack("U*").tosjis
       result = [r].pack("U*")
-#     result = @s.unpack("U*")[@cur]
       @cur += 1
       return r
-#     p = @cur
-#     @cur += 1
-#     return @s[p]
     end
   end
   def eos?
-#   puts "eos? #{@cur} == #{@len}"
     return (@cur == @len) ? true : false
   end
 end
+#
 # DoubleArray検索用のクラス
+#
 class Searcher
+  #保存されているDoubleArrayを読み込んで、このクラスのインスタンスを作成する
+  #path:: DoubleArrayが保存されているファイルのパス
   def initialize(path)
     fmis = FileMappedInputStream.new(path)
     node_size = fmis.get_int()
@@ -94,20 +109,18 @@ class Searcher
     @lens = fmis.get_short_array(tind_size)
     @chck = fmis.get_char_array(node_size)
     @tail = fmis.get_string(tail_size)
-#p @begs[0]
-#p @base[0]
-#p @lens[0]
-#print @tail.tosjis
-#print @tail[0].tosjis
     fmis.close
   end
+  #DoubleArrayに格納されているキーの数を返却
+  #return:: DoubleArrayに格納されているキーの数
   def size
     return @key_set_size
   end
+  #キーを検索する
+  #key:: 検索対象のキー文字列
+  #return:: キーが見つかった場合はそのIDを、見つからなかった場合は-1を返す
   def search(key)
     base = @base
     chck = @chck
@@ -130,6 +143,11 @@ class Searcher
     end
   end
+  #common-prefix検索を行う
+  #* 条件に一致するキーが見つかる度に、callback.callメソッドが呼び出される
+  #key:: 検索対象のキー文字列
+  #start:: 検索対象となるキー文字列の最初の添字
+  #callback:: 一致を検出した場合に呼び出されるコールバックメソッド
   def each_common_prefix(key, start, callback)
     base = @base
     chck = @chck
@@ -137,48 +155,29 @@ class Searcher
     offset = -1
     kin = KeyStream.new(key, start)
-#   puts "each_common_prefix"
     while true
       code = kin.read
       offset += 1
       terminal_index = node
-#     terminal_index = node + Node::Chck::TERMINATE_CODE
-#puts  "code #{code.tosjis}"
       if(chck[terminal_index] == Node::Chck::TERMINATE_CODE)
         callback.call(start, offset, Node::Base.ids(base[terminal_index]))
-#       puts "code -> #{code} #{Node::Chck::TERMINATE_CHAR}"
         if(code == Node::Chck::TERMINATE_CODE)
-#         puts code
-#         puts "(1)"
           return
         end
       end
-      # TODO
-#puts  "code #{code.tosjis}"
-#     p code
       idx = node + code
       node = base[idx]
-#     code = [code].pack('U*')
       if(chck[idx] == code)
         if(node >= 0)
           next
         else
-#         id = Node.Base.ids(node)
-#         if(kin.start_with(@tail, @begs[id], lens[id]))
-#           callback.call(start, offset+@lens[id]+1, id)
-#         end
           call_if_key_including(kin, node, start, offset, callback)
         end
       end
-#     puts code
-#     puts "(2)"
       return
     end
   end
@@ -186,7 +185,6 @@ class Searcher
   private
   def call_if_key_including(kin, node, start, offset, callback)
-#   puts "call_if_key_including"
     node_id = Node::Base.ids(node)
     if(kin.start_with(@tail, @begs[node_id], @lens[node_id]))
       callback.call(start, offset + @lens[node_id] + 1, node_id)

data/lib/igo/util.rb CHANGED

@@ -1,22 +1,31 @@
-# ユーティリティ
+# ファイルユーティリティ
+#
+#=== ファイルにマッピングされた入力ストリーム
+# ファイルからバイナリデータを取得する場合、必ずこのクラスが使用される。
+#
 class FileMappedInputStream
+  # 入力ストリームの初期化
+  # path:: 入力ファイルのパス
   def initialize(path)
     @path = path
     @cur = 0
     @file = open(path, "r+b")
-#   @file.binmode
   end
+  # int値で読み取り
   def get_int()
     return @file.read(4).unpack("i*")[0]
   end
+  # int配列で読み取り
+  # count:: 読み取りカウント
   def get_int_array(count)
-#   return map(count * 4).unpack("i*")
     return @file.read(count * 4).unpack("i*")
   end
+  # int配列で読み取り
+  # path:: 入力ファイルのパス
   def self.get_int_array(path)
     fmis = FileMappedInputStream.new(path)
     array = fmis.get_int_array((File::stat(path).size)/4)
@@ -24,22 +33,26 @@ class FileMappedInputStream
     return array
   end
+  # short配列で読み取り
+  # count:: 読み取りカウント
   def get_short_array(count)
-#   return map(count * 2).unpack("s*")
     return @file.read(count * 2).unpack("s*")
   end
+  # char配列で読み取り
+  # count:: 読み取りカウント
   def get_char_array(count)
-#   return map(count * 2).unpack("S!*")
     return @file.read(count * 2).unpack("S!*")
   end
+  # stringで読み取り
+  # count:: 読み取りカウント
   def get_string(count)
-#   return map(count * 2)
-#   puts "read count = #{count}"
     return @file.read(count * 2)
   end
+  # stringで読み取り
+  # path:: 入力ファイル
   def self.get_string(path)
     fmis = FileMappedInputStream.new(path)
     str = fmis.get_string((File::stat(path).size)/2)
@@ -48,14 +61,19 @@ class FileMappedInputStream
     return str
   end
+  # 入力ファイルのサイズを返却する
   def size
     return File::stat(@path).size
   end
+  # 入力ストリームを閉じる
+  #* newした場合、必ずcloseを呼ぶこと
   def close
     @file.close
   end
+  # char配列で読み取り
+  # path:: 入力ファイル
   def self.get_char_array(path)
     fmis = FileMappedInputStream.new(path)
     array = fmis.get_char_array(fmis.size / 2)
@@ -65,10 +83,11 @@ class FileMappedInputStream
   private
-  def __map(size)
+  # ファイルマップ
+  #* 現在、不使用
+  def map(size)
     @file.pos = @cur
     @cur += size
     return @file.read(size)
   end
 end

data/test/test.rb CHANGED

@@ -1,6 +1,6 @@
 require 'rubygems'
 require 'igo-ruby'
-tagger = Igo::Tagger.new('../ipadic')
+tagger = Igo::Tagger.new('../../ipadic')
 t = tagger.parse('吾輩は猫である。名前はまだ無い。')
 t.each{|m|
   puts "#{m.surface} #{m.feature} #{m.start}"

metadata CHANGED

@@ -1,13 +1,13 @@
 --- !ruby/object:Gem::Specification
 name: igo-ruby
 version: !ruby/object:Gem::Version
-  hash: 27
+  hash: 25
   prerelease: false
   segments:
   - 0
   - 1
-  - 0
-  version: 0.1.0
+  - 1
+  version: 0.1.1
 platform: ruby
 authors:
 - K.Nishi
@@ -15,7 +15,7 @@ autorequire:
 bindir: bin
 cert_chain: []
-date: 2010-12-11 00:00:00 +09:00
+date: 2010-12-12 00:00:00 +09:00
 default_executable:
 dependencies:
 - !ruby/object:Gem::Dependency
@@ -80,7 +80,7 @@ dependencies:
   name: rcov
   requirement: *id004
   type: :development
-description: Ruby port of Igo Japanese morphological analyzer.
+description: "\n    Ruby port of Igo Japanese morphological analyzer. Igo-ruby needs Igo's binary dictionary files.\n    These files created by Java programs.\n    See: http://igo.sourceforge.jp/\n  "
 email: 24signals@gmail.com
 executables: []
@@ -109,8 +109,10 @@ homepage: http://github.com/kyow/igo-ruby
 licenses:
 - MIT
 post_install_message:
-rdoc_options: []
+rdoc_options:
+- -c UTF-8
+- -S
+- -U
 require_paths:
 - lib
 required_ruby_version: !ruby/object:Gem::Requirement