RubyGems - mongolian - Versions diffs - 0.1.0 → 0.1.1 - Mend

mongolian 0.1.0 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

checksums.yaml +4 -4
data/lib/mongolian/latin.rb +94 -94
data/lib/mongolian/spellchecker.rb +6 -5
data/lib/mongolian/stemmify.rb +1 -1
data/lib/mongolian/tokenizer.rb +2 -2
data/lib/mongolian/version.rb +1 -1
metadata +1 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: b5ae047f3b8d5d37be63b5646bae637537a46f1a8402d9cb6bed1d95ea9f3135
-  data.tar.gz: 7e00183b681aa0a29119a5d3eadcb687546761bd3b9c78f8dc670f1dc869e7de
+  metadata.gz: 2e382f30019fbe63999fb05f4bf37f5f7e8a49d5de142947b88b68c8fd733d7a
+  data.tar.gz: 6837360f2162d1ea58f9bd2ab719767a47a705bee1e17c9867d6905863e7ceb2
 SHA512:
-  metadata.gz: b075ed85bfd720da5169e92b2e5c5ce6ce0a279ee7fb5fa8b137137bc6bcb6debd257efdac73751f63e1ccbb28bff533f2e764d71c427ae36c099173c595ca4e
-  data.tar.gz: 9ed88cc1be818a65e58a134dafca486faa1eeeed3325c460a86c3aac60990ebcd18848802164afd27e3ac79b2c611e73e14470ea2547f38521ffca60634f6042
+  metadata.gz: 4471e74185ab6c9c5c67c0dd3f2aa6080345a8fbffe5474459977561f285f11236bfc1b639ece74e0e8d68e611671459128f4cc64286717c3add23bb7e6149c3
+  data.tar.gz: 1927874996597a16f4f664ee09a0473b71498b21ef2a61e9631bb6c65261e2ee302ce4bcf4b9330efeb96ea03d836024d61196db2a1a60b7f273eb33fa381dea

data/lib/mongolian/latin.rb CHANGED Viewed

@@ -6,102 +6,102 @@ module Mongolian
   # 3. 根据 Unicode 定义，转写不分阴阳形式；
   # 转换传统蒙古文为拉丁转写
-  def m2l
-    mongolian_str = self.dup.to_str
-    mongolian_str = mongolian_str.gsub(/ᠠ/, "a")
-    mongolian_str = mongolian_str.gsub(/ᠡ/, "e")
-    mongolian_str = mongolian_str.gsub(/ᠢ/, "i")
-    mongolian_str = mongolian_str.gsub(/ᠣ/, "o")
-    mongolian_str = mongolian_str.gsub(/ᠤ/, "u")
-    mongolian_str = mongolian_str.gsub(/ᠥ/, "ö")
-    mongolian_str = mongolian_str.gsub(/ᠦ/, "ü")
-    mongolian_str = mongolian_str.gsub(/ᠧ/, "ë")
-    mongolian_str = mongolian_str.gsub(/ᠨ/, "n")
-    mongolian_str = mongolian_str.gsub(/ᠩ/, "ŋ")
-    mongolian_str = mongolian_str.gsub(/ᠪ/, "b")
-    mongolian_str = mongolian_str.gsub(/ᠫ/, "p")
-    mongolian_str = mongolian_str.gsub(/ᠬ/, "x")
-    mongolian_str = mongolian_str.gsub(/ᠭ/, "g")
-    mongolian_str = mongolian_str.gsub(/ᠮ/, "m")
-    mongolian_str = mongolian_str.gsub(/ᠯ/, "l")
-    mongolian_str = mongolian_str.gsub(/ᠰ/, "s")
-    mongolian_str = mongolian_str.gsub(/ᠱ/, "š")
-    mongolian_str = mongolian_str.gsub(/ᠲ/, "t")
-    mongolian_str = mongolian_str.gsub(/ᠳ/, "d")
-    mongolian_str = mongolian_str.gsub(/ᠴ/, "č")
-    mongolian_str = mongolian_str.gsub(/ᠵ/, "ǰ")
-    mongolian_str = mongolian_str.gsub(/ᠶ/, "y")
-    mongolian_str = mongolian_str.gsub(/ᠷ/, "r")
-    mongolian_str = mongolian_str.gsub(/ᠸ/, "w")
-    mongolian_str = mongolian_str.gsub(/ᠹ/, "f")
-    mongolian_str = mongolian_str.gsub(/ᠺ/, "k")
-    mongolian_str = mongolian_str.gsub(/ᠻ/, "ḳ")
-    mongolian_str = mongolian_str.gsub(/ᠼ/, "c")
-    mongolian_str = mongolian_str.gsub(/ᠽ/, "z")
-    mongolian_str = mongolian_str.gsub(/ᠾ/, "h")
-    mongolian_str = mongolian_str.gsub(/ᠿ/, "ž")
-    mongolian_str = mongolian_str.gsub(/ᡀ/, "lh")
-    mongolian_str = mongolian_str.gsub(/ᡁ/, "ẑ")
-    mongolian_str = mongolian_str.gsub(/ᡂ/, "ĉ")
-    mongolian_str = mongolian_str.gsub(/᠀/, "&")
-    mongolian_str = mongolian_str.gsub(/᠁/, "…")
-    mongolian_str = mongolian_str.gsub(/᠂/, ",")
-    mongolian_str = mongolian_str.gsub(/᠃/, ".")
-    mongolian_str = mongolian_str.gsub(/᠇/, ":")
-    mongolian_str = mongolian_str.gsub(/᠈/, "#")
-    mongolian_str = mongolian_str.gsub(/᠊/, "‐")
-    mongolian_str = mongolian_str.gsub(/᠋/, "") #fvs1
-    mongolian_str = mongolian_str.gsub(/᠌/, "") #fvs2
-    mongolian_str = mongolian_str.gsub(/᠍/, "") #fvs3
-    mongolian_str = mongolian_str.gsub(/᠎/, "_")
-    mongolian_str = mongolian_str.gsub(/᠐/, "'0")
-    mongolian_str = mongolian_str.gsub(/᠑/, "'1")
-    mongolian_str = mongolian_str.gsub(/᠒/, "'2")
-    mongolian_str = mongolian_str.gsub(/᠓/, "'3")
-    mongolian_str = mongolian_str.gsub(/᠔/, "'4")
-    mongolian_str = mongolian_str.gsub(/᠕/, "'5")
-    mongolian_str = mongolian_str.gsub(/᠖/, "'6")
-    mongolian_str = mongolian_str.gsub(/᠗/, "'7")
-    mongolian_str = mongolian_str.gsub(/᠘/, "'8")
-    mongolian_str = mongolian_str.gsub(/᠙/, "'9")
-    mongolian_str = mongolian_str.gsub(/ᡛ/, "ń")
-    mongolian_str = mongolian_str.gsub(/ᢀ/, "ṃ")
-    mongolian_str = mongolian_str.gsub(/ᢁ/, "ḥ")
-    mongolian_str = mongolian_str.gsub(/ᢂ/, "â")
-    mongolian_str = mongolian_str.gsub(/ᢃ/, "ŏ")
-    mongolian_str = mongolian_str.gsub(/ᢄ/, "ô")
-    mongolian_str = mongolian_str.gsub(/ᢅ/, "ˑ")
-    mongolian_str = mongolian_str.gsub(/ᢆ/, "ːˑ")
-    mongolian_str = mongolian_str.gsub(/ᢇ/, "ā")
-    mongolian_str = mongolian_str.gsub(/ᢈ/, "ī")
-    mongolian_str = mongolian_str.gsub(/ᢉ/, "ḵ")
-    mongolian_str = mongolian_str.gsub(/ᢊ/, "ṉ")
-    mongolian_str = mongolian_str.gsub(/ᢋ/, "ƈ")
-    mongolian_str = mongolian_str.gsub(/ᢌ/, "ť")
-    mongolian_str = mongolian_str.gsub(/ᢍ/, "ţ")
-    mongolian_str = mongolian_str.gsub(/ᢎ/, "ḏ")
-    mongolian_str = mongolian_str.gsub(/ᢏ/, "ņ")
-    mongolian_str = mongolian_str.gsub(/ᢐ/, "ṯ")
-    mongolian_str = mongolian_str.gsub(/ᢑ/, "ḓ")
-    mongolian_str = mongolian_str.gsub(/ᢒ/, "p̄")
-    mongolian_str = mongolian_str.gsub(/ᢓ/, "ṕh")
-    mongolian_str = mongolian_str.gsub(/ᢔ/, "ş")
-    mongolian_str = mongolian_str.gsub(/ᢕ/, "ẖ")
-    mongolian_str = mongolian_str.gsub(/ᢖ/, "ẕ")
-    mongolian_str = mongolian_str.gsub(/ᢗ/, "ʒ̄")
-    mongolian_str = mongolian_str.gsub(/ᢦ/, "ŭ")
-    mongolian_str = mongolian_str.gsub(/ᢧ/, "ÿ")
-    mongolian_str = mongolian_str.gsub(/ᢩ/, "̲")
-    mongolian_str = mongolian_str.gsub(/‌/, "^")
-    mongolian_str = mongolian_str.gsub(/‍/, "*")
-    mongolian_str = mongolian_str.gsub(/ /, "-")
-    return mongolian_str
+  def mon_m2l
+    str = self.dup.to_str
+    str = str.gsub(/ᠠ/, "a")
+    str = str.gsub(/ᠡ/, "e")
+    str = str.gsub(/ᠢ/, "i")
+    str = str.gsub(/ᠣ/, "o")
+    str = str.gsub(/ᠤ/, "u")
+    str = str.gsub(/ᠥ/, "ö")
+    str = str.gsub(/ᠦ/, "ü")
+    str = str.gsub(/ᠧ/, "ë")
+    str = str.gsub(/ᠨ/, "n")
+    str = str.gsub(/ᠩ/, "ng")
+    str = str.gsub(/ᠪ/, "b")
+    str = str.gsub(/ᠫ/, "p")
+    str = str.gsub(/ᠬ/, "x")
+    str = str.gsub(/ᠭ/, "g")
+    str = str.gsub(/ᠮ/, "m")
+    str = str.gsub(/ᠯ/, "l")
+    str = str.gsub(/ᠰ/, "s")
+    str = str.gsub(/ᠱ/, "š")
+    str = str.gsub(/ᠲ/, "t")
+    str = str.gsub(/ᠳ/, "d")
+    str = str.gsub(/ᠴ/, "č")
+    str = str.gsub(/ᠵ/, "ǰ")
+    str = str.gsub(/ᠶ/, "y")
+    str = str.gsub(/ᠷ/, "r")
+    str = str.gsub(/ᠸ/, "w")
+    str = str.gsub(/ᠹ/, "f")
+    str = str.gsub(/ᠺ/, "k")
+    str = str.gsub(/ᠻ/, "ḳ")
+    str = str.gsub(/ᠼ/, "c")
+    str = str.gsub(/ᠽ/, "z")
+    str = str.gsub(/ᠾ/, "h")
+    str = str.gsub(/ᠿ/, "ž")
+    str = str.gsub(/ᡀ/, "lh")
+    str = str.gsub(/ᡁ/, "ẑ")
+    str = str.gsub(/ᡂ/, "ĉ")
+    str = str.gsub(/᠀/, "&")
+    str = str.gsub(/᠁/, "…")
+    str = str.gsub(/᠂/, ",")
+    str = str.gsub(/᠃/, ".")
+    str = str.gsub(/᠇/, ":")
+    str = str.gsub(/᠈/, "#")
+    str = str.gsub(/᠊/, "‐")
+    str = str.gsub(/᠋/, "") #fvs1
+    str = str.gsub(/᠌/, "") #fvs2
+    str = str.gsub(/᠍/, "") #fvs3
+    str = str.gsub(/᠎/, "_")
+    str = str.gsub(/᠐/, "'0")
+    str = str.gsub(/᠑/, "'1")
+    str = str.gsub(/᠒/, "'2")
+    str = str.gsub(/᠓/, "'3")
+    str = str.gsub(/᠔/, "'4")
+    str = str.gsub(/᠕/, "'5")
+    str = str.gsub(/᠖/, "'6")
+    str = str.gsub(/᠗/, "'7")
+    str = str.gsub(/᠘/, "'8")
+    str = str.gsub(/᠙/, "'9")
+    str = str.gsub(/ᡛ/, "ń")
+    str = str.gsub(/ᢀ/, "ṃ")
+    str = str.gsub(/ᢁ/, "ḥ")
+    str = str.gsub(/ᢂ/, "â")
+    str = str.gsub(/ᢃ/, "ŏ")
+    str = str.gsub(/ᢄ/, "ô")
+    str = str.gsub(/ᢅ/, "ˑ")
+    str = str.gsub(/ᢆ/, "ːˑ")
+    str = str.gsub(/ᢇ/, "ā")
+    str = str.gsub(/ᢈ/, "ī")
+    str = str.gsub(/ᢉ/, "ḵ")
+    str = str.gsub(/ᢊ/, "ṉ")
+    str = str.gsub(/ᢋ/, "ƈ")
+    str = str.gsub(/ᢌ/, "ť")
+    str = str.gsub(/ᢍ/, "ţ")
+    str = str.gsub(/ᢎ/, "ḏ")
+    str = str.gsub(/ᢏ/, "ņ")
+    str = str.gsub(/ᢐ/, "ṯ")
+    str = str.gsub(/ᢑ/, "ḓ")
+    str = str.gsub(/ᢒ/, "p̄")
+    str = str.gsub(/ᢓ/, "ṕh")
+    str = str.gsub(/ᢔ/, "ş")
+    str = str.gsub(/ᢕ/, "ẖ")
+    str = str.gsub(/ᢖ/, "ẕ")
+    str = str.gsub(/ᢗ/, "ʒ̄")
+    str = str.gsub(/ᢦ/, "ŭ")
+    str = str.gsub(/ᢧ/, "ÿ")
+    str = str.gsub(/ᢩ/, "̲")
+    str = str.gsub(/‌/, "^")
+    str = str.gsub(/‍/, "*")
+    str = str.gsub(/ /, "-")
+    return str
   end
   # 对拉丁转写蒙古文恢复为蒙古文
-  def l2m
-    latin_str = self.dup.to_str
-    mongolian_str = latin_str
-    return mongolian_str
+  def mon_l2m
+    str = self.dup.to_str
+    # 将拉丁文转换文对应的蒙古文
+    return str
   end
 end

data/lib/mongolian/spellchecker.rb CHANGED Viewed

@@ -7,7 +7,7 @@ module Mongolian
   # 返回值 10：阳性词，但有错误，第一音节出现第五元音，却在后面出现了第四元音
   # 返回值 2：正确，阴性词
   # 返回值 20：阴性词，但有错误，第一音节出现第七元音，却在后面出现了第六元音
-  def vowel_harmony
+  def mon_vowel_harmony
     mongolian_str = self.dup.to_str
     #vowel = ["ᠠ", "ᠡ", "ᠢ", "ᠣ", "ᠤ", "ᠥ", "ᠦ"]
     if mongolian_str =~ /[ᠠᠣᠤ]/ and mongolian_str =~ /[ᠡᠥᠦ]/
@@ -15,14 +15,14 @@ module Mongolian
     else
       if mongolian_str =~ /[ᠠᠣᠤ]/
         #如果第一音节阳性元音为第 5 元音，却在后面出现第 4 元音，则错误
-        if mongolian_str.syllable[0] =~ /ᠤ/ and mongolian_str[mongolian_str.syllable[0].size..-1] =~ /ᠣ/
+        if mongolian_str.mon_syllable_classify[0] =~ /ᠤ/ and mongolian_str[mongolian_str.mon_syllable_classify[0].size..-1] =~ /ᠣ/
           return 10
         else
           return 1
         end
       else
         #如果第一音节阳性元音为第 7 元音，却在后面出现第 6 元音，则错误
-        if mongolian_str.syllable[0] =~ /ᠦ/ and mongolian_str[mongolian_str.syllable[0].size..-1] =~ /ᠥ/
+        if mongolian_str.mon_syllable_classify[0] =~ /ᠦ/ and mongolian_str[mongolian_str.mon_syllable_classify[0].size..-1] =~ /ᠥ/
           return 20
         else
           return 2
@@ -31,8 +31,9 @@ module Mongolian
     end
   end
-  # 对单词划分音节，返回音节数组
-  def syllable
+  # 对单词划分音节：每个元音前最多一个辅音前面既可划分音节
+  # 返回值是音节数组
+  def mon_syllable_classify
     mongolian_str = self.dup.to_str
     mlist = []
     s = ""

data/lib/mongolian/stemmify.rb CHANGED Viewed

@@ -1,6 +1,6 @@
 module Mongolian
   ## 对做好分词的蒙古文词进行词干提取。
-  def mongolian_stemmify
+  def mon_stemmify
     w = self.dup.to_str
     return w if w.length < 4

data/lib/mongolian/tokenizer.rb CHANGED Viewed

@@ -8,8 +8,8 @@ module Mongolian
   ## 对于混合有多个文种的一段文字，删除其中的非蒙古文字符和蒙古文标点符号后，
   #  仅对蒙古文分词。
-  #  函数返回仅包含蒙古文的分词数组。
-  def mongolian_tokenize
+  #  返回值为蒙古文分词数组。
+  def mon_tokenize
     w = self.dup.to_str
     # 去除标点符号，用空格替换标点符号
     w = w.gsub(/[!᠄?·᠃᠂⁈⁉᠁—;《》]/, " ")

data/lib/mongolian/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # frozen_string_literal: true
 module Mongolian
-  VERSION = "0.1.0"
+  VERSION = "0.1.1"
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: mongolian
 version: !ruby/object:Gem::Version
-  version: 0.1.0
+  version: 0.1.1
 platform: ruby
 authors:
 - Huang Fei-Long