RubyGems - pollex - Versions diffs - 0.1.0 → 0.1.1 - Mend

pollex 0.1.0 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

data/CHANGELOG CHANGED

@@ -1,3 +1,6 @@
+3/28/2013 version 0.1.1
+* Source.grammar now includes information on all Pollex sources
 3/6/2013 version 0.1.0
 * New class: Pollex:Translator
 * New methods:

data/lib/pollex/source.rb CHANGED

@@ -42,9 +42,6 @@ module Pollex
     # Returns grammatical information for this source, used for
     # intelligently parsing the descriptions of entries from this source
-    # @note Information is currently entered for all sources on
-    #   http://pollex.org.nz/source/ up to (and including)
-    #   Bse
     # @return [Hash] grammatical information pertaining to the descriptions
     #   of this sources' entries
     # @see Entry#terms
@@ -58,48 +55,60 @@ module Pollex
       # now bring in source-specific information
-      if ['Cnt', 'Bxn'].include? @code
+      if ['Cnt', 'Bxn', 'Egt', 'Fts'].include? @code
         # Spanish-language sources
         language = 'es'
-      elsif ['Aca', 'Bgn', 'Btn', 'Hmn', 'Rch'].include? @code
+      elsif ['Aca', 'Bgn', 'Btn', 'Hmn', 'Rch', 'Dln', 'Gzl', 'Jnu', 'Jsn', 'Rve', 'Lvs', 'Lch', 'Lmt', 'Myr', 'Mfr', 'Rdl', 'Sgs'].include? @code
         # French-language sources
         language = 'fr'
+      elsif ['Ths'].include? @code
+        # German-language sources
+        language = 'de'
       end
-      if ['Aca', 'Bxn'].include? @code
+      if ['Aca', 'Bxn', 'Jsn', 'Mtu', 'Grn'].include? @code
         # split by comma, semicolon, period
         dividers = /(,|;|\. )/
-      elsif ['Atn', 'Bwh', 'Hmn'].include? @code
+      elsif ['Atn', 'Bwh', 'Hmn', 'Crk', 'Hdy', 'Smt', 'Rkj'].include? @code
         # don't split at all
         dividers = '\n' # dividers = nil doesn't work
-      elsif ['Bgn', 'Bst', 'Brn'].include? @code
+      elsif ['Bgn', 'Bst', 'Brn', 'Gms', 'Tmo'].include? @code
         # split by period
         dividers = '.'
       elsif ['Bkr', 'Bgs'].include? @code
         # split by comma, period
         dividers = /(,|\. )/
-      elsif ['Bge', 'Bck'].include? @code
+      elsif ['Bge', 'Bck', 'Cbl', 'Chn', 'Cdn', 'Dvs', 'Dnr', 'Dln', 'Dye', 'Ebt', 'Egt', 'Fbg', 'Fth', 'Fox', 'Fts', 'Hzd', 'Hry', 'Hvn', 'Hnh', 'Fny', 'Mta', 'Myr', 'Mtx', 'Mnr', 'Mbg', 'Kvt', 'Ply', 'Ebt', 'Mka', 'Sby', 'Sve', 'Sta', 'Sma', 'Sks', 'Tbs', 'Tgr', 'Whe', 'Whr', 'Rmn', 'Wms', 'Ykr'].include? @code
         # split by semicolon
         dividers = ';'
+      elsif ['Drd', 'Hbn', 'Mkn', 'Rdl', 'Bke'].include? @code
+        # split by semicolon, period
+        dividers = /(;|\. )/
       end
-      if ['McP', 'Dsn'].include? @code
+      if ['McP', 'Dsn', 'Gzl', 'Sby', 'Sph'].include? @code
         # Trim all (parenthetical expressions)
         trim_expressions = /\(.*\)/
-      elsif ['Cnt', 'Aca', 'Bse', 'Hmn'].include? @code
+      elsif ['Cnt', 'Aca', 'Bse', 'Hmn', 'Cbl', 'Cpl', 'Crn', 'Chn', 'Chl', 'Cwd', 'Clk', 'Cek', 'Crk', 'Dvs', 'Dtn', 'Dnr', 'Dty', 'Fth', 'Fox', 'Fts', 'Gmd', 'McC', 'Hwd', 'Ivs', 'Lmt', 'Lvs', 'Lmt', 'Lbr', 'Mar', 'Mta', 'Myr', 'McE', 'Mnr', 'Mfr', 'Mtu', 'Gty', 'Ply', 'Rby', 'Mka', 'Clk', 'Sve', 'Shd', 'Sma', 'Stn', 'Sks', 'Tgr', 'Whe', 'Mke', 'Whr'].include? @code
         # Trim parenthetical expressions that are <= 4 chars or contain numbers
         trim_expressions = /\((.{0,4}|.*[0-9].*)\)/
       elsif ['Stz', 'Bck'].include? @code
         # Trim parenthetical expressions that contain numbers
         trim_expressions = /\(.*[0-9].*\)/
+      elsif ['Kch', 'Ray'].include? @code
+        # Trim all [bracketed expressions]
+        trim_expressions = /\[.*\]/
       elsif ['Rsr'].include? @code
         # Trim all "expressions in quotes"
         trim_expressions = /".*"/
       end
-      if ['Btl', 'Bck'].include? @code
+      if ['Btl', 'Bck', 'Chl', 'McC', 'Hpr', 'Mbg', 'Wte'].include? @code
         # Trim everything after a period
         trim_after = '.'
+      elsif ['Shd'].include? @code
+        # Trim everything after an equals sign
+        trim_after = '='
       end
       {

data/lib/pollex/translator.rb CHANGED

@@ -28,7 +28,7 @@ module Pollex
           @cache[key]
         else
           # make a request to MyMemory
-          puts "Translating '#{phrase}' ..."
+          puts "Translating '#{phrase}' from (#{source_lang_code}) ..."
           url = "http://mymemory.translated.net/api/get?q=#{URI::encode(phrase)}&langpair=#{source_lang_code}%7Cen"
           results_json = open(url).read
           result = JSON.parse(results_json)['responseData']['translatedText']

data/lib/pollex/version.rb CHANGED

@@ -1,3 +1,3 @@
 module Pollex
-  VERSION = '0.1.0'
+  VERSION = '0.1.1'
 end

metadata CHANGED

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: pollex
 version: !ruby/object:Gem::Version
-  version: 0.1.0
+  version: 0.1.1
   prerelease:
 platform: ruby
 authors:
@@ -9,7 +9,7 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2013-03-07 00:00:00.000000000 Z
+date: 2013-03-28 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: nokogiri
@@ -115,7 +115,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
       version: '0'
 requirements: []
 rubyforge_project:
-rubygems_version: 1.8.23
+rubygems_version: 1.8.25
 signing_key:
 specification_version: 3
 summary: Ruby wrapper for scraping pollex (the Polynesian Lexicon Project)