RubyGems - tbx_importer - Versions diffs - 0.1.7 → 0.2.0 - Mend

tbx_importer 0.1.7 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: b0a89cc90bfb0da2901149b99a39f968e22afb31
-  data.tar.gz: 647d1288aa408be31688a10bc31c25fd22ecbfa8
+  metadata.gz: aa7e9edaa27e364b2f4735dc7b4e71253c57e0fc
+  data.tar.gz: 53c3f75de385653094bd1a9a71f821fe052487d9
 SHA512:
-  metadata.gz: 15f48e14b96c3fcbcad3d572a6a22bc413132a7a1adbbfae34c8dfba302d60c6784258baa5291e753db623dfb4bbf43a08b05b474a1eee526bf088d0bc211311
-  data.tar.gz: ed62cb32c367bafa33ae4f57eae48891d2b0512d8f9887cb2c8049d18aae8722aa5ddc1071b9531f6ea238a4be1d31432ad8bff415d5e856ac02bc7b1db90732
+  metadata.gz: a12d12838ee83be6442085cae9917b420d44790acea53a2074f9e429128ea0b8885121d3ba3feec181ab761ed62bbcb9d65c303357fe7876ab1649a41b64c45a
+  data.tar.gz: 39e3065d6d167cd9632558a8f45f04b53607a2b32e3c4ab1a008e9cc8ae0d7516f48348e343b64b68b722e5f44ee6b1741c7394283ed1df794b1557e440a9144

data/lib/tbx_importer/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module TbxImporter
-  VERSION = "0.1.7"
+  VERSION = "0.2.0"
 end

data/lib/tbx_importer.rb CHANGED Viewed

@@ -26,7 +26,7 @@ module TbxImporter
       @doc = {
         source_language: "",
         tc: { id: "", counter: 0, vals: [], lang: "", definition: "" },
-        term: { lang: "", counter: 0, vals: [], part_of_speech: "" },
+        term: { lang: "", counter: 0, vals: [], part_of_speech: "", term: "" },
         language_pairs: [],
         term_entry: false
       }
@@ -94,17 +94,19 @@ module TbxImporter
     def parse_file(reader)
       tag_stack = []
-      generate_unique_id
       while reader.read do
-        if !tag_stack.include?(reader.name)
-          tag_stack.push(reader.name)
-          eval_state(tag_stack, reader)
-        elsif tag_stack.last == reader.name
-          if tag_stack.pop.bytes.to_a == [116, 101, 114, 109, 69, 110, 116, 114, 121]
-            generate_unique_id
+        if reader.node_type.to_i.eql?(1) && reader.read_string.nil?
+          tag_stack.pop
+        else
+          if !tag_stack.include?(reader.name)
+            tag_stack.push(reader.name)
+            eval_state(tag_stack, reader)
+          elsif tag_stack.last == reader.name
+            tag_stack.pop
           end
         end
       end
+      @doc[:tc][:vals].pop if @doc[:tc][:vals].last[0] != @doc[:term][:vals].last[0]
       reader.close
     end
@@ -114,6 +116,7 @@ module TbxImporter
         @doc[:lang] = reader.get_attribute("lang") || reader.get_attribute("xml:lang")
         @doc[:language_pairs] << @doc[:lang]
       when [116, 101, 114, 109, 69, 110, 116, 114, 121] #termEntry
+        generate_unique_id
         write_tc
       when [108, 97, 110, 103, 83, 101, 116] #langSet
         @doc[:term][:lang] = reader.get_attribute("lang") || reader.get_attribute("xml:lang")
@@ -122,9 +125,11 @@ module TbxImporter
         write_term(reader)
       when [116, 101, 114, 109, 78, 111, 116, 101] #termNote
         unless reader.read_string.nil?
-          @doc[:term][:part_of_speech] = PrettyStrings::Cleaner.new(reader.read_string.downcase).pretty.gsub("\\","&#92;").gsub("'",%q(\\\')) if reader.get_attribute("type").eql?("partOfSpeech")
-          @doc[:term][:vals].pop
-          write_term(reader)
+          if reader.get_attribute("type").eql?("partOfSpeech")
+            @doc[:term][:part_of_speech] = PrettyStrings::Cleaner.new(reader.read_string.downcase).pretty.gsub("\\","&#92;").gsub("'",%q(\\\'))
+            @doc[:term][:vals].pop
+            write_term_pos
+          end
         end
       when [100, 101, 115, 99, 114, 105, 112] #descrip
         @doc[:tc][:definition] = PrettyStrings::Cleaner.new(reader.read_string).pretty.gsub("\\","&#92;").gsub("'",%q(\\\')) if reader.get_attribute("type").eql?("definition")
@@ -140,9 +145,13 @@ module TbxImporter
     def write_term(reader)
       return if reader.read_string.nil?
-      text = PrettyStrings::Cleaner.new(reader.read_string).pretty.gsub("\\","&#92;").gsub("'",%q(\\\'))
-      word_count = text.gsub("\s+", ' ').split(' ').length
-      @doc[:term][:vals] << [@doc[:tc][:id], @doc[:term][:lang], @doc[:term][:part_of_speech], text]
+      @doc[:term][:term] = PrettyStrings::Cleaner.new(reader.read_string).pretty.gsub("\\","&#92;").gsub("'",%q(\\\'))
+      word_count = @doc[:term][:term].gsub("\s+", ' ').split(' ').length
+      @doc[:term][:vals] << [@doc[:tc][:id], @doc[:term][:lang], @doc[:term][:part_of_speech], @doc[:term][:term]]
+    end
+    def write_term_pos
+      @doc[:term][:vals] << [@doc[:tc][:id], @doc[:term][:lang], @doc[:term][:part_of_speech], @doc[:term][:term]]
     end
     def generate_unique_id

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: tbx_importer
 version: !ruby/object:Gem::Version
-  version: 0.1.7
+  version: 0.2.0
 platform: ruby
 authors:
 - Kevin S. Dias
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2016-06-16 00:00:00.000000000 Z
+date: 2016-06-17 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: bundler