RubyGems - confidential_info_redactor - Versions diffs - 0.0.14 → 0.0.15 - Mend

confidential_info_redactor 0.0.14 → 0.0.15

Files changed (5) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: f372184466d5b6452bc24fcba0cc4b7f6754d5c8
-  data.tar.gz: e6cc96f50cb2ff83e4d74b5e9fb201c2c0f93a17
+  metadata.gz: cdee56aab509c61bb5746e12b5649f9dad2ad3ce
+  data.tar.gz: 3e47c212345e9986a53bdc6d1d38fc1c5c974341
 SHA512:
-  metadata.gz: 3752768a77fd3514e3717363c9c23cfccfe62b6acbdba59a540d9eb1506a55573a582dc581b7f433c94822c43cbfc9d82d27ca754a0b51751306f8cfdc9d8ea7
-  data.tar.gz: 2de4f5514ea01869ae0f552d9bdefeba79c60c79cbb62167644f47c2a3a3d0213fb546c5c70fd3466e0afd8d421a3c712e163a6cfbc3e82629e44e8501798d7a
+  metadata.gz: f7ff4ea744c2b5ec7fc2927efa23f0c0894973bf01cd4a2a39d21ea8575c274ec6e93d0a7e18f6f23bc28d9581b26cbea1de40a2d182eee2fe0cfd3be1ff28b9
+  data.tar.gz: e0ed6e7ac500a44fe84393ae2554623f6571f52141cf4e588e02de796dc752f4b0cdbd9d85077cac3f2d3dd2d9c20df7ff31af50f4fa4ac59363b91319c2f6af

data/lib/confidential_info_redactor/extractor.rb CHANGED Viewed

@@ -23,6 +23,7 @@ module ConfidentialInfoRedactor
       extracted_terms = []
       PragmaticSegmenter::Segmenter.new(text: text, language: language).segment.each do |segment|
         initial_extracted_terms = segment.gsub(EXTRACT_REGEX).map { |match| match unless corpus.include?(match.downcase.gsub(/[\?\.\)\(\!\\\/\"\:\;]/, '').gsub(/”/,'').gsub(/\'$/, '')) }.compact
+        next if initial_extracted_terms.length.eql?(segment.split(' ').length)
         initial_extracted_terms.each do |ngram|
           ngram.split(/[\?\)\(\!\\\/\"\:\;\,]/).each do |t|
             next if !(t !~ /.*\d+.*/)

data/lib/confidential_info_redactor/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module ConfidentialInfoRedactor
-  VERSION = "0.0.14"
+  VERSION = "0.0.15"
 end

@@ -134,10 +134,15 @@ RSpec.describe ConfidentialInfoRedactor::Extractor do
         expect(described_class.new(text: text, language: 'en').extract).to eq([])
       end
-      it 'extracts the proper nouns from a text #015' do
+      it 'extracts the proper nouns from a text #016' do
         text = 'Corrigendum to Council Regulation (EC) No 85/2009 of 19 January 2009 amending Regulation (EC) No 1083/2006 laying down general provisions on the European Regional Development Fund, the European Social Fund and the Cohesion Fund concerning certain provisions relating to financial management'
         expect(described_class.new(text: text, language: 'en').extract).to eq(["Corrigendum"])
       end
+      it 'extracts the proper nouns from a text #017' do
+        text = 'John'
+        expect(described_class.new(text: text, language: 'en').extract).to eq([])
+      end
     end
     context 'German (de)' do

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: confidential_info_redactor
 version: !ruby/object:Gem::Version
-  version: 0.0.14
+  version: 0.0.15
 platform: ruby
 authors:
 - Kevin S. Dias