RubyGems - confidential_info_redactor_lite - Versions diffs - 0.0.20 → 0.0.21 - Mend

confidential_info_redactor_lite 0.0.20 → 0.0.21

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

checksums.yaml +4 -4
data/lib/confidential_info_redactor_lite/extractor.rb +9 -1
data/lib/confidential_info_redactor_lite/version.rb +1 -1
data/spec/confidential_info_redactor_lite/extractor_spec.rb +1 -1
data/spec/confidential_info_redactor_lite/redactor_spec.rb +1 -1
metadata +1 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: 536892192827f07c05d351d34ba72add5dc8b572
-  data.tar.gz: dd8caa21ae31b337c9d366e4b0dc792ee699d646
+  metadata.gz: 3f4f178e9f12c2b63b517cb83c476e4bba526f60
+  data.tar.gz: 3724ad4b679f8c56f27a23893d6a6b2e58f47d27
 SHA512:
-  metadata.gz: 8cf63069cb1f56353515eb0c0bb4d425c2d15749e119f1cb6477b3c4a456cd5742a52729be1a79fa71669d0e11665fa90aa7a3545f4c9ce0ba0529ce680ffac5
-  data.tar.gz: b22085b7813a3f3261711b6c5da379d5582fb6ae4d0b3eba0b2cfdb324abd3ee7c9a8218d61af5cf3e6a9e2bc2cd4993b9778be910731eccdf3febad6fd41f00
+  metadata.gz: 370acfe9773d924906cd8fc5bb133cab78d605ced79cdfd317dbc7fe78d441c138e1c9df93710b9e4e608487f3647e18c4e1dc4a009fed8ca79762e0afd4d2b6
+  data.tar.gz: 51eda51e3bb37741e950be881473335680c2269c08378a42a63e25fc8d632527c0351c72f4a114fab43c97dc963f39c677dc7a6a266c1e65472cba405fc45f5a

data/lib/confidential_info_redactor_lite/extractor.rb CHANGED Viewed

@@ -14,7 +14,15 @@ module ConfidentialInfoRedactorLite
       extracted_terms = []
       PragmaticSegmenter::Segmenter.new(text: text, language: language).segment.each do |segment|
         initial_extracted_terms = segment.gsub(EXTRACT_REGEX).map { |match| match unless corpus.include?(match.downcase.gsub(/[\?\.\)\(\!\\\/\"\:\;]/, '').gsub(/”/,'').gsub(/\'$/, '')) }.compact
-        next if initial_extracted_terms.length.eql?(segment.split(' ').length)
+        in_corpus = true
+        initial_extracted_terms.each do |ngram|
+          ngram.split(/[\?\)\(\!\\\/\"\:\;\,]/).each do |t|
+            unless corpus.include?(t.downcase.gsub(/[\?\)\(\!\\\/\"\:\;\,]/, '').gsub(/\'$/, '').gsub(/”/,'').gsub(/\.\z/, '').strip)
+              in_corpus = false
+            end
+          end
+        end
+        next if initial_extracted_terms.length.eql?(segment.split(' ').length) && in_corpus
         initial_extracted_terms.each do |ngram|
           ngram.split(/[\?\)\(\!\\\/\"\:\;\,]/).each do |t|
             next if !(t !~ /.*\d+.*/)

data/lib/confidential_info_redactor_lite/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module ConfidentialInfoRedactorLite
-  VERSION = "0.0.20"
+  VERSION = "0.0.21"
 end

data/spec/confidential_info_redactor_lite/extractor_spec.rb CHANGED Viewed

@@ -142,7 +142,7 @@ RSpec.describe ConfidentialInfoRedactorLite::Extractor do
       it 'extracts the proper nouns from a text #017' do
         text = 'John'
-        expect(described_class.new(text: text, corpus: corpus, language: 'en').extract).to eq([])
+        expect(described_class.new(text: text, corpus: corpus, language: 'en').extract).to eq(['John'])
       end
     end

data/spec/confidential_info_redactor_lite/redactor_spec.rb CHANGED Viewed

@@ -1,7 +1,7 @@
 require 'spec_helper'
 RSpec.describe ConfidentialInfoRedactorLite::Redactor do
-  let(:corpus) { ['i', 'in', 'you', 'top', 'so', 'are', 'december', 'please'] }
+  let(:corpus) { ['i', 'in', 'you', 'top', 'so', 'are', 'december', 'please', 'prizes'] }
   let(:en_dow) { %w(monday tuesday wednesday thursday friday saturday sunday) }
   let(:en_dow_abbr) { %w(mon tu tue tues wed th thu thur thurs fri sat sun) }
   let(:en_months) { %w(january february march april may june july august september october november december) }

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: confidential_info_redactor_lite
 version: !ruby/object:Gem::Version
-  version: 0.0.20
+  version: 0.0.21
 platform: ruby
 authors:
 - Kevin S. Dias