RubyGems - act_as_page_extractor - Versions diffs - 0.6.3 → 0.6.4 - Mend

act_as_page_extractor 0.6.3 → 0.6.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

checksums.yaml +4 -4
data/Gemfile +2 -0
data/Gemfile.lock +7 -4
data/act_as_page_extractor.gemspec +1 -1
data/lib/act_as_page_extractor/modules/extracting.rb +8 -1
data/lib/act_as_page_extractor/modules/interface.rb +1 -1
data/lib/act_as_page_extractor/version.rb +1 -1
data/lib/act_as_page_extractor.rb +2 -2
data/spec/act_as_page_extractor_spec.rb +13 -13
data/test/Oscar_Wilde_The_Happy_Prince_en.doc +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.docx +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.docx.7z +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.docx.rar +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.docx.zip +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.html +395 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.odt +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.pdf +0 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.rtf +257 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.txt +79 -0
data/test/Oscar_Wilde_The_Happy_Prince_en.wrong +0 -0
metadata +26 -26
data/test/test-doc-3-pages.doc +0 -0
data/test/test-doc-3-pages.docx +0 -0
data/test/test-doc-3-pages.docx.7z +0 -0
data/test/test-doc-3-pages.docx.rar +0 -0
data/test/test-doc-3-pages.docx.zip +0 -0
data/test/test-doc-3-pages.html +0 -279
data/test/test-doc-3-pages.odt +0 -0
data/test/test-doc-3-pages.pdf +0 -0
data/test/test-doc-3-pages.rtf +0 -339
data/test/test-doc-3-pages.txt +0 -125
data/test/test-doc-3-pages.wrong +0 -0

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 9c4528cd1633b4691d46d7cef1eac6b66c986bfd3ebdebedec786b01bab0f0e6
-  data.tar.gz: 05b6967bb2092e17fefca9923614a3b16fae9e5dc3bfd5caf91a16f4e93b6d57
+  metadata.gz: f412c60bccb3fca934efecbc7922af07b41297423e6a2c4fbe04b8110a0e22e8
+  data.tar.gz: 4b281d9c93de0955e90b1a9d500213b1fa7103c449d72354caaa3d5d29702ff5
 SHA512:
-  metadata.gz: 1ea4ba52c2cfc10c21ca3ca82791af40689140de14ce56781859e6cee6ce538d8c8ad9c9b64f2acb39f0fce4848ca548395f3442146d2e1b4e7f4711f2f0c801
-  data.tar.gz: 3cfbd8aef08741aceaf34103bdfbeb45ddbf9b34d863e9daf92f2d9a7c1636577cc265770cfd318287d0b77dacfb896c5c2d68923ed65393c250246f29053e3d
+  metadata.gz: b545143db8d5fd51fb4c5c3d95d76b8122576e26e6587bb0b8c1ec62303e7e7bc5509554132ba9e65d47294fd2fa7c803a01634529c8e4ca8ecf9d0b3f1a392c
+  data.tar.gz: 3ff648cca05fe842e97db5e5153399bcfcd34f98141cd47ad5ca511de588de67c080778b643cba9be372178a6d6fc497552082bece168d3e10be6788382c8426

data/Gemfile CHANGED Viewed

@@ -3,6 +3,8 @@ source 'https://rubygems.org'
 # Specify your gem's dependencies in total_compressor.gemspec
 gemspec
+ruby '>= 3.2'
 gem 'activerecord', '~> 6'
 gem 'awesome_print'

data/Gemfile.lock CHANGED Viewed

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    act_as_page_extractor (0.6.1)
+    act_as_page_extractor (0.6.4)
       activerecord (~> 6)
       awesome_print (~> 1)
       docsplit (~> 0)
@@ -80,13 +80,13 @@ GEM
     zeitwerk (2.6.17)
 PLATFORMS
-  ruby
+  x86_64-linux
 DEPENDENCIES
   act_as_page_extractor!
   activerecord (~> 6)
   awesome_print
-  bundler (~> 1)
+  bundler (~> 2)
   byebug
   docsplit
   filesize
@@ -98,5 +98,8 @@ DEPENDENCIES
   simplecov
   total_compressor
+RUBY VERSION
+   ruby 3.2.0p0
 BUNDLED WITH
-   1.17.3
+   2.4.1

data/act_as_page_extractor.gemspec CHANGED Viewed

@@ -17,7 +17,7 @@ Gem::Specification.new do |spec|
   spec.test_files    = spec.files.grep(%r{^(test|spec|features)/})
   spec.require_paths = ['lib']
-  spec.add_development_dependency 'bundler',   '~> 1'
+  spec.add_development_dependency 'bundler',   '~> 2'
   spec.add_development_dependency 'rake',      '~> 12', '>= 12.3.3'
   spec.add_development_dependency 'byebug',    '~> 0'
   spec.add_development_dependency 'rspec',     '~> 0'

data/lib/act_as_page_extractor/modules/extracting.rb CHANGED Viewed

@@ -1,3 +1,10 @@
+# Fix: https://github.com/documentcloud/docsplit/pull/159
+class File
+  class << self
+    alias_method :exists?, :exist?
+  end
+end
 module ActAsPageExtractor
   def extract_pages
     convert_to_pdf
@@ -10,7 +17,7 @@ module ActAsPageExtractor
      else
       if timeout_wrapper{ Docsplit.extract_pdf(@document_path, output: @tmp_dir)}
         pdf_path = (@document_path.split('.')[0..-2] + ['pdf']).join('.')
-        pdf_path if File.exists?(pdf_path)
+        pdf_path if File.exist?(pdf_path)
       end
     end
   end

data/lib/act_as_page_extractor/modules/interface.rb CHANGED Viewed

@@ -10,7 +10,7 @@ module ActAsPageExtractor
   end
   def remove_files
-    FileUtils::rm_rf(pdf_path) if File.exists?(pdf_path.to_s)
+    FileUtils::rm_rf(pdf_path) if File.exist?(pdf_path.to_s)
   end
   def self.start_extraction

data/lib/act_as_page_extractor/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # :nocov:
 module ActAsPageExtractor
-  VERSION = "0.6.3"
+  VERSION = "0.6.4"
 end
 # :nocov:

data/lib/act_as_page_extractor.rb CHANGED Viewed

@@ -85,13 +85,13 @@ module ActAsPageExtractor
   def create_pdf_dir
     if save_as_pdf
-      FileUtils::mkdir_p(pdf_storage) unless File.exists?(pdf_storage)
+      FileUtils::mkdir_p(pdf_storage) unless File.exist?(pdf_storage)
     end
   end
   def create_tmp_dir
     @tmp_dir = "#{TMP_EXTRACTION_FILE_STORAGE}/#{SecureRandom.hex(6)}"
-    FileUtils::mkdir_p(@tmp_dir) unless File.exists?(@tmp_dir)
+    FileUtils::mkdir_p(@tmp_dir) unless File.exist?(@tmp_dir)
   end
   def copy_document

data/spec/act_as_page_extractor_spec.rb CHANGED Viewed

@@ -4,24 +4,24 @@ require 'act_as_page_extractor'
 describe ActAsPageExtractor do
   context 'correct extraction' do
     [
-      'test-doc-3-pages.docx',
-      'test-doc-3-pages.doc',
-      'test-doc-3-pages.pdf',
-      'test-doc-3-pages.rtf',
-      'test-doc-3-pages.odt',
-      'test-doc-3-pages.html',
-      'test-doc-3-pages.txt',
-      'test-doc-3-pages.docx.zip',
-      'test-doc-3-pages.docx.rar',
-      'test-doc-3-pages.docx.7z'
+      'Oscar_Wilde_The_Happy_Prince_en.docx',
+      'Oscar_Wilde_The_Happy_Prince_en.doc',
+      'Oscar_Wilde_The_Happy_Prince_en.pdf',
+      'Oscar_Wilde_The_Happy_Prince_en.rtf',
+      'Oscar_Wilde_The_Happy_Prince_en.odt',
+      'Oscar_Wilde_The_Happy_Prince_en.html',
+      'Oscar_Wilde_The_Happy_Prince_en.txt',
+      'Oscar_Wilde_The_Happy_Prince_en.docx.zip',
+      'Oscar_Wilde_The_Happy_Prince_en.docx.rar',
+      'Oscar_Wilde_The_Happy_Prince_en.docx.7z'
     ].each do |document|
       it "extraction valid document #{document}" do
         book = Book.new({doc_path: document})
         allow(Book).to receive_message_chain('where') { [book] }
         ActAsPageExtractor.start_extraction
         expect(book.page_extraction_state).to eq ActAsPageExtractor::EXTRACTING_STATES[:extracted]
-        expect(ExtractedPage.array.count).to eq 3
-        expect(ExtractedPage.array[0][:page]).to match /require \'act_as_page_extractor\/modules\/interface\'/
+        expect(ExtractedPage.array.count).to eq 4
+        expect(ExtractedPage.array[0][:page]).to match /on a tall column, stood the statue of the Happy Prince/
         unless document.match /pdf/
           expect(book.pdf_path).to match /pdf/
           expect(book.remove_files.count).to eq 1
@@ -33,7 +33,7 @@ describe ActAsPageExtractor do
   context 'incorrect extraction' do
     [
-      'test-doc-3-pages.wrong',
+      'Oscar_Wilde_The_Happy_Prince_en.wrong',
     ].each do |document|
       it "extraction invalid document #{document}" do
         book = Book.new({doc_path: document})

data/test/Oscar_Wilde_The_Happy_Prince_en.doc ADDED Viewed

Binary file

data/test/Oscar_Wilde_The_Happy_Prince_en.docx ADDED Viewed

Binary file

data/test/Oscar_Wilde_The_Happy_Prince_en.docx.7z ADDED Viewed

Binary file

data/test/Oscar_Wilde_The_Happy_Prince_en.docx.rar ADDED Viewed

Binary file

data/test/Oscar_Wilde_The_Happy_Prince_en.docx.zip ADDED Viewed

Binary file