RubyGems - pdf-reader - Versions diffs - 2.11.0 → 2.12.0 - Mend

pdf-reader 2.11.0 → 2.12.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

checksums.yaml +4 -4
data/CHANGELOG +5 -0
data/lib/pdf/reader/buffer.rb +4 -5
data/lib/pdf/reader/cmap.rb +3 -3
data/lib/pdf/reader/encoding.rb +2 -3
data/lib/pdf/reader/font.rb +2 -2
data/lib/pdf/reader/lzw.rb +1 -1
data/lib/pdf/reader/object_hash.rb +1 -1
data/lib/pdf/reader/pages_strategy.rb +1 -1
data/lib/pdf/reader/parser.rb +1 -3
data/lib/pdf/reader/width_calculator/built_in.rb +1 -1
data/rbi/pdf-reader.rbi +1 -1
metadata +6 -6

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 2c84983c18d983798ff5f2ede514b540ee55a788229501976474b7341bf57fba
-  data.tar.gz: 79b8f092e72a194110062cf7d7e9425c0a6531e145009c9b7c10c2c072b3d1d5
+  metadata.gz: e3b00946c8b23b65d19ace187550b15bb3fd2537e518c778f4c12da28672c9d8
+  data.tar.gz: 4c2ebeb19dada9f257fa65c2add2f2f6d64f011cb13e997533a4b63fc81baa6d
 SHA512:
-  metadata.gz: '09c97a875bb46389172ed48ae8b2779ba3a8e032852b6a9943f187de13c23649e2398a5374358c62b64cf9e13bbf7f819bb5072d9aaa6882b9b94e96d23f5c13'
-  data.tar.gz: ed92250acee85f4e355785dd043f7774a5883550fe82b01b3cd9e10011f93a1fcdd500108b0e1f4e2af562bddd833c03ca601078b3eba8ee2e9990fd5e76305a
+  metadata.gz: 99c9ac879424056221f616d7f7299d03dfc9906c6b81c333ad255439780cf56d2dfc0c31a62347a7a163bcdb4075f8d0c914e2deeebb5d78e8ebc34e19cd7abc
+  data.tar.gz: 50ef8b5e1061dd1d6b24a7727b5537664bcb22473757274b4cc2b92c89b9ba5ea7516f055571f5c8b72d678f7cef549858631408c86a6984196ba7d1773daaca

data/CHANGELOG CHANGED Viewed

@@ -1,3 +1,8 @@
+v2.12.0 (26th December 2023)
+- Fix a sorbet method signature (http://github.com/yob/pdf-reader/pull/512)
+- Reduce allocations when parsing PDFs with hex strings (http://github.com/yob/pdf-reader/pull/528)
+- Fix text extraction of some rare unicode codepoints (http://github.com/yob/pdf-reader/pull/529)
 v2.11.0 (26th October 2022)
 - Various bug fixes
 - Expanded sorbet type annotations

data/lib/pdf/reader/buffer.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # coding: ASCII-8BIT
-# typed: strict
+# typed: true
 # frozen_string_literal: true
 ################################################################################
@@ -300,13 +300,12 @@ class PDF::Reader
     # we find a closing >
     #
     def prepare_hex_token
-      finished = :false
       str = "".dup
-      until finished == :true
+      loop do
         byte = @io.getbyte
         if byte.nil?
-          finished = :true # unbalanced params
+          break
         elsif (48..57).include?(byte) || (65..90).include?(byte) || (97..122).include?(byte)
           str << byte
         elsif byte <= 32
@@ -315,7 +314,7 @@ class PDF::Reader
           @tokens << str if str.size > 0
           @tokens << ">" if byte != 0x3E # '>'
           @tokens << byte.chr
-          finished = :true
+          break
         end
       end
     end

data/lib/pdf/reader/cmap.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # coding: utf-8
-# typed: strict
+# typed: true
 # frozen_string_literal: true
 ################################################################################
@@ -118,8 +118,8 @@ class PDF::Reader
       result = []
       while unpacked_string.any? do
         if unpacked_string.size >= 2 &&
-            unpacked_string.first.to_i > 0xD800 &&
-            unpacked_string.first.to_i < 0xDBFF
+            unpacked_string.first.to_i >= 0xD800 &&
+            unpacked_string.first.to_i <= 0xDBFF
           # this is a Unicode UTF-16 "Surrogate Pair" see Unicode Spec. Chapter 3.7
           # lets convert to a UTF-32. (the high bit is between 0xD800-0xDBFF, the
           # low bit is between 0xDC00-0xDFFF) for example: U+1D44E (U+D835 U+DC4E)

data/lib/pdf/reader/encoding.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # coding: utf-8
-# typed: strict
+# typed: true
 # frozen_string_literal: true
 ################################################################################
@@ -119,7 +119,7 @@ class PDF::Reader
     #     => [:A]
     #
     def int_to_name(glyph_code)
-      if @enc_name == "Identity-H" || @enc_name == "Identity-V"
+      if @enc_name == :"Identity-H" || @enc_name == :"Identity-V"
         []
       elsif differences[glyph_code]
         [differences[glyph_code]]
@@ -143,7 +143,6 @@ class PDF::Reader
         CONTROL_CHARS.include?(i) ? [i, UNKNOWN_CHAR] : [i,i]
       }
       mapping = Hash[tuples]
-      mapping[nil] = UNKNOWN_CHAR
       mapping
     end

data/lib/pdf/reader/font.rb CHANGED Viewed

@@ -82,8 +82,8 @@ class PDF::Reader
       glyph_width_in_glyph_space = glyph_width(code_point)
       if @subtype == :Type3
-        x1, y1 = font_matrix_transform(0,0)
-        x2, y2 = font_matrix_transform(glyph_width_in_glyph_space, 0)
+        x1, _y1 = font_matrix_transform(0,0)
+        x2, _y2 = font_matrix_transform(glyph_width_in_glyph_space, 0)
         (x2 - x1).abs.round(2)
       else
         glyph_width_in_glyph_space / 1000.0

data/lib/pdf/reader/lzw.rb CHANGED Viewed

@@ -42,7 +42,7 @@ module PDF
           while bits_left_in_chunk > 0 and @current_pos < @data.size
             chunk = 0 if chunk < 0
             codepoint = @data[@current_pos, 1].to_s.unpack("C*")[0].to_i
-            current_byte = codepoint & (2**@bits_left_in_byte - 1) #clear consumed bits
+            current_byte = codepoint & (2**@bits_left_in_byte - 1).to_i #clear consumed bits
             dif = bits_left_in_chunk - @bits_left_in_byte
             if dif > 0 then  current_byte <<= dif
             elsif dif < 0 then  current_byte >>= dif.abs

data/lib/pdf/reader/object_hash.rb CHANGED Viewed

@@ -612,7 +612,7 @@ class PDF::Reader
       if File.respond_to?(:binread)
         File.binread(input.to_s)
       else
-        File.open(input.to_s,"rb") { |f| f.read } || ""
+        File.open(input.to_s,"rb") { |f| f.read }
       end
     end

data/lib/pdf/reader/pages_strategy.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # coding: utf-8
-# typed: strict
+# typed: true
 # frozen_string_literal: true
 ################################################################################

data/lib/pdf/reader/parser.rb CHANGED Viewed

@@ -173,9 +173,7 @@ class PDF::Reader
       # add a missing digit if required, as required by the spec
       str << "0" unless str.size % 2 == 0
-      str.chars.each_slice(2).map { |nibbles|
-        nibbles.join("").hex.chr
-      }.join.force_encoding("binary")
+      [str].pack('H*')
     end
     ################################################################################
     # Reads a PDF String from the buffer and converts it to a Ruby String

data/lib/pdf/reader/width_calculator/built_in.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # coding: utf-8
-# typed: strict
+# typed: true
 # frozen_string_literal: true
 require 'afm'

data/rbi/pdf-reader.rbi CHANGED Viewed

@@ -842,7 +842,7 @@ module PDF
       sig { params(runs: T::Array[PDF::Reader::TextRun]).returns(T::Array[PDF::Reader::TextRun]) }
       def self.exclude_redundant_runs(runs); end
-      sig { params(sweep_line_status: T::Array[PDF::Reader::TextRun], event_point: EventPoint).returns(T::Boolean) }
+      sig { params(sweep_line_status: T::Array[PDF::Reader::TextRun], event_point: PDF::Reader::EventPoint).returns(T::Boolean) }
       def self.detect_intersection(sweep_line_status, event_point); end
     end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: pdf-reader
 version: !ruby/object:Gem::Version
-  version: 2.11.0
+  version: 2.12.0
 platform: ruby
 authors:
 - James Healy
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2022-10-26 00:00:00.000000000 Z
+date: 2023-12-26 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: rake
@@ -289,9 +289,9 @@ licenses:
 - MIT
 metadata:
   bug_tracker_uri: https://github.com/yob/pdf-reader/issues
-  changelog_uri: https://github.com/yob/pdf-reader/blob/v2.11.0/CHANGELOG
-  documentation_uri: https://www.rubydoc.info/gems/pdf-reader/2.11.0
-  source_code_uri: https://github.com/yob/pdf-reader/tree/v2.11.0
+  changelog_uri: https://github.com/yob/pdf-reader/blob/v2.12.0/CHANGELOG
+  documentation_uri: https://www.rubydoc.info/gems/pdf-reader/2.12.0
+  source_code_uri: https://github.com/yob/pdf-reader/tree/v2.12.0
 post_install_message:
 rdoc_options:
 - "--title"
@@ -312,7 +312,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
     - !ruby/object:Gem::Version
       version: '0'
 requirements: []
-rubygems_version: 3.2.32
+rubygems_version: 3.4.10
 signing_key:
 specification_version: 4
 summary: A library for accessing the content of PDF files