RubyGems - omnizip - Versions diffs - 0.3.2 → 0.3.4 - Mend

omnizip 0.3.2 → 0.3.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (86) hide show

checksums.yaml +4 -4
data/.rubocop_todo.yml +243 -368
data/README.adoc +101 -5
data/docs/guides/archive-formats/index.adoc +31 -1
data/docs/guides/archive-formats/ole-format.adoc +316 -0
data/docs/guides/archive-formats/rpm-format.adoc +249 -0
data/docs/index.adoc +12 -2
data/lib/omnizip/algorithms/lzma/distance_coder.rb +29 -18
data/lib/omnizip/algorithms/lzma/encoder.rb +2 -1
data/lib/omnizip/algorithms/lzma/length_coder.rb +6 -3
data/lib/omnizip/algorithms/lzma/literal_decoder.rb +2 -1
data/lib/omnizip/algorithms/lzma/lzip_decoder.rb +40 -13
data/lib/omnizip/algorithms/lzma/range_decoder.rb +36 -2
data/lib/omnizip/algorithms/lzma/range_encoder.rb +19 -0
data/lib/omnizip/algorithms/lzma/xz_encoder_fast.rb +2 -1
data/lib/omnizip/algorithms/lzma/xz_utils_decoder.rb +148 -112
data/lib/omnizip/algorithms/lzma.rb +20 -5
data/lib/omnizip/algorithms/ppmd7/decoder.rb +25 -21
data/lib/omnizip/algorithms/ppmd7/encoder.rb +4 -11
data/lib/omnizip/algorithms/sevenzip_lzma2.rb +2 -1
data/lib/omnizip/algorithms/xz_lzma2.rb +2 -1
data/lib/omnizip/algorithms/zstandard/constants.rb +125 -9
data/lib/omnizip/algorithms/zstandard/decoder.rb +202 -17
data/lib/omnizip/algorithms/zstandard/encoder.rb +197 -17
data/lib/omnizip/algorithms/zstandard/frame/block.rb +128 -0
data/lib/omnizip/algorithms/zstandard/frame/header.rb +224 -0
data/lib/omnizip/algorithms/zstandard/fse/bitstream.rb +186 -0
data/lib/omnizip/algorithms/zstandard/fse/encoder.rb +325 -0
data/lib/omnizip/algorithms/zstandard/fse/table.rb +269 -0
data/lib/omnizip/algorithms/zstandard/huffman.rb +272 -0
data/lib/omnizip/algorithms/zstandard/huffman_encoder.rb +339 -0
data/lib/omnizip/algorithms/zstandard/literals.rb +178 -0
data/lib/omnizip/algorithms/zstandard/literals_encoder.rb +251 -0
data/lib/omnizip/algorithms/zstandard/sequences.rb +346 -0
data/lib/omnizip/buffer/memory_extractor.rb +3 -3
data/lib/omnizip/buffer.rb +2 -2
data/lib/omnizip/filters/delta.rb +2 -1
data/lib/omnizip/filters/registry.rb +6 -6
data/lib/omnizip/formats/cpio/bounded_io.rb +66 -0
data/lib/omnizip/formats/lzip.rb +2 -1
data/lib/omnizip/formats/lzma_alone.rb +2 -1
data/lib/omnizip/formats/ole/allocation_table.rb +244 -0
data/lib/omnizip/formats/ole/constants.rb +61 -0
data/lib/omnizip/formats/ole/dirent.rb +380 -0
data/lib/omnizip/formats/ole/header.rb +198 -0
data/lib/omnizip/formats/ole/ranges_io.rb +264 -0
data/lib/omnizip/formats/ole/storage.rb +305 -0
data/lib/omnizip/formats/ole/types/variant.rb +328 -0
data/lib/omnizip/formats/ole.rb +145 -0
data/lib/omnizip/formats/rar/compression/ppmd/decoder.rb +92 -49
data/lib/omnizip/formats/rar/compression/ppmd/encoder.rb +13 -20
data/lib/omnizip/formats/rar/rar5/compression/lzss.rb +6 -2
data/lib/omnizip/formats/rar3/reader.rb +6 -2
data/lib/omnizip/formats/rar5/reader.rb +4 -1
data/lib/omnizip/formats/rpm/constants.rb +58 -0
data/lib/omnizip/formats/rpm/entry.rb +102 -0
data/lib/omnizip/formats/rpm/header.rb +113 -0
data/lib/omnizip/formats/rpm/lead.rb +122 -0
data/lib/omnizip/formats/rpm/tag.rb +230 -0
data/lib/omnizip/formats/rpm.rb +434 -0
data/lib/omnizip/formats/seven_zip/bcj2_stream_decompressor.rb +239 -0
data/lib/omnizip/formats/seven_zip/coder_chain.rb +32 -8
data/lib/omnizip/formats/seven_zip/constants.rb +1 -1
data/lib/omnizip/formats/seven_zip/reader.rb +84 -8
data/lib/omnizip/formats/seven_zip/stream_compressor.rb +2 -1
data/lib/omnizip/formats/seven_zip/stream_decompressor.rb +6 -0
data/lib/omnizip/formats/seven_zip/writer.rb +21 -9
data/lib/omnizip/formats/seven_zip.rb +10 -0
data/lib/omnizip/formats/xar/entry.rb +18 -5
data/lib/omnizip/formats/xar/header.rb +34 -6
data/lib/omnizip/formats/xar/reader.rb +43 -10
data/lib/omnizip/formats/xar/toc.rb +34 -21
data/lib/omnizip/formats/xar/writer.rb +15 -5
data/lib/omnizip/formats/xz_impl/block_decoder.rb +45 -33
data/lib/omnizip/formats/xz_impl/block_encoder.rb +2 -1
data/lib/omnizip/formats/xz_impl/index_decoder.rb +3 -1
data/lib/omnizip/formats/xz_impl/stream_header_parser.rb +2 -1
data/lib/omnizip/formats/zip/end_of_central_directory.rb +4 -3
data/lib/omnizip/implementations/seven_zip/lzma/decoder.rb +14 -6
data/lib/omnizip/implementations/seven_zip/lzma/encoder.rb +2 -1
data/lib/omnizip/implementations/seven_zip/lzma2/encoder.rb +28 -13
data/lib/omnizip/implementations/xz_utils/lzma2/encoder.rb +13 -6
data/lib/omnizip/pipe/stream_compressor.rb +1 -1
data/lib/omnizip/version.rb +1 -1
data/readme-docs/compression-algorithms.adoc +6 -2
metadata +30 -2

data/lib/omnizip/formats/xar/writer.rb CHANGED Viewed

@@ -193,7 +193,12 @@ module Omnizip
               next if [".", ".."].include?(entry)
               child_path = File.join(path, entry)
-              child_archive_path = archive_path ? File.join(archive_path, entry) : entry
+              child_archive_path = if archive_path
+                                     File.join(archive_path,
+                                               entry)
+                                   else
+                                     entry
+                                   end
               add_tree(child_path, child_archive_path)
             end
           else
@@ -223,7 +228,8 @@ module Omnizip
             # Calculate and write TOC checksum
             file.pos
-            toc_checksum_data = compute_checksum(compressed_toc, @options[:toc_checksum])
+            toc_checksum_data = compute_checksum(compressed_toc,
+                                                 @options[:toc_checksum])
             file.write(toc_checksum_data)
             toc_checksum_size = toc_checksum_data.bytesize
@@ -269,7 +275,8 @@ module Omnizip
           return if data.nil? || data.empty?
           # Calculate extracted checksum
-          entry.extracted_checksum = compute_checksum_hex(data, @options[:file_checksum])
+          entry.extracted_checksum = compute_checksum_hex(data,
+                                                          @options[:file_checksum])
           entry.extracted_checksum_style = @options[:file_checksum]
           # Compress data
@@ -279,11 +286,14 @@ module Omnizip
           entry.data_size = data.bytesize
           # Calculate archived checksum
-          entry.archived_checksum = compute_checksum_hex(compressed, @options[:file_checksum])
+          entry.archived_checksum = compute_checksum_hex(compressed,
+                                                         @options[:file_checksum])
           entry.archived_checksum_style = @options[:file_checksum]
           # Add to heap
-          entry.data_offset = @heap_data.bytesize
+          # Data offset must account for TOC checksum at start of heap
+          checksum_size = CHECKSUM_SIZES[@options[:toc_checksum]] || 0
+          entry.data_offset = checksum_size + @heap_data.bytesize
           @heap_data << compressed
         end

data/lib/omnizip/formats/xz_impl/block_decoder.rb CHANGED Viewed

@@ -355,10 +355,10 @@ module Omnizip
           # XZ Utils: lzma_delta_props_decode sets opt->dist = props[0] + 1
           # So if props[0] = 0, distance = 1; if props[0] = 255, distance = 256
           distance = if properties&.bytesize&.positive?
-              (properties.getbyte(0) || 0) + 1
-            else
-              1
-            end
+                       (properties.getbyte(0) || 0) + 1
+                     else
+                       1
+                     end
           Omnizip::Filters::Delta.new(distance).decode(data, 0)
         end
@@ -383,19 +383,26 @@ module Omnizip
           # Use the appropriate BCJ filter based on architecture
           case architecture
           when :x86
-            Omnizip::Filters::BCJ.new(architecture: :x86).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :x86).decode(data,
+                                                                 start_offset)
           when :powerpc
-            Omnizip::Filters::BCJ.new(architecture: :powerpc).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :powerpc).decode(data,
+                                                                     start_offset)
           when :ia64
-            Omnizip::Filters::BCJ.new(architecture: :ia64).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :ia64).decode(data,
+                                                                  start_offset)
           when :arm
-            Omnizip::Filters::BCJ.new(architecture: :arm).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :arm).decode(data,
+                                                                 start_offset)
           when :armthumb
-            Omnizip::Filters::BCJ.new(architecture: :armthumb).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :armthumb).decode(data,
+                                                                      start_offset)
           when :sparc
-            Omnizip::Filters::BCJ.new(architecture: :sparc).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :sparc).decode(data,
+                                                                   start_offset)
           when :arm64
-            Omnizip::Filters::BCJ.new(architecture: :arm64).decode(data, start_offset)
+            Omnizip::Filters::BCJ.new(architecture: :arm64).decode(data,
+                                                                   start_offset)
           else
             raise Omnizip::FormatError,
                   "Unsupported BCJ architecture: #{architecture}"
@@ -429,7 +436,9 @@ module Omnizip
           if ENV["DEBUG_ARM64_BCJ"]
             puts "DEBUG ARM64 BCJ: start_offset=0x#{start_offset.to_s(16).upcase}"
             puts "DEBUG ARM64 BCJ: input (first 32 bytes):"
-            puts data[0, 32].unpack1("H*").scan(/../).each_slice(16).map { |row| row.join(" ") }.join("\n")
+            puts data[0, 32].unpack1("H*").scan(/../).each_slice(16).map { |row|
+              row.join(" ")
+            }.join("\n")
           end
           # XZ Utils ARM64 BCJ filter implementation
@@ -480,7 +489,10 @@ module Omnizip
           # DEBUG: Show output data
           if ENV["DEBUG_ARM64_BCJ"]
             puts "DEBUG ARM64 BCJ: output (first 32 bytes):"
-            puts result[0, 32].unpack1("H*").scan(/../).each_slice(16).map { |row| row.join(" ") }.join("\n")
+            puts result[0,
+                        32].unpack1("H*").scan(/../).each_slice(16).map { |row|
+              row.join(" ")
+            }.join("\n")
           end
           result
@@ -546,19 +558,19 @@ module Omnizip
           properties = lzma2_filter[:properties]
           dict_size = if properties&.bytesize&.positive?
-              prop = properties.getbyte(0)
-              if prop.even?
-                1 << ((prop / 2) + 12)
-              else
-                3 * (1 << (((prop - 1) / 2) + 11))
-              end
-            else
-              8 * 1024 * 1024 # 8MB default
-            end
+                        prop = properties.getbyte(0)
+                        if prop.even?
+                          1 << ((prop / 2) + 12)
+                        else
+                          3 * (1 << (((prop - 1) / 2) + 11))
+                        end
+                      else
+                        8 * 1024 * 1024 # 8MB default
+                      end
           # Create LZMA2 decoder with raw_mode for XZ format
           decoder = Omnizip::Implementations::XZUtils::LZMA2::Decoder.new(input_buffer,
-                                                            raw_mode: true)
+                                                                          raw_mode: true)
           # Set dict_size directly since we skipped property byte reading
           decoder.instance_variable_set(:@dict_size, dict_size)
@@ -601,19 +613,19 @@ module Omnizip
           # If prop is even: dict_size = 2^((prop/2) + 12)
           # If prop is odd: dict_size = 3 * 2^((prop-1)/2 + 11)
           dict_size = if properties&.bytesize&.positive?
-              prop = properties.getbyte(0)
-              if prop.even?
-                1 << ((prop / 2) + 12)
-              else
-                3 * (1 << (((prop - 1) / 2) + 11))
-              end
-            else
-              8 * 1024 * 1024 # 8MB default
-            end
+                        prop = properties.getbyte(0)
+                        if prop.even?
+                          1 << ((prop / 2) + 12)
+                        else
+                          3 * (1 << (((prop - 1) / 2) + 11))
+                        end
+                      else
+                        8 * 1024 * 1024 # 8MB default
+                      end
           # Create LZMA2 decoder with raw_mode for XZ format
           decoder = Omnizip::Implementations::XZUtils::LZMA2::Decoder.new(input_buffer,
-                                                            raw_mode: true)
+                                                                          raw_mode: true)
           # Set dict_size directly since we skipped property byte reading
           decoder.instance_variable_set(:@dict_size, dict_size)

data/lib/omnizip/formats/xz_impl/block_encoder.rb CHANGED Viewed

@@ -16,7 +16,8 @@ module Omnizip
         attr_reader :uncompressed_size, :compressed_size
-        def initialize(check_type: CHECK_CRC64, dict_size: 8 * 1024 * 1024, include_block_sizes: false)
+        def initialize(check_type: CHECK_CRC64, dict_size: 8 * 1024 * 1024,
+include_block_sizes: false)
           @check_type = check_type
           @dict_size = dict_size
           @uncompressed_size = 0

data/lib/omnizip/formats/xz_impl/index_decoder.rb CHANGED Viewed

@@ -139,7 +139,9 @@ module Omnizip
           # "Index Padding MUST contain only null bytes" (XZ spec Section 4.1)
           unless padding.bytes.all?(&:zero?)
             raise FormatError,
-                  "Index padding contains non-null bytes: #{padding.bytes.map { |b| '0x%02x' % b }.join(', ')}"
+                  "Index padding contains non-null bytes: #{padding.bytes.map do |b|
+                    '0x%02x' % b
+                  end.join(', ')}"
           end
           # Add padding to index data for CRC calculation

data/lib/omnizip/formats/xz_impl/stream_header_parser.rb CHANGED Viewed

@@ -85,7 +85,8 @@ module Omnizip
           # Validate check type (only 0, 1, 4, 10 are valid)
           unless [0, 1, 4, 10].include?(check_type)
-            raise FormatError, "Unsupported check type: #{check_type} (not supported)"
+            raise FormatError,
+                  "Unsupported check type: #{check_type} (not supported)"
           end
           # Verify CRC32 (bytes 8-11)

data/lib/omnizip/formats/zip/end_of_central_directory.rb CHANGED Viewed

@@ -117,9 +117,10 @@ module Omnizip
               eocd_data = buffer[i..]
               comment_length = eocd_data[20, 2].unpack1("v")
-              # Verify this is the actual EOCD by checking if comment length matches
-              if i + 22 + comment_length == buffer.size
-                return from_binary(eocd_data)
+              # Verify this is the actual EOCD by checking if comment length is reasonable
+              # Some ZIP tools add trailing data, so we check if comment fits within remaining buffer
+              if i + 22 + comment_length <= buffer.size
+                return from_binary(eocd_data[0, 22 + comment_length])
               end
             end
           end

data/lib/omnizip/implementations/seven_zip/lzma/decoder.rb CHANGED Viewed

@@ -74,7 +74,10 @@ module Omnizip
           # @return [String, Integer] Decompressed data or bytes written
           def decode_stream(output = nil, preserve_dict: false)
             @output_buffer = []
-            @dictionary = Array.new(@dict_size, 0) unless preserve_dict && @dictionary
+            unless preserve_dict && @dictionary
+              @dictionary = Array.new(@dict_size,
+                                      0)
+            end
             @dict_pos = 0
             @dict_full = false
@@ -309,7 +312,8 @@ module Omnizip
             if is_rep.zero?
               # Simple match
-              len = @length_coder.decode(@range_decoder, pos_state) + MATCH_LEN_MIN
+              len = @length_coder.decode(@range_decoder,
+                                         pos_state) + MATCH_LEN_MIN
               @state.update_match
               # Decode distance
@@ -358,14 +362,16 @@ module Omnizip
                 return [1, @reps[0]]
               end
-              len = @rep_length_coder.decode(@range_decoder, pos_state) + MATCH_LEN_MIN
+              len = @rep_length_coder.decode(@range_decoder,
+                                             pos_state) + MATCH_LEN_MIN
               @state.update_rep
               return [len, @reps[0]]
             end
             if @range_decoder.decode_bit(@is_rep1_models[@state.value]).zero?
               # Rep1
-              len = @rep_length_coder.decode(@range_decoder, pos_state) + MATCH_LEN_MIN
+              len = @rep_length_coder.decode(@range_decoder,
+                                             pos_state) + MATCH_LEN_MIN
               distance = @reps[1]
               @reps[1] = @reps[0]
               @reps[0] = distance
@@ -375,7 +381,8 @@ module Omnizip
             if @range_decoder.decode_bit(@is_rep2_models[@state.value]).zero?
               # Rep2
-              len = @rep_length_coder.decode(@range_decoder, pos_state) + MATCH_LEN_MIN
+              len = @rep_length_coder.decode(@range_decoder,
+                                             pos_state) + MATCH_LEN_MIN
               distance = @reps[2]
               @reps[2] = @reps[1]
               @reps[1] = @reps[0]
@@ -385,7 +392,8 @@ module Omnizip
             end
             # Rep3
-            len = @rep_length_coder.decode(@range_decoder, pos_state) + MATCH_LEN_MIN
+            len = @rep_length_coder.decode(@range_decoder,
+                                           pos_state) + MATCH_LEN_MIN
             distance = @reps[3]
             @reps[3] = @reps[2]
             @reps[2] = @reps[1]

data/lib/omnizip/implementations/seven_zip/lzma/encoder.rb CHANGED Viewed

@@ -151,7 +151,8 @@ module Omnizip
             raise ArgumentError, "lc must be 0-8" unless @lc.between?(0, 8)
             raise ArgumentError, "lp must be 0-4" unless @lp.between?(0, 4)
             raise ArgumentError, "pb must be 0-4" unless @pb.between?(0, 4)
-            raise ArgumentError, "level must be 0-9" unless @level.between?(0, 9)
+            raise ArgumentError, "level must be 0-9" unless @level.between?(0,
+                                                                            9)
             return if @dict_size.between?(DICT_SIZE_MIN, DICT_SIZE_MAX)
             raise ArgumentError, "Invalid dictionary size"

data/lib/omnizip/implementations/seven_zip/lzma2/encoder.rb CHANGED Viewed

@@ -83,7 +83,8 @@ module Omnizip
             @dictionary = Omnizip::Algorithms::LZMA::Dictionary.new(dict_size)
             @state = Omnizip::Algorithms::LZMA::LZMAState.new(0)
-            @models = Omnizip::Algorithms::LZMA::XzProbabilityModels.new(lc, lp, pb)
+            @models = Omnizip::Algorithms::LZMA::XzProbabilityModels.new(lc,
+                                                                         lp, pb)
             @match_finder = Omnizip::Algorithms::LZMA::MatchFinder.new(@dictionary)
             @optimal = Omnizip::Algorithms::LZMA::OptimalEncoder.new(mode: :fast)
@@ -209,7 +210,9 @@ module Omnizip
             # Initialize hash table
             match_len_max = 2
-            end_pos = [@dictionary.buffer.bytesize + data.bytesize - match_len_max, 0].max
+            end_pos = [
+              @dictionary.buffer.bytesize + data.bytesize - match_len_max, 0
+            ].max
             @match_finder.skip(end_pos)
             # Position in match finder's buffer for encoding
@@ -245,7 +248,8 @@ module Omnizip
                 pos += length
               else
                 actual_distance = distance - REPS
-                encode_match(actual_distance, length, encoder, pos, match_pos, data)
+                encode_match(actual_distance, length, encoder, pos, match_pos,
+                             data)
                 pos += length
               end
             end
@@ -270,7 +274,8 @@ module Omnizip
             encoder.encode_symbols(temp_buffer, out_pos, 10000)
             if out_pos.value.positive?
-              output.write(StringCompat.byteslice(temp_buffer, 0, out_pos.value))
+              output.write(StringCompat.byteslice(temp_buffer, 0,
+                                                  out_pos.value))
             end
             output.size - size_before
@@ -309,7 +314,8 @@ module Omnizip
               if match_byte.nil?
                 encode_normal_literal(literal_offset, symbol, encoder)
               else
-                encode_matched_literal(literal_offset, match_byte, symbol, encoder)
+                encode_matched_literal(literal_offset, match_byte, symbol,
+                                       encoder)
               end
             else
               encode_normal_literal(literal_offset, symbol, encoder)
@@ -319,7 +325,8 @@ module Omnizip
           end
           # Encode normal match
-          def encode_match(distance, length, encoder, pos, match_pos, _input_data)
+          def encode_match(distance, length, encoder, pos, match_pos,
+_input_data)
             pos_state = pos & ((1 << @pb) - 1)
             prob_is_match = @models.is_match[@state.value][pos_state]
@@ -408,7 +415,8 @@ module Omnizip
             end
           end
-          def encode_matched_literal(literal_offset, match_byte, symbol, encoder)
+          def encode_matched_literal(literal_offset, match_byte, symbol,
+encoder)
             offset = 0x100
             symbol += 0x100
@@ -418,7 +426,9 @@ module Omnizip
               subcoder_index = offset + match_bit + (symbol >> 8)
               bit = (symbol >> 7) & 1
-              encoder.queue_bit(@models.literal[literal_offset + subcoder_index], bit)
+              encoder.queue_bit(
+                @models.literal[literal_offset + subcoder_index], bit
+              )
               symbol <<= 1
               offset &= ~(match_byte ^ symbol)
@@ -430,15 +440,18 @@ module Omnizip
             if len < 8
               encoder.queue_bit(@models.match_len_encoder.choice, 0)
-              encode_bittree(@models.match_len_encoder.low[pos_state], 3, len, encoder)
+              encode_bittree(@models.match_len_encoder.low[pos_state], 3, len,
+                             encoder)
             elsif len < 16
               encoder.queue_bit(@models.match_len_encoder.choice, 1)
               encoder.queue_bit(@models.match_len_encoder.choice2, 0)
-              encode_bittree(@models.match_len_encoder.mid[pos_state], 3, len - 8, encoder)
+              encode_bittree(@models.match_len_encoder.mid[pos_state], 3,
+                             len - 8, encoder)
             else
               encoder.queue_bit(@models.match_len_encoder.choice, 1)
               encoder.queue_bit(@models.match_len_encoder.choice2, 1)
-              encode_bittree(@models.match_len_encoder.high, 8, len - 16, encoder)
+              encode_bittree(@models.match_len_encoder.high, 8, len - 16,
+                             encoder)
             end
           end
@@ -454,12 +467,14 @@ module Omnizip
               dist_reduced = distance - base
               if dist_slot < 14
-                encode_bittree_reverse(@models.dist_special, dist_reduced, footer_bits, base - dist_slot - 1, encoder)
+                encode_bittree_reverse(@models.dist_special, dist_reduced,
+                                       footer_bits, base - dist_slot - 1, encoder)
               else
                 direct_bits = footer_bits - 4
                 encoder.queue_direct_bits(dist_reduced >> 4, direct_bits)
                 align_mask = (1 << 4) - 1
-                encode_bittree_reverse(@models.dist_align, dist_reduced & align_mask, 4, 0, encoder)
+                encode_bittree_reverse(@models.dist_align,
+                                       dist_reduced & align_mask, 4, 0, encoder)
               end
             end
           end

data/lib/omnizip/implementations/xz_utils/lzma2/encoder.rb CHANGED Viewed

@@ -97,7 +97,8 @@ module Omnizip
             # Shared state across all chunks
             @dictionary = Omnizip::Algorithms::LZMA::Dictionary.new(dict_size)
             @state = Omnizip::Algorithms::LZMA::LZMAState.new(0)
-            @models = Omnizip::Algorithms::LZMA::XzProbabilityModels.new(lc, lp, pb)
+            @models = Omnizip::Algorithms::LZMA::XzProbabilityModels.new(lc,
+                                                                         lp, pb)
             @match_finder = Omnizip::Algorithms::LZMA::MatchFinder.new(@dictionary)
             @optimal = Omnizip::Algorithms::LZMA::OptimalEncoder.new(mode: :fast)
@@ -234,7 +235,9 @@ module Omnizip
             # We skip to position (start_pos + data.bytesize - MATCH_LEN_MAX),
             # but ensure we don't go negative for small inputs
             match_len_max = 2 # Minimum match length in LZMA2
-            end_pos = [@dictionary.buffer.bytesize + data.bytesize - match_len_max, 0].max
+            end_pos = [
+              @dictionary.buffer.bytesize + data.bytesize - match_len_max, 0
+            ].max
             @match_finder.skip(end_pos)
             # Position in match finder's buffer for encoding
@@ -331,7 +334,8 @@ module Omnizip
               # Use StringCompat.byteslice for Ruby 3.0-3.1 compatibility
               # Ruby's [] operator has a bug with null bytes that can return extra bytes
               # See: https://bugs.ruby-lang.org/issues/15985
-              output.write(StringCompat.byteslice(temp_buffer, 0, out_pos.value))
+              output.write(StringCompat.byteslice(temp_buffer, 0,
+                                                  out_pos.value))
             end
             # Return the number of bytes written
@@ -358,7 +362,8 @@ module Omnizip
               # Use StringCompat.byteslice for Ruby 3.0-3.1 compatibility
               # Ruby's [] operator has a bug with null bytes that can return extra bytes
               # See: https://bugs.ruby-lang.org/issues/15985
-              output.write(StringCompat.byteslice(temp_buffer, 0, out_pos.value))
+              output.write(StringCompat.byteslice(temp_buffer, 0,
+                                                  out_pos.value))
             end
             # Return the number of bytes written
@@ -410,7 +415,8 @@ module Omnizip
           end
           # Encode normal match
-          def encode_match(distance, length, encoder, pos, match_pos, _input_data)
+          def encode_match(distance, length, encoder, pos, match_pos,
+_input_data)
             pos_state = pos & ((1 << @pb) - 1)
             # Encode is_match bit (1 for match) - uses OLD state value
@@ -554,7 +560,8 @@ module Omnizip
           # @param match_byte [Integer] The match byte to compare against
           # @param symbol [Integer] The literal byte to encode (0-255)
           # @param encoder [XZBufferedRangeEncoder] The range encoder
-          def encode_matched_literal(literal_offset, match_byte, symbol, encoder)
+          def encode_matched_literal(literal_offset, match_byte, symbol,
+encoder)
             offset = 0x100
             symbol += 0x100 # Start symbol at 256 (XZ Utils algorithm)

data/lib/omnizip/pipe/stream_compressor.rb CHANGED Viewed

@@ -60,7 +60,7 @@ module Omnizip
         case @format
         when :zip
           compress_zip
-        when :seven_zip, :'7z'
+        when :seven_zip, :"7z"
           compress_7z
         else
           raise ArgumentError, "Unsupported format: #{@format}"

data/lib/omnizip/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # frozen_string_literal: true
 module Omnizip
-  VERSION = "0.3.2"
+  VERSION = "0.3.4"
 end

data/readme-docs/compression-algorithms.adoc CHANGED Viewed

@@ -290,7 +290,11 @@ deflate64.compress(input, output)
 Zstandard (zstd) offers fast compression with good ratios, using a modern LZ77-based algorithm. It's designed to provide a good balance between compression ratio and speed.
-**Note:** Current implementation uses the zstd-ruby gem. A pure Ruby implementation is planned for full portability.
+**Implementation:** Pure Ruby implementation (RFC 8878 compliant). Supports:
+- Raw blocks (uncompressed)
+- RLE blocks (run-length encoding for repetitive data)
+- Frame/block decoding
+- Huffman/FSE compression infrastructure (encoder implemented, decoder in progress)
 === Characteristics
@@ -310,7 +314,7 @@ Zstandard (zstd) offers fast compression with good ratios, using a modern LZ77-b
 **Not Ideal For:**
 * Maximum compression needs (use LZMA instead)
-* Environments requiring pure Ruby (until pure Ruby implementation is complete)
+* General-purpose compression (Huffman/FSE decoder not complete)
 === Compression Levels

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: omnizip
 version: !ruby/object:Gem::Version
-  version: 0.3.2
+  version: 0.3.4
 platform: ruby
 authors:
 - Ribose Inc.
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2026-02-19 00:00:00.000000000 Z
+date: 2026-02-20 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: base64
@@ -145,8 +145,10 @@ files:
 - docs/guides/advanced-features/streaming.adoc
 - docs/guides/archive-formats/gzip-format.adoc
 - docs/guides/archive-formats/index.adoc
+- docs/guides/archive-formats/ole-format.adoc
 - docs/guides/archive-formats/rar-format.adoc
 - docs/guides/archive-formats/rar5.adoc
+- docs/guides/archive-formats/rpm-format.adoc
 - docs/guides/archive-formats/seven-zip-format.adoc
 - docs/guides/archive-formats/tar-format.adoc
 - docs/guides/archive-formats/xz-format.adoc
@@ -265,6 +267,16 @@ files:
 - lib/omnizip/algorithms/zstandard/constants.rb
 - lib/omnizip/algorithms/zstandard/decoder.rb
 - lib/omnizip/algorithms/zstandard/encoder.rb
+- lib/omnizip/algorithms/zstandard/frame/block.rb
+- lib/omnizip/algorithms/zstandard/frame/header.rb
+- lib/omnizip/algorithms/zstandard/fse/bitstream.rb
+- lib/omnizip/algorithms/zstandard/fse/encoder.rb
+- lib/omnizip/algorithms/zstandard/fse/table.rb
+- lib/omnizip/algorithms/zstandard/huffman.rb
+- lib/omnizip/algorithms/zstandard/huffman_encoder.rb
+- lib/omnizip/algorithms/zstandard/literals.rb
+- lib/omnizip/algorithms/zstandard/literals_encoder.rb
+- lib/omnizip/algorithms/zstandard/sequences.rb
 - lib/omnizip/buffer.rb
 - lib/omnizip/buffer/memory_archive.rb
 - lib/omnizip/buffer/memory_extractor.rb
@@ -344,6 +356,7 @@ files:
 - lib/omnizip/formats/.keep
 - lib/omnizip/formats/bzip2_file.rb
 - lib/omnizip/formats/cpio.rb
+- lib/omnizip/formats/cpio/bounded_io.rb
 - lib/omnizip/formats/cpio/constants.rb
 - lib/omnizip/formats/cpio/entry.rb
 - lib/omnizip/formats/cpio/reader.rb
@@ -362,6 +375,14 @@ files:
 - lib/omnizip/formats/iso/writer.rb
 - lib/omnizip/formats/lzip.rb
 - lib/omnizip/formats/lzma_alone.rb
+- lib/omnizip/formats/ole.rb
+- lib/omnizip/formats/ole/allocation_table.rb
+- lib/omnizip/formats/ole/constants.rb
+- lib/omnizip/formats/ole/dirent.rb
+- lib/omnizip/formats/ole/header.rb
+- lib/omnizip/formats/ole/ranges_io.rb
+- lib/omnizip/formats/ole/storage.rb
+- lib/omnizip/formats/ole/types/variant.rb
 - lib/omnizip/formats/rar.rb
 - lib/omnizip/formats/rar/archive_repairer.rb
 - lib/omnizip/formats/rar/archive_verifier.rb
@@ -422,7 +443,14 @@ files:
 - lib/omnizip/formats/rar5/decompressor.rb
 - lib/omnizip/formats/rar5/reader.rb
 - lib/omnizip/formats/rar5/writer.rb
+- lib/omnizip/formats/rpm.rb
+- lib/omnizip/formats/rpm/constants.rb
+- lib/omnizip/formats/rpm/entry.rb
+- lib/omnizip/formats/rpm/header.rb
+- lib/omnizip/formats/rpm/lead.rb
+- lib/omnizip/formats/rpm/tag.rb
 - lib/omnizip/formats/seven_zip.rb
+- lib/omnizip/formats/seven_zip/bcj2_stream_decompressor.rb
 - lib/omnizip/formats/seven_zip/coder_chain.rb
 - lib/omnizip/formats/seven_zip/constants.rb
 - lib/omnizip/formats/seven_zip/encoded_header.rb