RubyGems - pura-webp - Versions diffs - 0.1.0 - Mend

pura-webp 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

checksums.yaml +7 -0
data/LICENSE +21 -0
data/README.md +76 -0
data/lib/pura/webp/bool_decoder.rb +97 -0
data/lib/pura/webp/decoder.rb +461 -0
data/lib/pura/webp/encoder.rb +434 -0
data/lib/pura/webp/image.rb +158 -0
data/lib/pura/webp/version.rb +7 -0
data/lib/pura/webp/vp8_tables.rb +495 -0
data/lib/pura-webp.rb +20 -0
metadata +79 -0

data/lib/pura/webp/encoder.rb ADDED Viewed

@@ -0,0 +1,434 @@
+# frozen_string_literal: true
+module Pura
+  module Webp
+    class Encoder
+      def self.encode(image, path, **_options)
+        encoder = new(image)
+        data = encoder.encode
+        File.binwrite(path, data)
+        data.bytesize
+      end
+      def initialize(image)
+        @image = image
+        @width = image.width
+        @height = image.height
+      end
+      def encode
+        vp8l_data = encode_vp8l
+        wrap_riff(vp8l_data)
+      end
+      private
+      def wrap_riff(vp8l_payload)
+        chunk = String.new(encoding: Encoding::BINARY)
+        chunk << "VP8L"
+        chunk << [vp8l_payload.bytesize].pack("V")
+        chunk << vp8l_payload
+        chunk << "\x00" if vp8l_payload.bytesize.odd?
+        riff = String.new(encoding: Encoding::BINARY)
+        riff << "RIFF"
+        riff << [4 + chunk.bytesize].pack("V")
+        riff << "WEBP"
+        riff << chunk
+        riff
+      end
+      def encode_vp8l
+        bw = BitWriter.new
+        # VP8L signature
+        bw.write_bits(0x2F, 8)
+        # Image descriptor: width-1 (14 bits), height-1 (14 bits), alpha (1 bit), version (3 bits)
+        bw.write_bits(@width - 1, 14)
+        bw.write_bits(@height - 1, 14)
+        bw.write_bits(0, 1)  # no alpha
+        bw.write_bits(0, 3)  # version 0
+        # No transforms
+        bw.write_bits(0, 1)
+        # --- Image Data (Section 5) ---
+        # Color cache: not used
+        bw.write_bits(0, 1)
+        # Meta huffman: not used (main image is "recursive" so this bit is needed)
+        bw.write_bits(0, 1)
+        # Collect pixels
+        pixels = @image.pixels
+        num_pixels = @width * @height
+        greens = Array.new(num_pixels)
+        reds = Array.new(num_pixels)
+        blues = Array.new(num_pixels)
+        num_pixels.times do |i|
+          offset = i * 3
+          reds[i] = pixels.getbyte(offset)
+          greens[i] = pixels.getbyte(offset + 1)
+          blues[i] = pixels.getbyte(offset + 2)
+        end
+        # Build histograms
+        green_hist = Array.new(280, 0)
+        red_hist = Array.new(256, 0)
+        blue_hist = Array.new(256, 0)
+        greens.each { |v| green_hist[v] += 1 }
+        reds.each { |v| red_hist[v] += 1 }
+        blues.each { |v| blue_hist[v] += 1 }
+        # Build huffman code lengths
+        green_lengths = build_huffman_lengths(green_hist, 280)
+        red_lengths = build_huffman_lengths(red_hist, 256)
+        blue_lengths = build_huffman_lengths(blue_hist, 256)
+        alpha_lengths = Array.new(256, 0)
+        alpha_lengths[255] = 1
+        dist_lengths = Array.new(40, 0)
+        # Write 5 huffman tables (all simple)
+        write_code_lengths(bw, green_lengths)
+        write_code_lengths(bw, red_lengths)
+        write_code_lengths(bw, blue_lengths)
+        write_code_lengths(bw, alpha_lengths)
+        write_code_lengths(bw, dist_lengths)
+        # Build actual codes
+        green_codes = canonical_codes(green_lengths)
+        red_codes = canonical_codes(red_lengths)
+        blue_codes = canonical_codes(blue_lengths)
+        alpha_codes = canonical_codes(alpha_lengths)
+        # Encode pixels
+        num_pixels.times do |i|
+          emit_code(bw, green_codes, greens[i])
+          emit_code(bw, red_codes, reds[i])
+          emit_code(bw, blue_codes, blues[i])
+          emit_code(bw, alpha_codes, 255)
+        end
+        bw.finish
+      end
+      # Quantize channel to 2 most frequent values
+      def quantize_channel(values, uniq)
+        # Find 2 most frequent
+        freq = Hash.new(0)
+        values.each { |v| freq[v] += 1 }
+        top2 = freq.sort_by { |_, c| -c }.first(2).map(&:first).sort
+        values.map do |v|
+          # Map to nearest of top2
+          if (v - top2[0]).abs <= (v - top2[1]).abs
+            top2[0]
+          else
+            top2[1]
+          end
+        end
+      end
+      # Build simple code lengths (1 or 2 symbols only)
+      def simple_lengths(uniq_values, max_symbols)
+        lengths = Array.new(max_symbols, 0)
+        if uniq_values.size == 1
+          lengths[uniq_values[0]] = 1
+        elsif uniq_values.size == 2
+          lengths[uniq_values[0]] = 1
+          lengths[uniq_values[1]] = 1
+        end
+        lengths
+      end
+      # Build huffman code lengths from histogram
+      def build_huffman_lengths(hist, max_symbols)
+        non_zero = []
+        hist.each_with_index { |c, s| non_zero << [c, s] if c > 0 }
+        lengths = Array.new(max_symbols, 0)
+        if non_zero.empty?
+          return lengths
+        elsif non_zero.size == 1
+          lengths[non_zero[0][1]] = 1
+          return lengths
+        end
+        # Build huffman tree
+        nodes = non_zero.sort_by { |c, _| c }.map { |c, s| { count: c, sym: s } }
+        while nodes.size > 1
+          a = nodes.shift
+          b = nodes.shift
+          parent = { count: a[:count] + b[:count], sym: nil, left: a, right: b }
+          idx = nodes.bsearch_index { |n| n[:count] >= parent[:count] } || nodes.size
+          nodes.insert(idx, parent)
+        end
+        # Extract lengths
+        assign_depth(nodes[0], 0, lengths)
+        # Enforce max length (15 for data, 7 for CL codes)
+        enforce_max_length(lengths, 15)
+        lengths
+      end
+      def assign_depth(node, depth, lengths)
+        if node[:left].nil?
+          lengths[node[:sym]] = [depth, 1].max
+        else
+          assign_depth(node[:left], depth + 1, lengths)
+          assign_depth(node[:right], depth + 1, lengths)
+        end
+      end
+      # Enforce max code length while maintaining valid prefix code
+      def enforce_max_length(lengths, max_len)
+        return if lengths.max.to_i <= max_len
+        # Collect non-zero lengths with symbols
+        syms = []
+        lengths.each_with_index { |l, s| syms << [l, s] if l > 0 }
+        return if syms.empty?
+        # Cap all lengths
+        syms.each { |pair| pair[0] = max_len if pair[0] > max_len }
+        # Verify Kraft inequality: sum of 2^(-l) <= 1
+        # Multiply by 2^max_len: sum of 2^(max_len - l) <= 2^max_len
+        kraft_limit = 1 << max_len
+        loop do
+          kraft_sum = syms.sum { |l, _| 1 << (max_len - l) }
+          break if kraft_sum <= kraft_limit
+          # Find the longest code and shorten it
+          syms.sort_by! { |l, _| -l }
+          # Take from longest, give to shorter
+          syms[0][0] -= 1 if syms[0][0] > 1
+        end
+        # Write back
+        lengths.fill(0)
+        syms.each { |l, s| lengths[s] = l }
+      end
+      # Build canonical huffman codes from lengths
+      def canonical_codes(lengths)
+        max_len = lengths.max || 0
+        return {} if max_len == 0
+        bl_count = Array.new(max_len + 1, 0)
+        lengths.each { |l| bl_count[l] += 1 if l > 0 }
+        next_code = Array.new(max_len + 1, 0)
+        code = 0
+        1.upto(max_len) do |bits|
+          code = (code + bl_count[bits - 1]) << 1
+          next_code[bits] = code
+        end
+        codes = {}
+        lengths.each_with_index do |len, sym|
+          next if len == 0
+          codes[sym] = [next_code[len], len]
+          next_code[len] += 1
+        end
+        codes
+      end
+      def emit_code(bw, codes, sym)
+        if codes.size <= 1
+          # Single-symbol simple code: 0 bits needed
+          return
+        end
+        entry = codes[sym]
+        return unless entry
+        code, len = entry
+        return if len == 0  # singleton in normal huffman
+        # VP8L: huffman codes written MSB first
+        len.times do |i|
+          bw.write_bits((code >> (len - 1 - i)) & 1, 1)
+        end
+      end
+      # Write code lengths to bitstream using the VP8L format
+      def write_code_lengths(bw, lengths)
+        # Find how many symbols we actually have
+        non_zero_count = lengths.count { |l| l > 0 }
+        non_zero_syms = []
+        lengths.each_with_index { |l, s| non_zero_syms << s if l > 0 }
+        if non_zero_count == 0
+          # Write simple code with 1 symbol (symbol 0)
+          bw.write_bits(1, 1)  # is_simple
+          bw.write_bits(0, 1)  # num_symbols - 1 = 0
+          bw.write_bits(0, 1)  # is_first_8bit = false (1-bit symbol)
+          bw.write_bits(0, 1)  # symbol = 0
+        elsif non_zero_count == 1
+          sym = non_zero_syms[0]
+          bw.write_bits(1, 1)   # is_simple
+          bw.write_bits(0, 1)   # num_symbols - 1 = 0
+          if sym < 2
+            bw.write_bits(0, 1)  # 1-bit symbol
+            bw.write_bits(sym, 1)
+          else
+            bw.write_bits(1, 1)  # 8-bit symbol
+            bw.write_bits(sym, 8)
+          end
+        elsif non_zero_count == 2
+          bw.write_bits(1, 1)   # is_simple
+          bw.write_bits(1, 1)   # num_symbols - 1 = 1 (2 symbols)
+          s0 = non_zero_syms[0]
+          s1 = non_zero_syms[1]
+          if s0 < 2
+            bw.write_bits(0, 1)  # 1-bit
+            bw.write_bits(s0, 1)
+          else
+            bw.write_bits(1, 1)  # 8-bit
+            bw.write_bits(s0, 8)
+          end
+          bw.write_bits(s1, 8)
+        else
+          write_normal_code_lengths(bw, lengths)
+        end
+      end
+      def write_normal_code_lengths(bw, lengths)
+        bw.write_bits(0, 1)  # is_simple = false
+        # Must cover all symbols in the alphabet (lengths.size)
+        # The decoder reads alphabet_size code lengths
+        num_symbols = lengths.size
+        # Code length alphabet: 0-15 literal lengths, 16=repeat, 17=zero run 3-10, 18=zero run 11-138
+        # VP8L code length code order
+        kCodeLengthCodeOrder = [17, 18, 0, 1, 2, 3, 4, 5, 16, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
+        # RLE encode the code lengths
+        rle = rle_encode(lengths, num_symbols)
+        # Build histogram of RLE symbols
+        cl_hist = Array.new(19, 0)
+        rle.each { |sym, _, _| cl_hist[sym] += 1 }
+        # Build code lengths for code length alphabet
+        cl_lengths = build_huffman_lengths(cl_hist, 19)
+        # Code length codes max length is 7 (stored in 3 bits)
+        enforce_max_length(cl_lengths, 7)
+        # Determine num_code_length_codes (at least 4)
+        num_cl = 4
+        kCodeLengthCodeOrder.each_with_index do |order_idx, i|
+          num_cl = i + 1 if cl_lengths[order_idx] > 0
+        end
+        num_cl = [num_cl, 4].max
+        bw.write_bits(num_cl - 4, 4)
+        # Write code length code lengths
+        num_cl.times do |i|
+          bw.write_bits(cl_lengths[kCodeLengthCodeOrder[i]], 3)
+        end
+        # Build codes for code length symbols
+        cl_codes = canonical_codes(cl_lengths)
+        # max_symbol flag: 0 = use default max_symbol
+        bw.write_bits(0, 1)
+        # Write the RLE-encoded code lengths
+        rle.each do |sym, extra_bits, extra_val|
+          emit_code(bw, cl_codes, sym)
+          case sym
+          when 16 then bw.write_bits(extra_val, 2)
+          when 17 then bw.write_bits(extra_val, 3)
+          when 18 then bw.write_bits(extra_val, 7)
+          end
+        end
+      end
+      def rle_encode(lengths, num_symbols)
+        result = []
+        i = 0
+        while i < num_symbols
+          val = lengths[i]
+          if val == 0
+            run = 0
+            run += 1 while i + run < num_symbols && lengths[i + run] == 0
+            i += run
+            while run > 0
+              if run >= 11
+                extra = [run - 11, 127].min
+                result << [18, 7, extra]
+                run -= 11 + extra
+              elsif run >= 3
+                extra = run - 3
+                result << [17, 3, extra]
+                run -= 3 + extra
+              else
+                result << [0, 0, 0]
+                run -= 1
+              end
+            end
+          else
+            result << [val, 0, 0]
+            i += 1
+            # Count repeats of same value
+            total_run = 0
+            total_run += 1 while i + total_run < num_symbols && lengths[i + total_run] == val
+            remaining = total_run
+            while remaining >= 3
+              extra = [remaining - 3, 3].min
+              result << [16, 2, extra]
+              remaining -= 3 + extra
+            end
+            remaining.times do
+              result << [val, 0, 0]
+            end
+            i += total_run
+          end
+        end
+        result
+      end
+      # Bit writer (LSB-first, VP8L format)
+      class BitWriter
+        def initialize
+          @data = String.new(encoding: Encoding::BINARY)
+          @current = 0
+          @bits = 0
+        end
+        def write_bits(value, num_bits)
+          num_bits.times do |i|
+            @current |= ((value >> i) & 1) << @bits
+            @bits += 1
+            flush_byte if @bits == 8
+          end
+        end
+        def finish
+          @data << (@current & 0xFF).chr if @bits > 0
+          @data
+        end
+        private
+        def flush_byte
+          @data << (@current & 0xFF).chr
+          @current = 0
+          @bits = 0
+        end
+      end
+    end
+  end
+end

data/lib/pura/webp/image.rb ADDED Viewed

@@ -0,0 +1,158 @@
+# frozen_string_literal: true
+module Pura
+  module Webp
+    class Image
+      attr_reader :width, :height, :pixels
+      def initialize(width, height, pixels)
+        @width = width
+        @height = height
+        @pixels = pixels.b
+        expected = width * height * 3
+        return if @pixels.bytesize == expected
+        raise ArgumentError, "pixel data size #{@pixels.bytesize} != expected #{expected} (#{width}x#{height}x3)"
+      end
+      def to_rgb_array
+        result = Array.new(width * height)
+        i = 0
+        offset = 0
+        while offset < @pixels.bytesize
+          result[i] = [@pixels.getbyte(offset), @pixels.getbyte(offset + 1), @pixels.getbyte(offset + 2)]
+          i += 1
+          offset += 3
+        end
+        result
+      end
+      def pixel_at(x, y)
+        raise IndexError, "coordinates out of bounds" if x.negative? || x >= @width || y.negative? || y >= @height
+        offset = ((y * @width) + x) * 3
+        [@pixels.getbyte(offset), @pixels.getbyte(offset + 1), @pixels.getbyte(offset + 2)]
+      end
+      def to_ppm
+        header = "P6\n#{@width} #{@height}\n255\n"
+        header.b + @pixels
+      end
+      def resize(new_width, new_height, interpolation: :bilinear)
+        raise ArgumentError, "width must be positive" unless new_width.positive?
+        raise ArgumentError, "height must be positive" unless new_height.positive?
+        if interpolation == :nearest
+          resize_nearest(new_width, new_height)
+        else
+          resize_bilinear(new_width, new_height)
+        end
+      end
+      def resize_fit(max_width, max_height, interpolation: :bilinear)
+        raise ArgumentError, "max_width must be positive" unless max_width.positive?
+        raise ArgumentError, "max_height must be positive" unless max_height.positive?
+        scale = [max_width.to_f / @width, max_height.to_f / @height].min
+        scale = [scale, 1.0].min
+        new_width = (@width * scale).round
+        new_height = (@height * scale).round
+        new_width = 1 if new_width < 1
+        new_height = 1 if new_height < 1
+        resize(new_width, new_height, interpolation: interpolation)
+      end
+      def resize_fill(fill_width, fill_height, interpolation: :bilinear)
+        raise ArgumentError, "width must be positive" unless fill_width.positive?
+        raise ArgumentError, "height must be positive" unless fill_height.positive?
+        scale = [fill_width.to_f / @width, fill_height.to_f / @height].max
+        scaled_w = (@width * scale).round
+        scaled_h = (@height * scale).round
+        scaled_w = 1 if scaled_w < 1
+        scaled_h = 1 if scaled_h < 1
+        scaled = resize(scaled_w, scaled_h, interpolation: interpolation)
+        crop_x = (scaled_w - fill_width) / 2
+        crop_y = (scaled_h - fill_height) / 2
+        scaled.crop(crop_x, crop_y, fill_width, fill_height)
+      end
+      def crop(x, y, w, h)
+        out = String.new(encoding: Encoding::BINARY, capacity: w * h * 3)
+        h.times do |row|
+          src_offset = (((y + row) * @width) + x) * 3
+          out << @pixels.byteslice(src_offset, w * 3)
+        end
+        Image.new(w, h, out)
+      end
+      private
+      def resize_nearest(new_width, new_height)
+        out = String.new(encoding: Encoding::BINARY, capacity: new_width * new_height * 3)
+        x_ratio = @width.to_f / new_width
+        y_ratio = @height.to_f / new_height
+        new_height.times do |y|
+          src_y = (y * y_ratio).to_i
+          src_y = @height - 1 if src_y >= @height
+          new_width.times do |x|
+            src_x = (x * x_ratio).to_i
+            src_x = @width - 1 if src_x >= @width
+            offset = ((src_y * @width) + src_x) * 3
+            out << @pixels.byteslice(offset, 3)
+          end
+        end
+        Image.new(new_width, new_height, out)
+      end
+      def resize_bilinear(new_width, new_height)
+        out = String.new(encoding: Encoding::BINARY, capacity: new_width * new_height * 3)
+        x_ratio = (@width - 1).to_f / [new_width - 1, 1].max
+        y_ratio = (@height - 1).to_f / [new_height - 1, 1].max
+        new_height.times do |y|
+          src_y = y * y_ratio
+          y0 = src_y.to_i
+          y1 = [y0 + 1, @height - 1].min
+          y_frac = src_y - y0
+          new_width.times do |x|
+            src_x = x * x_ratio
+            x0 = src_x.to_i
+            x1 = [x0 + 1, @width - 1].min
+            x_frac = src_x - x0
+            off00 = ((y0 * @width) + x0) * 3
+            off10 = ((y0 * @width) + x1) * 3
+            off01 = ((y1 * @width) + x0) * 3
+            off11 = ((y1 * @width) + x1) * 3
+            3.times do |c|
+              v00 = @pixels.getbyte(off00 + c)
+              v10 = @pixels.getbyte(off10 + c)
+              v01 = @pixels.getbyte(off01 + c)
+              v11 = @pixels.getbyte(off11 + c)
+              val = (v00 * (1 - x_frac) * (1 - y_frac)) +
+                    (v10 * x_frac * (1 - y_frac)) +
+                    (v01 * (1 - x_frac) * y_frac) +
+                    (v11 * x_frac * y_frac)
+              val = val.round
+              val = 0 if val.negative?
+              val = 255 if val > 255
+              out << val.chr
+            end
+          end
+        end
+        Image.new(new_width, new_height, out)
+      end
+    end
+  end
+end

data/lib/pura/webp/version.rb ADDED Viewed

@@ -0,0 +1,7 @@
+# frozen_string_literal: true
+module Pura
+  module Webp
+    VERSION = "0.1.0"
+  end
+end