RubyGems - parquet - Versions diffs - 0.0.5 → 0.2.5 - Mend

parquet 0.0.5 → 0.2.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (20) hide show

checksums.yaml +4 -4
data/Cargo.lock +50 -0
data/README.md +92 -2
data/ext/parquet/Cargo.toml +1 -0
data/ext/parquet/src/lib.rs +5 -3
data/ext/parquet/src/{reader.rs → reader/mod.rs} +5 -2
data/ext/parquet/src/types/core_types.rs +73 -0
data/ext/parquet/src/types/mod.rs +30 -0
data/ext/parquet/src/types/parquet_value.rs +458 -0
data/ext/parquet/src/types/record_types.rs +204 -0
data/ext/parquet/src/types/timestamp.rs +85 -0
data/ext/parquet/src/types/type_conversion.rs +753 -0
data/ext/parquet/src/types/writer_types.rs +270 -0
data/ext/parquet/src/writer/mod.rs +403 -0
data/lib/parquet/version.rb +1 -1
data/lib/parquet.rbi +33 -2
metadata +13 -6
data/ext/parquet/src/types.rs +0 -763
/data/ext/parquet/src/{parquet_column_reader.rs → reader/parquet_column_reader.rs} +0 -0
/data/ext/parquet/src/{parquet_row_reader.rs → reader/parquet_row_reader.rs} +0 -0

data/lib/parquet.rbi CHANGED Viewed

@@ -1,4 +1,5 @@
 # typed: strict
 module Parquet
   # Options:
   #   - `input`: String, File, or IO object containing parquet data
@@ -12,7 +13,7 @@ module Parquet
       result_type: T.nilable(T.any(String, Symbol)),
       columns: T.nilable(T::Array[String]),
       blk: T.nilable(T.proc.params(row: T.any(T::Hash[String, T.untyped], T::Array[T.untyped])).void)
-    ).returns(T.any(Enumerator, NilClass))
+    ).returns(T.any(T::Enumerator[T.any(T::Hash[String, T.untyped], T::Array[T.untyped])], NilClass))
   end
   def self.each_row(input, result_type: nil, columns: nil, &blk)
   end
@@ -31,8 +32,38 @@ module Parquet
       batch_size: T.nilable(Integer),
       blk:
         T.nilable(T.proc.params(batch: T.any(T::Hash[String, T::Array[T.untyped]], T::Array[T::Array[T.untyped]])).void)
-    ).returns(T.any(Enumerator, NilClass))
+    ).returns(T.any(T::Enumerator[T.any(T::Hash[String, T.untyped], T::Array[T.untyped])], NilClass))
   end
   def self.each_column(input, result_type: nil, columns: nil, batch_size: nil, &blk)
   end
+  # Options:
+  #   - `read_from`: An Enumerator yielding arrays of values representing each row
+  #   - `schema`: Array of hashes specifying column names and types
+  #   - `write_to`: String path or IO object to write the parquet file to
+  #   - `batch_size`: Optional batch size for writing (defaults to 1000)
+  sig do
+    params(
+      read_from: T::Enumerator[T::Array[T.untyped]],
+      schema: T::Array[T::Hash[String, String]],
+      write_to: T.any(String, IO),
+      batch_size: T.nilable(Integer)
+    ).void
+  end
+  def self.write_rows(read_from, schema:, write_to:, batch_size: nil)
+  end
+  # Options:
+  #   - `read_from`: An Enumerator yielding arrays of column batches
+  #   - `schema`: Array of hashes specifying column names and types
+  #   - `write_to`: String path or IO object to write the parquet file to
+  sig do
+    params(
+      read_from: T::Enumerator[T::Array[T::Array[T.untyped]]],
+      schema: T::Array[T::Hash[String, String]],
+      write_to: T.any(String, IO)
+    ).void
+  end
+  def self.write_columns(read_from, schema:, write_to:)
+  end
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: parquet
 version: !ruby/object:Gem::Version
-  version: 0.0.5
+  version: 0.2.5
 platform: ruby
 authors:
 - Nathan Jaremko
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2025-01-06 00:00:00.000000000 Z
+date: 2025-01-13 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: rb_sys
@@ -60,13 +60,20 @@ files:
 - ext/parquet/src/enumerator.rs
 - ext/parquet/src/header_cache.rs
 - ext/parquet/src/lib.rs
-- ext/parquet/src/parquet_column_reader.rs
-- ext/parquet/src/parquet_row_reader.rs
-- ext/parquet/src/reader.rs
+- ext/parquet/src/reader/mod.rs
+- ext/parquet/src/reader/parquet_column_reader.rs
+- ext/parquet/src/reader/parquet_row_reader.rs
 - ext/parquet/src/ruby_integration.rs
 - ext/parquet/src/ruby_reader.rs
-- ext/parquet/src/types.rs
+- ext/parquet/src/types/core_types.rs
+- ext/parquet/src/types/mod.rs
+- ext/parquet/src/types/parquet_value.rs
+- ext/parquet/src/types/record_types.rs
+- ext/parquet/src/types/timestamp.rs
+- ext/parquet/src/types/type_conversion.rs
+- ext/parquet/src/types/writer_types.rs
 - ext/parquet/src/utils.rs
+- ext/parquet/src/writer/mod.rs
 - lib/parquet.rb
 - lib/parquet.rbi
 - lib/parquet/version.rb