npm - @gscdump/engine - Versions diffs - 0.28.3 → 0.30.0 - Mend

@gscdump/engine 0.28.3 → 0.30.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

package/dist/_chunks/duckdb.d.mts +1 -1
package/dist/_chunks/engine.mjs +55 -7
package/dist/_chunks/index.d.mts +6 -2
package/dist/_chunks/libs/hyparquet-compressors.mjs +9 -9
package/dist/_chunks/libs/icebird.mjs +37 -23
package/dist/_chunks/pg-adapter.d.mts +11 -3
package/dist/_chunks/resolver.mjs +78 -16
package/dist/_chunks/schema.d.mts +16 -9
package/dist/_chunks/schema.mjs +6 -3
package/dist/_chunks/schema2.mjs +30 -3
package/dist/_chunks/sink.d.mts +64 -10
package/dist/_chunks/storage.d.mts +16 -0
package/dist/_chunks/types.d.mts +7 -2
package/dist/adapters/duckdb-node.mjs +18 -6
package/dist/adapters/hyparquet.d.mts +10 -2
package/dist/adapters/hyparquet.mjs +132 -42
package/dist/adapters/node.mjs +1 -1
package/dist/errors.mjs +1 -1
package/dist/iceberg/index.d.mts +2 -2
package/dist/iceberg/index.mjs +47 -29
package/dist/ingest.mjs +5 -3
package/dist/resolver/index.d.mts +130 -13
package/dist/resolver/index.mjs +2 -2
package/dist/rollups.d.mts +50 -1
package/dist/rollups.mjs +133 -2
package/dist/schema.d.mts +2 -2
package/dist/schema.mjs +2 -2
package/dist/sql-fragments.d.mts +24 -1
package/dist/sql-fragments.mjs +6 -1
package/package.json +7 -7

package/dist/sql-fragments.d.mts CHANGED Viewed

@@ -18,4 +18,27 @@ declare const METRIC_EXPR: Record<Metric, string>;
  * on the resolved column expression so drizzle can pass a column ref.
  */
 declare function topLevelPagePredicateSql(pathExpr: string): string;
-export { METRIC_EXPR, escapeLike, topLevelPagePredicateSql };
+/**
+ * How a canonicalized date column is emitted by {@link dateReplaceClause}:
+ * - `'date'` keeps a real `DATE` value (`CAST(col AS DATE)`). Right for views
+ *   and `.duckdb` exports the app re-queries, where the column type matters.
+ * - `'string'` emits an ISO `YYYY-MM-DD` string (`strftime(CAST(col AS DATE)…)`).
+ *   Right for row materialisation to JSON/CSV/NDJSON, where a `DATE` would
+ *   serialize as an opaque object / epoch.
+ */
+type DateCanonicalForm = 'date' | 'string';
+/**
+ * Build a `read_parquet` `REPLACE (…)` clause that canonicalizes legacy `date`
+ * columns. `date` lands as VARCHAR in older parquets (BYTE_ARRAY/UTF8, written
+ * before the schema enforced DATE); DuckDB infers the column type from the file,
+ * so without this every read path would expose VARCHAR despite SCHEMAS declaring
+ * DATE. The `CAST(col AS DATE)` is a no-op for already-DATE columns and
+ * vectorized parsing for VARCHAR ones, so output stays canonical either way.
+ *
+ * Pure: the caller passes the table's DATE column names (derived from `SCHEMAS`)
+ * so this fragment carries no schema/drizzle dependency. Returns `''` when the
+ * table has no DATE columns, so callers can interpolate it unconditionally:
+ *   `SELECT * ${dateReplaceClause(cols)} FROM read_parquet(…)`.
+ */
+declare function dateReplaceClause(dateColumns: readonly string[], form?: DateCanonicalForm): string;
+export { DateCanonicalForm, METRIC_EXPR, dateReplaceClause, escapeLike, topLevelPagePredicateSql };

package/dist/sql-fragments.mjs CHANGED Viewed

@@ -10,4 +10,9 @@ const METRIC_EXPR = {
 function topLevelPagePredicateSql(pathExpr) {
 	return `LENGTH(${pathExpr}) - LENGTH(REPLACE(${pathExpr}, '/', '')) <= 1`;
 }
-export { METRIC_EXPR, escapeLike, topLevelPagePredicateSql };
+function dateReplaceClause(dateColumns, form = "string") {
+	if (dateColumns.length === 0) return "";
+	const cast = (n) => form === "date" ? `CAST(${n} AS DATE) AS ${n}` : `strftime(CAST(${n} AS DATE), '%Y-%m-%d') AS ${n}`;
+	return `REPLACE (${dateColumns.map(cast).join(", ")})`;
+}
+export { METRIC_EXPR, dateReplaceClause, escapeLike, topLevelPagePredicateSql };

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "@gscdump/engine",
   "type": "module",
-  "version": "0.28.3",
+  "version": "0.30.0",
   "description": "Append-only Parquet/DuckDB storage engine + planner + adapters for the gscdump pipeline. Node + edge runtimes; opt-in heavy peers.",
   "author": {
     "name": "Harlan Wilton",
@@ -172,8 +172,8 @@
   },
   "peerDependencies": {
     "@duckdb/duckdb-wasm": "^1.32.0",
-    "hyparquet": "^1.26.0",
-    "hyparquet-writer": "^0.15.6"
+    "hyparquet": "^1.26.1",
+    "hyparquet-writer": "^0.16.1"
   },
   "peerDependenciesMeta": {
     "@duckdb/duckdb-wasm": {
@@ -188,11 +188,11 @@
   },
   "dependencies": {
     "drizzle-orm": "1.0.0-rc.3",
-    "hyparquet": "^1.26.0",
-    "hyparquet-writer": "^0.15.6",
+    "hyparquet": "^1.26.1",
+    "hyparquet-writer": "^0.16.1",
     "proper-lockfile": "^4.1.2",
-    "@gscdump/contracts": "0.28.3",
-    "gscdump": "0.28.3"
+    "@gscdump/contracts": "0.30.0",
+    "gscdump": "0.30.0"
   },
   "devDependencies": {
     "@duckdb/duckdb-wasm": "^1.32.0",