npm - @loaders.gl/parquet - Versions diffs - 4.0.0-alpha.23 → 4.0.0-alpha.24 - Mend

@loaders.gl/parquet 4.0.0-alpha.23 → 4.0.0-alpha.24

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (93) hide show

package/dist/dist.min.js +17 -17
package/dist/dist.min.js.map +3 -3
package/dist/es5/parquet-loader.js +1 -1
package/dist/es5/parquet-wasm-loader.js +1 -1
package/dist/es5/parquet-wasm-writer.js +1 -1
package/dist/es5/parquet-writer.js +1 -1
package/dist/esm/parquet-loader.js +1 -1
package/dist/esm/parquet-wasm-loader.js +1 -1
package/dist/esm/parquet-wasm-writer.js +1 -1
package/dist/esm/parquet-writer.js +1 -1
package/dist/parquet-worker.js +17 -17
package/dist/parquet-worker.js.map +3 -3
package/package.json +11 -9
package/dist/bundle.js +0 -5
package/dist/constants.js +0 -18
package/dist/index.js +0 -56
package/dist/lib/arrow/convert-columns-to-row-group.js +0 -1
package/dist/lib/arrow/convert-row-group-to-columns.js +0 -12
package/dist/lib/arrow/convert-schema-from-parquet.js +0 -86
package/dist/lib/arrow/convert-schema-to-parquet.js +0 -71
package/dist/lib/geo/decode-geo-metadata.js +0 -77
package/dist/lib/geo/geoparquet-schema.js +0 -69
package/dist/lib/parsers/parse-parquet-to-columns.js +0 -46
package/dist/lib/parsers/parse-parquet-to-rows.js +0 -37
package/dist/lib/wasm/encode-parquet-wasm.js +0 -30
package/dist/lib/wasm/load-wasm/index.js +0 -5
package/dist/lib/wasm/load-wasm/load-wasm-browser.js +0 -38
package/dist/lib/wasm/load-wasm/load-wasm-node.js +0 -31
package/dist/lib/wasm/parse-parquet-wasm.js +0 -27
package/dist/parquet-loader.js +0 -41
package/dist/parquet-wasm-loader.js +0 -26
package/dist/parquet-wasm-writer.js +0 -24
package/dist/parquet-writer.js +0 -21
package/dist/parquetjs/codecs/declare.js +0 -2
package/dist/parquetjs/codecs/dictionary.js +0 -14
package/dist/parquetjs/codecs/index.js +0 -55
package/dist/parquetjs/codecs/plain.js +0 -211
package/dist/parquetjs/codecs/rle.js +0 -145
package/dist/parquetjs/compression.js +0 -183
package/dist/parquetjs/encoder/parquet-encoder.js +0 -484
package/dist/parquetjs/parquet-thrift/BoundaryOrder.js +0 -15
package/dist/parquetjs/parquet-thrift/BsonType.js +0 -62
package/dist/parquetjs/parquet-thrift/ColumnChunk.js +0 -211
package/dist/parquetjs/parquet-thrift/ColumnIndex.js +0 -217
package/dist/parquetjs/parquet-thrift/ColumnMetaData.js +0 -402
package/dist/parquetjs/parquet-thrift/ColumnOrder.js +0 -108
package/dist/parquetjs/parquet-thrift/CompressionCodec.js +0 -20
package/dist/parquetjs/parquet-thrift/ConvertedType.js +0 -34
package/dist/parquetjs/parquet-thrift/DataPageHeader.js +0 -170
package/dist/parquetjs/parquet-thrift/DataPageHeaderV2.js +0 -230
package/dist/parquetjs/parquet-thrift/DateType.js +0 -62
package/dist/parquetjs/parquet-thrift/DecimalType.js +0 -109
package/dist/parquetjs/parquet-thrift/DictionaryPageHeader.js +0 -126
package/dist/parquetjs/parquet-thrift/Encoding.js +0 -20
package/dist/parquetjs/parquet-thrift/EnumType.js +0 -62
package/dist/parquetjs/parquet-thrift/FieldRepetitionType.js +0 -15
package/dist/parquetjs/parquet-thrift/FileMetaData.js +0 -260
package/dist/parquetjs/parquet-thrift/IndexPageHeader.js +0 -62
package/dist/parquetjs/parquet-thrift/IntType.js +0 -109
package/dist/parquetjs/parquet-thrift/JsonType.js +0 -62
package/dist/parquetjs/parquet-thrift/KeyValue.js +0 -106
package/dist/parquetjs/parquet-thrift/ListType.js +0 -62
package/dist/parquetjs/parquet-thrift/LogicalType.js +0 -384
package/dist/parquetjs/parquet-thrift/MapType.js +0 -62
package/dist/parquetjs/parquet-thrift/MicroSeconds.js +0 -62
package/dist/parquetjs/parquet-thrift/MilliSeconds.js +0 -62
package/dist/parquetjs/parquet-thrift/NullType.js +0 -62
package/dist/parquetjs/parquet-thrift/OffsetIndex.js +0 -101
package/dist/parquetjs/parquet-thrift/PageEncodingStats.js +0 -131
package/dist/parquetjs/parquet-thrift/PageHeader.js +0 -220
package/dist/parquetjs/parquet-thrift/PageLocation.js +0 -145
package/dist/parquetjs/parquet-thrift/PageType.js +0 -16
package/dist/parquetjs/parquet-thrift/RowGroup.js +0 -186
package/dist/parquetjs/parquet-thrift/SchemaElement.js +0 -243
package/dist/parquetjs/parquet-thrift/SortingColumn.js +0 -131
package/dist/parquetjs/parquet-thrift/Statistics.js +0 -180
package/dist/parquetjs/parquet-thrift/StringType.js +0 -62
package/dist/parquetjs/parquet-thrift/TimeType.js +0 -110
package/dist/parquetjs/parquet-thrift/TimeUnit.js +0 -131
package/dist/parquetjs/parquet-thrift/TimestampType.js +0 -110
package/dist/parquetjs/parquet-thrift/Type.js +0 -20
package/dist/parquetjs/parquet-thrift/TypeDefinedOrder.js +0 -62
package/dist/parquetjs/parquet-thrift/UUIDType.js +0 -62
package/dist/parquetjs/parquet-thrift/index.js +0 -65
package/dist/parquetjs/parser/decoders.js +0 -318
package/dist/parquetjs/parser/parquet-reader.js +0 -200
package/dist/parquetjs/schema/declare.js +0 -12
package/dist/parquetjs/schema/schema.js +0 -162
package/dist/parquetjs/schema/shred.js +0 -355
package/dist/parquetjs/schema/types.js +0 -416
package/dist/parquetjs/utils/file-utils.js +0 -43
package/dist/parquetjs/utils/read-utils.js +0 -109
package/dist/workers/parquet-worker.js +0 -5

package/dist/parquetjs/schema/shred.js DELETED Viewed

@@ -1,355 +0,0 @@
-"use strict";
-// Forked from https://github.com/kbajalc/parquets under MIT license (Copyright (c) 2017 ironSource Ltd.)
-var __createBinding = (this && this.__createBinding) || (Object.create ? (function(o, m, k, k2) {
-    if (k2 === undefined) k2 = k;
-    var desc = Object.getOwnPropertyDescriptor(m, k);
-    if (!desc || ("get" in desc ? !m.__esModule : desc.writable || desc.configurable)) {
-      desc = { enumerable: true, get: function() { return m[k]; } };
-    }
-    Object.defineProperty(o, k2, desc);
-}) : (function(o, m, k, k2) {
-    if (k2 === undefined) k2 = k;
-    o[k2] = m[k];
-}));
-var __setModuleDefault = (this && this.__setModuleDefault) || (Object.create ? (function(o, v) {
-    Object.defineProperty(o, "default", { enumerable: true, value: v });
-}) : function(o, v) {
-    o["default"] = v;
-});
-var __importStar = (this && this.__importStar) || function (mod) {
-    if (mod && mod.__esModule) return mod;
-    var result = {};
-    if (mod != null) for (var k in mod) if (k !== "default" && Object.prototype.hasOwnProperty.call(mod, k)) __createBinding(result, mod, k);
-    __setModuleDefault(result, mod);
-    return result;
-};
-Object.defineProperty(exports, "__esModule", { value: true });
-exports.materializeColumns = exports.materializeRows = exports.shredRecord = exports.shredBuffer = exports.ParquetRowGroup = void 0;
-const declare_1 = require("./declare");
-Object.defineProperty(exports, "ParquetRowGroup", { enumerable: true, get: function () { return declare_1.ParquetRowGroup; } });
-const Types = __importStar(require("./types"));
-function shredBuffer(schema) {
-    const columnData = {};
-    for (const field of schema.fieldList) {
-        columnData[field.key] = {
-            dlevels: [],
-            rlevels: [],
-            values: [],
-            pageHeaders: [],
-            count: 0
-        };
-    }
-    return { rowCount: 0, columnData };
-}
-exports.shredBuffer = shredBuffer;
-/**
- * 'Shred' a record into a list of <value, repetition_level, definition_level>
- * tuples per column using the Google Dremel Algorithm..
- *
- * The rowGroup argument must point to an object into which the shredded record
- * will be returned. You may re-use the rowGroup for repeated calls to this function
- * to append to an existing rowGroup, as long as the schema is unchanged.
- *
- * The format in which the shredded records will be stored in the rowGroup is as
- * follows:
- *
- *   rowGroup = {
- *     columnData: [
- *       'my_col': {
- *          dlevels: [d1, d2, .. dN],
- *          rlevels: [r1, r2, .. rN],
- *          values: [v1, v2, .. vN],
- *        }, ...
- *      ],
- *      rowCount: X,
- *   }
- */
-function shredRecord(schema, record, rowGroup) {
-    /* shred the record, this may raise an exception */
-    const data = shredBuffer(schema).columnData;
-    shredRecordFields(schema.fields, record, data, 0, 0);
-    /* if no error during shredding, add the shredded record to the rowGroup */
-    if (rowGroup.rowCount === 0) {
-        rowGroup.rowCount = 1;
-        rowGroup.columnData = data;
-        return;
-    }
-    rowGroup.rowCount += 1;
-    for (const field of schema.fieldList) {
-        Array.prototype.push.apply(rowGroup.columnData[field.key].rlevels, data[field.key].rlevels);
-        Array.prototype.push.apply(rowGroup.columnData[field.key].dlevels, data[field.key].dlevels);
-        Array.prototype.push.apply(rowGroup.columnData[field.key].values, data[field.key].values);
-        rowGroup.columnData[field.key].count += data[field.key].count;
-    }
-}
-exports.shredRecord = shredRecord;
-// eslint-disable-next-line max-statements, complexity
-function shredRecordFields(fields, record, data, rLevel, dLevel) {
-    for (const name in fields) {
-        const field = fields[name];
-        // fetch values
-        let values = [];
-        if (record &&
-            field.name in record &&
-            record[field.name] !== undefined &&
-            record[field.name] !== null) {
-            if (record[field.name].constructor === Array) {
-                values = record[field.name];
-            }
-            else {
-                values.push(record[field.name]);
-            }
-        }
-        // check values
-        if (values.length === 0 && Boolean(record) && field.repetitionType === 'REQUIRED') {
-            throw new Error(`missing required field: ${field.name}`);
-        }
-        if (values.length > 1 && field.repetitionType !== 'REPEATED') {
-            throw new Error(`too many values for field: ${field.name}`);
-        }
-        // push null
-        if (values.length === 0) {
-            if (field.isNested) {
-                shredRecordFields(field.fields, null, data, rLevel, dLevel);
-            }
-            else {
-                data[field.key].count += 1;
-                data[field.key].rlevels.push(rLevel);
-                data[field.key].dlevels.push(dLevel);
-            }
-            continue; // eslint-disable-line no-continue
-        }
-        // push values
-        for (let i = 0; i < values.length; i++) {
-            const rlvl = i === 0 ? rLevel : field.rLevelMax;
-            if (field.isNested) {
-                shredRecordFields(field.fields, values[i], data, rlvl, field.dLevelMax);
-            }
-            else {
-                data[field.key].count += 1;
-                data[field.key].rlevels.push(rlvl);
-                data[field.key].dlevels.push(field.dLevelMax);
-                data[field.key].values.push(Types.toPrimitive((field.originalType || field.primitiveType), values[i]));
-            }
-        }
-    }
-}
-/**
- * 'Materialize' a list of <value, repetition_level, definition_level>
- * tuples back to nested records (objects/arrays) using the Google Dremel
- * Algorithm..
- *
- * The rowGroup argument must point to an object with the following structure (i.e.
- * the same structure that is returned by shredRecords):
- *
- *   rowGroup = {
- *     columnData: [
- *       'my_col': {
- *          dlevels: [d1, d2, .. dN],
- *          rlevels: [r1, r2, .. rN],
- *          values: [v1, v2, .. vN],
- *        }, ...
- *      ],
- *      rowCount: X,
- *   }
- */
-function materializeRows(schema, rowGroup) {
-    const rows = [];
-    // rows = new Array(rowGroup.rowCount).fill({})'
-    for (let i = 0; i < rowGroup.rowCount; i++) {
-        rows.push({});
-    }
-    for (const key in rowGroup.columnData) {
-        const columnData = rowGroup.columnData[key];
-        if (columnData.count) {
-            materializeColumnAsRows(schema, columnData, key, rows);
-        }
-    }
-    return rows;
-}
-exports.materializeRows = materializeRows;
-/** Populate record fields for one column */
-// eslint-disable-next-line max-statements, complexity
-function materializeColumnAsRows(schema, columnData, key, rows) {
-    const field = schema.findField(key);
-    const branch = schema.findFieldBranch(key);
-    // tslint:disable-next-line:prefer-array-literal
-    const rLevels = new Array(field.rLevelMax + 1).fill(0);
-    let vIndex = 0;
-    for (let i = 0; i < columnData.count; i++) {
-        const dLevel = columnData.dlevels[i];
-        const rLevel = columnData.rlevels[i];
-        rLevels[rLevel]++;
-        rLevels.fill(0, rLevel + 1);
-        let rIndex = 0;
-        let record = rows[rLevels[rIndex++] - 1];
-        // Internal nodes - Build a nested row object
-        for (const step of branch) {
-            if (step === field || dLevel < step.dLevelMax) {
-                break;
-            }
-            switch (step.repetitionType) {
-                case 'REPEATED':
-                    if (!(step.name in record)) {
-                        // eslint-disable max-depth
-                        record[step.name] = [];
-                    }
-                    const ix = rLevels[rIndex++];
-                    while (record[step.name].length <= ix) {
-                        // eslint-disable max-depth
-                        record[step.name].push({});
-                    }
-                    record = record[step.name][ix];
-                    break;
-                default:
-                    record[step.name] = record[step.name] || {};
-                    record = record[step.name];
-            }
-        }
-        // Leaf node - Add the value
-        if (dLevel === field.dLevelMax) {
-            const value = Types.fromPrimitive(
-            // @ts-ignore
-            field.originalType || field.primitiveType, columnData.values[vIndex], field);
-            vIndex++;
-            switch (field.repetitionType) {
-                case 'REPEATED':
-                    if (!(field.name in record)) {
-                        // eslint-disable max-depth
-                        record[field.name] = [];
-                    }
-                    const ix = rLevels[rIndex];
-                    while (record[field.name].length <= ix) {
-                        // eslint-disable max-depth
-                        record[field.name].push(null);
-                    }
-                    record[field.name][ix] = value;
-                    break;
-                default:
-                    record[field.name] = value;
-            }
-        }
-    }
-}
-// Columnar export
-/**
- * 'Materialize' a list of <value, repetition_level, definition_level>
- * tuples back to nested records (objects/arrays) using the Google Dremel
- * Algorithm..
- *
- * The rowGroup argument must point to an object with the following structure (i.e.
- * the same structure that is returned by shredRecords):
- *
- *   rowGroup = {
- *     columnData: [
- *       'my_col': {
- *          dlevels: [d1, d2, .. dN],
- *          rlevels: [r1, r2, .. rN],
- *          values: [v1, v2, .. vN],
- *        }, ...
- *      ],
- *      rowCount: X,
- *   }
- */
-function materializeColumns(schema, rowGroup) {
-    const columns = {};
-    for (const key in rowGroup.columnData) {
-        const columnData = rowGroup.columnData[key];
-        if (columnData.count) {
-            materializeColumnAsColumnarArray(schema, columnData, rowGroup.rowCount, key, columns);
-        }
-    }
-    return columns;
-}
-exports.materializeColumns = materializeColumns;
-// eslint-disable-next-line max-statements, complexity
-function materializeColumnAsColumnarArray(schema, columnData, rowCount, key, columns) {
-    if (columnData.count <= 0) {
-        return;
-    }
-    const field = schema.findField(key);
-    const branch = schema.findFieldBranch(key);
-    const columnName = branch[0].name;
-    let column;
-    const { values } = columnData;
-    if (values.length === rowCount && branch[0].primitiveType) {
-        // if (branch[0].repetitionType === `REQUIRED`) {
-        //   switch (branch[0].primitiveType) {
-        //     case 'INT32': return values instanceof Int32Array ? values : new Int32Array(values);
-        //   }
-        // }
-        column = values;
-    }
-    if (column) {
-        columns[columnName] = column;
-        return;
-    }
-    column = new Array(rowCount);
-    for (let i = 0; i < rowCount; i++) {
-        column[i] = {};
-    }
-    columns[columnName] = column;
-    // tslint:disable-next-line:prefer-array-literal
-    const rLevels = new Array(field.rLevelMax + 1).fill(0);
-    let vIndex = 0;
-    for (let i = 0; i < columnData.count; i++) {
-        const dLevel = columnData.dlevels[i];
-        const rLevel = columnData.rlevels[i];
-        rLevels[rLevel]++;
-        rLevels.fill(0, rLevel + 1);
-        let rIndex = 0;
-        let record = column[rLevels[rIndex++] - 1];
-        // Internal nodes - Build a nested row object
-        for (const step of branch) {
-            if (step === field || dLevel < step.dLevelMax) {
-                break;
-            }
-            switch (step.repetitionType) {
-                case 'REPEATED':
-                    if (!(step.name in record)) {
-                        // eslint-disable max-depth
-                        record[step.name] = [];
-                    }
-                    const ix = rLevels[rIndex++];
-                    while (record[step.name].length <= ix) {
-                        // eslint-disable max-depth
-                        record[step.name].push({});
-                    }
-                    record = record[step.name][ix];
-                    break;
-                default:
-                    record[step.name] = record[step.name] || {};
-                    record = record[step.name];
-            }
-        }
-        // Leaf node - Add the value
-        if (dLevel === field.dLevelMax) {
-            const value = Types.fromPrimitive(
-            // @ts-ignore
-            field.originalType || field.primitiveType, columnData.values[vIndex], field);
-            vIndex++;
-            switch (field.repetitionType) {
-                case 'REPEATED':
-                    if (!(field.name in record)) {
-                        // eslint-disable max-depth
-                        record[field.name] = [];
-                    }
-                    const ix = rLevels[rIndex];
-                    while (record[field.name].length <= ix) {
-                        // eslint-disable max-depth
-                        record[field.name].push(null);
-                    }
-                    record[field.name][ix] = value;
-                    break;
-                default:
-                    record[field.name] = value;
-            }
-        }
-    }
-    // Remove one level of nesting
-    for (let i = 0; i < rowCount; ++i) {
-        if (columnName in column[i]) {
-            column[i] = column[i][columnName];
-        }
-    }
-}