PyPI - FlowerPower - Versions diffs - 0.11.6.20__py3-none-any.whl → 0.21.0__py3-none-any.whl - Mend

FlowerPower 0.11.6.20py3-none-any.whl → 0.21.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (101) hide show

flowerpower/__init__.py +2 -6
flowerpower/cfg/__init__.py +7 -14
flowerpower/cfg/base.py +29 -25
flowerpower/cfg/pipeline/__init__.py +8 -6
flowerpower/cfg/pipeline/_schedule.py +32 -0
flowerpower/cfg/pipeline/adapter.py +0 -5
flowerpower/cfg/pipeline/builder.py +377 -0
flowerpower/cfg/pipeline/run.py +36 -0
flowerpower/cfg/project/__init__.py +11 -24
flowerpower/cfg/project/adapter.py +0 -12
flowerpower/cli/__init__.py +2 -21
flowerpower/cli/cfg.py +0 -3
flowerpower/cli/mqtt.py +0 -6
flowerpower/cli/pipeline.py +22 -415
flowerpower/cli/utils.py +0 -1
flowerpower/flowerpower.py +345 -146
flowerpower/pipeline/__init__.py +2 -0
flowerpower/pipeline/base.py +21 -12
flowerpower/pipeline/io.py +58 -54
flowerpower/pipeline/manager.py +165 -726
flowerpower/pipeline/pipeline.py +643 -0
flowerpower/pipeline/registry.py +285 -18
flowerpower/pipeline/visualizer.py +5 -6
flowerpower/plugins/io/__init__.py +8 -0
flowerpower/plugins/mqtt/__init__.py +7 -11
flowerpower/settings/__init__.py +0 -2
flowerpower/settings/{backend.py → _backend.py} +0 -21
flowerpower/settings/logging.py +1 -1
flowerpower/utils/logging.py +24 -12
flowerpower/utils/misc.py +17 -256
flowerpower/utils/monkey.py +1 -83
flowerpower-0.21.0.dist-info/METADATA +463 -0
flowerpower-0.21.0.dist-info/RECORD +44 -0
flowerpower/cfg/pipeline/schedule.py +0 -74
flowerpower/cfg/project/job_queue.py +0 -238
flowerpower/cli/job_queue.py +0 -1061
flowerpower/fs/__init__.py +0 -29
flowerpower/fs/base.py +0 -662
flowerpower/fs/ext.py +0 -2143
flowerpower/fs/storage_options.py +0 -1420
flowerpower/job_queue/__init__.py +0 -294
flowerpower/job_queue/apscheduler/__init__.py +0 -11
flowerpower/job_queue/apscheduler/_setup/datastore.py +0 -110
flowerpower/job_queue/apscheduler/_setup/eventbroker.py +0 -93
flowerpower/job_queue/apscheduler/manager.py +0 -1051
flowerpower/job_queue/apscheduler/setup.py +0 -554
flowerpower/job_queue/apscheduler/trigger.py +0 -169
flowerpower/job_queue/apscheduler/utils.py +0 -311
flowerpower/job_queue/base.py +0 -413
flowerpower/job_queue/rq/__init__.py +0 -10
flowerpower/job_queue/rq/_trigger.py +0 -37
flowerpower/job_queue/rq/concurrent_workers/gevent_worker.py +0 -226
flowerpower/job_queue/rq/concurrent_workers/thread_worker.py +0 -231
flowerpower/job_queue/rq/manager.py +0 -1582
flowerpower/job_queue/rq/setup.py +0 -154
flowerpower/job_queue/rq/utils.py +0 -69
flowerpower/mqtt.py +0 -12
flowerpower/pipeline/job_queue.py +0 -583
flowerpower/pipeline/runner.py +0 -603
flowerpower/plugins/io/base.py +0 -2520
flowerpower/plugins/io/helpers/datetime.py +0 -298
flowerpower/plugins/io/helpers/polars.py +0 -875
flowerpower/plugins/io/helpers/pyarrow.py +0 -570
flowerpower/plugins/io/helpers/sql.py +0 -202
flowerpower/plugins/io/loader/__init__.py +0 -28
flowerpower/plugins/io/loader/csv.py +0 -37
flowerpower/plugins/io/loader/deltatable.py +0 -190
flowerpower/plugins/io/loader/duckdb.py +0 -19
flowerpower/plugins/io/loader/json.py +0 -37
flowerpower/plugins/io/loader/mqtt.py +0 -159
flowerpower/plugins/io/loader/mssql.py +0 -26
flowerpower/plugins/io/loader/mysql.py +0 -26
flowerpower/plugins/io/loader/oracle.py +0 -26
flowerpower/plugins/io/loader/parquet.py +0 -35
flowerpower/plugins/io/loader/postgres.py +0 -26
flowerpower/plugins/io/loader/pydala.py +0 -19
flowerpower/plugins/io/loader/sqlite.py +0 -23
flowerpower/plugins/io/metadata.py +0 -244
flowerpower/plugins/io/saver/__init__.py +0 -28
flowerpower/plugins/io/saver/csv.py +0 -36
flowerpower/plugins/io/saver/deltatable.py +0 -186
flowerpower/plugins/io/saver/duckdb.py +0 -19
flowerpower/plugins/io/saver/json.py +0 -36
flowerpower/plugins/io/saver/mqtt.py +0 -28
flowerpower/plugins/io/saver/mssql.py +0 -26
flowerpower/plugins/io/saver/mysql.py +0 -26
flowerpower/plugins/io/saver/oracle.py +0 -26
flowerpower/plugins/io/saver/parquet.py +0 -36
flowerpower/plugins/io/saver/postgres.py +0 -26
flowerpower/plugins/io/saver/pydala.py +0 -20
flowerpower/plugins/io/saver/sqlite.py +0 -24
flowerpower/plugins/mqtt/cfg.py +0 -17
flowerpower/plugins/mqtt/manager.py +0 -962
flowerpower/settings/job_queue.py +0 -87
flowerpower/utils/scheduler.py +0 -311
flowerpower-0.11.6.20.dist-info/METADATA +0 -537
flowerpower-0.11.6.20.dist-info/RECORD +0 -102
{flowerpower-0.11.6.20.dist-info → flowerpower-0.21.0.dist-info}/WHEEL +0 -0
{flowerpower-0.11.6.20.dist-info → flowerpower-0.21.0.dist-info}/entry_points.txt +0 -0
{flowerpower-0.11.6.20.dist-info → flowerpower-0.21.0.dist-info}/licenses/LICENSE +0 -0
{flowerpower-0.11.6.20.dist-info → flowerpower-0.21.0.dist-info}/top_level.txt +0 -0

flowerpower/utils/misc.py CHANGED Viewed

@@ -7,262 +7,7 @@ import time
 from typing import Any
 import msgspec
-if importlib.util.find_spec("pyarrow"):
-    import pyarrow as pa
-    def convert_large_types_to_standard(schema: pa.Schema) -> pa.Schema:
-        # Define mapping of large types to standard types
-        type_mapping = {
-            pa.large_string(): pa.string(),
-            pa.large_binary(): pa.binary(),
-            pa.large_list(pa.null()): pa.list_(pa.null()),
-        }
-        # Convert fields
-        new_fields = []
-        for field in schema:
-            field_type = field.type
-            # Check if type exists in mapping
-            if field_type in type_mapping:
-                new_field = pa.field(
-                    name=field.name,
-                    type=type_mapping[field_type],
-                    nullable=field.nullable,
-                    metadata=field.metadata,
-                )
-                new_fields.append(new_field)
-            # Handle large lists with nested types
-            elif isinstance(field_type, pa.LargeListType):
-                new_field = pa.field(
-                    name=field.name,
-                    type=pa.list_(field_type.value_type),
-                    nullable=field.nullable,
-                    metadata=field.metadata,
-                )
-                new_fields.append(new_field)
-            else:
-                new_fields.append(field)
-        return pa.schema(new_fields)
-else:
-    def convert_large_types_to_standard(*args, **kwargs):
-        raise ImportError("pyarrow not installed")
-if importlib.util.find_spec("polars"):
-    import polars as pl
-    def _dict_to_dataframe(
-        data: dict | list[dict], unique: bool | list[str] | str = False
-    ) -> pl.DataFrame:
-        """
-        Convert a dictionary or list of dictionaries to a polars DataFrame.
-        Args:
-            data: (dict | list[dict]) Data to convert.
-        Returns:
-            pl.DataFrame: Converted data.
-        Examples:
-            >>> # Single dict with list values
-            >>> data = {'a': [1, 2, 3], 'b': [4, 5, 6]}
-            >>> _dict_to_dataframe(data)
-            shape: (3, 2)
-            ┌─────┬─────┐
-            │ a   ┆ b   │
-            │ --- ┆ --- │
-            │ i64 ┆ i64 │
-            ╞═════╪═════╡
-            │ 1   ┆ 4   │
-            │ 2   ┆ 5   │
-            │ 3   ┆ 6   │
-            └─────┴─────┘
-            >>> # Single dict with scalar values
-            >>> data = {'a': 1, 'b': 2}
-            >>> _dict_to_dataframe(data)
-            shape: (1, 2)
-            ┌─────┬─────┐
-            │ a   ┆ b   │
-            │ --- ┆ --- │
-            │ i64 ┆ i64 │
-            ╞═════╪═════╡
-            │ 1   ┆ 2   │
-            └─────┴─────┘
-            >>> # List of dicts with scalar values
-            >>> data = [{'a': 1, 'b': 2}, {'a': 3, 'b': 4}]
-            >>> _dict_to_dataframe(data)
-            shape: (2, 2)
-            ┌─────┬─────┐
-            │ a   ┆ b   │
-            │ --- ┆ --- │
-            │ i64 ┆ i64 │
-            ╞═════╪═════╡
-            │ 1   ┆ 2   │
-            │ 3   ┆ 4   │
-            └─────┴─────┘
-            >>> # List of dicts with list values
-            >>> data = [{'a': [1, 2], 'b': [3, 4]}, {'a': [5, 6], 'b': [7, 8]}]
-            >>> _dict_to_dataframe(data)
-            shape: (2, 2)
-            ┌───────┬───────┐
-            │ a     ┆ b     │
-            │ ---   ┆ ---   │
-            │ list  ┆ list  │
-            ╞═══════╪═══════╡
-            │ [1,2] ┆ [3,4] │
-            │ [5,6] ┆ [7,8] │
-            └───────┴───────┘
-        """
-        if isinstance(data, list):
-            # If it's a single-element list, just use the first element
-            if len(data) == 1:
-                data = data[0]
-            # If it's a list of dicts
-            else:
-                first_item = data[0]
-                # Check if the dict values are lists/tuples
-                if any(isinstance(v, (list, tuple)) for v in first_item.values()):
-                    # Each dict becomes a row with list/tuple values
-                    data = pl.DataFrame(data)
-                else:
-                    # If values are scalars, convert list of dicts to DataFrame
-                    data = pl.DataFrame(data)
-                if unique:
-                    data = data.unique(
-                        subset=None if not isinstance(unique, str | list) else unique,
-                        maintain_order=True,
-                    )
-                return data
-        # If it's a single dict
-        if isinstance(data, dict):
-            # Check if values are lists/tuples
-            if any(isinstance(v, (list, tuple)) for v in data.values()):
-                # Get the length of any list value (assuming all lists have same length)
-                length = len(
-                    next(v for v in data.values() if isinstance(v, (list, tuple)))
-                )
-                # Convert to DataFrame where each list element becomes a row
-                data = pl.DataFrame({
-                    k: v if isinstance(v, (list, tuple)) else [v] * length
-                    for k, v in data.items()
-                })
-            else:
-                # If values are scalars, wrap them in a list to create a single row
-                data = pl.DataFrame({k: [v] for k, v in data.items()})
-            if unique:
-                data = data.unique(
-                    subset=None if not isinstance(unique, str | list) else unique,
-                    maintain_order=True,
-                )
-            return data
-        raise ValueError("Input must be a dictionary or list of dictionaries")
-else:
-    def _dict_to_dataframe(*args, **kwargs):
-        raise ImportError("polars not installed")
-if (
-    importlib.util.find_spec("pandas")
-    and importlib.util.find_spec("polars")
-    and importlib.util.find_spec("pyarrow")
-):
-    from typing import Generator
-    import pandas as pd
-    def to_pyarrow_table(
-        data: pl.DataFrame
-        | pl.LazyFrame
-        | pd.DataFrame
-        | dict
-        | list[pl.DataFrame | pl.LazyFrame | pd.DataFrame | dict],
-        concat: bool = False,
-        unique: bool | list[str] | str = False,
-    ) -> pa.Table:
-        if isinstance(data, dict):
-            data = _dict_to_dataframe(data)
-        if isinstance(data, list):
-            if isinstance(data[0], dict):
-                data = _dict_to_dataframe(data, unique=unique)
-        if not isinstance(data, list):
-            data = [data]
-        if isinstance(data[0], pl.LazyFrame):
-            data = [dd.collect() for dd in data]
-        if isinstance(data[0], pl.DataFrame):
-            if concat:
-                data = pl.concat(data, how="diagonal_relaxed")
-                if unique:
-                    data = data.unique(
-                        subset=None if not isinstance(unique, str | list) else unique,
-                        maintain_order=True,
-                    )
-                data = data.to_arrow()
-                data = data.cast(convert_large_types_to_standard(data.schema))
-            else:
-                data = [dd.to_arrow() for dd in data]
-                data = [
-                    dd.cast(convert_large_types_to_standard(dd.schema)) for dd in data
-                ]
-        elif isinstance(data[0], pd.DataFrame):
-            data = [pa.Table.from_pandas(dd, preserve_index=False) for dd in data]
-            if concat:
-                data = pa.concat_tables(data, promote_options="permissive")
-                if unique:
-                    data = (
-                        pl.from_arrow(data)
-                        .unique(
-                            subset=None
-                            if not isinstance(unique, str | list)
-                            else unique,
-                            maintain_order=True,
-                        )
-                        .to_arrow()
-                    )
-                    data = data.cast(convert_large_types_to_standard(data.schema))
-        elif isinstance(data[0], pa.RecordBatch | pa.RecordBatchReader | Generator):
-            if concat:
-                data = pa.Table.from_batches(data)
-                if unique:
-                    data = (
-                        pl.from_arrow(data)
-                        .unique(
-                            subset=None
-                            if not isinstance(unique, str | list)
-                            else unique,
-                            maintain_order=True,
-                        )
-                        .to_arrow()
-                    )
-                    data = data.cast(convert_large_types_to_standard(data.schema))
-            else:
-                data = [pa.Table.from_batches([dd]) for dd in data]
-        return data
-else:
-    def to_pyarrow_table(*args, **kwargs):
-        raise ImportError("pandas, polars, or pyarrow not installed")
+from fsspec_utils import AbstractFileSystem, filesystem
 if importlib.util.find_spec("joblib"):
     from joblib import Parallel, delayed
@@ -484,3 +229,19 @@ def update_nested_dict(
             # Direct update
             result[key] = value
     return result
+def get_filesystem(fs: AbstractFileSystem | None = None, fs_type: str = "file") -> AbstractFileSystem:
+    """
+    Helper function to get a filesystem instance.
+    Args:
+        fs: An optional filesystem instance to use. If provided, this will be returned directly.
+        fs_type: The type of filesystem to create if fs is None. Defaults to "file".
+    Returns:
+        An AbstractFileSystem instance.
+    """
+    if fs is None:
+        fs = filesystem(fs_type)
+    return fs

flowerpower/utils/monkey.py CHANGED Viewed

@@ -1,85 +1,3 @@
-import importlib
-import sys
+# Placeholder file - APScheduler monkey patches removed
-from dill import dumps, loads
-def patch_pickle():
-    """
-    Patch the pickle serializer in the apscheduler module.
-    This function replaces the `dumps` and `loads` functions in the `apscheduler.serializers.pickle` module
-    with custom implementations.
-    This is useful when you want to modify the behavior of the pickle serializer used by the apscheduler module.
-    Example usage:
-    patch_pickle()
-    """
-    sys.modules["apscheduler.serializers.pickle"].dumps = dumps
-    sys.modules["apscheduler.serializers.pickle"].loads = loads
-if importlib.util.find_spec("apscheduler"):
-    from apscheduler._structures import Job, Schedule, Task
-    def job_to_dict(job):
-        return {
-            "id": str(job.id),
-            "task_id": job.task_id,
-            "args": [str(arg) for arg in job.args],
-            "kwargs": job.kwargs,
-            "schedule_id": job.schedule_id,
-            "scheduled_fire_time": (
-                job.scheduled_fire_time.isoformat() if job.scheduled_fire_time else None
-            ),
-            "jitter": job.jitter.total_seconds(),
-            "start_deadline": (
-                job.start_deadline.isoformat() if job.start_deadline else None
-            ),
-            "result_expiration_time": job.result_expiration_time.total_seconds(),
-            "created_at": job.created_at.isoformat(),
-            "acquired_by": job.acquired_by,
-            "acquired_until": (
-                job.acquired_until.isoformat() if job.acquired_until else None
-            ),
-        }
-    Job.to_dict = job_to_dict
-    def task_to_dict(task):
-        return {
-            "id": task.id,
-            "func": task.func,
-            "job_executor": task.job_executor,
-            "max_running_jobs": task.max_running_jobs,
-            "misfire_grace_time": task.misfire_grace_time,
-        }
-    Task.to_dict = task_to_dict
-    def schedule_to_dict(schedule):
-        return {
-            "id": schedule.id,
-            "task_id": schedule.task_id,
-            "trigger": str(schedule.trigger),
-            "args": [str(arg) for arg in schedule.args],
-            "kwargs": schedule.kwargs,
-            "paused": schedule.paused,
-            "coalesce": schedule.coalesce.name if schedule.coalesce else None,
-            "misfire_grace_time": schedule.misfire_grace_time,
-            "max_jitter": schedule.max_jitter,
-            "next_fire_time": (
-                schedule.next_fire_time.isoformat() if schedule.next_fire_time else None
-            ),
-            "last_fire_time": (
-                schedule.last_fire_time.isoformat() if schedule.last_fire_time else None
-            ),
-            "acquired_by": schedule.acquired_by,
-            "acquired_until": (
-                schedule.acquired_until.isoformat() if schedule.acquired_until else None
-            ),
-        }
-    Schedule.to_dict = schedule_to_dict

FlowerPower 0.11.6.20__py3-none-any.whl → 0.21.0__py3-none-any.whl

FlowerPower 0.11.6.20py3-none-any.whl → 0.21.0py3-none-any.whl