PyPI - jerry-thomas - Versions diffs - 0.3.0__py3-none-any.whl → 1.0.0__py3-none-any.whl - Mend

jerry-thomas 0.3.0py3-none-any.whl → 1.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (164) hide show

datapipeline/analysis/vector/collector.py +120 -17
datapipeline/analysis/vector/matrix.py +33 -8
datapipeline/analysis/vector/report.py +162 -32
datapipeline/build/tasks/__init__.py +11 -0
datapipeline/build/tasks/config.py +74 -0
datapipeline/build/tasks/metadata.py +170 -0
datapipeline/build/tasks/scaler.py +73 -0
datapipeline/build/tasks/schema.py +60 -0
datapipeline/build/tasks/utils.py +169 -0
datapipeline/cli/app.py +304 -127
datapipeline/cli/commands/build.py +240 -16
datapipeline/cli/commands/contract.py +367 -0
datapipeline/cli/commands/domain.py +8 -3
datapipeline/cli/commands/inspect.py +401 -149
datapipeline/cli/commands/list_.py +30 -7
datapipeline/cli/commands/plugin.py +1 -1
datapipeline/cli/commands/run.py +227 -241
datapipeline/cli/commands/run_config.py +101 -0
datapipeline/cli/commands/serve_pipeline.py +156 -0
datapipeline/cli/commands/source.py +44 -8
datapipeline/cli/visuals/__init__.py +4 -2
datapipeline/cli/visuals/common.py +239 -0
datapipeline/cli/visuals/labels.py +15 -15
datapipeline/cli/visuals/runner.py +66 -0
datapipeline/cli/visuals/sections.py +20 -0
datapipeline/cli/visuals/sources.py +132 -119
datapipeline/cli/visuals/sources_basic.py +260 -0
datapipeline/cli/visuals/sources_off.py +76 -0
datapipeline/cli/visuals/sources_rich.py +414 -0
datapipeline/config/catalog.py +37 -3
datapipeline/config/context.py +214 -0
datapipeline/config/dataset/loader.py +21 -4
datapipeline/config/dataset/normalize.py +4 -4
datapipeline/config/metadata.py +43 -0
datapipeline/config/postprocess.py +2 -2
datapipeline/config/project.py +3 -2
datapipeline/config/resolution.py +129 -0
datapipeline/config/tasks.py +309 -0
datapipeline/config/workspace.py +155 -0
datapipeline/domain/__init__.py +12 -0
datapipeline/domain/record.py +11 -0
datapipeline/domain/sample.py +54 -0
datapipeline/integrations/ml/adapter.py +34 -20
datapipeline/integrations/ml/pandas_support.py +0 -2
datapipeline/integrations/ml/rows.py +1 -6
datapipeline/integrations/ml/torch_support.py +1 -3
datapipeline/io/factory.py +112 -0
datapipeline/io/output.py +132 -0
datapipeline/io/protocols.py +21 -0
datapipeline/io/serializers.py +219 -0
datapipeline/io/sinks/__init__.py +23 -0
datapipeline/io/sinks/base.py +2 -0
datapipeline/io/sinks/files.py +79 -0
datapipeline/io/sinks/rich.py +57 -0
datapipeline/io/sinks/stdout.py +18 -0
datapipeline/io/writers/__init__.py +14 -0
datapipeline/io/writers/base.py +28 -0
datapipeline/io/writers/csv_writer.py +25 -0
datapipeline/io/writers/jsonl.py +52 -0
datapipeline/io/writers/pickle_writer.py +30 -0
datapipeline/pipeline/artifacts.py +58 -0
datapipeline/pipeline/context.py +66 -7
datapipeline/pipeline/observability.py +65 -0
datapipeline/pipeline/pipelines.py +65 -13
datapipeline/pipeline/split.py +11 -10
datapipeline/pipeline/stages.py +127 -16
datapipeline/pipeline/utils/keygen.py +20 -7
datapipeline/pipeline/utils/memory_sort.py +22 -10
datapipeline/pipeline/utils/transform_utils.py +22 -0
datapipeline/runtime.py +5 -2
datapipeline/services/artifacts.py +12 -6
datapipeline/services/bootstrap/config.py +25 -0
datapipeline/services/bootstrap/core.py +52 -37
datapipeline/services/constants.py +6 -5
datapipeline/services/factories.py +123 -1
datapipeline/services/project_paths.py +43 -16
datapipeline/services/runs.py +208 -0
datapipeline/services/scaffold/domain.py +3 -2
datapipeline/services/scaffold/filter.py +3 -2
datapipeline/services/scaffold/mappers.py +9 -6
datapipeline/services/scaffold/plugin.py +3 -3
datapipeline/services/scaffold/source.py +93 -56
datapipeline/sources/{composed_loader.py → data_loader.py} +9 -9
datapipeline/sources/decoders.py +83 -18
datapipeline/sources/factory.py +26 -16
datapipeline/sources/models/__init__.py +2 -2
datapipeline/sources/models/generator.py +0 -7
datapipeline/sources/models/loader.py +3 -3
datapipeline/sources/models/parsing_error.py +24 -0
datapipeline/sources/models/source.py +6 -6
datapipeline/sources/synthetic/time/loader.py +14 -2
datapipeline/sources/transports.py +74 -37
datapipeline/templates/plugin_skeleton/README.md +74 -30
datapipeline/templates/plugin_skeleton/example/contracts/time.ticks.hour_sin.yaml +31 -0
datapipeline/templates/plugin_skeleton/example/contracts/time.ticks.linear.yaml +30 -0
datapipeline/templates/plugin_skeleton/example/dataset.yaml +18 -0
datapipeline/templates/plugin_skeleton/example/postprocess.yaml +29 -0
datapipeline/templates/plugin_skeleton/{config/datasets/default → example}/project.yaml +11 -8
datapipeline/templates/plugin_skeleton/example/sources/synthetic.ticks.yaml +12 -0
datapipeline/templates/plugin_skeleton/example/tasks/metadata.yaml +3 -0
datapipeline/templates/plugin_skeleton/example/tasks/scaler.yaml +9 -0
datapipeline/templates/plugin_skeleton/example/tasks/schema.yaml +2 -0
datapipeline/templates/plugin_skeleton/example/tasks/serve.test.yaml +4 -0
datapipeline/templates/plugin_skeleton/example/tasks/serve.train.yaml +28 -0
datapipeline/templates/plugin_skeleton/example/tasks/serve.val.yaml +4 -0
datapipeline/templates/plugin_skeleton/jerry.yaml +28 -0
datapipeline/templates/plugin_skeleton/your-dataset/contracts/time.ticks.hour_sin.yaml +31 -0
datapipeline/templates/plugin_skeleton/your-dataset/contracts/time.ticks.linear.yaml +30 -0
datapipeline/templates/plugin_skeleton/your-dataset/dataset.yaml +18 -0
datapipeline/templates/plugin_skeleton/your-dataset/postprocess.yaml +29 -0
datapipeline/templates/plugin_skeleton/your-dataset/project.yaml +22 -0
datapipeline/templates/plugin_skeleton/your-dataset/sources/synthetic.ticks.yaml +12 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/metadata.yaml +3 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/scaler.yaml +9 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/schema.yaml +2 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/serve.test.yaml +4 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/serve.train.yaml +28 -0
datapipeline/templates/plugin_skeleton/your-dataset/tasks/serve.val.yaml +4 -0
datapipeline/templates/stubs/dto.py.j2 +2 -0
datapipeline/templates/stubs/mapper.py.j2 +5 -4
datapipeline/templates/stubs/parser.py.j2 +2 -0
datapipeline/templates/stubs/record.py.j2 +2 -0
datapipeline/templates/stubs/source.yaml.j2 +2 -3
datapipeline/transforms/debug/lint.py +26 -41
datapipeline/transforms/feature/scaler.py +89 -13
datapipeline/transforms/record/floor_time.py +4 -4
datapipeline/transforms/sequence.py +2 -35
datapipeline/transforms/stream/dedupe.py +24 -0
datapipeline/transforms/stream/ensure_ticks.py +7 -6
datapipeline/transforms/vector/__init__.py +5 -0
datapipeline/transforms/vector/common.py +98 -0
datapipeline/transforms/vector/drop/__init__.py +4 -0
datapipeline/transforms/vector/drop/horizontal.py +79 -0
datapipeline/transforms/vector/drop/orchestrator.py +59 -0
datapipeline/transforms/vector/drop/vertical.py +182 -0
datapipeline/transforms/vector/ensure_schema.py +184 -0
datapipeline/transforms/vector/fill.py +87 -0
datapipeline/transforms/vector/replace.py +62 -0
datapipeline/utils/load.py +24 -3
datapipeline/utils/rich_compat.py +38 -0
datapipeline/utils/window.py +76 -0
jerry_thomas-1.0.0.dist-info/METADATA +825 -0
jerry_thomas-1.0.0.dist-info/RECORD +199 -0
{jerry_thomas-0.3.0.dist-info → jerry_thomas-1.0.0.dist-info}/entry_points.txt +9 -8
datapipeline/build/tasks.py +0 -186
datapipeline/cli/commands/link.py +0 -128
datapipeline/cli/commands/writers.py +0 -138
datapipeline/config/build.py +0 -64
datapipeline/config/run.py +0 -116
datapipeline/templates/plugin_skeleton/config/contracts/time_hour_sin.synthetic.yaml +0 -24
datapipeline/templates/plugin_skeleton/config/contracts/time_linear.synthetic.yaml +0 -23
datapipeline/templates/plugin_skeleton/config/datasets/default/build.yaml +0 -9
datapipeline/templates/plugin_skeleton/config/datasets/default/dataset.yaml +0 -14
datapipeline/templates/plugin_skeleton/config/datasets/default/postprocess.yaml +0 -13
datapipeline/templates/plugin_skeleton/config/datasets/default/runs/run_test.yaml +0 -10
datapipeline/templates/plugin_skeleton/config/datasets/default/runs/run_train.yaml +0 -10
datapipeline/templates/plugin_skeleton/config/datasets/default/runs/run_val.yaml +0 -10
datapipeline/templates/plugin_skeleton/config/sources/time_ticks.yaml +0 -11
datapipeline/transforms/vector.py +0 -210
jerry_thomas-0.3.0.dist-info/METADATA +0 -502
jerry_thomas-0.3.0.dist-info/RECORD +0 -139
{jerry_thomas-0.3.0.dist-info → jerry_thomas-1.0.0.dist-info}/WHEEL +0 -0
{jerry_thomas-0.3.0.dist-info → jerry_thomas-1.0.0.dist-info}/licenses/LICENSE +0 -0
{jerry_thomas-0.3.0.dist-info → jerry_thomas-1.0.0.dist-info}/top_level.txt +0 -0

datapipeline/cli/app.py CHANGED Viewed

@@ -1,17 +1,100 @@
 import argparse
 import logging
+from pathlib import Path
+from typing import Optional, Tuple
 from datapipeline.cli.commands.run import handle_serve
 from datapipeline.cli.commands.plugin import bar as handle_bar
 from datapipeline.cli.commands.source import handle as handle_source
 from datapipeline.cli.commands.domain import handle as handle_domain
-from datapipeline.cli.commands.link import handle as handle_link
+from datapipeline.cli.commands.contract import handle as handle_contract
 from datapipeline.cli.commands.list_ import handle as handle_list
 from datapipeline.cli.commands.filter import handle as handle_filter
 from datapipeline.cli.commands.inspect import (
     report as handle_inspect_report,
 )
 from datapipeline.cli.commands.build import handle as handle_build
+from datapipeline.config.workspace import (
+    WorkspaceContext,
+    load_workspace_context,
+)
+from datapipeline.config.resolution import resolve_visuals
+from datapipeline.utils.rich_compat import suppress_file_proxy_shutdown_errors
+suppress_file_proxy_shutdown_errors()
+def _dataset_to_project_path(
+    dataset: str,
+    workspace: Optional[WorkspaceContext],
+) -> str:
+    """Resolve a dataset selector (alias, folder, or file) into a project.yaml path."""
+    # 1) Alias via jerry.yaml datasets (wins over local folders with same name)
+    if workspace is not None:
+        datasets = getattr(workspace.config, "datasets", {}) or {}
+        raw = datasets.get(dataset)
+        if raw:
+            base = workspace.root
+            candidate = Path(raw)
+            candidate = candidate if candidate.is_absolute() else (base / candidate)
+            if candidate.is_dir():
+                candidate = candidate / "project.yaml"
+            return str(candidate.resolve())
+    # 2) Direct file path
+    path = Path(dataset)
+    if path.suffix in {".yaml", ".yml"}:
+        return str(path if path.is_absolute() else (Path.cwd() / path).resolve())
+    # 3) Directory: assume project.yaml inside
+    if path.is_dir():
+        candidate = path / "project.yaml"
+        return str(candidate.resolve())
+    raise SystemExit(f"Unknown dataset '{dataset}'. Define it under datasets: in jerry.yaml or pass a valid path.")
+def _resolve_project_from_args(
+    project: Optional[str],
+    dataset: Optional[str],
+    workspace: Optional[WorkspaceContext],
+) -> Tuple[Optional[str], Optional[str]]:
+    """Resolve final project path from --project / --dataset / jerry.yaml defaults.
+    Rules:
+    - If both project and dataset are explicitly given (and project != DEFAULT_PROJECT_PATH), error.
+    - If dataset is given, resolve it to a project path (alias, dir, or file).
+    - If neither is given (or project==DEFAULT_PROJECT_PATH), and jerry.yaml declares default_dataset,
+      resolve that alias.
+    - Otherwise fall back to legacy DEFAULT_PROJECT_PATH resolution.
+    """
+    explicit_project = project is not None
+    explicit_dataset = dataset is not None
+    if explicit_project and explicit_dataset:
+        raise SystemExit("Cannot use both --project and --dataset; pick one.")
+    # Prefer dataset when provided
+    if explicit_dataset:
+        resolved = _dataset_to_project_path(dataset, workspace)
+        return resolved, dataset
+    # No explicit dataset; use default_dataset from workspace when project is not explicitly set
+    if not explicit_project and workspace is not None:
+        default_ds = getattr(workspace.config, "default_dataset", None)
+        if default_ds:
+            resolved = _dataset_to_project_path(default_ds, workspace)
+            return resolved, default_ds
+    # If project was given explicitly, use it as-is (caller is responsible for validity).
+    if explicit_project:
+        return project, dataset
+    # Nothing resolved: require explicit selection.
+    raise SystemExit(
+        "No dataset/project selected. Use --dataset <name|path>, --project <path>, "
+        "or define default_dataset in jerry.yaml."
+    )
 def main() -> None:
@@ -37,10 +120,15 @@ def main() -> None:
         help="produce vectors with configurable logging",
         parents=[common],
     )
+    p_serve.add_argument(
+        "--dataset",
+        "-d",
+        help="dataset alias, folder, or project.yaml path",
+    )
     p_serve.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_serve.add_argument(
@@ -48,22 +136,31 @@ def main() -> None:
         help="optional cap on the number of vectors to emit",
     )
     p_serve.add_argument(
-        "--output", "-o", default=None,
-        help="output destination: 'print', 'stream', or a file ending in .pt",
+        "--out-transport",
+        choices=["stdout", "fs"],
+        help="output transport (stdout or fs) for serve runs",
     )
     p_serve.add_argument(
-        "--include-targets",
-        action=argparse.BooleanOptionalAction,
-        default=None,
-        help="include dataset.targets in served vectors (use --no-include-targets to force disable)",
+        "--out-format",
+        choices=["print", "json-lines", "json", "csv", "pickle"],
+        help="output format (print/json-lines/csv/pickle) for serve runs",
+    )
+    p_serve.add_argument(
+        "--out-payload",
+        choices=["sample", "vector"],
+        help="payload structure: full sample (default) or vector-only body",
+    )
+    p_serve.add_argument(
+        "--out-path",
+        help="destination file path when using fs transport",
     )
     p_serve.add_argument(
         "--keep",
-        help="split label to serve; overrides run.yaml and project globals",
+        help="split label to serve; overrides serve tasks and project globals",
     )
     p_serve.add_argument(
         "--run",
-        help="select a specific run config by filename stem when project.paths.run points to a folder",
+        help="select a serve task by name when project.paths.tasks contains multiple entries",
     )
     p_serve.add_argument(
         "--stage",
@@ -73,6 +170,23 @@ def main() -> None:
         default=None,
         help="preview a specific pipeline stage (0-5 feature stages, 6 assembled vectors, 7 transformed vectors)",
     )
+    p_serve.add_argument(
+        "--visuals",
+        choices=["auto", "tqdm", "rich", "off"],
+        default=None,
+        help="visuals renderer: auto (default), tqdm, rich, or off",
+    )
+    p_serve.add_argument(
+        "--progress",
+        choices=["auto", "spinner", "bars", "off"],
+        default=None,
+        help="progress display: auto (spinner unless DEBUG), spinner, bars, or off",
+    )
+    p_serve.add_argument(
+        "--skip-build",
+        action="store_true",
+        help="skip the automatic build step (useful for quick feature previews)",
+    )
     # build (materialize artifacts)
     p_build = sub.add_parser(
@@ -80,10 +194,15 @@ def main() -> None:
         help="materialize project artifacts (expected ids, hashes, etc.)",
         parents=[common],
     )
+    p_build.add_argument(
+        "--dataset",
+        "-d",
+        help="dataset alias, folder, or project.yaml path",
+    )
     p_build.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_build.add_argument(
@@ -91,63 +210,99 @@ def main() -> None:
         action="store_true",
         help="rebuild even when the configuration hash matches the last run",
     )
+    p_build.add_argument(
+        "--visuals",
+        choices=["auto", "tqdm", "rich", "off"],
+        default=None,
+        help="visuals renderer: auto (default), tqdm, rich, or off",
+    )
+    p_build.add_argument(
+        "--progress",
+        choices=["auto", "spinner", "bars", "off"],
+        default=None,
+        help="progress display: auto (spinner unless DEBUG), spinner, bars, or off",
+    )
     # source
-    p_dist = sub.add_parser(
+    p_source = sub.add_parser(
         "source",
         help="add or list raw sources",
         parents=[common],
     )
-    dist_sub = p_dist.add_subparsers(dest="dist_cmd", required=True)
-    p_dist_add = dist_sub.add_parser(
+    source_sub = p_source.add_subparsers(dest="source_cmd", required=True)
+    p_source_add = source_sub.add_parser(
         "add",
         help="create a provider+dataset source",
         description=(
             "Scaffold a source using transport + format.\n\n"
+            "Usage:\n"
+            "  jerry source add <provider> <dataset> -t fs -f csv\n"
+            "  jerry source add <provider>.<dataset> -t http -f json\n"
+            "  jerry source add -p <provider> -d <dataset> -t synthetic\n\n"
             "Examples:\n"
             "  fs CSV:        -t fs  -f csv\n"
             "  fs NDJSON:     -t fs  -f json-lines\n"
-            "  URL JSON:      -t url -f json\n"
+            "  HTTP JSON:     -t http -f json\n"
             "  Synthetic:     -t synthetic\n\n"
             "Note: set 'glob: true' in the generated YAML if your 'path' contains wildcards."
         ),
     )
-    p_dist_add.add_argument("--provider", "-p", required=True)
-    p_dist_add.add_argument("--dataset", "-d", required=True)
-    p_dist_add.add_argument(
+    # Support simple positionals, plus flags for compatibility
+    # Allow either positionals or flags. Use distinct dest names for flags
+    # to avoid ambiguity when both forms are present in some environments.
+    p_source_add.add_argument("provider", nargs="?", help="provider name")
+    p_source_add.add_argument("dataset", nargs="?", help="dataset slug")
+    p_source_add.add_argument("--provider", "-p", dest="provider_opt", metavar="PROVIDER", help="provider name")
+    p_source_add.add_argument("--dataset", "-d", dest="dataset_opt", metavar="DATASET", help="dataset slug")
+    p_source_add.add_argument("--alias", "-a", help="provider.dataset alias")
+    p_source_add.add_argument(
         "--transport", "-t",
-        choices=["fs", "url", "synthetic"],
+        choices=["fs", "http", "synthetic"],
         required=True,
-        help="how data is accessed: fs/url/synthetic",
+        help="how data is accessed: fs/http/synthetic",
     )
-    p_dist_add.add_argument(
+    p_source_add.add_argument(
         "--format", "-f",
-        choices=["csv", "json", "json-lines"],
-        help="data format for fs/url transports (ignored otherwise)",
+        choices=["csv", "json", "json-lines", "pickle"],
+        help="data format for fs/http transports (ignored otherwise)",
+    )
+    p_source_add.add_argument(
+        "--identity",
+        action="store_true",
+        help="use the built-in identity parser (skips DTO/parser scaffolding)",
     )
-    dist_sub.add_parser("list", help="list known sources")
+    source_sub.add_parser("list", help="list known sources")
     # domain
-    p_spirit = sub.add_parser(
+    p_domain = sub.add_parser(
         "domain",
         help="add or list domains",
         parents=[common],
     )
-    spirit_sub = p_spirit.add_subparsers(dest="spirit_cmd", required=True)
-    p_spirit_add = spirit_sub.add_parser(
+    domain_sub = p_domain.add_subparsers(dest="domain_cmd", required=True)
+    p_domain_add = domain_sub.add_parser(
         "add",
         help="create a domain",
         description="Create a time-aware domain package rooted in TemporalRecord.",
     )
-    p_spirit_add.add_argument("--domain", "-d", required=True)
-    spirit_sub.add_parser("list", help="list known domains")
+    # Accept positional name, plus flags for flexibility and consistency.
+    p_domain_add.add_argument("domain", nargs="?", help="domain name")
+    p_domain_add.add_argument(
+        "--name", "-n", dest="domain", help="domain name"
+    )
+    domain_sub.add_parser("list", help="list known domains")
-    # contract (link source <-> domain)
+    # contract (interactive: ingest or composed)
     p_contract = sub.add_parser(
         "contract",
-        help="link a source to a domain",
+        help="manage stream contracts (ingest or composed)",
         parents=[common],
     )
+    p_contract.add_argument(
+        "--identity",
+        action="store_true",
+        help="use built-in identity mapper (skip mapper scaffolding)",
+    )
     # plugin (plugin scaffolding)
     p_bar = sub.add_parser(
@@ -158,7 +313,9 @@ def main() -> None:
     bar_sub = p_bar.add_subparsers(dest="bar_cmd", required=True)
     p_bar_init = bar_sub.add_parser(
         "init", help="create a plugin skeleton")
-    p_bar_init.add_argument("--name", "-n", required=True)
+    # Accept positional name and flag for flexibility
+    p_bar_init.add_argument("name", nargs="?", help="plugin distribution name")
+    p_bar_init.add_argument("--name", "-n", dest="name", help="plugin distribution name")
     p_bar_init.add_argument("--out", "-o", default=".")
     # filter (unchanged helper)
@@ -171,11 +328,31 @@ def main() -> None:
         help="filter entrypoint name and function/module name",
     )
+    # Shared visuals/progress controls for inspect commands
+    inspect_common = argparse.ArgumentParser(add_help=False)
+    inspect_common.add_argument(
+        "--visuals",
+        choices=["auto", "tqdm", "rich", "off"],
+        default=None,
+        help="visuals renderer: auto (default), tqdm, rich, or off",
+    )
+    inspect_common.add_argument(
+        "--progress",
+        choices=["auto", "spinner", "bars", "off"],
+        default=None,
+        help="progress display: auto (spinner unless DEBUG), spinner, bars, or off",
+    )
+    inspect_common.add_argument(
+        "--dataset",
+        "-d",
+        help="dataset alias, folder, or project.yaml path",
+    )
     # inspect (metadata helpers)
     p_inspect = sub.add_parser(
         "inspect",
-        help="inspect dataset metadata: report, coverage, matrix, partitions",
-        parents=[common],
+        help="inspect dataset metadata: report, matrix, partitions",
+        parents=[common, inspect_common],
     )
     inspect_sub = p_inspect.add_subparsers(dest="inspect_cmd", required=False)
@@ -183,11 +360,12 @@ def main() -> None:
     p_inspect_report = inspect_sub.add_parser(
         "report",
         help="print a quality report to stdout",
+        parents=[inspect_common],
     )
     p_inspect_report.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_inspect_report.add_argument(
@@ -210,62 +388,22 @@ def main() -> None:
         help="whether to apply postprocess transforms (final) or skip them (raw)",
     )
     p_inspect_report.add_argument(
-        "--include-targets",
-        action="store_true",
-        help="include dataset.targets when computing report/matrix/coverage",
-    )
-    # Coverage (JSON file)
-    p_inspect_cov = inspect_sub.add_parser(
-        "coverage",
-        help="write coverage summary JSON",
-    )
-    p_inspect_cov.add_argument(
-        "--project",
-        "-p",
-        default="config/datasets/default/project.yaml",
-        help="path to project.yaml",
-    )
-    p_inspect_cov.add_argument(
-        "--output",
-        "-o",
-        default=None,
-        help="coverage JSON path (defaults to build/coverage.json)",
-    )
-    p_inspect_cov.add_argument(
-        "--threshold",
-        "-t",
-        type=float,
-        default=0.95,
-        help="coverage threshold (0-1) for keep/drop lists",
-    )
-    p_inspect_cov.add_argument(
-        "--match-partition",
-        choices=["base", "full"],
-        default="base",
-        help="match features by base id or full partition id",
-    )
-    p_inspect_cov.add_argument(
-        "--mode",
-        choices=["final", "raw"],
-        default="final",
-        help="whether to apply postprocess transforms (final) or skip them (raw)",
-    )
-    p_inspect_cov.add_argument(
-        "--include-targets",
-        action="store_true",
-        help="include dataset.targets when computing coverage",
+        "--sort",
+        choices=["missing", "nulls"],
+        default="missing",
+        help="feature ranking metric in the report (missing or nulls)",
     )
     # Matrix export
     p_inspect_matrix = inspect_sub.add_parser(
         "matrix",
         help="export availability matrix",
+        parents=[inspect_common],
     )
     p_inspect_matrix.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_inspect_matrix.add_argument(
@@ -309,21 +447,17 @@ def main() -> None:
         default="final",
         help="whether to apply postprocess transforms (final) or skip them (raw)",
     )
-    p_inspect_matrix.add_argument(
-        "--include-targets",
-        action="store_true",
-        help="include dataset.targets when exporting the matrix",
-    )
     # Partitions manifest subcommand
     p_inspect_parts = inspect_sub.add_parser(
         "partitions",
         help="discover partitions and write a manifest JSON",
+        parents=[inspect_common],
     )
     p_inspect_parts.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_inspect_parts.add_argument(
@@ -332,21 +466,17 @@ def main() -> None:
         default=None,
         help="partitions manifest path (defaults to build/partitions.json)",
     )
-    p_inspect_parts.add_argument(
-        "--include-targets",
-        action="store_true",
-        help="include dataset.targets when discovering partitions",
-    )
     # Expected IDs (newline list)
     p_inspect_expected = inspect_sub.add_parser(
         "expected",
         help="discover full feature ids and write a newline list",
+        parents=[inspect_common],
     )
     p_inspect_expected.add_argument(
         "--project",
         "-p",
-        default="config/datasets/default/project.yaml",
+        default=None,
         help="path to project.yaml",
     )
     p_inspect_expected.add_argument(
@@ -355,47 +485,87 @@ def main() -> None:
         default=None,
         help="expected ids output path (defaults to build/datasets/<name>/expected.txt)",
     )
-    p_inspect_expected.add_argument(
-        "--include-targets",
-        action="store_true",
-        help="include dataset.targets when discovering expected ids",
-    )
+    workspace_context = load_workspace_context(Path.cwd())
     args = parser.parse_args()
+    # Resolve dataset/project selection for commands that use a project.
+    if hasattr(args, "project") or hasattr(args, "dataset"):
+        raw_project = getattr(args, "project", None)
+        raw_dataset = getattr(args, "dataset", None)
+        resolved_project, resolved_dataset = _resolve_project_from_args(
+            raw_project,
+            raw_dataset,
+            workspace_context,
+        )
+        if hasattr(args, "project"):
+            args.project = resolved_project
+        if hasattr(args, "dataset"):
+            args.dataset = resolved_dataset
     cli_level_arg = getattr(args, "log_level", None)
-    base_level_name = (cli_level_arg or "WARNING").upper()
+    shared_defaults = workspace_context.config.shared if workspace_context else None
+    # Default logging level: CLI flag > jerry.yaml shared.log_level > INFO
+    default_level_name = (
+        shared_defaults.log_level.upper()
+        if shared_defaults and shared_defaults.log_level
+        else "INFO"
+    )
+    base_level_name = (cli_level_arg or default_level_name).upper()
     base_level = logging._nameToLevel.get(base_level_name, logging.WARNING)
     logging.basicConfig(level=base_level, format="%(message)s")
+    plugin_root = (
+        workspace_context.resolve_plugin_root() if workspace_context else None
+    )
     if args.cmd == "serve":
         handle_serve(
             project=args.project,
             limit=getattr(args, "limit", None),
-            output=args.output,
-            include_targets=args.include_targets,
             keep=getattr(args, "keep", None),
             run_name=getattr(args, "run", None),
             stage=getattr(args, "stage", None),
+            out_transport=getattr(args, "out_transport", None),
+            out_format=getattr(args, "out_format", None),
+            out_payload=getattr(args, "out_payload", None),
+            out_path=getattr(args, "out_path", None),
+            skip_build=getattr(args, "skip_build", False),
             cli_log_level=cli_level_arg,
             base_log_level=base_level_name,
+            cli_visuals=getattr(args, "visuals", None),
+            cli_progress=getattr(args, "progress", None),
+            workspace=workspace_context,
         )
         return
     if args.cmd == "build":
         handle_build(
             project=args.project,
             force=getattr(args, "force", False),
+            cli_visuals=getattr(args, "visuals", None),
+            cli_progress=getattr(args, "progress", None),
+            workspace=workspace_context,
         )
         return
     if args.cmd == "inspect":
         # Default to 'report' when no subcommand is given
         subcmd = getattr(args, "inspect_cmd", None)
+        shared_visuals_default = shared_defaults.visuals if shared_defaults else None
+        shared_progress_default = shared_defaults.progress if shared_defaults else None
+        inspect_visuals = resolve_visuals(
+            cli_visuals=getattr(args, "visuals", None),
+            config_visuals=None,
+            workspace_visuals=shared_visuals_default,
+            cli_progress=getattr(args, "progress", None),
+            config_progress=None,
+            workspace_progress=shared_progress_default,
+        )
+        inspect_visual_provider = inspect_visuals.visuals or "auto"
+        inspect_progress_style = inspect_visuals.progress or "auto"
         if subcmd in (None, "report"):
             handle_inspect_report(
-                project=getattr(args, "project",
-                                "config/datasets/default/project.yaml"),
+                project=args.project,
                 output=None,
                 threshold=getattr(args, "threshold", 0.95),
                 match_partition=getattr(args, "match_partition", "base"),
@@ -406,22 +576,11 @@ def main() -> None:
                 quiet=False,
                 write_coverage=False,
                 apply_postprocess=(getattr(args, "mode", "final") == "final"),
-                include_targets=getattr(args, "include_targets", False),
-            )
-        elif subcmd == "coverage":
-            handle_inspect_report(
-                project=args.project,
-                output=getattr(args, "output", None),
-                threshold=getattr(args, "threshold", 0.95),
-                match_partition=getattr(args, "match_partition", "base"),
-                matrix="none",
-                matrix_output=None,
-                rows=20,
-                cols=10,
-                quiet=True,
-                write_coverage=True,
-                apply_postprocess=(getattr(args, "mode", "final") == "final"),
-                include_targets=getattr(args, "include_targets", False),
+                visuals=inspect_visual_provider,
+                progress=inspect_progress_style,
+                log_level=base_level,
+                sort=getattr(args, "sort", "missing"),
+                workspace=workspace_context,
             )
         elif subcmd == "matrix":
             handle_inspect_report(
@@ -436,49 +595,67 @@ def main() -> None:
                 quiet=getattr(args, "quiet", False),
                 write_coverage=False,
                 apply_postprocess=(getattr(args, "mode", "final") == "final"),
-                include_targets=getattr(args, "include_targets", False),
+                visuals=inspect_visual_provider,
+                progress=inspect_progress_style,
+                log_level=base_level,
+                sort=getattr(args, "sort", "missing"),
+                workspace=workspace_context,
             )
         elif subcmd == "partitions":
             from datapipeline.cli.commands.inspect import partitions as handle_inspect_partitions
             handle_inspect_partitions(
                 project=args.project,
                 output=getattr(args, "output", None),
-                include_targets=getattr(args, "include_targets", False),
+                visuals=inspect_visual_provider,
+                progress=inspect_progress_style,
+                log_level=base_level,
+                workspace=workspace_context,
             )
         elif subcmd == "expected":
             from datapipeline.cli.commands.inspect import expected as handle_inspect_expected
             handle_inspect_expected(
                 project=args.project,
                 output=getattr(args, "output", None),
-                include_targets=getattr(args, "include_targets", False),
+                visuals=inspect_visual_provider,
+                progress=inspect_progress_style,
+                log_level=base_level,
+                workspace=workspace_context,
             )
         return
     if args.cmd == "source":
-        if args.dist_cmd == "list":
+        if args.source_cmd == "list":
             handle_list(subcmd="sources")
         else:
+            # Merge positionals and flags for provider/dataset
             handle_source(
                 subcmd="add",
-                provider=getattr(args, "provider", None),
-                dataset=getattr(args, "dataset", None),
+                provider=(getattr(args, "provider", None) or getattr(args, "provider_opt", None)),
+                dataset=(getattr(args, "dataset", None) or getattr(args, "dataset_opt", None)),
                 transport=getattr(args, "transport", None),
                 format=getattr(args, "format", None),
+                alias=getattr(args, "alias", None),
+                identity=getattr(args, "identity", False),
+                plugin_root=plugin_root,
             )
         return
     if args.cmd == "domain":
-        if args.spirit_cmd == "list":
+        if args.domain_cmd == "list":
             handle_list(subcmd="domains")
         else:
             handle_domain(
                 subcmd="add",
                 domain=getattr(args, "domain", None),
+                plugin_root=plugin_root,
             )
         return
     if args.cmd == "contract":
-        handle_link()
+        handle_contract(
+            plugin_root=plugin_root,
+            use_identity=args.identity,
+        )
         return
     if args.cmd == "plugin":

jerry-thomas 0.3.0__py3-none-any.whl → 1.0.0__py3-none-any.whl

jerry-thomas 0.3.0py3-none-any.whl → 1.0.0py3-none-any.whl