PyPI - juniper-data - Versions diffs - 0.4.2__py3-none-any.whl - Mend

juniper-data 0.4.2__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (95) hide show

juniper_data/__init__.py +88 -0
juniper_data/__main__.py +78 -0
juniper_data/api/__init__.py +10 -0
juniper_data/api/app.py +111 -0
juniper_data/api/middleware.py +95 -0
juniper_data/api/routes/__init__.py +9 -0
juniper_data/api/routes/datasets.py +414 -0
juniper_data/api/routes/generators.py +125 -0
juniper_data/api/routes/health.py +49 -0
juniper_data/api/security.py +238 -0
juniper_data/api/settings.py +109 -0
juniper_data/core/__init__.py +32 -0
juniper_data/core/artifacts.py +63 -0
juniper_data/core/dataset_id.py +38 -0
juniper_data/core/models.py +135 -0
juniper_data/core/split.py +120 -0
juniper_data/generators/__init__.py +15 -0
juniper_data/generators/arc_agi/__init__.py +11 -0
juniper_data/generators/arc_agi/generator.py +229 -0
juniper_data/generators/arc_agi/params.py +56 -0
juniper_data/generators/checkerboard/__init__.py +15 -0
juniper_data/generators/checkerboard/generator.py +114 -0
juniper_data/generators/checkerboard/params.py +32 -0
juniper_data/generators/circles/__init__.py +11 -0
juniper_data/generators/circles/generator.py +112 -0
juniper_data/generators/circles/params.py +31 -0
juniper_data/generators/csv_import/__init__.py +15 -0
juniper_data/generators/csv_import/generator.py +198 -0
juniper_data/generators/csv_import/params.py +48 -0
juniper_data/generators/gaussian/__init__.py +11 -0
juniper_data/generators/gaussian/generator.py +149 -0
juniper_data/generators/gaussian/params.py +53 -0
juniper_data/generators/mnist/__init__.py +11 -0
juniper_data/generators/mnist/generator.py +124 -0
juniper_data/generators/mnist/params.py +39 -0
juniper_data/generators/spiral/__init__.py +57 -0
juniper_data/generators/spiral/defaults.py +39 -0
juniper_data/generators/spiral/generator.py +206 -0
juniper_data/generators/spiral/params.py +148 -0
juniper_data/generators/xor/__init__.py +11 -0
juniper_data/generators/xor/generator.py +162 -0
juniper_data/generators/xor/params.py +30 -0
juniper_data/storage/__init__.py +120 -0
juniper_data/storage/base.py +279 -0
juniper_data/storage/cached.py +211 -0
juniper_data/storage/hf_store.py +257 -0
juniper_data/storage/kaggle_store.py +333 -0
juniper_data/storage/local_fs.py +232 -0
juniper_data/storage/memory.py +136 -0
juniper_data/storage/postgres_store.py +373 -0
juniper_data/storage/redis_store.py +264 -0
juniper_data/tests/__init__.py +1 -0
juniper_data/tests/conftest.py +68 -0
juniper_data/tests/fixtures/generate_golden_datasets.py +199 -0
juniper_data/tests/integration/__init__.py +1 -0
juniper_data/tests/integration/test_api.py +283 -0
juniper_data/tests/integration/test_e2e_workflow.py +378 -0
juniper_data/tests/integration/test_lifecycle_api.py +304 -0
juniper_data/tests/integration/test_security_integration.py +189 -0
juniper_data/tests/integration/test_storage_workflow.py +259 -0
juniper_data/tests/performance/__init__.py +1 -0
juniper_data/tests/performance/test_generator_benchmarks.py +178 -0
juniper_data/tests/performance/test_storage_benchmarks.py +257 -0
juniper_data/tests/unit/__init__.py +1 -0
juniper_data/tests/unit/test_api_app.py +206 -0
juniper_data/tests/unit/test_api_routes.py +407 -0
juniper_data/tests/unit/test_api_settings.py +100 -0
juniper_data/tests/unit/test_arc_agi_generator.py +525 -0
juniper_data/tests/unit/test_artifacts.py +145 -0
juniper_data/tests/unit/test_cached_store.py +423 -0
juniper_data/tests/unit/test_checkerboard_generator.py +232 -0
juniper_data/tests/unit/test_circles_generator.py +256 -0
juniper_data/tests/unit/test_csv_import_generator.py +345 -0
juniper_data/tests/unit/test_dataset_id.py +181 -0
juniper_data/tests/unit/test_gaussian_generator.py +333 -0
juniper_data/tests/unit/test_hf_store.py +416 -0
juniper_data/tests/unit/test_init.py +93 -0
juniper_data/tests/unit/test_kaggle_store.py +469 -0
juniper_data/tests/unit/test_lifecycle.py +394 -0
juniper_data/tests/unit/test_main.py +127 -0
juniper_data/tests/unit/test_middleware.py +79 -0
juniper_data/tests/unit/test_mnist_generator.py +370 -0
juniper_data/tests/unit/test_postgres_store.py +490 -0
juniper_data/tests/unit/test_redis_store.py +500 -0
juniper_data/tests/unit/test_security.py +281 -0
juniper_data/tests/unit/test_security_boundaries.py +517 -0
juniper_data/tests/unit/test_spiral_generator.py +566 -0
juniper_data/tests/unit/test_split.py +245 -0
juniper_data/tests/unit/test_storage.py +767 -0
juniper_data/tests/unit/test_xor_generator.py +223 -0
juniper_data-0.4.2.dist-info/METADATA +216 -0
juniper_data-0.4.2.dist-info/RECORD +95 -0
juniper_data-0.4.2.dist-info/WHEEL +5 -0
juniper_data-0.4.2.dist-info/licenses/LICENSE +9 -0
juniper_data-0.4.2.dist-info/top_level.txt +1 -0

juniper_data/api/routes/datasets.py ADDED Viewed

@@ -0,0 +1,414 @@
+"""Dataset endpoints for creating, listing, and retrieving datasets."""
+import io
+from datetime import UTC, datetime, timedelta
+import numpy as np
+from fastapi import APIRouter, Depends, HTTPException, Query
+from fastapi.responses import StreamingResponse
+from juniper_data.core.dataset_id import generate_dataset_id
+from juniper_data.core.models import (
+    BatchDeleteRequest,
+    BatchDeleteResponse,
+    CreateDatasetRequest,
+    CreateDatasetResponse,
+    DatasetListResponse,
+    DatasetMeta,
+    DatasetStats,
+    PreviewData,
+    UpdateTagsRequest,
+)
+from juniper_data.storage import DatasetStore
+from .generators import GENERATOR_REGISTRY
+# from typing import List, Optional
+router = APIRouter(prefix="/datasets", tags=["datasets"])
+_store: DatasetStore | None = None
+def get_store() -> DatasetStore:
+    """Dependency to get the dataset store."""
+    if _store is None:
+        raise HTTPException(status_code=500, detail="Storage not initialized")
+    return _store
+def set_store(store: DatasetStore) -> None:
+    """Set the dataset store (called during app startup)."""
+    global _store
+    _store = store
+@router.post("", response_model=CreateDatasetResponse, status_code=201)
+async def create_dataset(
+    request: CreateDatasetRequest,
+    store: DatasetStore = Depends(get_store),
+) -> CreateDatasetResponse:
+    """Create or generate a new dataset.
+    If a dataset with the same parameters already exists, returns the existing
+    metadata without regeneration (caching behavior).
+    Args:
+        request: Dataset creation request with generator name and parameters.
+        store: Dataset storage backend.
+    Returns:
+        Dataset metadata and artifact URL.
+    Raises:
+        HTTPException: 400 if generator not found or parameters invalid.
+    """
+    if request.generator not in GENERATOR_REGISTRY:
+        raise HTTPException(
+            status_code=400,
+            detail=f"Unknown generator '{request.generator}'. Available: {list(GENERATOR_REGISTRY.keys())}",
+        )
+    generator_info = GENERATOR_REGISTRY[request.generator]
+    generator_class = generator_info["generator"]
+    params_class = generator_info["params_class"]
+    version = generator_info["version"]
+    try:
+        params = params_class(**request.params)
+    except Exception as e:
+        raise HTTPException(status_code=400, detail=f"Invalid parameters: {e}")
+    dataset_id = generate_dataset_id(
+        generator=request.generator,
+        version=version,
+        params=params.model_dump(),
+    )
+    existing_meta = store.get_meta(dataset_id)
+    if existing_meta is not None:
+        return CreateDatasetResponse(
+            dataset_id=dataset_id,
+            generator=request.generator,
+            meta=existing_meta,
+            artifact_url=f"/v1/datasets/{dataset_id}/artifact",
+        )
+    arrays = generator_class.generate(params)
+    n_train = len(arrays["X_train"])
+    n_test = len(arrays["X_test"])
+    n_samples = n_train + n_test
+    n_features = arrays["X_train"].shape[1] if n_train > 0 else 2
+    n_classes = arrays["y_train"].shape[1] if n_train > 0 else params.n_spirals
+    y_full = arrays.get("y_full", np.vstack([arrays["y_train"], arrays["y_test"]]))
+    class_labels = np.argmax(y_full, axis=1)
+    unique, counts = np.unique(class_labels, return_counts=True)
+    class_distribution = {str(int(k)): int(v) for k, v in zip(unique, counts)}
+    now = datetime.now(UTC)
+    expires_at = None
+    if request.ttl_seconds is not None:
+        expires_at = now + timedelta(seconds=request.ttl_seconds)
+    meta = DatasetMeta(
+        dataset_id=dataset_id,
+        generator=request.generator,
+        generator_version=version,
+        params=params.model_dump(),
+        n_samples=n_samples,
+        n_features=n_features,
+        n_classes=n_classes,
+        n_train=n_train,
+        n_test=n_test,
+        class_distribution=class_distribution,
+        artifact_formats=["npz"],
+        created_at=now,
+        tags=request.tags,
+        ttl_seconds=request.ttl_seconds,
+        expires_at=expires_at,
+    )
+    if request.persist:
+        store.save(dataset_id, meta, arrays)
+    return CreateDatasetResponse(
+        dataset_id=dataset_id,
+        generator=request.generator,
+        meta=meta,
+        artifact_url=f"/v1/datasets/{dataset_id}/artifact",
+    )
+@router.get("", response_model=list[str])
+async def list_datasets(
+    limit: int = Query(default=100, ge=1, le=1000),
+    offset: int = Query(default=0, ge=0),
+    store: DatasetStore = Depends(get_store),
+) -> list[str]:
+    """List all dataset IDs.
+    Args:
+        limit: Maximum number of dataset IDs to return.
+        offset: Number of dataset IDs to skip.
+        store: Dataset storage backend.
+    Returns:
+        List of dataset IDs.
+    """
+    return store.list_datasets(limit=limit, offset=offset)
+@router.get("/filter", response_model=DatasetListResponse)
+async def filter_datasets(
+    generator: str | None = Query(default=None, description="Filter by generator name"),
+    tags: str | None = Query(default=None, description="Comma-separated list of tags to filter by"),
+    tags_match: str = Query(
+        default="any", pattern="^(any|all)$", description="Tag matching mode: 'any' (OR) or 'all' (AND)"
+    ),
+    created_after: datetime | None = Query(default=None, description="Filter by creation date (after)"),
+    created_before: datetime | None = Query(default=None, description="Filter by creation date (before)"),
+    min_samples: int | None = Query(default=None, ge=1, description="Minimum number of samples"),
+    max_samples: int | None = Query(default=None, ge=1, description="Maximum number of samples"),
+    include_expired: bool = Query(default=False, description="Include expired datasets"),
+    limit: int = Query(default=100, ge=1, le=1000),
+    offset: int = Query(default=0, ge=0),
+    store: DatasetStore = Depends(get_store),
+) -> DatasetListResponse:
+    """Filter datasets by various criteria.
+    Args:
+        generator: Filter by generator name.
+        tags: Comma-separated list of tags.
+        tags_match: Tag matching mode: 'any' (OR) or 'all' (AND).
+        created_after: Filter by creation date (after).
+        created_before: Filter by creation date (before).
+        min_samples: Minimum number of samples.
+        max_samples: Maximum number of samples.
+        include_expired: Include expired datasets.
+        limit: Maximum number of results.
+        offset: Number of results to skip.
+        store: Dataset storage backend.
+    Returns:
+        Filtered list of dataset metadata with pagination info.
+    """
+    tag_list = [t.strip() for t in tags.split(",")] if tags else None
+    datasets, total = store.filter_datasets(
+        generator=generator,
+        tags=tag_list,
+        tags_match=tags_match,
+        created_after=created_after,
+        created_before=created_before,
+        min_samples=min_samples,
+        max_samples=max_samples,
+        include_expired=include_expired,
+        limit=limit,
+        offset=offset,
+    )
+    return DatasetListResponse(
+        datasets=datasets,
+        total=total,
+        limit=limit,
+        offset=offset,
+    )
+@router.get("/stats", response_model=DatasetStats)
+async def get_dataset_stats(
+    store: DatasetStore = Depends(get_store),
+) -> DatasetStats:
+    """Get aggregate statistics about stored datasets.
+    Args:
+        store: Dataset storage backend.
+    Returns:
+        Dataset statistics.
+    """
+    stats = store.get_stats()
+    return DatasetStats(**stats)  # type: ignore[arg-type]
+@router.post("/batch-delete", response_model=BatchDeleteResponse)
+async def batch_delete_datasets(
+    request: BatchDeleteRequest,
+    store: DatasetStore = Depends(get_store),
+) -> BatchDeleteResponse:
+    """Delete multiple datasets in a single request.
+    Args:
+        request: Batch delete request with list of dataset IDs.
+        store: Dataset storage backend.
+    Returns:
+        Batch delete response with deleted and not found IDs.
+    """
+    deleted, not_found = store.batch_delete(request.dataset_ids)
+    return BatchDeleteResponse(
+        deleted=deleted,
+        not_found=not_found,
+        total_deleted=len(deleted),
+    )
+@router.post("/cleanup-expired", response_model=list[str])
+async def cleanup_expired_datasets(
+    store: DatasetStore = Depends(get_store),
+) -> list[str]:
+    """Delete all expired datasets.
+    Args:
+        store: Dataset storage backend.
+    Returns:
+        List of deleted dataset IDs.
+    """
+    return store.delete_expired()
+@router.get("/{dataset_id}", response_model=DatasetMeta)
+async def get_dataset_metadata(
+    dataset_id: str,
+    store: DatasetStore = Depends(get_store),
+) -> DatasetMeta:
+    """Get metadata for a specific dataset.
+    Args:
+        dataset_id: Unique dataset identifier.
+        store: Dataset storage backend.
+    Returns:
+        Dataset metadata.
+    Raises:
+        HTTPException: 404 if dataset not found.
+    """
+    meta = store.get_meta(dataset_id)
+    if meta is None:
+        raise HTTPException(status_code=404, detail=f"Dataset '{dataset_id}' not found")
+    return meta
+@router.get("/{dataset_id}/artifact")
+async def download_artifact(
+    dataset_id: str,
+    store: DatasetStore = Depends(get_store),
+) -> StreamingResponse:
+    """Download dataset artifact as NPZ file.
+    Args:
+        dataset_id: Unique dataset identifier.
+        store: Dataset storage backend.
+    Returns:
+        Streaming response with NPZ file contents.
+    Raises:
+        HTTPException: 404 if dataset not found.
+    """
+    artifact_bytes = store.get_artifact_bytes(dataset_id)
+    if artifact_bytes is None:
+        raise HTTPException(status_code=404, detail=f"Dataset '{dataset_id}' not found")
+    return StreamingResponse(
+        io.BytesIO(artifact_bytes),
+        media_type="application/octet-stream",
+        headers={"Content-Disposition": f"attachment; filename={dataset_id}.npz"},
+    )
+@router.get("/{dataset_id}/preview", response_model=PreviewData)
+async def preview_dataset(
+    dataset_id: str,
+    n: int = Query(default=100, ge=1, le=1000),
+    store: DatasetStore = Depends(get_store),
+) -> PreviewData:
+    """Preview first N samples of a dataset as JSON.
+    Args:
+        dataset_id: Unique dataset identifier.
+        n: Number of samples to preview (default 100, max 1000).
+        store: Dataset storage backend.
+    Returns:
+        Preview data with sample features and labels.
+    Raises:
+        HTTPException: 404 if dataset not found.
+    """
+    artifact_bytes = store.get_artifact_bytes(dataset_id)
+    if artifact_bytes is None:
+        raise HTTPException(status_code=404, detail=f"Dataset '{dataset_id}' not found")
+    with np.load(io.BytesIO(artifact_bytes)) as data:
+        if "X_full" in data and "y_full" in data:
+            X = data["X_full"]
+            y = data["y_full"]
+        else:
+            X = np.vstack([data["X_train"], data["X_test"]])
+            y = np.vstack([data["y_train"], data["y_test"]])
+    n_samples = min(n, len(X))
+    return PreviewData(
+        n_samples=n_samples,
+        X_sample=X[:n_samples].tolist(),
+        y_sample=y[:n_samples].tolist(),
+    )
+@router.delete("/{dataset_id}", status_code=204)
+async def delete_dataset(
+    dataset_id: str,
+    store: DatasetStore = Depends(get_store),
+) -> None:
+    """Delete a dataset.
+    Args:
+        dataset_id: Unique dataset identifier.
+        store: Dataset storage backend.
+    Raises:
+        HTTPException: 404 if dataset not found.
+    """
+    deleted = store.delete(dataset_id)
+    if not deleted:
+        raise HTTPException(status_code=404, detail=f"Dataset '{dataset_id}' not found")
+@router.patch("/{dataset_id}/tags", response_model=DatasetMeta)
+async def update_dataset_tags(
+    dataset_id: str,
+    request: UpdateTagsRequest,
+    store: DatasetStore = Depends(get_store),
+) -> DatasetMeta:
+    """Add or remove tags from a dataset.
+    Args:
+        dataset_id: Unique dataset identifier.
+        request: Tags to add and/or remove.
+        store: Dataset storage backend.
+    Returns:
+        Updated dataset metadata.
+    Raises:
+        HTTPException: 404 if dataset not found.
+    """
+    meta = store.get_meta(dataset_id)
+    if meta is None:
+        raise HTTPException(status_code=404, detail=f"Dataset '{dataset_id}' not found")
+    current_tags = set(meta.tags)
+    current_tags.update(request.add_tags)
+    current_tags -= set(request.remove_tags)
+    meta.tags = sorted(current_tags)
+    store.update_meta(dataset_id, meta)
+    return meta

juniper_data/api/routes/generators.py ADDED Viewed

@@ -0,0 +1,125 @@
+"""Generator endpoints for listing and describing available generators."""
+from typing import Any
+from fastapi import APIRouter, HTTPException
+from juniper_data.core.models import GeneratorInfo
+from juniper_data.generators.arc_agi import VERSION as ARC_AGI_VERSION
+from juniper_data.generators.arc_agi import ArcAgiGenerator, ArcAgiParams
+from juniper_data.generators.checkerboard import VERSION as CHECKERBOARD_VERSION
+from juniper_data.generators.checkerboard import CheckerboardGenerator, CheckerboardParams
+from juniper_data.generators.circles import VERSION as CIRCLES_VERSION
+from juniper_data.generators.circles import CirclesGenerator, CirclesParams
+from juniper_data.generators.csv_import import VERSION as CSV_IMPORT_VERSION
+from juniper_data.generators.csv_import import CsvImportGenerator, CsvImportParams
+from juniper_data.generators.gaussian import VERSION as GAUSSIAN_VERSION
+from juniper_data.generators.gaussian import GaussianGenerator, GaussianParams
+from juniper_data.generators.mnist import VERSION as MNIST_VERSION
+from juniper_data.generators.mnist import MnistGenerator, MnistParams
+from juniper_data.generators.spiral import VERSION as SPIRAL_VERSION
+from juniper_data.generators.spiral import SpiralGenerator, SpiralParams
+from juniper_data.generators.xor import VERSION as XOR_VERSION
+from juniper_data.generators.xor import XorGenerator, XorParams
+router = APIRouter(prefix="/generators", tags=["generators"])
+GENERATOR_REGISTRY: dict[str, dict[str, Any]] = {
+    "spiral": {
+        "generator": SpiralGenerator,
+        "params_class": SpiralParams,
+        "version": SPIRAL_VERSION,
+        "description": "Multi-spiral classification dataset generator. "
+        "Generates N interleaved spiral arms with configurable points, rotations, and noise.",
+    },
+    "xor": {
+        "generator": XorGenerator,
+        "params_class": XorParams,
+        "version": XOR_VERSION,
+        "description": "XOR classification dataset generator. "
+        "Generates points in 4 quadrants with opposite classes in diagonal quadrants.",
+    },
+    "gaussian": {
+        "generator": GaussianGenerator,
+        "params_class": GaussianParams,
+        "version": GAUSSIAN_VERSION,
+        "description": "Gaussian blobs classification dataset generator. "
+        "Generates mixture-of-Gaussians with configurable centers and covariance.",
+    },
+    "circles": {
+        "generator": CirclesGenerator,
+        "params_class": CirclesParams,
+        "version": CIRCLES_VERSION,
+        "description": "Concentric circles classification dataset generator. "
+        "Generates binary classification with inner and outer circle classes.",
+    },
+    "checkerboard": {
+        "generator": CheckerboardGenerator,
+        "params_class": CheckerboardParams,
+        "version": CHECKERBOARD_VERSION,
+        "description": "Checkerboard pattern classification dataset generator. "
+        "Generates 2D grid with alternating class squares.",
+    },
+    "csv_import": {
+        "generator": CsvImportGenerator,
+        "params_class": CsvImportParams,
+        "version": CSV_IMPORT_VERSION,
+        "description": "CSV/JSON import generator for custom datasets. "
+        "Import data from CSV or JSON files with configurable feature and label columns.",
+    },
+    "mnist": {
+        "generator": MnistGenerator,
+        "params_class": MnistParams,
+        "version": MNIST_VERSION,
+        "description": "MNIST and Fashion-MNIST dataset generator. "
+        "Downloads and prepares standard handwritten digit or fashion item classification datasets.",
+    },
+    "arc_agi": {
+        "generator": ArcAgiGenerator,
+        "params_class": ArcAgiParams,
+        "version": ARC_AGI_VERSION,
+        "description": "ARC-AGI (Abstraction and Reasoning Corpus) dataset generator. "
+        "Generates visual reasoning tasks from the ARC benchmark.",
+    },
+}
+@router.get("", response_model=list[GeneratorInfo])
+async def list_generators() -> list[GeneratorInfo]:
+    """List all available dataset generators with their info.
+    Returns:
+        List of generator information objects including name, version,
+        description, and parameter schema.
+    """
+    generators: list[GeneratorInfo] = []
+    generators.extend(
+        GeneratorInfo(
+            name=name,
+            version=info["version"],
+            description=info["description"],
+            schema=info["params_class"].model_json_schema(),
+        )
+        for name, info in GENERATOR_REGISTRY.items()
+    )
+    return generators
+@router.get("/{name}/schema")
+async def get_generator_schema(name: str) -> dict[str, Any]:
+    """Get the JSON schema for a generator's parameters.
+    Args:
+        name: Generator name (e.g., "spiral").
+    Returns:
+        JSON schema dictionary describing the generator's parameters.
+    Raises:
+        HTTPException: 404 if generator not found.
+    """
+    if name not in GENERATOR_REGISTRY:
+        raise HTTPException(status_code=404, detail=f"Generator '{name}' not found")
+    params_class = GENERATOR_REGISTRY[name]["params_class"]
+    return params_class.model_json_schema()

juniper_data/api/routes/health.py ADDED Viewed

@@ -0,0 +1,49 @@
+"""Health check endpoints for container orchestration.
+Provides three health check endpoints:
+- /v1/health: Combined health check (backward compatible)
+- /v1/health/live: Liveness probe - is the process running?
+- /v1/health/ready: Readiness probe - is the service ready to accept traffic?
+"""
+from fastapi import APIRouter
+from juniper_data import __version__
+router = APIRouter(tags=["health"])
+@router.get("/health")
+async def health_check() -> dict:
+    """Combined health check endpoint (backward compatible).
+    Returns:
+        Dictionary with service status and version.
+    """
+    return {"status": "ok", "version": __version__}
+@router.get("/health/live")
+async def liveness_probe() -> dict:
+    """Liveness probe for container orchestration.
+    Used by Kubernetes/Docker to determine if the container should be restarted.
+    Returns success if the Python process is running and can respond to requests.
+    Returns:
+        Dictionary with liveness status.
+    """
+    return {"status": "alive"}
+@router.get("/health/ready")
+async def readiness_probe() -> dict:
+    """Readiness probe for container orchestration.
+    Used by Kubernetes/Docker to determine if the container can accept traffic.
+    Returns success if the service is fully initialized and ready to handle requests.
+    Returns:
+        Dictionary with readiness status and version.
+    """
+    return {"status": "ready", "version": __version__}