PyPI - careamics - Versions diffs - 0.1.0rc6__py3-none-any.whl → 0.1.0rc8__py3-none-any.whl - Mend

careamics 0.1.0rc6py3-none-any.whl → 0.1.0rc8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of careamics might be problematic. Click here for more details.

Files changed (91) hide show

careamics/__init__.py +1 -14
careamics/careamist.py +212 -294
careamics/config/__init__.py +0 -3
careamics/config/algorithm_model.py +8 -15
careamics/config/architectures/architecture_model.py +1 -0
careamics/config/architectures/custom_model.py +5 -3
careamics/config/architectures/unet_model.py +19 -0
careamics/config/architectures/vae_model.py +1 -0
careamics/config/callback_model.py +76 -34
careamics/config/configuration_factory.py +18 -98
careamics/config/configuration_model.py +23 -18
careamics/config/data_model.py +103 -54
careamics/config/inference_model.py +41 -19
careamics/config/optimizer_models.py +13 -7
careamics/config/support/supported_data.py +29 -4
careamics/config/support/supported_transforms.py +0 -1
careamics/config/tile_information.py +36 -58
careamics/config/training_model.py +5 -1
careamics/config/transformations/normalize_model.py +32 -4
careamics/config/validators/validator_utils.py +1 -1
careamics/dataset/__init__.py +12 -1
careamics/dataset/dataset_utils/__init__.py +8 -7
careamics/dataset/dataset_utils/file_utils.py +2 -2
careamics/dataset/dataset_utils/iterate_over_files.py +83 -0
careamics/dataset/dataset_utils/running_stats.py +186 -0
careamics/dataset/in_memory_dataset.py +84 -173
careamics/dataset/in_memory_pred_dataset.py +88 -0
careamics/dataset/in_memory_tiled_pred_dataset.py +129 -0
careamics/dataset/iterable_dataset.py +97 -250
careamics/dataset/iterable_pred_dataset.py +122 -0
careamics/dataset/iterable_tiled_pred_dataset.py +140 -0
careamics/dataset/patching/patching.py +97 -52
careamics/dataset/patching/random_patching.py +9 -4
careamics/dataset/patching/validate_patch_dimension.py +5 -3
careamics/dataset/tiling/__init__.py +10 -0
careamics/dataset/tiling/collate_tiles.py +33 -0
careamics/dataset/{patching → tiling}/tiled_patching.py +4 -4
careamics/file_io/__init__.py +7 -0
careamics/file_io/read/__init__.py +11 -0
careamics/file_io/read/get_func.py +56 -0
careamics/{dataset/dataset_utils/read_tiff.py → file_io/read/tiff.py} +3 -10
careamics/file_io/write/__init__.py +9 -0
careamics/file_io/write/get_func.py +59 -0
careamics/file_io/write/tiff.py +39 -0
careamics/lightning/__init__.py +17 -0
careamics/{lightning_module.py → lightning/lightning_module.py} +69 -92
careamics/{lightning_prediction_datamodule.py → lightning/predict_data_module.py} +120 -178
careamics/{lightning_datamodule.py → lightning/train_data_module.py} +135 -220
careamics/lvae_training/__init__.py +0 -0
careamics/lvae_training/data_modules.py +1220 -0
careamics/lvae_training/data_utils.py +618 -0
careamics/lvae_training/eval_utils.py +905 -0
careamics/lvae_training/get_config.py +84 -0
careamics/lvae_training/lightning_module.py +701 -0
careamics/lvae_training/metrics.py +214 -0
careamics/lvae_training/train_lvae.py +339 -0
careamics/lvae_training/train_utils.py +121 -0
careamics/model_io/bioimage/model_description.py +40 -32
careamics/model_io/bmz_io.py +2 -2
careamics/model_io/model_io_utils.py +6 -3
careamics/models/lvae/__init__.py +0 -0
careamics/models/lvae/layers.py +1998 -0
careamics/models/lvae/likelihoods.py +312 -0
careamics/models/lvae/lvae.py +985 -0
careamics/models/lvae/noise_models.py +409 -0
careamics/models/lvae/utils.py +395 -0
careamics/prediction_utils/__init__.py +10 -0
careamics/prediction_utils/prediction_outputs.py +137 -0
careamics/prediction_utils/stitch_prediction.py +103 -0
careamics/transforms/n2v_manipulate.py +3 -1
careamics/transforms/normalize.py +139 -68
careamics/transforms/pixel_manipulation.py +33 -9
careamics/transforms/tta.py +43 -29
careamics/utils/__init__.py +2 -0
careamics/utils/autocorrelation.py +40 -0
careamics/utils/ram.py +2 -2
{careamics-0.1.0rc6.dist-info → careamics-0.1.0rc8.dist-info}/METADATA +7 -6
careamics-0.1.0rc8.dist-info/RECORD +135 -0
{careamics-0.1.0rc6.dist-info → careamics-0.1.0rc8.dist-info}/WHEEL +1 -1
careamics/config/configuration_example.py +0 -89
careamics/dataset/dataset_utils/read_utils.py +0 -27
careamics/lightning_prediction_loop.py +0 -118
careamics/prediction/__init__.py +0 -7
careamics/prediction/stitch_prediction.py +0 -70
careamics/utils/running_stats.py +0 -43
careamics-0.1.0rc6.dist-info/RECORD +0 -107
/careamics/{dataset/dataset_utils/read_zarr.py → file_io/read/zarr.py} +0 -0
/careamics/{callbacks → lightning/callbacks}/__init__.py +0 -0
/careamics/{callbacks → lightning/callbacks}/hyperparameters_callback.py +0 -0
/careamics/{callbacks → lightning/callbacks}/progress_bar_callback.py +0 -0
{careamics-0.1.0rc6.dist-info → careamics-0.1.0rc8.dist-info}/licenses/LICENSE +0 -0

careamics/dataset/iterable_dataset.py CHANGED Viewed

@@ -3,86 +3,27 @@
 from __future__ import annotations
 import copy
+from collections.abc import Generator
 from pathlib import Path
-from typing import Any, Callable, Generator, List, Optional, Tuple, Union
+from typing import Callable, Optional
 import numpy as np
-from torch.utils.data import IterableDataset, get_worker_info
+from torch.utils.data import IterableDataset
+from careamics.config import DataConfig
+from careamics.config.transformations import NormalizeModel
+from careamics.file_io.read import read_tiff
 from careamics.transforms import Compose
-from ..config import DataConfig, InferenceConfig
-from ..config.tile_information import TileInformation
-from ..config.transformations import NormalizeModel
 from ..utils.logging import get_logger
-from .dataset_utils import read_tiff, reshape_array
+from .dataset_utils import iterate_over_files
+from .dataset_utils.running_stats import WelfordStatistics
+from .patching.patching import Stats
 from .patching.random_patching import extract_patches_random
-from .patching.tiled_patching import extract_tiles
 logger = get_logger(__name__)
-def _iterate_over_files(
-    data_config: Union[DataConfig, InferenceConfig],
-    data_files: List[Path],
-    target_files: Optional[List[Path]] = None,
-    read_source_func: Callable = read_tiff,
-) -> Generator[Tuple[np.ndarray, Optional[np.ndarray]], None, None]:
-    """
-    Iterate over data source and yield whole image.
-    Parameters
-    ----------
-    data_config : Union[DataConfig, InferenceConfig]
-        Data configuration.
-    data_files : List[Path]
-        List of data files.
-    target_files : Optional[List[Path]]
-        List of target files, by default None.
-    read_source_func : Optional[Callable]
-        Function to read the source, by default read_tiff.
-    Yields
-    ------
-    np.ndarray
-        Image.
-    """
-    # When num_workers > 0, each worker process will have a different copy of the
-    # dataset object
-    # Configuring each copy independently to avoid having duplicate data returned
-    # from the workers
-    worker_info = get_worker_info()
-    worker_id = worker_info.id if worker_info is not None else 0
-    num_workers = worker_info.num_workers if worker_info is not None else 1
-    # iterate over the files
-    for i, filename in enumerate(data_files):
-        # retrieve file corresponding to the worker id
-        if i % num_workers == worker_id:
-            try:
-                # read data
-                sample = read_source_func(filename, data_config.axes)
-                # read target, if available
-                if target_files is not None:
-                    if filename.name != target_files[i].name:
-                        raise ValueError(
-                            f"File {filename} does not match target file "
-                            f"{target_files[i]}. Have you passed sorted "
-                            f"arrays?"
-                        )
-                    # read target
-                    target = read_source_func(target_files[i], data_config.axes)
-                    yield sample, target
-                else:
-                    yield sample, None
-            except Exception as e:
-                logger.error(f"Error reading file {filename}: {e}")
 class PathIterableDataset(IterableDataset):
     """
     Dataset allowing extracting patches w/o loading whole data into memory.
@@ -91,38 +32,26 @@ class PathIterableDataset(IterableDataset):
     ----------
     data_config : DataConfig
         Data configuration.
-    src_files : List[Path]
+    src_files : list of pathlib.Path
         List of data files.
-    target_files : Optional[List[Path]], optional
+    target_files : list of pathlib.Path, optional
         Optional list of target files, by default None.
     read_source_func : Callable, optional
         Read source function for custom types, by default read_tiff.
     Attributes
     ----------
-    data_path : List[Path]
+    data_path : list of pathlib.Path
         Path to the data, must be a directory.
     axes : str
         Description of axes in format STCZYX.
-    patch_extraction_method : Union[ExtractionStrategies, None]
-        Patch extraction strategy, as defined in extraction_strategy.
-    patch_size : Optional[Union[List[int], Tuple[int]]], optional
-        Size of the patches in each dimension, by default None.
-    patch_overlap : Optional[Union[List[int], Tuple[int]]], optional
-        Overlap of the patches in each dimension, by default None.
-    mean : Optional[float], optional
-        Expected mean of the dataset, by default None.
-    std : Optional[float], optional
-        Expected standard deviation of the dataset, by default None.
-    patch_transform : Optional[Callable], optional
-        Patch transform callable, by default None.
     """
     def __init__(
         self,
         data_config: DataConfig,
-        src_files: List[Path],
-        target_files: Optional[List[Path]] = None,
+        src_files: list[Path],
+        target_files: Optional[list[Path]] = None,
         read_source_func: Callable = read_tiff,
     ) -> None:
         """Constructors.
@@ -131,9 +60,9 @@ class PathIterableDataset(IterableDataset):
         ----------
         data_config : DataConfig
             Data configuration.
-        src_files : List[Path]
+        src_files : list[Path]
             List of data files.
-        target_files : Optional[List[Path]], optional
+        target_files : list[Path] or None, optional
             Optional list of target files, by default None.
         read_source_func : Callable, optional
             Read source function for custom types, by default read_tiff.
@@ -141,55 +70,99 @@ class PathIterableDataset(IterableDataset):
         self.data_config = data_config
         self.data_files = src_files
         self.target_files = target_files
-        self.data_config = data_config
         self.read_source_func = read_source_func
         # compute mean and std over the dataset
-        if not data_config.mean or not data_config.std:
-            self.mean, self.std = self._calculate_mean_and_std()
+        # only checking the image_mean because the DataConfig class ensures that
+        # if image_mean is provided, image_std is also provided
+        if not self.data_config.image_means:
+            self.image_stats, self.target_stats = self._calculate_mean_and_std()
+            logger.info(
+                f"Computed dataset mean: {self.image_stats.means},"
+                f"std: {self.image_stats.stds}"
+            )
+            # update the mean in the config
+            self.data_config.set_means_and_stds(
+                image_means=self.image_stats.means,
+                image_stds=self.image_stats.stds,
+                target_means=(
+                    list(self.target_stats.means)
+                    if self.target_stats.means is not None
+                    else None
+                ),
+                target_stds=(
+                    list(self.target_stats.stds)
+                    if self.target_stats.stds is not None
+                    else None
+                ),
+            )
-            # update mean and std in configuration
-            # the object is mutable and should then be recorded in the CAREamist
-            data_config.set_mean_and_std(self.mean, self.std)
         else:
-            self.mean = data_config.mean
-            self.std = data_config.std
+            # if mean and std are provided in the config, use them
+            self.image_stats, self.target_stats = (
+                Stats(self.data_config.image_means, self.data_config.image_stds),
+                Stats(self.data_config.target_means, self.data_config.target_stds),
+            )
-        # get transforms
-        self.patch_transform = Compose(transform_list=data_config.transforms)
+        # create transform composed of normalization and other transforms
+        self.patch_transform = Compose(
+            transform_list=[
+                NormalizeModel(
+                    image_means=self.image_stats.means,
+                    image_stds=self.image_stats.stds,
+                    target_means=self.target_stats.means,
+                    target_stds=self.target_stats.stds,
+                )
+            ]
+            + data_config.transforms
+        )
-    def _calculate_mean_and_std(self) -> Tuple[float, float]:
+    def _calculate_mean_and_std(self) -> tuple[Stats, Stats]:
         """
         Calculate mean and std of the dataset.
         Returns
         -------
-        Tuple[float, float]
-            Tuple containing mean and standard deviation.
+        tuple of Stats and optional Stats
+            Data classes containing the image and target statistics.
         """
-        means, stds = 0, 0
         num_samples = 0
+        image_stats = WelfordStatistics()
+        if self.target_files is not None:
+            target_stats = WelfordStatistics()
-        for sample, _ in _iterate_over_files(
+        for sample, target in iterate_over_files(
             self.data_config, self.data_files, self.target_files, self.read_source_func
         ):
-            means += sample.mean()
-            stds += sample.std()
+            # update the image statistics
+            image_stats.update(sample, num_samples)
+            # update the target statistics if target is available
+            if target is not None:
+                target_stats.update(target, num_samples)
             num_samples += 1
         if num_samples == 0:
             raise ValueError("No samples found in the dataset.")
-        result_mean = means / num_samples
-        result_std = stds / num_samples
+        # Average the means and stds per sample
+        image_means, image_stds = image_stats.finalize()
-        logger.info(f"Calculated mean and std for {num_samples} images")
-        logger.info(f"Mean: {result_mean}, std: {result_std}")
-        return result_mean, result_std
+        if target is not None:
+            target_means, target_stds = target_stats.finalize()
+            return (
+                Stats(image_means, image_stds),
+                Stats(np.array(target_means), np.array(target_stds)),
+            )
+        else:
+            return Stats(image_means, image_stds), Stats(None, None)
     def __iter__(
         self,
-    ) -> Generator[Tuple[np.ndarray, ...], None, None]:
+    ) -> Generator[tuple[np.ndarray, ...], None, None]:
         """
         Iterate over data source and yield single patch.
@@ -199,24 +172,17 @@ class PathIterableDataset(IterableDataset):
             Single patch.
         """
         assert (
-            self.mean is not None and self.std is not None
+            self.image_stats.means is not None and self.image_stats.stds is not None
         ), "Mean and std must be provided"
         # iterate over files
-        for sample_input, sample_target in _iterate_over_files(
+        for sample_input, sample_target in iterate_over_files(
             self.data_config, self.data_files, self.target_files, self.read_source_func
         ):
-            reshaped_sample = reshape_array(sample_input, self.data_config.axes)
-            reshaped_target = (
-                None
-                if sample_target is None
-                else reshape_array(sample_target, self.data_config.axes)
-            )
             patches = extract_patches_random(
-                arr=reshaped_sample,
+                arr=sample_input,
                 patch_size=self.data_config.patch_size,
-                target=reshaped_target,
+                target=sample_target,
             )
             # iterate over patches
@@ -229,6 +195,16 @@ class PathIterableDataset(IterableDataset):
                     target=patch_data[1],
                 )
+    def get_data_statistics(self) -> tuple[list[float], list[float]]:
+        """Return training data statistics.
+        Returns
+        -------
+        tuple of list of floats
+            Means and standard deviations across channels of the training data.
+        """
+        return self.image_stats.get_statistics()
     def get_number_of_files(self) -> int:
         """
         Return the number of files in the dataset.
@@ -317,132 +293,3 @@ class PathIterableDataset(IterableDataset):
             dataset.target_files = val_target_files
         return dataset
-class IterablePredictionDataset(IterableDataset):
-    """
-    Prediction dataset.
-    Parameters
-    ----------
-    prediction_config : InferenceConfig
-        Inference configuration.
-    src_files : List[Path]
-        List of data files.
-    read_source_func : Callable, optional
-        Read source function for custom types, by default read_tiff.
-    **kwargs : Any
-        Additional keyword arguments, unused.
-    Attributes
-    ----------
-    data_path : Union[str, Path]
-        Path to the data, must be a directory.
-    axes : str
-        Description of axes in format STCZYX.
-    mean : Optional[float], optional
-        Expected mean of the dataset, by default None.
-    std : Optional[float], optional
-        Expected standard deviation of the dataset, by default None.
-    patch_transform : Optional[Callable], optional
-        Patch transform callable, by default None.
-    """
-    def __init__(
-        self,
-        prediction_config: InferenceConfig,
-        src_files: List[Path],
-        read_source_func: Callable = read_tiff,
-        **kwargs: Any,
-    ) -> None:
-        """Constructor.
-        Parameters
-        ----------
-        prediction_config : InferenceConfig
-            Inference configuration.
-        src_files : List[Path]
-            List of data files.
-        read_source_func : Callable, optional
-            Read source function for custom types, by default read_tiff.
-        **kwargs : Any
-            Additional keyword arguments, unused.
-        Raises
-        ------
-        ValueError
-            If mean and std are not provided in the inference configuration.
-        """
-        self.prediction_config = prediction_config
-        self.data_files = src_files
-        self.axes = prediction_config.axes
-        self.tile_size = self.prediction_config.tile_size
-        self.tile_overlap = self.prediction_config.tile_overlap
-        self.read_source_func = read_source_func
-        # tile only if both tile size and overlaps are provided
-        self.tile = self.tile_size is not None and self.tile_overlap is not None
-        # check mean and std and create normalize transform
-        if self.prediction_config.mean is None or self.prediction_config.std is None:
-            raise ValueError("Mean and std must be provided for prediction.")
-        else:
-            self.mean = self.prediction_config.mean
-            self.std = self.prediction_config.std
-            # instantiate normalize transform
-            self.patch_transform = Compose(
-                transform_list=[
-                    NormalizeModel(
-                        mean=prediction_config.mean, std=prediction_config.std
-                    )
-                ],
-            )
-    def __iter__(
-        self,
-    ) -> Generator[Tuple[np.ndarray, TileInformation], None, None]:
-        """
-        Iterate over data source and yield single patch.
-        Yields
-        ------
-        np.ndarray
-            Single patch.
-        """
-        assert (
-            self.mean is not None and self.std is not None
-        ), "Mean and std must be provided"
-        for sample, _ in _iterate_over_files(
-            self.prediction_config,
-            self.data_files,
-            read_source_func=self.read_source_func,
-        ):
-            # reshape array
-            reshaped_sample = reshape_array(sample, self.axes)
-            if (
-                self.tile
-                and self.tile_size is not None
-                and self.tile_overlap is not None
-            ):
-                # generate patches, return a generator
-                patch_gen = extract_tiles(
-                    arr=reshaped_sample,
-                    tile_size=self.tile_size,
-                    overlaps=self.tile_overlap,
-                )
-            else:
-                # just wrap the sample in a generator with default tiling info
-                array_shape = reshaped_sample.squeeze().shape
-                patch_gen = (
-                    (reshaped_sample, TileInformation(array_shape=array_shape))
-                    for _ in range(1)
-                )
-            # apply transform to patches
-            for patch_array, tile_info in patch_gen:
-                transformed_patch, _ = self.patch_transform(patch=patch_array)
-                yield transformed_patch, tile_info

careamics/dataset/iterable_pred_dataset.py ADDED Viewed

@@ -0,0 +1,122 @@
+"""Iterable prediction dataset used to load data file by file."""
+from __future__ import annotations
+from pathlib import Path
+from typing import Any, Callable, Generator
+from numpy.typing import NDArray
+from torch.utils.data import IterableDataset
+from careamics.file_io.read import read_tiff
+from careamics.transforms import Compose
+from ..config import InferenceConfig
+from ..config.transformations import NormalizeModel
+from .dataset_utils import iterate_over_files
+class IterablePredDataset(IterableDataset):
+    """Simple iterable prediction dataset.
+    Parameters
+    ----------
+    prediction_config : InferenceConfig
+        Inference configuration.
+    src_files : List[Path]
+        List of data files.
+    read_source_func : Callable, optional
+        Read source function for custom types, by default read_tiff.
+    **kwargs : Any
+        Additional keyword arguments, unused.
+    Attributes
+    ----------
+    data_path : Union[str, Path]
+        Path to the data, must be a directory.
+    axes : str
+        Description of axes in format STCZYX.
+    mean : Optional[float], optional
+        Expected mean of the dataset, by default None.
+    std : Optional[float], optional
+        Expected standard deviation of the dataset, by default None.
+    patch_transform : Optional[Callable], optional
+        Patch transform callable, by default None.
+    """
+    def __init__(
+        self,
+        prediction_config: InferenceConfig,
+        src_files: list[Path],
+        read_source_func: Callable = read_tiff,
+        **kwargs: Any,
+    ) -> None:
+        """Constructor.
+        Parameters
+        ----------
+        prediction_config : InferenceConfig
+            Inference configuration.
+        src_files : list of pathlib.Path
+            List of data files.
+        read_source_func : Callable, optional
+            Read source function for custom types, by default read_tiff.
+        **kwargs : Any
+            Additional keyword arguments, unused.
+        Raises
+        ------
+        ValueError
+            If mean and std are not provided in the inference configuration.
+        """
+        self.prediction_config = prediction_config
+        self.data_files = src_files
+        self.axes = prediction_config.axes
+        self.read_source_func = read_source_func
+        # check mean and std and create normalize transform
+        if (
+            self.prediction_config.image_means is None
+            or self.prediction_config.image_stds is None
+        ):
+            raise ValueError("Mean and std must be provided for prediction.")
+        else:
+            self.image_means = self.prediction_config.image_means
+            self.image_stds = self.prediction_config.image_stds
+        # instantiate normalize transform
+        self.patch_transform = Compose(
+            transform_list=[
+                NormalizeModel(
+                    image_means=self.image_means,
+                    image_stds=self.image_stds,
+                )
+            ],
+        )
+    def __iter__(
+        self,
+    ) -> Generator[NDArray, None, None]:
+        """
+        Iterate over data source and yield single patch.
+        Yields
+        ------
+        NDArray
+            Single patch.
+        """
+        assert (
+            self.image_means is not None and self.image_stds is not None
+        ), "Mean and std must be provided"
+        for sample, _ in iterate_over_files(
+            self.prediction_config,
+            self.data_files,
+            read_source_func=self.read_source_func,
+        ):
+            # sample has S dimension
+            for i in range(sample.shape[0]):
+                transformed_sample, _ = self.patch_transform(patch=sample[i])
+                yield transformed_sample

careamics 0.1.0rc6__py3-none-any.whl → 0.1.0rc8__py3-none-any.whl

Potentially problematic release.

careamics 0.1.0rc6py3-none-any.whl → 0.1.0rc8py3-none-any.whl