PyPI - quadra - Versions diffs - 0.0.1__py3-none-any.whl → 2.2.7__py3-none-any.whl - Mend

quadra 0.0.1py3-none-any.whl → 2.2.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (302) hide show

hydra_plugins/quadra_searchpath_plugin.py +30 -0
quadra/__init__.py +6 -0
quadra/callbacks/__init__.py +0 -0
quadra/callbacks/anomalib.py +289 -0
quadra/callbacks/lightning.py +501 -0
quadra/callbacks/mlflow.py +291 -0
quadra/callbacks/scheduler.py +69 -0
quadra/configs/__init__.py +0 -0
quadra/configs/backbone/caformer_m36.yaml +8 -0
quadra/configs/backbone/caformer_s36.yaml +8 -0
quadra/configs/backbone/convnextv2_base.yaml +8 -0
quadra/configs/backbone/convnextv2_femto.yaml +8 -0
quadra/configs/backbone/convnextv2_tiny.yaml +8 -0
quadra/configs/backbone/dino_vitb8.yaml +12 -0
quadra/configs/backbone/dino_vits8.yaml +12 -0
quadra/configs/backbone/dinov2_vitb14.yaml +12 -0
quadra/configs/backbone/dinov2_vits14.yaml +12 -0
quadra/configs/backbone/efficientnet_b0.yaml +8 -0
quadra/configs/backbone/efficientnet_b1.yaml +8 -0
quadra/configs/backbone/efficientnet_b2.yaml +8 -0
quadra/configs/backbone/efficientnet_b3.yaml +8 -0
quadra/configs/backbone/efficientnetv2_s.yaml +8 -0
quadra/configs/backbone/levit_128s.yaml +8 -0
quadra/configs/backbone/mnasnet0_5.yaml +9 -0
quadra/configs/backbone/resnet101.yaml +8 -0
quadra/configs/backbone/resnet18.yaml +8 -0
quadra/configs/backbone/resnet18_ssl.yaml +8 -0
quadra/configs/backbone/resnet50.yaml +8 -0
quadra/configs/backbone/smp.yaml +9 -0
quadra/configs/backbone/tiny_vit_21m_224.yaml +9 -0
quadra/configs/backbone/unetr.yaml +15 -0
quadra/configs/backbone/vit16_base.yaml +9 -0
quadra/configs/backbone/vit16_small.yaml +9 -0
quadra/configs/backbone/vit16_tiny.yaml +9 -0
quadra/configs/backbone/xcit_tiny_24_p8_224.yaml +9 -0
quadra/configs/callbacks/all.yaml +45 -0
quadra/configs/callbacks/default.yaml +34 -0
quadra/configs/callbacks/default_anomalib.yaml +64 -0
quadra/configs/config.yaml +33 -0
quadra/configs/core/default.yaml +11 -0
quadra/configs/datamodule/base/anomaly.yaml +16 -0
quadra/configs/datamodule/base/classification.yaml +21 -0
quadra/configs/datamodule/base/multilabel_classification.yaml +23 -0
quadra/configs/datamodule/base/segmentation.yaml +18 -0
quadra/configs/datamodule/base/segmentation_multiclass.yaml +20 -0
quadra/configs/datamodule/base/sklearn_classification.yaml +23 -0
quadra/configs/datamodule/base/sklearn_classification_patch.yaml +17 -0
quadra/configs/datamodule/base/ssl.yaml +21 -0
quadra/configs/datamodule/generic/imagenette/classification/base.yaml +9 -0
quadra/configs/datamodule/generic/imagenette/ssl/base.yaml +10 -0
quadra/configs/datamodule/generic/mnist/anomaly/base.yaml +14 -0
quadra/configs/datamodule/generic/mvtec/anomaly/base.yaml +14 -0
quadra/configs/datamodule/generic/oxford_pet/segmentation/base.yaml +9 -0
quadra/configs/experiment/base/anomaly/cfa.yaml +47 -0
quadra/configs/experiment/base/anomaly/cflow.yaml +47 -0
quadra/configs/experiment/base/anomaly/csflow.yaml +48 -0
quadra/configs/experiment/base/anomaly/draem.yaml +51 -0
quadra/configs/experiment/base/anomaly/efficient_ad.yaml +43 -0
quadra/configs/experiment/base/anomaly/fastflow.yaml +46 -0
quadra/configs/experiment/base/anomaly/inference.yaml +21 -0
quadra/configs/experiment/base/anomaly/padim.yaml +37 -0
quadra/configs/experiment/base/anomaly/patchcore.yaml +37 -0
quadra/configs/experiment/base/classification/classification.yaml +73 -0
quadra/configs/experiment/base/classification/classification_evaluation.yaml +25 -0
quadra/configs/experiment/base/classification/multilabel_classification.yaml +41 -0
quadra/configs/experiment/base/classification/sklearn_classification.yaml +27 -0
quadra/configs/experiment/base/classification/sklearn_classification_patch.yaml +25 -0
quadra/configs/experiment/base/classification/sklearn_classification_patch_test.yaml +18 -0
quadra/configs/experiment/base/classification/sklearn_classification_test.yaml +25 -0
quadra/configs/experiment/base/segmentation/smp.yaml +30 -0
quadra/configs/experiment/base/segmentation/smp_evaluation.yaml +17 -0
quadra/configs/experiment/base/segmentation/smp_multiclass.yaml +26 -0
quadra/configs/experiment/base/segmentation/smp_multiclass_evaluation.yaml +18 -0
quadra/configs/experiment/base/ssl/barlow.yaml +48 -0
quadra/configs/experiment/base/ssl/byol.yaml +43 -0
quadra/configs/experiment/base/ssl/dino.yaml +46 -0
quadra/configs/experiment/base/ssl/linear_eval.yaml +52 -0
quadra/configs/experiment/base/ssl/simclr.yaml +48 -0
quadra/configs/experiment/base/ssl/simsiam.yaml +53 -0
quadra/configs/experiment/custom/cls.yaml +12 -0
quadra/configs/experiment/default.yaml +15 -0
quadra/configs/experiment/generic/imagenette/classification/default.yaml +20 -0
quadra/configs/experiment/generic/imagenette/ssl/barlow.yaml +14 -0
quadra/configs/experiment/generic/imagenette/ssl/byol.yaml +14 -0
quadra/configs/experiment/generic/imagenette/ssl/dino.yaml +14 -0
quadra/configs/experiment/generic/imagenette/ssl/simclr.yaml +14 -0
quadra/configs/experiment/generic/imagenette/ssl/simsiam.yaml +14 -0
quadra/configs/experiment/generic/mnist/anomaly/cfa.yaml +34 -0
quadra/configs/experiment/generic/mnist/anomaly/cflow.yaml +33 -0
quadra/configs/experiment/generic/mnist/anomaly/csflow.yaml +33 -0
quadra/configs/experiment/generic/mnist/anomaly/draem.yaml +33 -0
quadra/configs/experiment/generic/mnist/anomaly/fastflow.yaml +29 -0
quadra/configs/experiment/generic/mnist/anomaly/inference.yaml +27 -0
quadra/configs/experiment/generic/mnist/anomaly/padim.yaml +37 -0
quadra/configs/experiment/generic/mnist/anomaly/patchcore.yaml +37 -0
quadra/configs/experiment/generic/mvtec/anomaly/cfa.yaml +34 -0
quadra/configs/experiment/generic/mvtec/anomaly/cflow.yaml +33 -0
quadra/configs/experiment/generic/mvtec/anomaly/csflow.yaml +33 -0
quadra/configs/experiment/generic/mvtec/anomaly/draem.yaml +33 -0
quadra/configs/experiment/generic/mvtec/anomaly/efficient_ad.yaml +38 -0
quadra/configs/experiment/generic/mvtec/anomaly/fastflow.yaml +29 -0
quadra/configs/experiment/generic/mvtec/anomaly/inference.yaml +27 -0
quadra/configs/experiment/generic/mvtec/anomaly/padim.yaml +37 -0
quadra/configs/experiment/generic/mvtec/anomaly/patchcore.yaml +37 -0
quadra/configs/experiment/generic/oxford_pet/segmentation/smp.yaml +27 -0
quadra/configs/export/default.yaml +13 -0
quadra/configs/hydra/anomaly_custom.yaml +15 -0
quadra/configs/hydra/default.yaml +14 -0
quadra/configs/inference/default.yaml +26 -0
quadra/configs/logger/comet.yaml +10 -0
quadra/configs/logger/csv.yaml +5 -0
quadra/configs/logger/mlflow.yaml +12 -0
quadra/configs/logger/tensorboard.yaml +8 -0
quadra/configs/loss/asl.yaml +7 -0
quadra/configs/loss/barlow.yaml +2 -0
quadra/configs/loss/bce.yaml +1 -0
quadra/configs/loss/byol.yaml +1 -0
quadra/configs/loss/cross_entropy.yaml +1 -0
quadra/configs/loss/dino.yaml +8 -0
quadra/configs/loss/simclr.yaml +2 -0
quadra/configs/loss/simsiam.yaml +1 -0
quadra/configs/loss/smp_ce.yaml +3 -0
quadra/configs/loss/smp_dice.yaml +2 -0
quadra/configs/loss/smp_dice_multiclass.yaml +2 -0
quadra/configs/loss/smp_mcc.yaml +2 -0
quadra/configs/loss/vicreg.yaml +5 -0
quadra/configs/model/anomalib/cfa.yaml +35 -0
quadra/configs/model/anomalib/cflow.yaml +30 -0
quadra/configs/model/anomalib/csflow.yaml +34 -0
quadra/configs/model/anomalib/dfm.yaml +19 -0
quadra/configs/model/anomalib/draem.yaml +29 -0
quadra/configs/model/anomalib/efficient_ad.yaml +31 -0
quadra/configs/model/anomalib/fastflow.yaml +32 -0
quadra/configs/model/anomalib/padim.yaml +32 -0
quadra/configs/model/anomalib/patchcore.yaml +36 -0
quadra/configs/model/barlow.yaml +16 -0
quadra/configs/model/byol.yaml +25 -0
quadra/configs/model/classification.yaml +10 -0
quadra/configs/model/dino.yaml +26 -0
quadra/configs/model/logistic_regression.yaml +4 -0
quadra/configs/model/multilabel_classification.yaml +9 -0
quadra/configs/model/simclr.yaml +18 -0
quadra/configs/model/simsiam.yaml +24 -0
quadra/configs/model/smp.yaml +4 -0
quadra/configs/model/smp_multiclass.yaml +4 -0
quadra/configs/model/vicreg.yaml +16 -0
quadra/configs/optimizer/adam.yaml +5 -0
quadra/configs/optimizer/adamw.yaml +3 -0
quadra/configs/optimizer/default.yaml +4 -0
quadra/configs/optimizer/lars.yaml +8 -0
quadra/configs/optimizer/sgd.yaml +4 -0
quadra/configs/scheduler/default.yaml +5 -0
quadra/configs/scheduler/rop.yaml +5 -0
quadra/configs/scheduler/step.yaml +3 -0
quadra/configs/scheduler/warmrestart.yaml +2 -0
quadra/configs/scheduler/warmup.yaml +6 -0
quadra/configs/task/anomalib/cfa.yaml +5 -0
quadra/configs/task/anomalib/cflow.yaml +5 -0
quadra/configs/task/anomalib/csflow.yaml +5 -0
quadra/configs/task/anomalib/draem.yaml +5 -0
quadra/configs/task/anomalib/efficient_ad.yaml +5 -0
quadra/configs/task/anomalib/fastflow.yaml +5 -0
quadra/configs/task/anomalib/inference.yaml +3 -0
quadra/configs/task/anomalib/padim.yaml +5 -0
quadra/configs/task/anomalib/patchcore.yaml +5 -0
quadra/configs/task/classification.yaml +6 -0
quadra/configs/task/classification_evaluation.yaml +6 -0
quadra/configs/task/default.yaml +1 -0
quadra/configs/task/segmentation.yaml +9 -0
quadra/configs/task/segmentation_evaluation.yaml +3 -0
quadra/configs/task/sklearn_classification.yaml +13 -0
quadra/configs/task/sklearn_classification_patch.yaml +11 -0
quadra/configs/task/sklearn_classification_patch_test.yaml +8 -0
quadra/configs/task/sklearn_classification_test.yaml +8 -0
quadra/configs/task/ssl.yaml +2 -0
quadra/configs/trainer/lightning_cpu.yaml +36 -0
quadra/configs/trainer/lightning_gpu.yaml +35 -0
quadra/configs/trainer/lightning_gpu_bf16.yaml +36 -0
quadra/configs/trainer/lightning_gpu_fp16.yaml +36 -0
quadra/configs/trainer/lightning_multigpu.yaml +37 -0
quadra/configs/trainer/sklearn_classification.yaml +7 -0
quadra/configs/transforms/byol.yaml +47 -0
quadra/configs/transforms/byol_no_random_resize.yaml +61 -0
quadra/configs/transforms/default.yaml +37 -0
quadra/configs/transforms/default_numpy.yaml +24 -0
quadra/configs/transforms/default_resize.yaml +22 -0
quadra/configs/transforms/dino.yaml +63 -0
quadra/configs/transforms/linear_eval.yaml +18 -0
quadra/datamodules/__init__.py +20 -0
quadra/datamodules/anomaly.py +180 -0
quadra/datamodules/base.py +375 -0
quadra/datamodules/classification.py +1003 -0
quadra/datamodules/generic/__init__.py +0 -0
quadra/datamodules/generic/imagenette.py +144 -0
quadra/datamodules/generic/mnist.py +81 -0
quadra/datamodules/generic/mvtec.py +58 -0
quadra/datamodules/generic/oxford_pet.py +163 -0
quadra/datamodules/patch.py +190 -0
quadra/datamodules/segmentation.py +742 -0
quadra/datamodules/ssl.py +140 -0
quadra/datasets/__init__.py +17 -0
quadra/datasets/anomaly.py +287 -0
quadra/datasets/classification.py +241 -0
quadra/datasets/patch.py +138 -0
quadra/datasets/segmentation.py +239 -0
quadra/datasets/ssl.py +110 -0
quadra/losses/__init__.py +0 -0
quadra/losses/classification/__init__.py +6 -0
quadra/losses/classification/asl.py +83 -0
quadra/losses/classification/focal.py +320 -0
quadra/losses/classification/prototypical.py +148 -0
quadra/losses/ssl/__init__.py +17 -0
quadra/losses/ssl/barlowtwins.py +47 -0
quadra/losses/ssl/byol.py +37 -0
quadra/losses/ssl/dino.py +129 -0
quadra/losses/ssl/hyperspherical.py +45 -0
quadra/losses/ssl/idmm.py +50 -0
quadra/losses/ssl/simclr.py +67 -0
quadra/losses/ssl/simsiam.py +30 -0
quadra/losses/ssl/vicreg.py +76 -0
quadra/main.py +49 -0
quadra/metrics/__init__.py +3 -0
quadra/metrics/segmentation.py +251 -0
quadra/models/__init__.py +0 -0
quadra/models/base.py +151 -0
quadra/models/classification/__init__.py +8 -0
quadra/models/classification/backbones.py +149 -0
quadra/models/classification/base.py +92 -0
quadra/models/evaluation.py +322 -0
quadra/modules/__init__.py +0 -0
quadra/modules/backbone.py +30 -0
quadra/modules/base.py +312 -0
quadra/modules/classification/__init__.py +3 -0
quadra/modules/classification/base.py +327 -0
quadra/modules/ssl/__init__.py +17 -0
quadra/modules/ssl/barlowtwins.py +59 -0
quadra/modules/ssl/byol.py +172 -0
quadra/modules/ssl/common.py +285 -0
quadra/modules/ssl/dino.py +186 -0
quadra/modules/ssl/hyperspherical.py +206 -0
quadra/modules/ssl/idmm.py +98 -0
quadra/modules/ssl/simclr.py +73 -0
quadra/modules/ssl/simsiam.py +68 -0
quadra/modules/ssl/vicreg.py +67 -0
quadra/optimizers/__init__.py +4 -0
quadra/optimizers/lars.py +153 -0
quadra/optimizers/sam.py +127 -0
quadra/schedulers/__init__.py +3 -0
quadra/schedulers/base.py +44 -0
quadra/schedulers/warmup.py +127 -0
quadra/tasks/__init__.py +24 -0
quadra/tasks/anomaly.py +582 -0
quadra/tasks/base.py +397 -0
quadra/tasks/classification.py +1263 -0
quadra/tasks/patch.py +492 -0
quadra/tasks/segmentation.py +389 -0
quadra/tasks/ssl.py +560 -0
quadra/trainers/README.md +3 -0
quadra/trainers/__init__.py +0 -0
quadra/trainers/classification.py +179 -0
quadra/utils/__init__.py +0 -0
quadra/utils/anomaly.py +112 -0
quadra/utils/classification.py +618 -0
quadra/utils/deprecation.py +31 -0
quadra/utils/evaluation.py +474 -0
quadra/utils/export.py +585 -0
quadra/utils/imaging.py +32 -0
quadra/utils/logger.py +15 -0
quadra/utils/mlflow.py +98 -0
quadra/utils/model_manager.py +320 -0
quadra/utils/models.py +523 -0
quadra/utils/patch/__init__.py +15 -0
quadra/utils/patch/dataset.py +1433 -0
quadra/utils/patch/metrics.py +449 -0
quadra/utils/patch/model.py +153 -0
quadra/utils/patch/visualization.py +217 -0
quadra/utils/resolver.py +42 -0
quadra/utils/segmentation.py +31 -0
quadra/utils/tests/__init__.py +0 -0
quadra/utils/tests/fixtures/__init__.py +1 -0
quadra/utils/tests/fixtures/dataset/__init__.py +39 -0
quadra/utils/tests/fixtures/dataset/anomaly.py +124 -0
quadra/utils/tests/fixtures/dataset/classification.py +406 -0
quadra/utils/tests/fixtures/dataset/imagenette.py +53 -0
quadra/utils/tests/fixtures/dataset/segmentation.py +161 -0
quadra/utils/tests/fixtures/models/__init__.py +3 -0
quadra/utils/tests/fixtures/models/anomaly.py +89 -0
quadra/utils/tests/fixtures/models/classification.py +45 -0
quadra/utils/tests/fixtures/models/segmentation.py +33 -0
quadra/utils/tests/helpers.py +70 -0
quadra/utils/tests/models.py +27 -0
quadra/utils/utils.py +525 -0
quadra/utils/validator.py +115 -0
quadra/utils/visualization.py +422 -0
quadra/utils/vit_explainability.py +349 -0
quadra-2.2.7.dist-info/LICENSE +201 -0
quadra-2.2.7.dist-info/METADATA +381 -0
quadra-2.2.7.dist-info/RECORD +300 -0
{quadra-0.0.1.dist-info → quadra-2.2.7.dist-info}/WHEEL +1 -1
quadra-2.2.7.dist-info/entry_points.txt +3 -0
quadra-0.0.1.dist-info/METADATA +0 -14
quadra-0.0.1.dist-info/RECORD +0 -4

quadra/datamodules/ssl.py ADDED Viewed

@@ -0,0 +1,140 @@
+# pylint: disable=unsubscriptable-object
+from __future__ import annotations
+from typing import Any
+import numpy as np
+import torch
+from sklearn.model_selection import train_test_split
+from torch.utils.data import DataLoader
+from quadra.datamodules.classification import ClassificationDataModule
+from quadra.datasets import TwoAugmentationDataset, TwoSetAugmentationDataset
+from quadra.utils import utils
+log = utils.get_logger(__name__)
+class SSLDataModule(ClassificationDataModule):
+    """Base class for all data modules for self supervised learning data modules.
+    Args:
+        data_path: Path to the data main folder.
+        augmentation_dataset: Augmentation dataset
+            for training dataset.
+        name: The name for the data module. Defaults to  "ssl_datamodule".
+        split_validation: Whether to split the validation set if . Defaults to True.
+        **kwargs: The keyword arguments for the classification data module. Defaults to None.
+    """
+    def __init__(
+        self,
+        data_path: str,
+        augmentation_dataset: TwoAugmentationDataset | TwoSetAugmentationDataset,
+        name: str = "ssl_datamodule",
+        split_validation: bool = True,
+        **kwargs: Any,
+    ):
+        super().__init__(
+            data_path=data_path,
+            name=name,
+            **kwargs,
+        )
+        self.augmentation_dataset = augmentation_dataset
+        self.classifier_train_dataset: torch.utils.data.Dataset | None = None
+        self.split_validation = split_validation
+    def setup(self, stage: str | None = None) -> None:
+        """Setup data module based on stages of training."""
+        if stage == "fit":
+            self.train_dataset = self.dataset(
+                samples=self.train_data["samples"].tolist(),
+                targets=self.train_data["targets"].tolist(),
+                transform=self.train_transform,
+            )
+            if np.unique(self.train_data["targets"]).shape[0] > 1 and not self.split_validation:
+                self.classifier_train_dataset = self.dataset(
+                    samples=self.train_data["samples"].tolist(),
+                    targets=self.train_data["targets"].tolist(),
+                    transform=self.val_transform,
+                )
+                self.val_dataset = self.dataset(
+                    samples=self.val_data["samples"].tolist(),
+                    targets=self.val_data["targets"].tolist(),
+                    transform=self.val_transform,
+                )
+            else:
+                train_classifier_samples, val_samples, train_classifier_targets, val_targets = train_test_split(
+                    self.val_data["samples"],
+                    self.val_data["targets"],
+                    test_size=0.3,
+                    random_state=self.seed,
+                    stratify=self.val_data["targets"],
+                )
+                self.classifier_train_dataset = self.dataset(
+                    samples=train_classifier_samples,
+                    targets=train_classifier_targets,
+                    transform=self.test_transform,
+                )
+                self.val_dataset = self.dataset(
+                    samples=val_samples,
+                    targets=val_targets,
+                    transform=self.val_transform,
+                )
+                log.warning(
+                    "The training set contains only one class and cannot be used to train a classifier. To overcome "
+                    "this issue 70% of the validation set is used to train the classifier. The remaining will be used "
+                    "as standard validation. To disable this behaviour set the `split_validation` parameter to False."
+                )
+                self._check_train_dataset_config()
+        if stage == "test":
+            self.test_dataset = self.dataset(
+                samples=self.test_data["samples"].tolist(),
+                targets=self.test_data["targets"].tolist(),
+                transform=self.test_transform,
+            )
+    def _check_train_dataset_config(self):
+        """Check if train dataset is configured correctly."""
+        if self.train_dataset is None:
+            raise ValueError("Train dataset is not initialized")
+        if self.augmentation_dataset is None:
+            raise ValueError("Augmentation dataset is not initialized")
+        if self.train_dataset.transform is not None:
+            log.warning("Train dataset transform is not None. It will be applied before SSL augmentations")
+    def train_dataloader(self) -> DataLoader:
+        """Returns train dataloader."""
+        if not isinstance(self.train_dataset, torch.utils.data.Dataset):
+            raise ValueError("Train dataset is not a subclass of `torch.utils.data.Dataset`")
+        self.augmentation_dataset.dataset = self.train_dataset
+        loader = DataLoader(
+            self.augmentation_dataset,
+            batch_size=self.batch_size,
+            shuffle=True,
+            num_workers=self.num_workers,
+            drop_last=False,
+            pin_memory=True,
+            persistent_workers=self.num_workers > 0,
+        )
+        return loader
+    def classifier_train_dataloader(self) -> DataLoader:
+        """Returns classifier train dataloader."""
+        if self.classifier_train_dataset is None:
+            raise ValueError("Classifier train dataset is not initialized")
+        loader = DataLoader(
+            self.classifier_train_dataset,
+            batch_size=self.batch_size,
+            shuffle=True,
+            num_workers=self.num_workers,
+            drop_last=False,
+            pin_memory=True,
+            persistent_workers=self.num_workers > 0,
+        )
+        return loader

quadra/datasets/__init__.py ADDED Viewed

@@ -0,0 +1,17 @@
+from .anomaly import AnomalyDataset
+from .classification import ClassificationDataset, ImageClassificationListDataset, MultilabelClassificationDataset
+from .patch import PatchSklearnClassificationTrainDataset
+from .segmentation import SegmentationDataset, SegmentationDatasetMulticlass
+from .ssl import TwoAugmentationDataset, TwoSetAugmentationDataset
+__all__ = [
+    "ImageClassificationListDataset",
+    "ClassificationDataset",
+    "SegmentationDataset",
+    "SegmentationDatasetMulticlass",
+    "PatchSklearnClassificationTrainDataset",
+    "MultilabelClassificationDataset",
+    "AnomalyDataset",
+    "TwoAugmentationDataset",
+    "TwoSetAugmentationDataset",
+]

quadra/datasets/anomaly.py ADDED Viewed

@@ -0,0 +1,287 @@
+from __future__ import annotations
+import os
+import random
+from pathlib import Path
+import albumentations as alb
+import cv2
+import numpy as np
+import pandas as pd
+from pandas import DataFrame
+from torch import Tensor
+from torch.utils.data import Dataset
+from quadra.utils.utils import IMAGE_EXTENSIONS
+def create_validation_set_from_test_set(samples: DataFrame, seed: int = 0) -> DataFrame:
+    """Craete Validation Set from Test Set.
+    This function creates a validation set from test set by splitting both
+    normal and abnormal samples to two.
+    Args:
+        samples: Dataframe containing dataset info such as filenames, splits etc.
+        seed: Random seed to ensure reproducibility. Defaults to 0.
+    """
+    if seed > 0:
+        random.seed(seed)
+    # Split normal images.
+    normal_test_image_indices = samples.index[(samples.split == "test") & (samples.targets == "good")].to_list()
+    num_normal_valid_images = len(normal_test_image_indices) // 2
+    indices_to_sample = random.sample(population=normal_test_image_indices, k=num_normal_valid_images)
+    samples.loc[indices_to_sample, "split"] = "val"
+    # Split abnormal images.
+    abnormal_test_image_indices = samples.index[(samples.split == "test") & (samples.targets != "good")].to_list()
+    num_abnormal_valid_images = len(abnormal_test_image_indices) // 2
+    indices_to_sample = random.sample(population=abnormal_test_image_indices, k=num_abnormal_valid_images)
+    samples.loc[indices_to_sample, "split"] = "val"
+    return samples
+def split_normal_images_in_train_set(samples: DataFrame, split_ratio: float = 0.1, seed: int = 0) -> DataFrame:
+    """Split normal images in train set.
+        This function splits the normal images in training set and assigns the
+        values to the test set. This is particularly useful especially when the
+        test set does not contain any normal images.
+        This is important because when the test set doesn't have any normal images,
+        AUC computation fails due to having single class.
+    Args:
+        samples: Dataframe containing dataset info such as filenames, splits etc.
+        split_ratio: Train-Test normal image split ratio. Defaults to 0.1.
+        seed: Random seed to ensure reproducibility. Defaults to 0.
+    Returns:
+        Output dataframe where the part of the training set is assigned to test set.
+    """
+    if seed > 0:
+        random.seed(seed)
+    normal_train_image_indices = samples.index[(samples.split == "train") & (samples.targets == "good")].to_list()
+    num_normal_train_images = len(normal_train_image_indices)
+    num_normal_valid_images = int(num_normal_train_images * split_ratio)
+    indices_to_split_from_train_set = random.sample(population=normal_train_image_indices, k=num_normal_valid_images)
+    samples.loc[indices_to_split_from_train_set, "split"] = "test"
+    return samples
+def make_anomaly_dataset(
+    path: Path,
+    split: str | None = None,
+    split_ratio: float = 0.1,
+    seed: int = 0,
+    mask_suffix: str | None = None,
+    create_test_set_if_empty: bool = True,
+) -> DataFrame:
+    """Create dataframe by parsing a folder following the MVTec data file structure.
+    The files are expected to follow the structure:
+        path/to/dataset/split/label/image_filename.xyz
+        path/to/dataset/ground_truth/label/mask_filename.png
+    Masks MUST be png images, no other format is allowed
+    Split can be either train/val/test
+    This function creates a dataframe to store the parsed information based on the following format:
+    |---|---------------|-------|---------|--------------|-----------------------------------------------|-------------|
+    |   | path          | split | targets | samples      | mask_path                                     | label_index |
+    |---|---------------|-------|---------|--------------|-----------------------------------------------|-------------|
+    | 0 | datasets/name |  test |  defect | filename.xyz | ground_truth/defect/filename{mask_suffix}.png | 1           |
+    |---|---------------|-------|---------|--------------|-----------------------------------------------|-------------|
+    Args:
+        path: Path to dataset
+        split: Dataset split (i.e., either train or test). Defaults to None.
+        split_ratio: Ratio to split normal training images and add to the
+            test set in case test set doesn't contain any normal images.
+            Defaults to 0.1.
+        seed: Random seed to ensure reproducibility when splitting. Defaults to 0.
+        mask_suffix: String to append to the base filename to get the mask name, by default for MVTec dataset masks
+            are saved as imagename_mask.png in this case the parameter shoul be filled with "_mask"
+        create_test_set_if_empty: If True, create a test set if the test set is empty.
+    Example:
+        The following example shows how to get training samples from MVTec bottle category:
+        >>> root = Path('./MVTec')
+        >>> category = 'bottle'
+        >>> path = root / category
+        >>> path
+        PosixPath('MVTec/bottle')
+        >>> samples = make_anomaly_dataset(path, split='train', split_ratio=0.1, seed=0)
+        >>> samples.head()
+           path         split label image_path                           mask_path                   label_index
+        0  MVTec/bottle train good MVTec/bottle/train/good/105.png MVTec/bottle/ground_truth/good/105_mask.png 0
+        1  MVTec/bottle train good MVTec/bottle/train/good/017.png MVTec/bottle/ground_truth/good/017_mask.png 0
+        2  MVTec/bottle train good MVTec/bottle/train/good/137.png MVTec/bottle/ground_truth/good/137_mask.png 0
+        3  MVTec/bottle train good MVTec/bottle/train/good/152.png MVTec/bottle/ground_truth/good/152_mask.png 0
+        4  MVTec/bottle train good MVTec/bottle/train/good/109.png MVTec/bottle/ground_truth/good/109_mask.png 0
+    Returns:
+        An output dataframe containing samples for the requested split (ie., train or test)
+    """
+    samples_list = [
+        (str(path),) + filename.parts[-3:]
+        for filename in path.glob("**/*")
+        if filename.is_file()
+        and os.path.splitext(filename)[-1].lower() in IMAGE_EXTENSIONS
+        and ".ipynb_checkpoints" not in str(filename)
+    ]
+    if len(samples_list) == 0:
+        raise RuntimeError(f"Found 0 images in {path}")
+    samples_list.sort()
+    data = pd.DataFrame(samples_list, columns=["path", "split", "targets", "samples"])
+    data = data[data.split != "ground_truth"]
+    # Create mask_path column, masks MUST have png extension
+    data["mask_path"] = (
+        data.path
+        + "/ground_truth/"
+        + data.targets
+        + "/"
+        + data.samples.apply(lambda x: os.path.splitext(os.path.basename(x))[0])
+        + (f"{mask_suffix}.png" if mask_suffix is not None else ".png")
+    )
+    # Modify image_path column by converting to absolute path
+    data["samples"] = data.path + "/" + data.split + "/" + data.targets + "/" + data.samples
+    # Split the normal images in training set if test set doesn't
+    # contain any normal images. This is needed because AUC score
+    # cannot be computed based on 1-class
+    if sum((data.split == "test") & (data.targets == "good")) == 0 and create_test_set_if_empty:
+        data = split_normal_images_in_train_set(data, split_ratio, seed)
+    # Good images don't have mask
+    data.loc[(data.split == "test") & (data.targets == "good"), "mask_path"] = ""
+    # Create label index for normal (0), anomalous (1) and unknown (-1) images.
+    data.loc[data.targets == "good", "label_index"] = 0
+    data.loc[~data.targets.isin(["good", "unknown"]), "label_index"] = 1
+    data.loc[data.targets == "unknown", "label_index"] = -1
+    data.label_index = data.label_index.astype(int)
+    # Get the data frame for the split.
+    if split is not None and split in ["train", "val", "test"]:
+        data = data[data.split == split]
+        data = data.reset_index(drop=True)
+    return data
+class AnomalyDataset(Dataset):
+    """Anomaly Dataset.
+    Args:
+        transform: Albumentations compose.
+        task: ``classification`` or ``segmentation``
+        samples: Pandas dataframe containing samples following the same structure created by make_anomaly_dataset
+        valid_area_mask: Optional path to the mask to use to filter out the valid area of the image. If None, the
+            whole image is considered valid.
+        crop_area: Optional tuple of 4 integers (x1, y1, x2, y2) to crop the image to the specified area. If None, the
+            whole image is considered valid.
+    """
+    def __init__(
+        self,
+        transform: alb.Compose,
+        samples: DataFrame,
+        task: str = "segmentation",
+        valid_area_mask: str | None = None,
+        crop_area: tuple[int, int, int, int] | None = None,
+    ) -> None:
+        self.task = task
+        self.transform = transform
+        self.samples = samples
+        self.samples = self.samples.reset_index(drop=True)
+        self.split = self.samples.split.unique()[0]
+        self.crop_area = crop_area
+        self.valid_area_mask: np.ndarray | None = None
+        if valid_area_mask is not None:
+            if not os.path.exists(valid_area_mask):
+                raise RuntimeError(f"Valid area mask {valid_area_mask} does not exist.")
+            self.valid_area_mask = cv2.imread(valid_area_mask, 0) > 0  # type: ignore[operator]
+    def __len__(self) -> int:
+        """Get length of the dataset."""
+        return len(self.samples)
+    def __getitem__(self, index: int) -> dict[str, str | Tensor]:
+        """Get dataset item for the index ``index``.
+        Args:
+            index: Index to get the item.
+        Returns:
+            Dict of image tensor during training.
+            Otherwise, Dict containing image path, target path, image tensor, label and transformed bounding box.
+        """
+        item: dict[str, str | Tensor] = {}
+        image_path = self.samples.samples.iloc[index]
+        image = cv2.imread(image_path)
+        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
+        original_image_shape = image.shape
+        if self.valid_area_mask is not None:
+            image = image * self.valid_area_mask[:, :, np.newaxis]
+        if self.crop_area is not None:
+            image = image[self.crop_area[1] : self.crop_area[3], self.crop_area[0] : self.crop_area[2]]
+        label_index = self.samples.label_index[index]
+        if self.split == "train":
+            pre_processed = self.transform(image=image)
+            item = {"image": pre_processed["image"], "label": label_index}
+        elif self.split in ["val", "test"]:
+            item["image_path"] = image_path
+            item["label"] = label_index
+            if self.task == "segmentation":
+                mask_path = self.samples.mask_path[index]
+                # If good images have no associated mask create an empty one
+                if label_index == 0:
+                    mask = np.zeros(shape=original_image_shape[:2])
+                elif os.path.isfile(mask_path):
+                    mask = cv2.imread(mask_path, flags=0) / 255.0  # type: ignore[operator]
+                else:
+                    # We need ones in the mask to compute correctly at least image level f1 score
+                    mask = np.ones(shape=original_image_shape[:2])
+                if self.valid_area_mask is not None:
+                    mask = mask * self.valid_area_mask
+                if self.crop_area is not None:
+                    mask = mask[self.crop_area[1] : self.crop_area[3], self.crop_area[0] : self.crop_area[2]]
+                pre_processed = self.transform(image=image, mask=mask)
+                item["mask_path"] = mask_path
+                item["mask"] = pre_processed["mask"]
+            else:
+                pre_processed = self.transform(image=image)
+            item["image"] = pre_processed["image"]
+        return item

quadra/datasets/classification.py ADDED Viewed

@@ -0,0 +1,241 @@
+from __future__ import annotations
+import warnings
+from collections.abc import Callable
+import cv2
+import numpy as np
+import torch
+from torch.utils.data import Dataset
+from quadra.utils.imaging import crop_image, keep_aspect_ratio_resize
+class ImageClassificationListDataset(Dataset):
+    """Standard classification dataset.
+    Args:
+        samples: List of paths to images to be read
+        targets: List of labels, one for every image
+            in samples
+        class_to_idx: mapping from classes
+            to unique indexes.
+            Defaults to None.
+        resize: Integer specifying the size of
+            a first optional resize keeping the aspect ratio: the smaller side
+            of the image will be resized to `resize`, while the longer will be
+            resized keeping the aspect ratio.
+            Defaults to None.
+        roi: Optional ROI, with
+            (x_upper_left, y_upper_left, x_bottom_right, y_bottom_right).
+            Defaults to None.
+        transform: Optional Albumentations
+            transform.
+            Defaults to None.
+        rgb: if False, image will be converted in grayscale
+        channel: 1 or 3. If rgb is True, then channel will be set at 3.
+        allow_missing_label: If set to false warn the user if the dataset contains missing labels
+    """
+    def __init__(
+        self,
+        samples: list[str],
+        targets: list[str | int],
+        class_to_idx: dict | None = None,
+        resize: int | None = None,
+        roi: tuple[int, int, int, int] | None = None,
+        transform: Callable | None = None,
+        rgb: bool = True,
+        channel: int = 3,
+        allow_missing_label: bool | None = False,
+    ):
+        super().__init__()
+        assert len(samples) == len(
+            targets
+        ), f"Samples ({len(samples)}) and targets ({len(targets)}) must have the same length"
+        # Setting the ROI
+        self.roi = roi
+        # Keep-Aspect-Ratio resize
+        self.resize = resize
+        if not allow_missing_label and None in targets:
+            warnings.warn(
+                (
+                    "Dataset contains empty targets but allow_missing_label is set to False, "
+                    "be careful because None labels will not work inside Dataloaders"
+                ),
+                UserWarning,
+                stacklevel=2,
+            )
+        targets = [-1 if target is None else target for target in targets]
+        # Data
+        self.x = np.array(samples)
+        self.y = np.array(targets)
+        if class_to_idx is None:
+            unique_targets = np.unique(targets)
+            class_to_idx = {c: i for i, c in enumerate(unique_targets)}
+        self.class_to_idx = class_to_idx
+        self.idx_to_class = {v: k for k, v in class_to_idx.items()}
+        self.samples = [
+            (path, self.class_to_idx[self.y[i]] if (self.y[i] != -1 and self.y[i] != "-1") else -1)
+            for i, path in enumerate(self.x)
+        ]
+        self.rgb = rgb
+        self.channel = 3 if rgb else channel
+        self.transform = transform
+    def __getitem__(self, idx) -> tuple[np.ndarray, np.ndarray]:
+        path, y = self.samples[idx]
+        # Load image
+        x = cv2.imread(str(path))
+        if self.rgb:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB)
+        else:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2GRAY)
+            x = cv2.cvtColor(x, cv2.COLOR_GRAY2RGB)
+        if self.channel == 1:
+            x = x[:, :, 0]
+        # Crop with ROI
+        if self.roi:
+            x = crop_image(x, self.roi)
+        # Resize keeping aspect ratio
+        if self.resize:
+            x = keep_aspect_ratio_resize(x, self.resize)
+        if self.transform:
+            aug = self.transform(image=x)
+            x = aug["image"]
+        return x, y
+    def __len__(self):
+        return len(self.samples)
+class ClassificationDataset(ImageClassificationListDataset):
+    """Custom Classification Dataset.
+    Args:
+        samples: List of paths to images
+        targets: List of targets
+        class_to_idx: Defaults to None.
+        resize: Resize image to this size. Defaults to None.
+        roi: Region of interest. Defaults to None.
+        transform: transform function. Defaults to None.
+        rgb: Use RGB space
+        channel: Number of channels. Defaults to 3.
+        random_padding: Random padding. Defaults to False.
+        circular_crop: Circular crop. Defaults to False.
+    """
+    def __init__(
+        self,
+        samples: list[str],
+        targets: list[str | int],
+        class_to_idx: dict | None = None,
+        resize: int | None = None,
+        roi: tuple[int, int, int, int] | None = None,
+        transform: Callable | None = None,
+        rgb: bool = True,
+        channel: int = 3,
+        random_padding: bool = False,
+        circular_crop: bool = False,
+    ):
+        super().__init__(samples, targets, class_to_idx, resize, roi, transform, rgb, channel)
+        if transform is None:
+            self.transform = None
+        self.random_padding = random_padding
+        self.circular_crop = circular_crop
+    def __getitem__(self, idx):
+        path, y = self.samples[idx]
+        path = str(path)
+        # Load image
+        x = cv2.imread(path)
+        if self.rgb:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB)
+        else:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2GRAY)
+            x = cv2.cvtColor(x, cv2.COLOR_GRAY2RGB)
+        if self.transform is not None:
+            aug = self.transform(image=x)
+            x = aug["image"]
+        if self.channel == 1:
+            x = x[:1]
+        return x, y
+class MultilabelClassificationDataset(torch.utils.data.Dataset):
+    """Custom MultilabelClassification Dataset.
+    Args:
+        samples: list of paths to images.
+        targets: array of multiple targets per sample. The array must be a one-hot enoding.
+            It must have a shape of (n_samples, n_targets).
+        class_to_idx: Defaults to None.
+        transform: transform function. Defaults to None.
+        rgb: Use RGB space
+    """
+    def __init__(
+        self,
+        samples: list[str],
+        targets: np.ndarray,
+        class_to_idx: dict | None = None,
+        transform: Callable | None = None,
+        rgb: bool = True,
+    ):
+        super().__init__()
+        assert len(samples) == len(
+            targets
+        ), f"Samples ({len(samples)}) and targets ({len(targets)}) must have the same length"
+        # Data
+        self.x = samples
+        self.y = targets
+        # Class to idx and the other way around
+        if class_to_idx is None:
+            unique_targets = targets.shape[1]
+            class_to_idx = {c: i for i, c in enumerate(range(unique_targets))}
+        self.class_to_idx = class_to_idx
+        self.idx_to_class = {v: k for k, v in class_to_idx.items()}
+        self.samples = list(zip(self.x, self.y))
+        self.rgb = rgb
+        self.transform = transform
+    def __getitem__(self, idx):
+        path, y = self.samples[idx]
+        path = str(path)
+        # Load image
+        x = cv2.imread(path)
+        if self.rgb:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB)
+        else:
+            x = cv2.cvtColor(x, cv2.COLOR_BGR2GRAY)
+            x = cv2.cvtColor(x, cv2.COLOR_GRAY2RGB)
+        if self.transform is not None:
+            aug = self.transform(image=x)
+            x = aug["image"]
+        return x, torch.from_numpy(y).float()
+    def __len__(self):
+        return len(self.samples)

quadra 0.0.1__py3-none-any.whl → 2.2.7__py3-none-any.whl

quadra 0.0.1py3-none-any.whl → 2.2.7py3-none-any.whl