PyPI - kaiko-eva - Versions diffs - 0.2.1__py3-none-any.whl → 0.3.0__py3-none-any.whl - Mend

kaiko-eva 0.2.1py3-none-any.whl → 0.3.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (91) hide show

eva/core/data/dataloaders/__init__.py +2 -1
eva/core/data/dataloaders/collate_fn/__init__.py +5 -0
eva/core/data/dataloaders/collate_fn/collate.py +24 -0
eva/core/data/dataloaders/dataloader.py +4 -0
eva/core/interface/interface.py +34 -1
eva/core/metrics/defaults/classification/multiclass.py +45 -35
eva/core/models/modules/__init__.py +2 -1
eva/core/models/modules/scheduler.py +51 -0
eva/core/models/transforms/extract_cls_features.py +1 -1
eva/core/models/transforms/extract_patch_features.py +1 -1
eva/core/models/wrappers/base.py +17 -14
eva/core/models/wrappers/from_function.py +5 -4
eva/core/models/wrappers/from_torchhub.py +5 -6
eva/core/models/wrappers/huggingface.py +8 -5
eva/core/models/wrappers/onnx.py +4 -4
eva/core/trainers/_recorder.py +4 -1
eva/core/trainers/functional.py +40 -43
eva/core/utils/factory.py +66 -0
eva/core/utils/registry.py +42 -0
eva/core/utils/requirements.py +26 -0
eva/language/__init__.py +13 -0
eva/language/data/__init__.py +5 -0
eva/language/data/datasets/__init__.py +9 -0
eva/language/data/datasets/classification/__init__.py +7 -0
eva/language/data/datasets/classification/base.py +63 -0
eva/language/data/datasets/classification/pubmedqa.py +149 -0
eva/language/data/datasets/language.py +13 -0
eva/language/models/__init__.py +25 -0
eva/language/models/modules/__init__.py +5 -0
eva/language/models/modules/text.py +85 -0
eva/language/models/modules/typings.py +16 -0
eva/language/models/wrappers/__init__.py +11 -0
eva/language/models/wrappers/huggingface.py +69 -0
eva/language/models/wrappers/litellm.py +77 -0
eva/language/models/wrappers/vllm.py +149 -0
eva/language/utils/__init__.py +5 -0
eva/language/utils/str_to_int_tensor.py +95 -0
eva/vision/data/dataloaders/__init__.py +2 -1
eva/vision/data/dataloaders/worker_init.py +35 -0
eva/vision/data/datasets/__init__.py +5 -5
eva/vision/data/datasets/segmentation/__init__.py +4 -4
eva/vision/data/datasets/segmentation/btcv.py +3 -0
eva/vision/data/datasets/segmentation/consep.py +5 -4
eva/vision/data/datasets/segmentation/lits17.py +231 -0
eva/vision/data/datasets/segmentation/metadata/__init__.py +1 -0
eva/vision/data/datasets/segmentation/metadata/_msd_task7_pancreas.py +287 -0
eva/vision/data/datasets/segmentation/msd_task7_pancreas.py +243 -0
eva/vision/data/datasets/segmentation/total_segmentator_2d.py +1 -1
eva/vision/data/transforms/__init__.py +11 -2
eva/vision/data/transforms/base/__init__.py +5 -0
eva/vision/data/transforms/base/monai.py +27 -0
eva/vision/data/transforms/common/__init__.py +2 -1
eva/vision/data/transforms/common/squeeze.py +24 -0
eva/vision/data/transforms/croppad/__init__.py +4 -0
eva/vision/data/transforms/croppad/rand_crop_by_label_classes.py +74 -0
eva/vision/data/transforms/croppad/rand_crop_by_pos_neg_label.py +6 -2
eva/vision/data/transforms/croppad/rand_spatial_crop.py +89 -0
eva/vision/data/transforms/intensity/rand_scale_intensity.py +6 -2
eva/vision/data/transforms/intensity/rand_shift_intensity.py +8 -4
eva/vision/models/modules/semantic_segmentation.py +27 -11
eva/vision/models/networks/backbones/__init__.py +2 -3
eva/vision/models/networks/backbones/_utils.py +1 -1
eva/vision/models/networks/backbones/pathology/bioptimus.py +4 -4
eva/vision/models/networks/backbones/pathology/gigapath.py +2 -2
eva/vision/models/networks/backbones/pathology/histai.py +3 -3
eva/vision/models/networks/backbones/pathology/hkust.py +2 -2
eva/vision/models/networks/backbones/pathology/kaiko.py +7 -7
eva/vision/models/networks/backbones/pathology/lunit.py +3 -3
eva/vision/models/networks/backbones/pathology/mahmood.py +3 -3
eva/vision/models/networks/backbones/pathology/owkin.py +3 -3
eva/vision/models/networks/backbones/pathology/paige.py +3 -3
eva/vision/models/networks/backbones/radiology/swin_unetr.py +2 -2
eva/vision/models/networks/backbones/radiology/voco.py +5 -5
eva/vision/models/networks/backbones/registry.py +2 -44
eva/vision/models/networks/backbones/timm/backbones.py +2 -2
eva/vision/models/networks/backbones/universal/__init__.py +8 -1
eva/vision/models/networks/backbones/universal/vit.py +53 -3
eva/vision/models/networks/decoders/segmentation/decoder2d.py +1 -1
eva/vision/models/networks/decoders/segmentation/linear.py +1 -1
eva/vision/models/networks/decoders/segmentation/semantic/common.py +2 -2
eva/vision/models/networks/decoders/segmentation/typings.py +1 -1
eva/vision/models/wrappers/from_registry.py +14 -9
eva/vision/models/wrappers/from_timm.py +6 -5
{kaiko_eva-0.2.1.dist-info → kaiko_eva-0.3.0.dist-info}/METADATA +22 -12
{kaiko_eva-0.2.1.dist-info → kaiko_eva-0.3.0.dist-info}/RECORD +89 -58
{kaiko_eva-0.2.1.dist-info → kaiko_eva-0.3.0.dist-info}/WHEEL +1 -1
eva/vision/data/datasets/segmentation/lits.py +0 -199
eva/vision/data/datasets/segmentation/lits_balanced.py +0 -94
/eva/vision/data/datasets/segmentation/{_total_segmentator.py → metadata/_total_segmentator.py} +0 -0
{kaiko_eva-0.2.1.dist-info → kaiko_eva-0.3.0.dist-info}/entry_points.txt +0 -0
{kaiko_eva-0.2.1.dist-info → kaiko_eva-0.3.0.dist-info}/licenses/LICENSE +0 -0

eva/vision/models/modules/semantic_segmentation.py CHANGED Viewed

@@ -1,6 +1,7 @@
-""""Neural Network Semantic Segmentation Module."""
+"""Neural Network Semantic Segmentation Module."""
-from typing import Any, Callable, Dict, Iterable, List
+import functools
+from typing import Any, Callable, Dict, Iterable, List, Tuple
 import torch
 from lightning.pytorch.cli import LRSchedulerCallable, OptimizerCallable
@@ -11,7 +12,7 @@ from torch.optim import lr_scheduler
 from typing_extensions import override
 from eva.core.metrics import structs as metrics_lib
-from eva.core.models.modules import module
+from eva.core.models.modules import SchedulerConfiguration, module
 from eva.core.models.modules.typings import INPUT_BATCH, INPUT_TENSOR_BATCH
 from eva.core.models.modules.utils import batch_postprocess, grad, submodule_state_dict
 from eva.core.utils import parser
@@ -31,10 +32,11 @@ class SemanticSegmentationModule(module.ModelModule):
         lr_multiplier_encoder: float = 0.0,
         inferer: Inferer | None = None,
         optimizer: OptimizerCallable = optim.AdamW,
-        lr_scheduler: LRSchedulerCallable = lr_scheduler.ConstantLR,
+        lr_scheduler: LRSchedulerCallable | SchedulerConfiguration = lr_scheduler.ConstantLR,
         metrics: metrics_lib.MetricsSchema | None = None,
         postprocess: batch_postprocess.BatchPostProcess | None = None,
         save_decoder_only: bool = True,
+        spatial_dims: int = 2,
     ) -> None:
         """Initializes the neural net head module.
@@ -57,6 +59,8 @@ class SemanticSegmentationModule(module.ModelModule):
                 predictions and targets.
             save_decoder_only: Whether to save only the decoder during checkpointing. If False,
                 will also save the encoder (not recommended when frozen).
+            spatial_dims: The number of spatial dimensions, 2 for 2D
+                and 3 for 3D segmentation.
         """
         super().__init__(metrics=metrics, postprocess=postprocess)
@@ -68,6 +72,7 @@ class SemanticSegmentationModule(module.ModelModule):
         self.lr_scheduler = lr_scheduler
         self.save_decoder_only = save_decoder_only
         self.inferer = inferer
+        self.spatial_dims = spatial_dims
     @override
     def configure_model(self) -> None:
@@ -111,13 +116,14 @@ class SemanticSegmentationModule(module.ModelModule):
     def forward(
         self,
         tensor: torch.Tensor,
+        to_size: Tuple[int, ...],
         *args: Any,
         **kwargs: Any,
     ) -> torch.Tensor:
         return (
-            self.inferer(tensor, network=self._forward_networks)
+            self.inferer(tensor, network=functools.partial(self._forward_networks, to_size=to_size))
             if self.inferer is not None and not self.training
-            else self._forward_networks(tensor)
+            else self._forward_networks(tensor, to_size=to_size)
         )
     @override
@@ -168,7 +174,8 @@ class SemanticSegmentationModule(module.ModelModule):
             The batch step output.
         """
         data, targets, metadata = INPUT_TENSOR_BATCH(*batch)
-        predictions = self(data)
+        to_size = targets.shape[-self.spatial_dims :] if self.inferer is None else None
+        predictions = self(data, to_size=to_size)
         loss = self.criterion(predictions, targets)
         return {
             "loss": loss,
@@ -177,12 +184,21 @@ class SemanticSegmentationModule(module.ModelModule):
             "metadata": metadata,
         }
-    def _forward_networks(self, tensor: torch.Tensor) -> torch.Tensor:
+    def _forward_networks(
+        self, tensor: torch.Tensor, to_size: Tuple[int, ...] | None = None
+    ) -> torch.Tensor:
         """Passes the input tensor through the encoder and decoder."""
-        features = self.encoder(tensor) if self.encoder else tensor
+        if self.encoder:
+            to_size = to_size or tuple(tensor.shape[-self.spatial_dims :])
+            features = self.encoder(tensor)
+        else:
+            if to_size is None:
+                raise ValueError("`to_size` must be provided when no encoder is used.")
+            features = tensor
         if isinstance(self.decoder, segmentation.Decoder):
             if not isinstance(features, list):
                 raise ValueError(f"Expected a list of feature map tensors, got {type(features)}.")
-            image_size = (tensor.shape[-2], tensor.shape[-1])
-            return self.decoder(DecoderInputs(features, image_size, tensor))
+            return self.decoder(DecoderInputs(features, to_size, tensor))
         return self.decoder(features)

eva/vision/models/networks/backbones/__init__.py CHANGED Viewed

@@ -1,13 +1,12 @@
 """Vision Model Backbones API."""
 from eva.vision.models.networks.backbones import pathology, radiology, timm, universal
-from eva.vision.models.networks.backbones.registry import BackboneModelRegistry, register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
 __all__ = [
     "radiology",
     "pathology",
     "timm",
     "universal",
-    "BackboneModelRegistry",
-    "register_model",
+    "backbone_registry",
 ]

eva/vision/models/networks/backbones/_utils.py CHANGED Viewed

@@ -36,7 +36,7 @@ def load_hugingface_model(
     return models.HuggingFaceModel(
         model_name_or_path=model_name,
-        tensor_transforms=tensor_transforms,
+        transforms=tensor_transforms,
         model_kwargs=model_kwargs,
     )

eva/vision/models/networks/backbones/pathology/bioptimus.py CHANGED Viewed

@@ -8,10 +8,10 @@ from torch import nn
 from eva.core.models import transforms
 from eva.vision.models import wrappers
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/bioptimus_h_optimus_0")
+@backbone_registry.register("pathology/bioptimus_h_optimus_0")
 def bioptimus_h_optimus_0(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,
@@ -39,7 +39,7 @@ def bioptimus_h_optimus_0(
     )
-@register_model("pathology/bioptimus_h0_mini")
+@backbone_registry.register("pathology/bioptimus_h0_mini")
 def bioptimus_h0_mini(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,
@@ -72,7 +72,7 @@ def bioptimus_h0_mini(
             "mlp_layer": timm.layers.SwiGLUPacked,
             "act_layer": nn.SiLU,
         },
-        tensor_transforms=(
+        transforms=(
             transforms.ExtractCLSFeatures(include_patch_tokens=include_patch_tokens)
             if out_indices is None
             else None

eva/vision/models/networks/backbones/pathology/gigapath.py CHANGED Viewed

@@ -5,10 +5,10 @@ from typing import Tuple
 import timm
 from torch import nn
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/prov_gigapath")
+@backbone_registry.register("pathology/prov_gigapath")
 def prov_gigapath(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,

eva/vision/models/networks/backbones/pathology/histai.py CHANGED Viewed

@@ -5,10 +5,10 @@ from typing import Tuple
 from torch import nn
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/histai_hibou_b")
+@backbone_registry.register("pathology/histai_hibou_b")
 def histai_hibou_b(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     """Initializes the hibou-B pathology FM by hist.ai (https://huggingface.co/histai/hibou-B).
@@ -30,7 +30,7 @@ def histai_hibou_b(out_indices: int | Tuple[int, ...] | None = None) -> nn.Modul
     )
-@register_model("pathology/histai_hibou_l")
+@backbone_registry.register("pathology/histai_hibou_l")
 def histai_hibou_l(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     """Initializes the hibou-L pathology FM by hist.ai (https://huggingface.co/histai/hibou-L).

eva/vision/models/networks/backbones/pathology/hkust.py CHANGED Viewed

@@ -7,10 +7,10 @@ import timm
 from torch import nn
 from eva.core.models.wrappers import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/hkust_gpfm")
+@backbone_registry.register("pathology/hkust_gpfm")
 def hkust_gpfm(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,

eva/vision/models/networks/backbones/pathology/kaiko.py CHANGED Viewed

@@ -6,10 +6,10 @@ import torch
 from torch import nn
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/kaiko_midnight_12k")
+@backbone_registry.register("pathology/kaiko_midnight_12k")
 def kaiko_midnight_12k(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     """Initializes the Midnight-12k pathology FM by kaiko.ai.
@@ -26,7 +26,7 @@ def kaiko_midnight_12k(out_indices: int | Tuple[int, ...] | None = None) -> nn.M
     )
-@register_model("pathology/kaiko_vits16")
+@backbone_registry.register("pathology/kaiko_vits16")
 def kaiko_vits16(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -49,7 +49,7 @@ def kaiko_vits16(
     )
-@register_model("pathology/kaiko_vits8")
+@backbone_registry.register("pathology/kaiko_vits8")
 def kaiko_vits8(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -72,7 +72,7 @@ def kaiko_vits8(
     )
-@register_model("pathology/kaiko_vitb16")
+@backbone_registry.register("pathology/kaiko_vitb16")
 def kaiko_vitb16(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -95,7 +95,7 @@ def kaiko_vitb16(
     )
-@register_model("pathology/kaiko_vitb8")
+@backbone_registry.register("pathology/kaiko_vitb8")
 def kaiko_vitb8(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -118,7 +118,7 @@ def kaiko_vitb8(
     )
-@register_model("pathology/kaiko_vitl14")
+@backbone_registry.register("pathology/kaiko_vitl14")
 def kaiko_vitl14(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:

eva/vision/models/networks/backbones/pathology/lunit.py CHANGED Viewed

@@ -13,14 +13,14 @@ from typing import Tuple
 from torch import nn
 from eva.vision.models import wrappers
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
 VITS_URL_PREFIX = (
     "https://github.com/lunit-io/benchmark-ssl-pathology/releases/download/pretrained-weights"
 )
-@register_model("pathology/lunit_vits16")
+@backbone_registry.register("pathology/lunit_vits16")
 def lunit_vits16(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -44,7 +44,7 @@ def lunit_vits16(
     )
-@register_model("pathology/lunit_vits8")
+@backbone_registry.register("pathology/lunit_vits8")
 def lunit_vits8(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:

eva/vision/models/networks/backbones/pathology/mahmood.py CHANGED Viewed

@@ -8,10 +8,10 @@ from torch import nn
 from eva.vision.models import wrappers
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/mahmood_uni")
+@backbone_registry.register("pathology/mahmood_uni")
 def mahmood_uni(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,
@@ -41,7 +41,7 @@ def mahmood_uni(
     )
-@register_model("pathology/mahmood_uni2_h")
+@backbone_registry.register("pathology/mahmood_uni2_h")
 def mahmood_uni2_h(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,

eva/vision/models/networks/backbones/pathology/owkin.py CHANGED Viewed

@@ -5,10 +5,10 @@ from typing import Tuple
 from torch import nn
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/owkin_phikon")
+@backbone_registry.register("pathology/owkin_phikon")
 def owkin_phikon(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     """Initializes the phikon pathology FM by owkin (https://huggingface.co/owkin/phikon).
@@ -22,7 +22,7 @@ def owkin_phikon(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     return _utils.load_hugingface_model(model_name="owkin/phikon", out_indices=out_indices)
-@register_model("pathology/owkin_phikon_v2")
+@backbone_registry.register("pathology/owkin_phikon_v2")
 def owkin_phikon_v2(out_indices: int | Tuple[int, ...] | None = None) -> nn.Module:
     """Initializes the phikon-v2 pathology FM by owkin (https://huggingface.co/owkin/phikon-v2).

eva/vision/models/networks/backbones/pathology/paige.py CHANGED Viewed

@@ -11,10 +11,10 @@ import torch.nn as nn
 from eva.core.models import transforms
 from eva.vision.models import wrappers
 from eva.vision.models.networks.backbones import _utils
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("pathology/paige_virchow2")
+@backbone_registry.register("pathology/paige_virchow2")
 def paige_virchow2(
     dynamic_img_size: bool = True,
     out_indices: int | Tuple[int, ...] | None = None,
@@ -43,7 +43,7 @@ def paige_virchow2(
             "mlp_layer": timm.layers.SwiGLUPacked,
             "act_layer": nn.SiLU,
         },
-        tensor_transforms=(
+        transforms=(
             transforms.ExtractCLSFeatures(include_patch_tokens=include_patch_tokens)
             if out_indices is None
             else None

eva/vision/models/networks/backbones/radiology/swin_unetr.py CHANGED Viewed

@@ -9,10 +9,10 @@ from monai.networks.nets import swin_unetr
 from monai.utils import misc
 from torch import nn
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("radiology/swin_unetr_encoder")
+@backbone_registry.register("radiology/swin_unetr_encoder")
 class SwinUNETREncoder(nn.Module):
     """Swin transformer encoder based on UNETR [0].

eva/vision/models/networks/backbones/radiology/voco.py CHANGED Viewed

@@ -4,10 +4,10 @@ from typing_extensions import override
 from eva.core.models.wrappers import _utils
 from eva.vision.models.networks.backbones.radiology import swin_unetr
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-class _VoCo(swin_unetr.SwinUNETREncoder):
+class _VoCo(swin_unetr.SwinUNETREncoder):  # type: ignore
     """Base class for the VoCo self-supervised encoders."""
     _checkpoint: str
@@ -39,7 +39,7 @@ class _VoCo(swin_unetr.SwinUNETREncoder):
         self.load_state_dict(state_dict)
-@register_model("radiology/voco_b")
+@backbone_registry.register("radiology/voco_b")
 class VoCoB(_VoCo):
     """VoCo Self-supervised pre-trained B model."""
@@ -51,7 +51,7 @@ class VoCoB(_VoCo):
         super().__init__(feature_size=48, out_indices=out_indices)
-@register_model("radiology/voco_l")
+@backbone_registry.register("radiology/voco_l")
 class VoCoL(_VoCo):
     """VoCo Self-supervised pre-trained L model."""
@@ -63,7 +63,7 @@ class VoCoL(_VoCo):
         super().__init__(feature_size=96, out_indices=out_indices)
-@register_model("radiology/voco_h")
+@backbone_registry.register("radiology/voco_h")
 class VoCoH(_VoCo):
     """VoCo Self-supervised pre-trained H model."""

eva/vision/models/networks/backbones/registry.py CHANGED Viewed

@@ -1,47 +1,5 @@
 """Backbone Model Registry."""
-from typing import Any, Callable, Dict, List
+from eva.core.utils.registry import Registry
-import torch.nn as nn
-class BackboneModelRegistry:
-    """A model registry for accessing backbone models by name."""
-    _registry: Dict[str, Callable[..., nn.Module]] = {}
-    @classmethod
-    def register(cls, name: str) -> Callable:
-        """Decorator to register a new model."""
-        def decorator(model_fn: Callable[..., nn.Module]) -> Callable[..., nn.Module]:
-            if name in cls._registry:
-                raise ValueError(f"Model {name} is already registered.")
-            cls._registry[name] = model_fn
-            return model_fn
-        return decorator
-    @classmethod
-    def get(cls, model_name: str) -> Callable[..., nn.Module]:
-        """Gets a model function from the registry."""
-        if model_name not in cls._registry:
-            raise ValueError(f"Model {model_name} not found in the registry.")
-        return cls._registry[model_name]
-    @classmethod
-    def load_model(cls, model_name: str, model_kwargs: Dict[str, Any] | None = None) -> nn.Module:
-        """Loads & initializes a model class from the registry."""
-        model_fn = cls.get(model_name)
-        return model_fn(**(model_kwargs or {}))
-    @classmethod
-    def list_models(cls) -> List[str]:
-        """List all models in the registry."""
-        register_models = [name for name in cls._registry.keys() if not name.startswith("timm")]
-        return register_models + ["timm/<model_name>"]
-def register_model(name: str) -> Callable:
-    """Simple decorator to register a model."""
-    return BackboneModelRegistry.register(name)
+backbone_registry = Registry()

eva/vision/models/networks/backbones/timm/backbones.py CHANGED Viewed

@@ -8,7 +8,7 @@ from loguru import logger
 from torch import nn
 from eva.vision.models import wrappers
-from eva.vision.models.networks.backbones.registry import BackboneModelRegistry
+from eva.vision.models.networks.backbones.registry import backbone_registry
 def timm_model(
@@ -46,7 +46,7 @@ def timm_model(
     )
-BackboneModelRegistry._registry.update(
+backbone_registry._registry.update(
     {
         f"timm/{model_name}": functools.partial(timm_model, model_name=model_name)
         for model_name in timm.list_models()

eva/vision/models/networks/backbones/universal/__init__.py CHANGED Viewed

@@ -1,8 +1,15 @@
 """Universal Vision Model Backbones API."""
 from eva.vision.models.networks.backbones.universal.vit import (
+    vit_base_patch16_224_dino_1chan,
     vit_small_patch16_224_dino,
+    vit_small_patch16_224_dino_1chan,
     vit_small_patch16_224_random,
 )
-__all__ = ["vit_small_patch16_224_dino", "vit_small_patch16_224_random"]
+__all__ = [
+    "vit_small_patch16_224_dino",
+    "vit_small_patch16_224_random",
+    "vit_small_patch16_224_dino_1chan",
+    "vit_base_patch16_224_dino_1chan",
+]

eva/vision/models/networks/backbones/universal/vit.py CHANGED Viewed

@@ -5,10 +5,10 @@ from typing import Tuple
 import timm
 from torch import nn
-from eva.vision.models.networks.backbones.registry import register_model
+from eva.vision.models.networks.backbones.registry import backbone_registry
-@register_model("universal/vit_small_patch16_224_random")
+@backbone_registry.register("universal/vit_small_patch16_224_random")
 def vit_small_patch16_224_random(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -31,7 +31,7 @@ def vit_small_patch16_224_random(
     )
-@register_model("universal/vit_small_patch16_224_dino")
+@backbone_registry.register("universal/vit_small_patch16_224_dino")
 def vit_small_patch16_224_dino(
     dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
 ) -> nn.Module:
@@ -52,3 +52,53 @@ def vit_small_patch16_224_dino(
         out_indices=out_indices,
         dynamic_img_size=dynamic_img_size,
     )
+@backbone_registry.register("universal/vit_small_patch16_224_dino_1chan")
+def vit_small_patch16_224_dino_1chan(
+    dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
+) -> nn.Module:
+    """Initializes a ViTS-16 baseline model pretrained w/ DINO for single-channel images.
+    Args:
+        dynamic_img_size: Support different input image sizes by allowing to change
+            the grid size (interpolate abs and/or ROPE pos) in the forward pass.
+        out_indices: Whether and which multi-level patch embeddings to return.
+    Returns:
+        The torch ViTS-16 based foundation model.
+    """
+    return timm.create_model(
+        model_name="vit_small_patch16_224.dino",
+        in_chans=1,
+        num_classes=0,
+        pretrained=True,
+        features_only=out_indices is not None,
+        out_indices=out_indices,
+        dynamic_img_size=dynamic_img_size,
+    )
+@backbone_registry.register("universal/vit_base_patch16_224_dino_1chan")
+def vit_base_patch16_224_dino_1chan(
+    dynamic_img_size: bool = True, out_indices: int | Tuple[int, ...] | None = None
+) -> nn.Module:
+    """Initializes a ViTB-16 baseline model pretrained w/ DINO for single-channel images.
+    Args:
+        dynamic_img_size: Support different input image sizes by allowing to change
+            the grid size (interpolate abs and/or ROPE pos) in the forward pass.
+        out_indices: Whether and which multi-level patch embeddings to return.
+    Returns:
+        The torch ViTB-16 based foundation model.
+    """
+    return timm.create_model(
+        model_name="vit_base_patch16_224.dino",
+        in_chans=1,
+        num_classes=0,
+        pretrained=True,
+        features_only=out_indices is not None,
+        out_indices=out_indices,
+        dynamic_img_size=dynamic_img_size,
+    )

eva/vision/models/networks/decoders/segmentation/decoder2d.py CHANGED Viewed

@@ -115,4 +115,4 @@ class Decoder2D(base.Decoder):
         if self._combine_features:
             features = self._forward_features(features)
         logits = self._forward_head(features)
-        return self._upscale(logits, image_size)
+        return self._upscale(logits, image_size)  # type: ignore

eva/vision/models/networks/decoders/segmentation/linear.py CHANGED Viewed

@@ -117,4 +117,4 @@ class LinearDecoder(base.Decoder):
         """
         patch_embeddings = self._forward_features(decoder_inputs.features)
         logits = self._forward_head(patch_embeddings)
-        return self._cls_seg(logits, decoder_inputs.image_size)
+        return self._cls_seg(logits, decoder_inputs.image_size)  # type: ignore

eva/vision/models/networks/decoders/segmentation/semantic/common.py CHANGED Viewed

@@ -1,7 +1,7 @@
 """Common semantic segmentation decoders.
-This module contains implementations of different types of decoder models
-used in semantic segmentation. These decoders convert the high-level features
+This module contains implementations of different types of decoder models
+used in semantic segmentation. These decoders convert the high-level features
 output by an encoder into pixel-wise predictions for segmentation tasks.
 """

eva/vision/models/networks/decoders/segmentation/typings.py CHANGED Viewed

@@ -11,7 +11,7 @@ class DecoderInputs(NamedTuple):
     features: List[torch.Tensor]
     """List of image features generated by the encoder from the original images."""
-    image_size: Tuple[int, int]
+    image_size: Tuple[int, ...]
     """Size of the original input images to be used for upsampling."""
     images: torch.Tensor | None = None

kaiko-eva 0.2.1__py3-none-any.whl → 0.3.0__py3-none-any.whl

kaiko-eva 0.2.1py3-none-any.whl → 0.3.0py3-none-any.whl