PyPI - wavedl - Versions diffs - 1.5.7__py3-none-any.whl → 1.6.1__py3-none-any.whl - Mend

wavedl 1.5.7py3-none-any.whl → 1.6.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

wavedl/__init__.py +1 -1
wavedl/hpo.py +451 -451
wavedl/models/__init__.py +80 -4
wavedl/models/_pretrained_utils.py +366 -0
wavedl/models/base.py +48 -0
wavedl/models/caformer.py +270 -0
wavedl/models/cnn.py +2 -27
wavedl/models/convnext.py +113 -51
wavedl/models/convnext_v2.py +488 -0
wavedl/models/densenet.py +10 -23
wavedl/models/efficientnet.py +6 -6
wavedl/models/efficientnetv2.py +315 -315
wavedl/models/efficientvit.py +398 -0
wavedl/models/fastvit.py +252 -0
wavedl/models/mamba.py +555 -0
wavedl/models/maxvit.py +254 -0
wavedl/models/mobilenetv3.py +295 -295
wavedl/models/regnet.py +406 -406
wavedl/models/resnet.py +19 -61
wavedl/models/resnet3d.py +258 -258
wavedl/models/swin.py +443 -443
wavedl/models/tcn.py +393 -409
wavedl/models/unet.py +2 -6
wavedl/models/unireplknet.py +491 -0
wavedl/models/vit.py +9 -9
wavedl/train.py +1430 -1425
wavedl/utils/config.py +367 -367
wavedl/utils/cross_validation.py +530 -530
wavedl/utils/data.py +39 -6
wavedl/utils/losses.py +216 -216
wavedl/utils/optimizers.py +216 -216
wavedl/utils/schedulers.py +251 -251
{wavedl-1.5.7.dist-info → wavedl-1.6.1.dist-info}/METADATA +150 -82
wavedl-1.6.1.dist-info/RECORD +46 -0
wavedl-1.5.7.dist-info/RECORD +0 -38
{wavedl-1.5.7.dist-info → wavedl-1.6.1.dist-info}/LICENSE +0 -0
{wavedl-1.5.7.dist-info → wavedl-1.6.1.dist-info}/WHEEL +0 -0
{wavedl-1.5.7.dist-info → wavedl-1.6.1.dist-info}/entry_points.txt +0 -0
{wavedl-1.5.7.dist-info → wavedl-1.6.1.dist-info}/top_level.txt +0 -0

wavedl/models/resnet.py CHANGED Viewed

@@ -11,9 +11,9 @@ Provides multiple depth variants (18, 34, 50) with optional pretrained weights f
     - 3D: Volumetric data, CT/MRI (N, 1, D, H, W) → Conv3d
 **Variants**:
-    - resnet18: Lightweight, fast training (~11M params)
-    - resnet34: Balanced capacity (~21M params)
-    - resnet50: Higher capacity with bottleneck blocks (~25M params)
+    - resnet18: Lightweight, fast training (~11.2M backbone params)
+    - resnet34: Balanced capacity (~21.3M backbone params)
+    - resnet50: Higher capacity with bottleneck blocks (~23.5M backbone params)
 References:
     He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning
@@ -27,14 +27,10 @@ from typing import Any
 import torch
 import torch.nn as nn
-from wavedl.models.base import BaseModel
+from wavedl.models.base import BaseModel, SpatialShape, compute_num_groups
 from wavedl.models.registry import register_model
-# Type alias for spatial shapes
-SpatialShape = tuple[int] | tuple[int, int] | tuple[int, int, int]
 def _get_conv_layers(
     dim: int,
 ) -> tuple[type[nn.Module], type[nn.Module], type[nn.Module]]:
@@ -49,36 +45,6 @@ def _get_conv_layers(
         raise ValueError(f"Unsupported dimensionality: {dim}D. Supported: 1D, 2D, 3D.")
-def _get_num_groups(num_channels: int, preferred_groups: int = 32) -> int:
-    """
-    Get valid num_groups for GroupNorm that divides num_channels evenly.
-    Args:
-        num_channels: Number of channels to normalize
-        preferred_groups: Preferred number of groups (default: 32)
-    Returns:
-        Valid num_groups that divides num_channels
-    Raises:
-        ValueError: If no valid divisor found (shouldn't happen with power-of-2 channels)
-    """
-    # Try preferred groups first, then decrease
-    for groups in [preferred_groups, 16, 8, 4, 2, 1]:
-        if groups <= num_channels and num_channels % groups == 0:
-            return groups
-    # Fallback: find any valid divisor
-    for groups in range(min(32, num_channels), 0, -1):
-        if num_channels % groups == 0:
-            return groups
-    raise ValueError(
-        f"Cannot find valid num_groups for {num_channels} channels. "
-        f"Consider using base_width that is a power of 2 (e.g., 32, 64, 128)."
-    )
 class BasicBlock(nn.Module):
     """
     Basic residual block for ResNet-18/34.
@@ -107,12 +73,12 @@ class BasicBlock(nn.Module):
             padding=1,
             bias=False,
         )
-        self.gn1 = nn.GroupNorm(_get_num_groups(out_channels), out_channels)
+        self.gn1 = nn.GroupNorm(compute_num_groups(out_channels), out_channels)
         self.relu = nn.ReLU(inplace=True)
         self.conv2 = Conv(
             out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False
         )
-        self.gn2 = nn.GroupNorm(_get_num_groups(out_channels), out_channels)
+        self.gn2 = nn.GroupNorm(compute_num_groups(out_channels), out_channels)
         self.downsample = downsample
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -155,7 +121,7 @@ class Bottleneck(nn.Module):
         # 1x1 reduce
         self.conv1 = Conv(in_channels, out_channels, kernel_size=1, bias=False)
-        self.gn1 = nn.GroupNorm(_get_num_groups(out_channels), out_channels)
+        self.gn1 = nn.GroupNorm(compute_num_groups(out_channels), out_channels)
         # 3x3 conv
         self.conv2 = Conv(
@@ -166,14 +132,16 @@ class Bottleneck(nn.Module):
             padding=1,
             bias=False,
         )
-        self.gn2 = nn.GroupNorm(_get_num_groups(out_channels), out_channels)
+        self.gn2 = nn.GroupNorm(compute_num_groups(out_channels), out_channels)
         # 1x1 expand
         self.conv3 = Conv(
             out_channels, out_channels * self.expansion, kernel_size=1, bias=False
         )
         expanded_channels = out_channels * self.expansion
-        self.gn3 = nn.GroupNorm(_get_num_groups(expanded_channels), expanded_channels)
+        self.gn3 = nn.GroupNorm(
+            compute_num_groups(expanded_channels), expanded_channels
+        )
         self.relu = nn.ReLU(inplace=True)
         self.downsample = downsample
@@ -229,7 +197,7 @@ class ResNetBase(BaseModel):
         # Stem: 7x7 conv (or equivalent for 1D/3D)
         self.conv1 = Conv(1, base_width, kernel_size=7, stride=2, padding=3, bias=False)
-        self.gn1 = nn.GroupNorm(_get_num_groups(base_width), base_width)
+        self.gn1 = nn.GroupNorm(compute_num_groups(base_width), base_width)
         self.relu = nn.ReLU(inplace=True)
         self.maxpool = MaxPool(kernel_size=3, stride=2, padding=1)
@@ -275,7 +243,7 @@ class ResNetBase(BaseModel):
                     bias=False,
                 ),
                 nn.GroupNorm(
-                    _get_num_groups(out_channels * block.expansion),
+                    compute_num_groups(out_channels * block.expansion),
                     out_channels * block.expansion,
                 ),
             )
@@ -495,21 +463,11 @@ class PretrainedResNetBase(BaseModel):
         # Modify first conv for single-channel input
         # Original: Conv2d(3, 64, ...) → New: Conv2d(1, 64, ...)
-        old_conv = self.backbone.conv1
-        self.backbone.conv1 = nn.Conv2d(
-            1,
-            old_conv.out_channels,
-            kernel_size=old_conv.kernel_size,
-            stride=old_conv.stride,
-            padding=old_conv.padding,
-            bias=False,
+        from wavedl.models._pretrained_utils import adapt_first_conv_for_single_channel
+        adapt_first_conv_for_single_channel(
+            self.backbone, "conv1", pretrained=pretrained
         )
-        # Initialize new conv with mean of pretrained weights
-        if pretrained:
-            with torch.no_grad():
-                self.backbone.conv1.weight = nn.Parameter(
-                    old_conv.weight.mean(dim=1, keepdim=True)
-                )
         # Optionally freeze backbone
         if freeze_backbone:
@@ -534,7 +492,7 @@ class ResNet18Pretrained(PretrainedResNetBase):
     """
     ResNet-18 with ImageNet pretrained weights (2D only).
-    ~11M parameters. Good for: Transfer learning, faster convergence.
+    ~11.2M backbone parameters. Good for: Transfer learning, faster convergence.
     Args:
         in_shape: (H, W) image dimensions
@@ -563,7 +521,7 @@ class ResNet50Pretrained(PretrainedResNetBase):
     """
     ResNet-50 with ImageNet pretrained weights (2D only).
-    ~25M parameters. Good for: High accuracy with transfer learning.
+    ~23.5M backbone parameters. Good for: High accuracy with transfer learning.
     Args:
         in_shape: (H, W) image dimensions

wavedl 1.5.7__py3-none-any.whl → 1.6.1__py3-none-any.whl

wavedl 1.5.7py3-none-any.whl → 1.6.1py3-none-any.whl