PyPI - birder - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.1__py3-none-any.whl - Mend

birder 0.4.0py3-none-any.whl → 0.4.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (187) hide show

birder/adversarial/base.py +1 -1
birder/adversarial/simba.py +4 -4
birder/common/cli.py +1 -1
birder/common/fs_ops.py +11 -11
birder/common/lib.py +2 -2
birder/common/masking.py +3 -3
birder/common/training_cli.py +24 -2
birder/common/training_utils.py +28 -4
birder/data/collators/detection.py +9 -1
birder/data/transforms/detection.py +27 -8
birder/data/transforms/mosaic.py +1 -1
birder/datahub/classification.py +3 -3
birder/inference/classification.py +3 -3
birder/inference/data_parallel.py +1 -1
birder/inference/detection.py +5 -5
birder/inference/wbf.py +1 -1
birder/introspection/attention_rollout.py +5 -5
birder/introspection/feature_pca.py +4 -4
birder/introspection/gradcam.py +1 -1
birder/introspection/guided_backprop.py +2 -2
birder/introspection/transformer_attribution.py +3 -3
birder/layers/attention_pool.py +2 -2
birder/model_registry/model_registry.py +2 -1
birder/net/__init__.py +2 -0
birder/net/_rope_vit_configs.py +5 -0
birder/net/_vit_configs.py +0 -13
birder/net/alexnet.py +5 -5
birder/net/base.py +28 -3
birder/net/biformer.py +17 -17
birder/net/cait.py +2 -2
birder/net/cas_vit.py +1 -1
birder/net/coat.py +15 -15
birder/net/convnext_v1.py +2 -10
birder/net/convnext_v1_iso.py +198 -0
birder/net/convnext_v2.py +2 -10
birder/net/crossformer.py +9 -9
birder/net/crossvit.py +1 -1
birder/net/cspnet.py +1 -1
birder/net/cswin_transformer.py +10 -10
birder/net/davit.py +10 -10
birder/net/deit.py +56 -3
birder/net/deit3.py +27 -15
birder/net/detection/__init__.py +4 -0
birder/net/detection/{yolo_anchors.py → _yolo_anchors.py} +5 -5
birder/net/detection/base.py +6 -5
birder/net/detection/deformable_detr.py +26 -28
birder/net/detection/detr.py +9 -9
birder/net/detection/efficientdet.py +9 -28
birder/net/detection/faster_rcnn.py +22 -22
birder/net/detection/fcos.py +8 -8
birder/net/detection/plain_detr.py +852 -0
birder/net/detection/retinanet.py +4 -4
birder/net/detection/rt_detr_v1.py +81 -25
birder/net/detection/rt_detr_v2.py +1147 -0
birder/net/detection/ssd.py +5 -5
birder/net/detection/yolo_v2.py +12 -12
birder/net/detection/yolo_v3.py +19 -19
birder/net/detection/yolo_v4.py +16 -16
birder/net/detection/yolo_v4_tiny.py +3 -3
birder/net/edgenext.py +3 -3
birder/net/edgevit.py +10 -14
birder/net/efficientformer_v1.py +1 -1
birder/net/efficientvim.py +9 -9
birder/net/efficientvit_mit.py +2 -2
birder/net/efficientvit_msft.py +3 -3
birder/net/fasternet.py +1 -1
birder/net/fastvit.py +5 -12
birder/net/flexivit.py +28 -15
birder/net/focalnet.py +5 -9
birder/net/gc_vit.py +11 -11
birder/net/ghostnet_v1.py +1 -1
birder/net/ghostnet_v2.py +1 -1
birder/net/groupmixformer.py +12 -12
birder/net/hgnet_v1.py +1 -1
birder/net/hgnet_v2.py +4 -4
birder/net/hiera.py +6 -6
birder/net/hieradet.py +9 -9
birder/net/hornet.py +3 -3
birder/net/iformer.py +4 -4
birder/net/inception_next.py +4 -14
birder/net/levit.py +3 -3
birder/net/lit_v1.py +13 -15
birder/net/lit_v1_tiny.py +9 -9
birder/net/lit_v2.py +14 -15
birder/net/maxvit.py +10 -22
birder/net/metaformer.py +2 -2
birder/net/mim/crossmae.py +5 -5
birder/net/mim/fcmae.py +3 -5
birder/net/mim/mae_hiera.py +7 -7
birder/net/mim/mae_vit.py +3 -5
birder/net/mim/simmim.py +2 -3
birder/net/mobilenet_v4_hybrid.py +4 -4
birder/net/mobileone.py +5 -12
birder/net/mobilevit_v1.py +2 -2
birder/net/mobilevit_v2.py +5 -9
birder/net/mvit_v2.py +24 -24
birder/net/nextvit.py +2 -2
birder/net/pit.py +11 -26
birder/net/pvt_v1.py +4 -4
birder/net/pvt_v2.py +5 -11
birder/net/regionvit.py +15 -15
birder/net/regnet.py +1 -1
birder/net/repghost.py +4 -5
birder/net/repvgg.py +3 -5
birder/net/repvit.py +2 -2
birder/net/resnest.py +1 -1
birder/net/rope_deit3.py +29 -15
birder/net/rope_flexivit.py +28 -15
birder/net/rope_vit.py +41 -23
birder/net/sequencer2d.py +3 -4
birder/net/shufflenet_v1.py +1 -1
birder/net/shufflenet_v2.py +1 -1
birder/net/simple_vit.py +47 -5
birder/net/smt.py +7 -7
birder/net/ssl/barlow_twins.py +1 -1
birder/net/ssl/byol.py +2 -2
birder/net/ssl/capi.py +3 -3
birder/net/ssl/data2vec2.py +1 -1
birder/net/ssl/dino_v2.py +11 -1
birder/net/ssl/franca.py +26 -2
birder/net/ssl/i_jepa.py +4 -4
birder/net/ssl/mmcr.py +1 -1
birder/net/swiftformer.py +1 -1
birder/net/swin_transformer_v1.py +4 -5
birder/net/swin_transformer_v2.py +4 -7
birder/net/tiny_vit.py +3 -3
birder/net/transnext.py +19 -19
birder/net/uniformer.py +4 -4
birder/net/vgg.py +1 -10
birder/net/vit.py +38 -25
birder/net/vit_parallel.py +35 -20
birder/net/vit_sam.py +10 -10
birder/net/vovnet_v2.py +1 -1
birder/net/xcit.py +9 -7
birder/ops/msda.py +4 -4
birder/ops/swattention.py +10 -10
birder/results/classification.py +3 -3
birder/results/gui.py +8 -8
birder/scripts/benchmark.py +37 -12
birder/scripts/evaluate.py +1 -1
birder/scripts/predict.py +3 -3
birder/scripts/predict_detection.py +2 -2
birder/scripts/train.py +63 -15
birder/scripts/train_barlow_twins.py +10 -7
birder/scripts/train_byol.py +10 -7
birder/scripts/train_capi.py +15 -10
birder/scripts/train_data2vec.py +10 -7
birder/scripts/train_data2vec2.py +10 -7
birder/scripts/train_detection.py +29 -14
birder/scripts/train_dino_v1.py +13 -9
birder/scripts/train_dino_v2.py +27 -14
birder/scripts/train_dino_v2_dist.py +28 -15
birder/scripts/train_franca.py +16 -9
birder/scripts/train_i_jepa.py +12 -9
birder/scripts/train_ibot.py +15 -11
birder/scripts/train_kd.py +64 -17
birder/scripts/train_mim.py +11 -8
birder/scripts/train_mmcr.py +11 -8
birder/scripts/train_rotnet.py +11 -7
birder/scripts/train_simclr.py +10 -7
birder/scripts/train_vicreg.py +10 -7
birder/tools/adversarial.py +4 -4
birder/tools/auto_anchors.py +5 -5
birder/tools/avg_model.py +1 -1
birder/tools/convert_model.py +30 -22
birder/tools/det_results.py +1 -1
birder/tools/download_model.py +1 -1
birder/tools/ensemble_model.py +1 -1
birder/tools/introspection.py +11 -2
birder/tools/labelme_to_coco.py +2 -2
birder/tools/model_info.py +12 -14
birder/tools/pack.py +8 -8
birder/tools/quantize_model.py +53 -4
birder/tools/results.py +2 -2
birder/tools/show_det_iterator.py +19 -6
birder/tools/show_iterator.py +2 -2
birder/tools/similarity.py +5 -5
birder/tools/stats.py +4 -6
birder/tools/voc_to_coco.py +1 -1
birder/version.py +1 -1
{birder-0.4.0.dist-info → birder-0.4.1.dist-info}/METADATA +3 -3
birder-0.4.1.dist-info/RECORD +300 -0
{birder-0.4.0.dist-info → birder-0.4.1.dist-info}/WHEEL +1 -1
birder-0.4.0.dist-info/RECORD +0 -297
{birder-0.4.0.dist-info → birder-0.4.1.dist-info}/entry_points.txt +0 -0
{birder-0.4.0.dist-info → birder-0.4.1.dist-info}/licenses/LICENSE +0 -0
{birder-0.4.0.dist-info → birder-0.4.1.dist-info}/top_level.txt +0 -0

birder/scripts/train_data2vec2.py CHANGED Viewed

@@ -75,7 +75,7 @@ def train(args: argparse.Namespace) -> None:
     #
     # Initialize
     #
-    (device, device_id, disable_tqdm) = training_utils.init_training(args, logger)
+    device, device_id, disable_tqdm = training_utils.init_training(args, logger)
     if args.size is None:
         # Prefer mim size over encoder default size
@@ -105,7 +105,7 @@ def train(args: argparse.Namespace) -> None:
     network_name = get_mim_network_name("data2vec2", encoder=args.network, tag=args.tag)
-    backbone = registry.net_factory(args.network, sample_shape[1], 0, config=args.model_config, size=args.size)
+    backbone = registry.net_factory(args.network, 0, sample_shape[1], config=args.model_config, size=args.size)
     net = Data2Vec2(
         backbone,
         config={
@@ -121,7 +121,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, training_states) = fs_ops.load_simple_checkpoint(
+        net, training_states = fs_ops.load_simple_checkpoint(
             device, net, network_name, epoch=args.resume_epoch, strict=not args.non_strict_weights
         )
@@ -169,11 +169,11 @@ def train(args: argparse.Namespace) -> None:
     elif args.wds is True:
         wds_path: str | list[str]
         if args.wds_info is not None:
-            (wds_path, dataset_size) = wds_args_from_info(args.wds_info, args.wds_split)
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
             if args.wds_size is not None:
                 dataset_size = args.wds_size
         else:
-            (wds_path, dataset_size) = prepare_wds_args(args.data_path[0], args.wds_size, device)
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
         training_dataset = make_wds_dataset(
             wds_path,
@@ -199,7 +199,7 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, _) = training_utils.get_samplers(
+    train_sampler, _ = training_utils.get_samplers(
         args, training_dataset, validation_dataset=None, infinite=virtual_epoch_mode
     )
@@ -288,7 +288,7 @@ def train(args: argparse.Namespace) -> None:
     )
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -400,6 +400,9 @@ def train(args: argparse.Namespace) -> None:
         tic = time.time()
         net.train()
+        # Clear metrics
+        running_loss.clear()
         if args.distributed is True or virtual_epoch_mode is True:
             train_sampler.set_epoch(epoch)

birder/scripts/train_detection.py CHANGED Viewed

@@ -27,7 +27,7 @@ from birder.common import training_cli
 from birder.common import training_utils
 from birder.conf import settings
 from birder.data.collators.detection import BatchRandomResizeCollator
-from birder.data.collators.detection import training_collate_fn
+from birder.data.collators.detection import DetectionCollator
 from birder.data.datasets.coco import CocoMosaicTraining
 from birder.data.datasets.coco import CocoTraining
 from birder.data.transforms.classification import get_rgb_stats
@@ -63,7 +63,7 @@ def train(args: argparse.Namespace) -> None:
     )
     model_dynamic_size = transform_dynamic_size or args.batch_multiscale is True
-    (device, device_id, disable_tqdm) = training_utils.init_training(
+    device, device_id, disable_tqdm = training_utils.init_training(
         args, logger, cudnn_dynamic_size=transform_dynamic_size
     )
@@ -92,6 +92,7 @@ def train(args: argparse.Namespace) -> None:
         args.multiscale,
         args.max_size,
         args.multiscale_min_size,
+        args.multiscale_step,
     )
     mosaic_dataset = None
     if args.mosaic_prob > 0.0:
@@ -104,6 +105,7 @@ def train(args: argparse.Namespace) -> None:
             args.multiscale,
             args.max_size,
             args.multiscale_min_size,
+            args.multiscale_step,
             post_mosaic=True,
         )
         if args.dynamic_size is True or args.multiscale is True:
@@ -177,14 +179,22 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, validation_sampler) = training_utils.get_samplers(
+    train_sampler, validation_sampler = training_utils.get_samplers(
         args, training_dataset, validation_dataset, infinite=virtual_epoch_mode
     )
     if args.batch_multiscale is True:
-        train_collate_fn: Any = BatchRandomResizeCollator(0, args.size, multiscale_min_size=args.multiscale_min_size)
+        train_collate_fn: Any = BatchRandomResizeCollator(
+            0,
+            args.size,
+            size_divisible=args.multiscale_step,
+            multiscale_min_size=args.multiscale_min_size,
+            multiscale_step=args.multiscale_step,
+        )
     else:
-        train_collate_fn = training_collate_fn
+        train_collate_fn = DetectionCollator(0, size_divisible=args.multiscale_step)
+    validation_collate_fn = DetectionCollator(0, size_divisible=args.multiscale_step)
     training_loader = DataLoader(
         training_dataset,
@@ -202,7 +212,7 @@ def train(args: argparse.Namespace) -> None:
         sampler=validation_sampler,
         num_workers=args.num_workers,
         prefetch_factor=args.prefetch_factor,
-        collate_fn=training_collate_fn,
+        collate_fn=validation_collate_fn,
         pin_memory=True,
         drop_last=args.drop_last,
     )
@@ -243,7 +253,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, class_to_idx_saved, training_states) = fs_ops.load_detection_checkpoint(
+        net, class_to_idx_saved, training_states = fs_ops.load_detection_checkpoint(
             device,
             args.network,
             config=args.model_config,
@@ -262,7 +272,7 @@ def train(args: argparse.Namespace) -> None:
     elif args.pretrained is True:
         fs_ops.download_model_by_weights(network_name, progress_bar=training_utils.is_local_primary(args))
-        (net, class_to_idx_saved, training_states) = fs_ops.load_detection_checkpoint(
+        net, class_to_idx_saved, training_states = fs_ops.load_detection_checkpoint(
             device,
             args.network,
             config=args.model_config,
@@ -282,7 +292,7 @@ def train(args: argparse.Namespace) -> None:
     else:
         if args.backbone_epoch is not None:
             backbone: DetectorBackbone
-            (backbone, class_to_idx_saved, _) = fs_ops.load_checkpoint(
+            backbone, class_to_idx_saved, _ = fs_ops.load_checkpoint(
                 device,
                 args.backbone,
                 config=args.backbone_model_config,
@@ -297,7 +307,7 @@ def train(args: argparse.Namespace) -> None:
                 lib.get_network_name(args.backbone, tag=args.backbone_tag),
                 progress_bar=training_utils.is_local_primary(args),
             )
-            (backbone, class_to_idx_saved, _) = fs_ops.load_checkpoint(
+            backbone, class_to_idx_saved, _ = fs_ops.load_checkpoint(
                 device,
                 args.backbone,
                 config=args.backbone_model_config,
@@ -309,7 +319,7 @@ def train(args: argparse.Namespace) -> None:
         else:
             backbone = registry.net_factory(
-                args.backbone, sample_shape[1], num_outputs, config=args.backbone_model_config, size=args.size
+                args.backbone, num_outputs, sample_shape[1], config=args.backbone_model_config, size=args.size
             )
         net = registry.detection_net_factory(
@@ -386,7 +396,7 @@ def train(args: argparse.Namespace) -> None:
         optimizer.step = torch.compile(optimizer.step, fullgraph=False)
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -546,6 +556,11 @@ def train(args: argparse.Namespace) -> None:
         tic = time.time()
         net.train()
+        # Clear metrics
+        running_loss.clear()
+        for tracker in loss_trackers.values():
+            tracker.clear()
         validation_metrics.reset()
         if args.distributed is True or virtual_epoch_mode is True:
@@ -586,7 +601,7 @@ def train(args: argparse.Namespace) -> None:
             # Forward, backward and optimize
             with torch.amp.autocast("cuda", enabled=args.amp, dtype=amp_dtype):
-                (_detections, losses) = net(inputs, targets, masks, image_sizes)
+                _detections, losses = net(inputs, targets, masks, image_sizes)
                 loss = sum(v for v in losses.values())
             if scaler is not None:
@@ -708,7 +723,7 @@ def train(args: argparse.Namespace) -> None:
                 masks = masks.to(device, non_blocking=True)
                 with torch.amp.autocast("cuda", enabled=args.amp, dtype=amp_dtype):
-                    (detections, losses) = eval_model(inputs, masks=masks, image_sizes=image_sizes)
+                    detections, losses = eval_model(inputs, masks=masks, image_sizes=image_sizes)
                 for target in targets:
                     # TorchMetrics can't handle "empty" images

birder/scripts/train_dino_v1.py CHANGED Viewed

@@ -101,7 +101,7 @@ def train(args: argparse.Namespace) -> None:
     #
     # Initialize
     #
-    (device, device_id, disable_tqdm) = training_utils.init_training(args, logger)
+    device, device_id, disable_tqdm = training_utils.init_training(args, logger)
     if args.size is None:
         args.size = registry.get_default_size(args.network)
@@ -129,11 +129,11 @@ def train(args: argparse.Namespace) -> None:
     elif args.wds is True:
         wds_path: str | list[str]
         if args.wds_info is not None:
-            (wds_path, dataset_size) = wds_args_from_info(args.wds_info, args.wds_split)
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
             if args.wds_size is not None:
                 dataset_size = args.wds_size
         else:
-            (wds_path, dataset_size) = prepare_wds_args(args.data_path[0], args.wds_size, device)
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
         training_dataset = make_wds_dataset(
             wds_path,
@@ -163,7 +163,7 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, _) = training_utils.get_samplers(
+    train_sampler, _ = training_utils.get_samplers(
         args, training_dataset, validation_dataset=None, infinite=virtual_epoch_mode
     )
@@ -226,9 +226,9 @@ def train(args: argparse.Namespace) -> None:
     network_name = get_mim_network_name("dino_v1", encoder=args.network, tag=args.tag)
-    student_backbone = registry.net_factory(args.network, sample_shape[1], 0, config=args.model_config, size=args.size)
+    student_backbone = registry.net_factory(args.network, 0, sample_shape[1], config=args.model_config, size=args.size)
     if args.backbone_epoch is not None:
-        (student_backbone, _) = fs_ops.load_simple_checkpoint(
+        student_backbone, _ = fs_ops.load_simple_checkpoint(
             device, student_backbone, backbone_name, epoch=args.backbone_epoch, strict=not args.non_strict_weights
         )
@@ -239,7 +239,7 @@ def train(args: argparse.Namespace) -> None:
         teacher_model_config = {"drop_path_rate": 0.0}
     teacher_backbone = registry.net_factory(
-        args.network, sample_shape[1], 0, config=teacher_model_config, size=args.size
+        args.network, 0, sample_shape[1], config=teacher_model_config, size=args.size
     )
     if args.freeze_body is True:
         student_backbone.freeze(freeze_classifier=False, unfreeze_features=True)
@@ -293,7 +293,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, training_states) = fs_ops.load_simple_checkpoint(
+        net, training_states = fs_ops.load_simple_checkpoint(
             device, net, network_name, epoch=args.resume_epoch, strict=not args.non_strict_weights
         )
         student = net["student"]
@@ -368,7 +368,7 @@ def train(args: argparse.Namespace) -> None:
         wd_schedule = None
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -488,6 +488,10 @@ def train(args: argparse.Namespace) -> None:
         tic = time.time()
         net.train()
+        # Clear metrics
+        running_loss.clear()
+        train_proto_agreement.clear()
         if args.distributed is True or virtual_epoch_mode is True:
             train_sampler.set_epoch(epoch)

birder/scripts/train_dino_v2.py CHANGED Viewed

@@ -178,7 +178,7 @@ def train(args: argparse.Namespace) -> None:
     #
     # Initialize
     #
-    (device, device_id, disable_tqdm) = training_utils.init_training(args, logger)
+    device, device_id, disable_tqdm = training_utils.init_training(args, logger)
     if args.size is None:
         args.size = registry.get_default_size(args.network)
@@ -207,7 +207,7 @@ def train(args: argparse.Namespace) -> None:
     network_name = get_mim_network_name("dino_v2", encoder=args.network, tag=args.tag)
-    student_backbone = registry.net_factory(args.network, sample_shape[1], 0, config=args.model_config, size=args.size)
+    student_backbone = registry.net_factory(args.network, 0, sample_shape[1], config=args.model_config, size=args.size)
     if args.model_config is not None:
         teacher_model_config = args.model_config.copy()
         teacher_model_config.update({"drop_path_rate": 0.0})
@@ -215,7 +215,7 @@ def train(args: argparse.Namespace) -> None:
         teacher_model_config = {"drop_path_rate": 0.0}
     teacher_backbone = registry.net_factory(
-        args.network, sample_shape[1], 0, config=teacher_model_config, size=args.size
+        args.network, 0, sample_shape[1], config=teacher_model_config, size=args.size
     )
     student_backbone.set_dynamic_size()
     if args.ibot_separate_head is False:
@@ -267,7 +267,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, training_states) = fs_ops.load_simple_checkpoint(
+        net, training_states = fs_ops.load_simple_checkpoint(
             device, net, network_name, epoch=args.resume_epoch, strict=not args.non_strict_weights
         )
         student = net["student"]
@@ -336,11 +336,11 @@ def train(args: argparse.Namespace) -> None:
     elif args.wds is True:
         wds_path: str | list[str]
         if args.wds_info is not None:
-            (wds_path, dataset_size) = wds_args_from_info(args.wds_info, args.wds_split)
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
             if args.wds_size is not None:
                 dataset_size = args.wds_size
         else:
-            (wds_path, dataset_size) = prepare_wds_args(args.data_path[0], args.wds_size, device)
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
         training_dataset = make_wds_dataset(
             wds_path,
@@ -366,7 +366,7 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, _) = training_utils.get_samplers(
+    train_sampler, _ = training_utils.get_samplers(
         args, training_dataset, validation_dataset=None, infinite=virtual_epoch_mode
     )
@@ -466,7 +466,7 @@ def train(args: argparse.Namespace) -> None:
         wd_schedule = None
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -603,6 +603,19 @@ def train(args: argparse.Namespace) -> None:
         tic = time.time()
         net.train()
+        # Clear metrics
+        running_loss.clear()
+        running_loss_dino_local.clear()
+        running_loss_dino_global.clear()
+        running_loss_koleo.clear()
+        running_loss_ibot_patch.clear()
+        if track_extended_metrics is True:
+            train_proto_agreement.clear()
+            train_patch_agreement.clear()
+            running_target_entropy.clear()
+            running_dino_center_drift.clear()
+            running_ibot_center_drift.clear()
         if args.sinkhorn_queue_size is not None:
             queue_active = epoch > args.sinkhorn_queue_warmup_epochs
             dino_loss.set_queue_active(queue_active)
@@ -661,7 +674,7 @@ def train(args: argparse.Namespace) -> None:
             with torch.amp.autocast("cuda", enabled=args.amp, dtype=amp_dtype):
                 with torch.no_grad():
                     # Teacher
-                    (teacher_embedding_after_head, teacher_masked_patch_tokens_after_head) = teacher(
+                    teacher_embedding_after_head, teacher_masked_patch_tokens_after_head = teacher(
                         global_crops, n_global_crops, upper_bound, mask_indices_list
                     )
                     teacher_patch_tokens_raw = teacher_masked_patch_tokens_after_head
@@ -671,7 +684,7 @@ def train(args: argparse.Namespace) -> None:
                             prev_dino_center = dino_loss.center.clone()
                             prev_ibot_center = ibot_patch_loss.center.clone()
-                        teacher_dino_softmax_centered_list = dino_loss.softmax_center_teacher(
+                        teacher_dino_softmax_centered = dino_loss.softmax_center_teacher(
                             teacher_embedding_after_head, teacher_temp=teacher_temp
                         ).view(n_global_crops, -1, *teacher_embedding_after_head.shape[1:])
                         dino_loss.update_center(teacher_embedding_after_head)
@@ -684,7 +697,7 @@ def train(args: argparse.Namespace) -> None:
                         ibot_patch_loss.update_center(teacher_masked_patch_tokens_after_head[:, :n_masked_patches])
                     else:  # sinkhorn_knopp
-                        teacher_dino_softmax_centered_list = dino_loss.sinkhorn_knopp_teacher(
+                        teacher_dino_softmax_centered = dino_loss.sinkhorn_knopp_teacher(
                             teacher_embedding_after_head, teacher_temp=teacher_temp
                         ).view(n_global_crops, -1, *teacher_embedding_after_head.shape[1:])
@@ -705,7 +718,7 @@ def train(args: argparse.Namespace) -> None:
                 # Local DINO loss
                 loss_dino_local_crops = dino_loss(
                     student_local_embedding_after_head.chunk(n_local_crops),
-                    teacher_dino_softmax_centered_list,
+                    teacher_dino_softmax_centered.unbind(0),
                 ) / (n_global_crops_loss_terms + n_local_crops_loss_terms)
                 loss = args.dino_loss_weight * loss_dino_local_crops
@@ -715,7 +728,7 @@ def train(args: argparse.Namespace) -> None:
                     dino_loss(
                         [student_global_embedding_after_head],
                         [
-                            teacher_dino_softmax_centered_list.flatten(0, 1)
+                            teacher_dino_softmax_centered.flatten(0, 1)
                         ],  # These were chunked and stacked in reverse so A is matched to B
                     )
                     * loss_scales
@@ -809,7 +822,7 @@ def train(args: argparse.Namespace) -> None:
                 train_patch_agreement.update(training_utils.accuracy(pred_patch_teacher, pred_patch_student))
                 with torch.no_grad():
-                    p = teacher_dino_softmax_centered_list.detach()
+                    p = teacher_dino_softmax_centered.detach()
                     p = p.reshape(-1, p.size(-1))  # (N, D)
                     # Mean distribution over prototypes (marginal)

birder/scripts/train_dino_v2_dist.py CHANGED Viewed

@@ -179,7 +179,7 @@ def train(args: argparse.Namespace) -> None:
     #
     # Initialize
     #
-    (device, device_id, disable_tqdm) = training_utils.init_training(args, logger)
+    device, device_id, disable_tqdm = training_utils.init_training(args, logger)
     if args.size is None:
         args.size = registry.get_default_size(args.network)
@@ -208,17 +208,17 @@ def train(args: argparse.Namespace) -> None:
     network_name = get_mim_network_name("dino_v2_dist", encoder=args.network, tag=args.tag)
-    student_backbone = registry.net_factory(args.network, sample_shape[1], 0, config=args.model_config, size=args.size)
+    student_backbone = registry.net_factory(args.network, 0, sample_shape[1], config=args.model_config, size=args.size)
     student_backbone_ema = registry.net_factory(
-        args.network, sample_shape[1], 0, config=args.model_config, size=args.size
+        args.network, 0, sample_shape[1], config=args.model_config, size=args.size
     )
     student_backbone_ema.load_state_dict(student_backbone.state_dict())
     student_backbone_ema.requires_grad_(False)
     teacher_backbone = registry.net_factory(
         args.teacher,
-        sample_shape[1],
         0,
+        sample_shape[1],
         config=args.teacher_model_config,
         size=args.size,
     )
@@ -277,7 +277,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, training_states) = fs_ops.load_simple_checkpoint(
+        net, training_states = fs_ops.load_simple_checkpoint(
             device, net, network_name, epoch=args.resume_epoch, strict=not args.non_strict_weights
         )
         student = net["student"]
@@ -358,11 +358,11 @@ def train(args: argparse.Namespace) -> None:
     elif args.wds is True:
         wds_path: str | list[str]
         if args.wds_info is not None:
-            (wds_path, dataset_size) = wds_args_from_info(args.wds_info, args.wds_split)
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
             if args.wds_size is not None:
                 dataset_size = args.wds_size
         else:
-            (wds_path, dataset_size) = prepare_wds_args(args.data_path[0], args.wds_size, device)
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
         training_dataset = make_wds_dataset(
             wds_path,
@@ -388,7 +388,7 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, _) = training_utils.get_samplers(
+    train_sampler, _ = training_utils.get_samplers(
         args, training_dataset, validation_dataset=None, infinite=virtual_epoch_mode
     )
@@ -487,7 +487,7 @@ def train(args: argparse.Namespace) -> None:
         wd_schedule = None
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -625,6 +625,19 @@ def train(args: argparse.Namespace) -> None:
         net.train()
         teacher.eval()
+        # Clear metrics
+        running_loss.clear()
+        running_loss_dino_local.clear()
+        running_loss_dino_global.clear()
+        running_loss_koleo.clear()
+        running_loss_ibot_patch.clear()
+        if track_extended_metrics is True:
+            train_proto_agreement.clear()
+            train_patch_agreement.clear()
+            running_target_entropy.clear()
+            running_dino_center_drift.clear()
+            running_ibot_center_drift.clear()
         if args.sinkhorn_queue_size is not None:
             queue_active = epoch > args.sinkhorn_queue_warmup_epochs
             dino_loss.set_queue_active(queue_active)
@@ -682,7 +695,7 @@ def train(args: argparse.Namespace) -> None:
             with torch.amp.autocast("cuda", enabled=args.amp, dtype=amp_dtype):
                 with torch.no_grad():
                     # Teacher
-                    (teacher_embedding_after_head, teacher_masked_patch_tokens_after_head) = teacher(
+                    teacher_embedding_after_head, teacher_masked_patch_tokens_after_head = teacher(
                         global_crops, n_global_crops, upper_bound, mask_indices_list
                     )
                     teacher_patch_tokens_raw = teacher_masked_patch_tokens_after_head
@@ -692,7 +705,7 @@ def train(args: argparse.Namespace) -> None:
                             prev_dino_center = dino_loss.center.clone()
                             prev_ibot_center = ibot_patch_loss.center.clone()
-                        teacher_dino_softmax_centered_list = dino_loss.softmax_center_teacher(
+                        teacher_dino_softmax_centered = dino_loss.softmax_center_teacher(
                             teacher_embedding_after_head, teacher_temp=teacher_temp
                         ).view(n_global_crops, -1, *teacher_embedding_after_head.shape[1:])
                         dino_loss.update_center(teacher_embedding_after_head)
@@ -705,7 +718,7 @@ def train(args: argparse.Namespace) -> None:
                         ibot_patch_loss.update_center(teacher_masked_patch_tokens_after_head[:, :n_masked_patches])
                     else:  # sinkhorn_knopp
-                        teacher_dino_softmax_centered_list = dino_loss.sinkhorn_knopp_teacher(
+                        teacher_dino_softmax_centered = dino_loss.sinkhorn_knopp_teacher(
                             teacher_embedding_after_head, teacher_temp=teacher_temp
                         ).view(n_global_crops, -1, *teacher_embedding_after_head.shape[1:])
@@ -726,7 +739,7 @@ def train(args: argparse.Namespace) -> None:
                 # Local DINO loss
                 loss_dino_local_crops = dino_loss(
                     student_local_embedding_after_head.chunk(n_local_crops),
-                    teacher_dino_softmax_centered_list,
+                    teacher_dino_softmax_centered.unbind(0),
                 ) / (n_global_crops_loss_terms + n_local_crops_loss_terms)
                 loss = args.dino_loss_weight * loss_dino_local_crops
@@ -736,7 +749,7 @@ def train(args: argparse.Namespace) -> None:
                     dino_loss(
                         [student_global_embedding_after_head],
                         [
-                            teacher_dino_softmax_centered_list.flatten(0, 1)
+                            teacher_dino_softmax_centered.flatten(0, 1)
                         ],  # These were chunked and stacked in reverse so A is matched to B
                     )
                     * loss_scales
@@ -830,7 +843,7 @@ def train(args: argparse.Namespace) -> None:
                 train_patch_agreement.update(training_utils.accuracy(pred_patch_teacher, pred_patch_student))
                 with torch.no_grad():
-                    p = teacher_dino_softmax_centered_list.detach()
+                    p = teacher_dino_softmax_centered.detach()
                     p = p.reshape(-1, p.size(-1))  # (N, D)
                     # Mean distribution over prototypes (marginal)

birder/scripts/train_franca.py CHANGED Viewed

@@ -205,7 +205,7 @@ def train(args: argparse.Namespace) -> None:
     #
     # Initialize
     #
-    (device, device_id, disable_tqdm) = training_utils.init_training(args, logger)
+    device, device_id, disable_tqdm = training_utils.init_training(args, logger)
     if args.size is None:
         args.size = registry.get_default_size(args.network)
@@ -234,7 +234,7 @@ def train(args: argparse.Namespace) -> None:
     network_name = get_mim_network_name("franca", encoder=args.network, tag=args.tag)
-    student_backbone = registry.net_factory(args.network, sample_shape[1], 0, config=args.model_config, size=args.size)
+    student_backbone = registry.net_factory(args.network, 0, sample_shape[1], config=args.model_config, size=args.size)
     if args.model_config is not None:
         teacher_model_config = args.model_config.copy()
         teacher_model_config.update({"drop_path_rate": 0.0})
@@ -242,7 +242,7 @@ def train(args: argparse.Namespace) -> None:
         teacher_model_config = {"drop_path_rate": 0.0}
     teacher_backbone = registry.net_factory(
-        args.network, sample_shape[1], 0, config=teacher_model_config, size=args.size
+        args.network, 0, sample_shape[1], config=teacher_model_config, size=args.size
     )
     student_backbone.set_dynamic_size()
     if args.ibot_separate_head is False:
@@ -296,7 +296,7 @@ def train(args: argparse.Namespace) -> None:
     if args.resume_epoch is not None:
         begin_epoch = args.resume_epoch + 1
-        (net, training_states) = fs_ops.load_simple_checkpoint(
+        net, training_states = fs_ops.load_simple_checkpoint(
             device, net, network_name, epoch=args.resume_epoch, strict=not args.non_strict_weights
         )
         student = net["student"]
@@ -363,11 +363,11 @@ def train(args: argparse.Namespace) -> None:
     elif args.wds is True:
         wds_path: str | list[str]
         if args.wds_info is not None:
-            (wds_path, dataset_size) = wds_args_from_info(args.wds_info, args.wds_split)
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
             if args.wds_size is not None:
                 dataset_size = args.wds_size
         else:
-            (wds_path, dataset_size) = prepare_wds_args(args.data_path[0], args.wds_size, device)
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
         training_dataset = make_wds_dataset(
             wds_path,
@@ -393,7 +393,7 @@ def train(args: argparse.Namespace) -> None:
     # Data loaders and samplers
     virtual_epoch_mode = args.steps_per_epoch is not None
-    (train_sampler, _) = training_utils.get_samplers(
+    train_sampler, _ = training_utils.get_samplers(
         args, training_dataset, validation_dataset=None, infinite=virtual_epoch_mode
     )
@@ -493,7 +493,7 @@ def train(args: argparse.Namespace) -> None:
         wd_schedule = None
     # Gradient scaler and AMP related tasks
-    (scaler, amp_dtype) = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
+    scaler, amp_dtype = training_utils.get_amp_scaler(args.amp, args.amp_dtype)
     # Load states
     if args.load_states is True:
@@ -623,6 +623,13 @@ def train(args: argparse.Namespace) -> None:
         tic = time.time()
         net.train()
+        # Clear metrics
+        running_loss.clear()
+        running_loss_dino_local.clear()
+        running_loss_dino_global.clear()
+        running_loss_koleo.clear()
+        running_loss_ibot_patch.clear()
         if args.sinkhorn_queue_size is not None:
             queue_active = epoch > args.sinkhorn_queue_warmup_epochs
             dino_loss.set_queue_active(queue_active)
@@ -681,7 +688,7 @@ def train(args: argparse.Namespace) -> None:
             with torch.amp.autocast("cuda", enabled=args.amp, dtype=amp_dtype):
                 with torch.no_grad():
                     # Teacher
-                    (teacher_embedding_after_head, teacher_masked_patch_tokens_after_head) = teacher(
+                    teacher_embedding_after_head, teacher_masked_patch_tokens_after_head = teacher(
                         global_crops, n_global_crops, upper_bound, mask_indices_list
                     )

birder 0.4.0__py3-none-any.whl → 0.4.1__py3-none-any.whl

birder 0.4.0py3-none-any.whl → 0.4.1py3-none-any.whl