PyPI - birder - Versions diffs - 0.2.1__py3-none-any.whl → 0.2.2__py3-none-any.whl - Mend

birder 0.2.1py3-none-any.whl → 0.2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

birder/adversarial/__init__.py +13 -0
birder/adversarial/base.py +101 -0
birder/adversarial/deepfool.py +173 -0
birder/adversarial/fgsm.py +51 -18
birder/adversarial/pgd.py +79 -28
birder/adversarial/simba.py +172 -0
birder/common/training_cli.py +11 -3
birder/common/training_utils.py +18 -1
birder/inference/data_parallel.py +1 -2
birder/introspection/__init__.py +10 -6
birder/introspection/attention_rollout.py +122 -54
birder/introspection/base.py +73 -29
birder/introspection/gradcam.py +71 -100
birder/introspection/guided_backprop.py +146 -72
birder/introspection/transformer_attribution.py +182 -0
birder/net/detection/deformable_detr.py +14 -12
birder/net/detection/detr.py +7 -3
birder/net/detection/rt_detr_v1.py +3 -3
birder/net/detection/yolo_v3.py +6 -11
birder/net/detection/yolo_v4.py +7 -18
birder/net/detection/yolo_v4_tiny.py +3 -3
birder/net/fastvit.py +1 -1
birder/net/mim/mae_vit.py +7 -8
birder/net/pit.py +1 -1
birder/net/resnet_v1.py +94 -34
birder/net/ssl/data2vec.py +1 -1
birder/net/ssl/data2vec2.py +4 -2
birder/results/gui.py +15 -2
birder/scripts/predict_detection.py +33 -1
birder/scripts/train.py +24 -17
birder/scripts/train_barlow_twins.py +10 -7
birder/scripts/train_byol.py +10 -7
birder/scripts/train_capi.py +12 -9
birder/scripts/train_data2vec.py +10 -7
birder/scripts/train_data2vec2.py +10 -7
birder/scripts/train_detection.py +42 -18
birder/scripts/train_dino_v1.py +10 -7
birder/scripts/train_dino_v2.py +10 -7
birder/scripts/train_dino_v2_dist.py +17 -7
birder/scripts/train_franca.py +10 -7
birder/scripts/train_i_jepa.py +17 -13
birder/scripts/train_ibot.py +10 -7
birder/scripts/train_kd.py +24 -18
birder/scripts/train_mim.py +11 -10
birder/scripts/train_mmcr.py +10 -7
birder/scripts/train_rotnet.py +10 -7
birder/scripts/train_simclr.py +10 -7
birder/scripts/train_vicreg.py +10 -7
birder/tools/__main__.py +6 -2
birder/tools/adversarial.py +147 -96
birder/tools/auto_anchors.py +361 -0
birder/tools/ensemble_model.py +1 -1
birder/tools/introspection.py +58 -31
birder/version.py +1 -1
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/METADATA +2 -1
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/RECORD +60 -55
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/WHEEL +0 -0
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/entry_points.txt +0 -0
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/licenses/LICENSE +0 -0
{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/top_level.txt +0 -0

birder/tools/auto_anchors.py ADDED Viewed

@@ -0,0 +1,361 @@
+"""
+Fit YOLO-style anchor boxes using k-means based on COCO-format annotations.
+Generated by gpt-5.2-codex xhigh.
+"""
+import argparse
+import json
+import logging
+import math
+from pathlib import Path
+from pprint import pformat
+from typing import Any
+from typing import Literal
+from typing import Optional
+from typing import TypedDict
+import torch
+from birder.common import cli
+from birder.conf import settings
+logger = logging.getLogger(__name__)
+class AnchorPreset(TypedDict):
+    num_scales: int
+    num_anchors: int
+    default_size: tuple[int, int]
+    format: Literal["pixels", "grid"]
+MODEL_PRESETS: dict[str, AnchorPreset] = {
+    "yolo_v2": {"num_scales": 1, "num_anchors": 5, "default_size": (416, 416), "format": "grid"},
+    "yolo_v3": {"num_scales": 3, "num_anchors": 9, "default_size": (416, 416), "format": "pixels"},
+    "yolo_v4": {"num_scales": 3, "num_anchors": 9, "default_size": (608, 608), "format": "pixels"},
+    "yolo_v4_tiny": {"num_scales": 2, "num_anchors": 6, "default_size": (416, 416), "format": "pixels"},
+}
+def _load_ignore_list(ignore_file: Optional[str]) -> set[str]:
+    if ignore_file is None:
+        return set()
+    with open(ignore_file, "r", encoding="utf-8") as handle:
+        return {line.strip() for line in handle if line.strip()}
+def _load_coco_boxes(
+    coco_json_path: str, target_size: tuple[int, int], ignore_list: set[str], min_size: float, ignore_crowd: bool
+) -> tuple[torch.Tensor, dict[str, int]]:
+    coco_path = Path(coco_json_path)
+    if coco_path.exists() is False:
+        raise ValueError(f"COCO json not found at {coco_path}")
+    with open(coco_path, "r", encoding="utf-8") as handle:
+        data = json.load(handle)
+    images = {}
+    for image in data.get("images", []):
+        image_id = image.get("id")
+        if image_id is None:
+            continue
+        images[image_id] = (image.get("width"), image.get("height"), image.get("file_name", ""))
+    stats = {
+        "total_annotations": 0,
+        "used_annotations": 0,
+        "crowd_annotations": 0,
+        "invalid_bbox": 0,
+        "ignored_images": 0,
+        "missing_images": 0,
+        "missing_size": 0,
+        "too_small": 0,
+    }
+    boxes: list[tuple[float, float]] = []
+    target_h = float(target_size[0])
+    target_w = float(target_size[1])
+    for annotation in data.get("annotations", []):
+        stats["total_annotations"] += 1
+        if ignore_crowd is True and annotation.get("iscrowd", 0) == 1:
+            stats["crowd_annotations"] += 1
+            continue
+        bbox = annotation.get("bbox")
+        if bbox is None or len(bbox) != 4:
+            stats["invalid_bbox"] += 1
+            continue
+        image_id = annotation.get("image_id")
+        if image_id not in images:
+            stats["missing_images"] += 1
+            continue
+        (img_w, img_h, file_name) = images[image_id]
+        if file_name in ignore_list:
+            stats["ignored_images"] += 1
+            continue
+        if img_w in {None, 0} or img_h in {None, 0}:
+            stats["missing_size"] += 1
+            continue
+        bbox_w = float(bbox[2])
+        bbox_h = float(bbox[3])
+        if bbox_w <= 0.0 or bbox_h <= 0.0:
+            stats["invalid_bbox"] += 1
+            continue
+        scaled_w = bbox_w / float(img_w) * target_w
+        scaled_h = bbox_h / float(img_h) * target_h
+        if scaled_w < min_size or scaled_h < min_size:
+            stats["too_small"] += 1
+            continue
+        boxes.append((scaled_w, scaled_h))
+    stats["used_annotations"] = len(boxes)
+    if len(boxes) == 0:
+        raise ValueError("No valid bounding boxes found for anchor fitting")
+    return (torch.tensor(boxes, dtype=torch.float32), stats)
+def _wh_iou(boxes: torch.Tensor, anchors: torch.Tensor) -> torch.Tensor:
+    boxes = boxes[:, None, :]
+    anchors = anchors[None, :, :]
+    inter = torch.min(boxes, anchors).prod(dim=2)
+    union = boxes.prod(dim=2) + anchors.prod(dim=2) - inter
+    return inter / (union + 1e-9)
+def _kmeans_plusplus_init(boxes: torch.Tensor, num_anchors: int, generator: torch.Generator) -> torch.Tensor:
+    n_local_trials = 2 + int(math.log(num_anchors))
+    anchors = []
+    first_idx = torch.randint(0, boxes.size(0), (1,), generator=generator).item()
+    anchors.append(boxes[first_idx])
+    for _ in range(num_anchors - 1):
+        anchors_tensor = torch.stack(anchors)
+        ious = _wh_iou(boxes, anchors_tensor)
+        max_ious = ious.max(dim=1).values
+        min_distances = 1.0 - max_ious
+        squared_distances = min_distances**2
+        probs = squared_distances / (squared_distances.sum() + 1e-9)
+        cumulative_probs = torch.cumsum(probs, dim=0)
+        r = torch.rand(n_local_trials, generator=generator)
+        candidate_indices = torch.searchsorted(cumulative_probs, r, right=True)
+        candidate_indices = torch.clamp(candidate_indices, 0, boxes.size(0) - 1)
+        candidate_boxes = boxes[candidate_indices]
+        candidate_ious = _wh_iou(boxes, candidate_boxes)  # (n_boxes, n_trials)
+        candidate_distances = 1.0 - candidate_ious
+        min_distances_expanded = min_distances.unsqueeze(1)
+        candidate_potentials = torch.min(min_distances_expanded, candidate_distances).sum(dim=0)
+        best_trial_idx = torch.argmin(candidate_potentials).item()
+        best_idx = candidate_indices[best_trial_idx].item()
+        anchors.append(boxes[best_idx])
+    return torch.stack(anchors)
+def _kmeans_anchors(
+    boxes: torch.Tensor, num_anchors: int, seed: Optional[int], max_iter: int
+) -> tuple[torch.Tensor, torch.Tensor]:
+    if boxes.size(0) < num_anchors:
+        raise ValueError(
+            f"Not enough boxes ({boxes.size(0)}) to fit {num_anchors} anchors, Reduce --num-anchors or add more data"
+        )
+    generator = torch.Generator()
+    if seed is not None:
+        generator.manual_seed(seed)
+    anchors = _kmeans_plusplus_init(boxes, num_anchors, generator)
+    assignments = torch.full((boxes.size(0),), -1, dtype=torch.int64)
+    for _ in range(max_iter):
+        ious = _wh_iou(boxes, anchors)
+        new_assignments = torch.argmax(ious, dim=1)
+        if torch.equal(assignments, new_assignments):
+            break
+        assignments = new_assignments
+        for idx in range(num_anchors):
+            mask = assignments == idx
+            if mask.any():
+                anchors[idx] = boxes[mask].median(dim=0).values
+            else:
+                rand_idx = torch.randint(0, boxes.size(0), (1,), generator=generator).item()
+                anchors[idx] = boxes[rand_idx]
+    return (anchors, assignments)
+def _format_anchor_groups(anchor_groups: list[torch.Tensor], precision: int) -> list[list[tuple[float, float]]]:
+    formatted: list[list[tuple[float, float]]] = []
+    for group in anchor_groups:
+        formatted.append([(round(float(anchor[0]), precision), round(float(anchor[1]), precision)) for anchor in group])
+    return formatted
+def _validate_args(
+    args: argparse.Namespace,
+) -> tuple[tuple[int, int], int, int, Literal["pixels", "grid"], list[float]]:
+    preset = MODEL_PRESETS.get(args.preset) if args.preset is not None else None
+    size = cli.parse_size(args.size) if args.size is not None else (preset["default_size"] if preset else None)
+    if size is None:
+        raise cli.ValidationError("Missing --size. Provide --size or use a --preset")
+    num_scales = args.num_scales if args.num_scales is not None else (preset["num_scales"] if preset else None)
+    num_anchors = args.num_anchors if args.num_anchors is not None else (preset["num_anchors"] if preset else None)
+    output_format = args.format if args.format is not None else (preset["format"] if preset else None)
+    if num_scales is None or num_anchors is None or output_format is None:
+        raise cli.ValidationError(
+            "Missing configuration. Provide --num-scales, --num-anchors, and --format or use a --preset"
+        )
+    if num_scales < 1:
+        raise cli.ValidationError("--num-scales must be >= 1")
+    if num_anchors < 1:
+        raise cli.ValidationError("--num-anchors must be >= 1")
+    if num_anchors % num_scales != 0:
+        raise cli.ValidationError("--num-anchors must be divisible by --num-scales")
+    strides: list[float] = []
+    if output_format == "grid":
+        if args.stride is None:
+            raise cli.ValidationError("--format grid requires --stride values per scale")
+        strides = [float(value) for value in args.stride]
+        if len(strides) != num_scales:
+            raise cli.ValidationError("--stride must provide one value per scale when --format grid is used")
+        if any(value <= 0 for value in strides):
+            raise cli.ValidationError("--stride values must be > 0")
+    return (size, num_scales, num_anchors, output_format, strides)
+def auto_anchors(args: argparse.Namespace) -> None:
+    (size, num_scales, num_anchors, output_format, strides) = _validate_args(args)
+    ignore_list = _load_ignore_list(args.ignore_file)
+    (boxes, stats) = _load_coco_boxes(
+        args.coco_json_path, size, ignore_list, args.min_size, ignore_crowd=not args.include_crowd
+    )
+    if args.preset is not None:
+        logger.info(f"Using preset {args.preset}")
+    logger.info(f"Fitting anchors using size={size[0]}x{size[1]}")
+    logger.info(
+        f"Annotations: total={stats['total_annotations']}, used={stats['used_annotations']}, "
+        f"crowd={stats['crowd_annotations']}, invalid={stats['invalid_bbox']}, "
+        f"ignored={stats['ignored_images']}, missing={stats['missing_images']}, "
+        f"missing_size={stats['missing_size']}, too_small={stats['too_small']}"
+    )
+    (anchors, _assignments) = _kmeans_anchors(boxes, num_anchors, args.seed, args.max_iter)
+    areas = anchors.prod(dim=1)
+    anchors = anchors[torch.argsort(areas)]
+    anchors_per_scale = num_anchors // num_scales
+    anchor_groups = [anchors[i : i + anchors_per_scale] for i in range(0, num_anchors, anchors_per_scale)]
+    ious = _wh_iou(boxes, anchors)
+    best_iou = ious.max(dim=1).values
+    logger.info(f"Mean IoU: {best_iou.mean().item():.4f}")
+    formatted_groups = _format_anchor_groups(anchor_groups, args.precision)
+    if output_format == "pixels":
+        if num_scales == 1:
+            formatted_anchors: Any = formatted_groups[0]
+        else:
+            formatted_anchors = formatted_groups
+        print("Anchors (pixels):")
+        print(pformat(formatted_anchors))
+    if output_format == "grid":
+        grid_groups: list[torch.Tensor] = []
+        for group, stride in zip(anchor_groups, strides):
+            grid_group = group.clone()
+            grid_group[:, 0] = grid_group[:, 0] / stride
+            grid_group[:, 1] = grid_group[:, 1] / stride
+            grid_groups.append(grid_group)
+        formatted_grid = _format_anchor_groups(grid_groups, args.precision)
+        if num_scales == 1:
+            formatted_grid_output: Any = formatted_grid[0]
+        else:
+            formatted_grid_output = formatted_grid
+        print("Anchors (grid units):")
+        print(pformat(formatted_grid_output))
+def set_parser(subparsers: Any) -> None:
+    subparser = subparsers.add_parser(
+        "auto-anchors",
+        allow_abbrev=False,
+        help="fit YOLO anchors with k-means on a COCO dataset",
+        description="fit YOLO anchors with k-means on a COCO dataset",
+        epilog=(
+            "Usage examples:\n"
+            "python -m birder.tools auto-anchors --preset yolo_v4 --size 640 "
+            "--coco-json-path data/detection_data/training_annotations_coco.json\n"
+            "python -m birder.tools auto-anchors --size 640 --num-anchors 9 --num-scales 3 --format pixels "
+            "--coco-json-path data/detection_data/training_annotations_coco.json\n"
+            "python -m birder.tools auto-anchors --preset yolo_v4_tiny --size 416 416 "
+            "--coco-json-path ~/Datasets/cocodataset/annotations/instances_train2017.json\n"
+            "python -m birder.tools auto-anchors --preset yolo_v2 --stride 32 "
+            "--coco-json-path data/detection_data/training_annotations_coco.json\n"
+            "python -m birder.tools auto-anchors --size 640 --num-anchors 9 --num-scales 3 "
+            "--format grid --stride 8 16 32 --coco-json-path data/detection_data/training_annotations_coco.json\n"
+        ),
+        formatter_class=cli.ArgumentHelpFormatter,
+    )
+    subparser.add_argument(
+        "--preset", type=str, choices=sorted(MODEL_PRESETS.keys()), help="YOLO preset for anchor formatting"
+    )
+    subparser.add_argument(
+        "--size",
+        type=int,
+        nargs="+",
+        metavar=("H", "W"),
+        help="target image size as [height, width], required without --preset",
+    )
+    subparser.add_argument("--num-anchors", type=int, help="number of anchors to fit, required without --preset")
+    subparser.add_argument("--num-scales", type=int, help="number of output scales, required without --preset")
+    subparser.add_argument(
+        "--format", type=str, choices=["pixels", "grid"], help="anchor output format, required without --preset"
+    )
+    subparser.add_argument(
+        "--stride", type=int, nargs="+", default=[32], help="strides per scale used to convert anchors to grid units"
+    )
+    subparser.add_argument(
+        "--min-size", type=float, default=1.0, help="minimum scaled box size to include in anchor fitting"
+    )
+    subparser.add_argument("--include-crowd", default=False, action="store_true", help="include crowd annotations")
+    subparser.add_argument("--seed", type=int, help="random seed for k-means initialization")
+    subparser.add_argument("--max-iter", type=int, default=1000, help="maximum k-means iterations")
+    subparser.add_argument("--precision", type=int, default=1, help="number of decimals to keep in anchor output")
+    subparser.add_argument(
+        "--ignore-file", type=str, metavar="FILE", help="file containing image names to skip (one per line)"
+    )
+    subparser.add_argument(
+        "--coco-json-path",
+        type=str,
+        default=f"{settings.TRAINING_DETECTION_ANNOTATIONS_PATH}_coco.json",
+        help="training COCO json path",
+    )
+    subparser.set_defaults(func=main)
+def main(args: argparse.Namespace) -> None:
+    auto_anchors(args)

birder/tools/ensemble_model.py CHANGED Viewed

@@ -37,7 +37,7 @@ def set_parser(subparsers: Any) -> None:
             "python -m birder.tools ensemble-model --networks convnext_v2_4_0 focalnet_3_0 "
             "swin_transformer_v2_1_0 --pts\n"
             "python -m birder.tools ensemble-model --networks mobilevit_v2_1_5_intermediate_80 "
-            "edgevit_2_intermediate_100 --pt2"
+            "edgevit_2_intermediate_100 --pt2\n"
         ),
         formatter_class=cli.ArgumentHelpFormatter,
     )

birder/tools/introspection.py CHANGED Viewed

@@ -9,9 +9,10 @@ from birder.common import cli
 from birder.common import fs_ops
 from birder.common import lib
 from birder.data.transforms.classification import inference_preset
-from birder.introspection import AttentionRolloutInterpreter
-from birder.introspection import GradCamInterpreter
-from birder.introspection import GuidedBackpropInterpreter
+from birder.introspection import AttentionRollout
+from birder.introspection import GradCAM
+from birder.introspection import GuidedBackprop
+from birder.introspection import TransformerAttribution
 from birder.net.base import BaseNet
 logger = logging.getLogger(__name__)
@@ -21,19 +22,18 @@ def _nhwc_reshape_transform(tensor: torch.Tensor) -> torch.Tensor:
     return tensor.permute(0, 3, 1, 2).contiguous()
-def show_attn_rollout(
+def _show_attn_rollout(
     args: argparse.Namespace,
     net: BaseNet,
-    _class_to_idx: dict[str, int],
     transform: Callable[..., torch.Tensor],
     device: torch.device,
 ) -> None:
-    ar = AttentionRolloutInterpreter(net, device, transform, args.attn_layer_name, args.discard_ratio, args.head_fusion)
-    result = ar.interpret(args.image_path)
+    ar = AttentionRollout(net, device, transform, args.attn_layer_name, args.discard_ratio, args.head_fusion)
+    result = ar(args.image_path)
     result.show()
-def show_guided_backprop(
+def _show_transformer_attribution(
     args: argparse.Namespace,
     net: BaseNet,
     class_to_idx: dict[str, int],
@@ -45,12 +45,29 @@ def show_guided_backprop(
     else:
         target = None
-    guided_bp = GuidedBackpropInterpreter(net, device, transform)
-    result = guided_bp.interpret(args.image_path, target_class=target)
+    ta = TransformerAttribution(net, device, transform, args.attn_layer_name)
+    result = ta(args.image_path, target_class=target)
     result.show()
-def show_grad_cam(
+def _show_guided_backprop(
+    args: argparse.Namespace,
+    net: BaseNet,
+    class_to_idx: dict[str, int],
+    transform: Callable[..., torch.Tensor],
+    device: torch.device,
+) -> None:
+    if args.target is not None:
+        target = class_to_idx[args.target]
+    else:
+        target = None
+    guided_bp = GuidedBackprop(net, device, transform)
+    result = guided_bp(args.image_path, target_class=target)
+    result.show()
+def _show_grad_cam(
     args: argparse.Namespace,
     net: BaseNet,
     class_to_idx: dict[str, int],
@@ -70,8 +87,8 @@ def show_grad_cam(
     else:
         target = None
-    grad_cam = GradCamInterpreter(net, device, transform, target_layer, reshape_transform=reshape_transform)
-    result = grad_cam.interpret(args.image_path, target_class=target)
+    grad_cam = GradCAM(net, device, transform, target_layer, reshape_transform=reshape_transform)
+    result = grad_cam(args.image_path, target_class=target)
     result.show()
@@ -83,25 +100,22 @@ def set_parser(subparsers: Any) -> None:
         description="computer vision introspection and explainability",
         epilog=(
             "Usage examples:\n"
-            "python -m birder.tools introspection --method gradcam --network efficientnet_v2_m "
-            "--epoch 200 'data/training/European goldfinch/000300.jpeg'\n"
-            "python -m birder.tools introspection --method gradcam -n resnest_50 --epoch 300 "
+            "python -m birder.tools introspection --network efficientnet_v2_m -e 200 --method gradcam "
+            "'data/training/European goldfinch/000300.jpeg'\n"
+            "python -m birder.tools introspection -n resnest_50 --epoch 300 --method gradcam "
             "data/index5.jpeg --target 'Grey heron'\n"
-            "python -m birder.tools introspection --method guided-backprop -n efficientnet_v2_s "
-            "-e 0 'data/training/European goldfinch/000300.jpeg'\n"
-            "python -m birder.tools introspection --method gradcam -n swin_transformer_v1_b -e 85 --layer-num -4 "
+            "python -m birder.tools introspection -n efficientnet_v2_s --method guided-backprop "
+            "'data/training/European goldfinch/000300.jpeg'\n"
+            "python -m birder.tools introspection -n swin_transformer_v1_b -e 85 --layer-num -4 --method gradcam "
             "--channels-last data/training/Fieldfare/000002.jpeg\n"
-            "python -m birder.tools introspection --method attn-rollout -n vit_reg4_b16 -t mim -e 100 "
+            "python -m birder.tools introspection -n vit_reg4_b16 -t mim -e 100 --method attn-rollout "
             " data/validation/Bluethroat/000013.jpeg\n"
+            "python -m birder.tools introspection -n deit3_t16 -t il-common --method transformer-attribution "
+            "--target 'Black-crowned night heron' data/detection_data/training/0002/000544.jpeg\n"
         ),
         formatter_class=cli.ArgumentHelpFormatter,
     )
-    subparser.add_argument(
-        "--method", type=str, choices=["gradcam", "guided-backprop", "attn-rollout"], help="introspection method"
-    )
-    subparser.add_argument(
-        "-n", "--network", type=str, required=True, help="the neural network to use (i.e. resnet_v2)"
-    )
+    subparser.add_argument("-n", "--network", type=str, required=True, help="the neural network to use")
     subparser.add_argument("-e", "--epoch", type=int, metavar="N", help="model checkpoint to load")
     subparser.add_argument("-t", "--tag", type=str, help="model tag (from the training phase)")
     subparser.add_argument(
@@ -109,11 +123,19 @@ def set_parser(subparsers: Any) -> None:
     )
     subparser.add_argument("--gpu", default=False, action="store_true", help="use gpu")
     subparser.add_argument("--gpu-id", type=int, metavar="ID", help="gpu id to use")
+    subparser.add_argument(
+        "--method",
+        type=str,
+        choices=["gradcam", "guided-backprop", "attn-rollout", "transformer-attribution"],
+        help="introspection method",
+    )
     subparser.add_argument(
         "--size", type=int, nargs="+", metavar=("H", "W"), help="image size for inference (defaults to model signature)"
     )
     subparser.add_argument(
-        "--target", type=str, help="target class, leave empty to use predicted class (gradcam and guided-backprop only)"
+        "--target",
+        type=str,
+        help="target class, leave empty to use predicted class (gradcam, guided-backprop, and transformer-attribution)",
     )
     subparser.add_argument("--block-name", type=str, default="body", help="target block (gradcam only)")
     subparser.add_argument(
@@ -123,7 +145,10 @@ def set_parser(subparsers: Any) -> None:
         "--channels-last", default=False, action="store_true", help="channels last model, like swin (gradcam only)"
     )
     subparser.add_argument(
-        "--attn-layer-name", type=str, default="self_attention", help="attention layer name (attn-rollout only)"
+        "--attn-layer-name",
+        type=str,
+        default="self_attention",
+        help="attention layer name (attn-rollout and transformer-attribution)",
     )
     subparser.add_argument(
         "--head-fusion",
@@ -169,8 +194,10 @@ def main(args: argparse.Namespace) -> None:
     transform = inference_preset(args.size, model_info.rgb_stats, 1.0)
     if args.method == "gradcam":
-        show_grad_cam(args, net, model_info.class_to_idx, transform, device)
+        _show_grad_cam(args, net, model_info.class_to_idx, transform, device)
     elif args.method == "guided-backprop":
-        show_guided_backprop(args, net, model_info.class_to_idx, transform, device)
+        _show_guided_backprop(args, net, model_info.class_to_idx, transform, device)
     elif args.method == "attn-rollout":
-        show_attn_rollout(args, net, model_info.class_to_idx, transform, device)
+        _show_attn_rollout(args, net, transform, device)
+    elif args.method == "transformer-attribution":
+        _show_transformer_attribution(args, net, model_info.class_to_idx, transform, device)

birder/version.py CHANGED Viewed

	@@ -1 +1 @@
1	- __version__ = "v0.2.1"
1	+ __version__ = "v0.2.2"

{birder-0.2.1.dist-info → birder-0.2.2.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: birder
-Version: 0.2.1
+Version: 0.2.2
 Summary: An open-source computer vision framework for wildlife image analysis, featuring state-of-the-art models for species classification and detection.
 Author: Ofer Hasson
 License-Expression: Apache-2.0
@@ -62,6 +62,7 @@ Requires-Dist: MonkeyType~=23.3.0; extra == "dev"
 Requires-Dist: mypy~=1.19.1; extra == "dev"
 Requires-Dist: parameterized~=0.9.0; extra == "dev"
 Requires-Dist: pylint~=4.0.4; extra == "dev"
+Requires-Dist: pytest; extra == "dev"
 Requires-Dist: requests~=2.32.5; extra == "dev"
 Requires-Dist: safetensors~=0.7.0; extra == "dev"
 Requires-Dist: setuptools; extra == "dev"

birder 0.2.1__py3-none-any.whl → 0.2.2__py3-none-any.whl

birder 0.2.1py3-none-any.whl → 0.2.2py3-none-any.whl