PyPI - birder - Versions diffs - 0.4.1__py3-none-any.whl → 0.4.4__py3-none-any.whl - Mend

birder 0.4.1py3-none-any.whl → 0.4.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (100) hide show

birder/__init__.py +2 -0
birder/common/fs_ops.py +81 -1
birder/common/training_cli.py +12 -2
birder/common/training_utils.py +73 -12
birder/data/collators/detection.py +3 -1
birder/datahub/_lib.py +15 -6
birder/datahub/evaluation.py +591 -0
birder/eval/__init__.py +0 -0
birder/eval/__main__.py +74 -0
birder/eval/_embeddings.py +50 -0
birder/eval/adversarial.py +315 -0
birder/eval/benchmarks/__init__.py +0 -0
birder/eval/benchmarks/awa2.py +357 -0
birder/eval/benchmarks/bioscan5m.py +198 -0
birder/eval/benchmarks/fishnet.py +318 -0
birder/eval/benchmarks/flowers102.py +210 -0
birder/eval/benchmarks/fungiclef.py +261 -0
birder/eval/benchmarks/nabirds.py +202 -0
birder/eval/benchmarks/newt.py +262 -0
birder/eval/benchmarks/plankton.py +255 -0
birder/eval/benchmarks/plantdoc.py +259 -0
birder/eval/benchmarks/plantnet.py +252 -0
birder/eval/classification.py +235 -0
birder/eval/methods/__init__.py +0 -0
birder/eval/methods/ami.py +78 -0
birder/eval/methods/knn.py +71 -0
birder/eval/methods/linear.py +152 -0
birder/eval/methods/mlp.py +178 -0
birder/eval/methods/simpleshot.py +100 -0
birder/eval/methods/svm.py +92 -0
birder/inference/classification.py +23 -2
birder/inference/detection.py +35 -15
birder/net/_vit_configs.py +5 -0
birder/net/cait.py +3 -3
birder/net/coat.py +3 -3
birder/net/cswin_transformer.py +2 -1
birder/net/deit.py +1 -1
birder/net/deit3.py +1 -1
birder/net/detection/__init__.py +2 -0
birder/net/detection/base.py +41 -18
birder/net/detection/deformable_detr.py +74 -50
birder/net/detection/detr.py +29 -26
birder/net/detection/efficientdet.py +42 -25
birder/net/detection/faster_rcnn.py +53 -21
birder/net/detection/fcos.py +42 -23
birder/net/detection/lw_detr.py +1204 -0
birder/net/detection/plain_detr.py +60 -47
birder/net/detection/retinanet.py +47 -35
birder/net/detection/rt_detr_v1.py +49 -46
birder/net/detection/rt_detr_v2.py +95 -102
birder/net/detection/ssd.py +47 -31
birder/net/detection/ssdlite.py +2 -2
birder/net/detection/yolo_v2.py +33 -18
birder/net/detection/yolo_v3.py +35 -33
birder/net/detection/yolo_v4.py +35 -20
birder/net/detection/yolo_v4_tiny.py +1 -2
birder/net/edgevit.py +3 -3
birder/net/efficientvit_msft.py +1 -1
birder/net/flexivit.py +1 -1
birder/net/hiera.py +44 -67
birder/net/hieradet.py +2 -2
birder/net/maxvit.py +2 -2
birder/net/mim/fcmae.py +2 -2
birder/net/mim/mae_hiera.py +9 -16
birder/net/mnasnet.py +2 -2
birder/net/nextvit.py +4 -4
birder/net/resnext.py +2 -2
birder/net/rope_deit3.py +2 -2
birder/net/rope_flexivit.py +2 -2
birder/net/rope_vit.py +2 -2
birder/net/simple_vit.py +1 -1
birder/net/squeezenet.py +1 -1
birder/net/ssl/capi.py +32 -25
birder/net/ssl/dino_v2.py +12 -15
birder/net/ssl/franca.py +26 -19
birder/net/van.py +2 -2
birder/net/vit.py +21 -3
birder/net/vit_parallel.py +1 -1
birder/net/vit_sam.py +62 -16
birder/net/xcit.py +1 -1
birder/ops/msda.py +46 -16
birder/scripts/benchmark.py +35 -8
birder/scripts/predict.py +14 -1
birder/scripts/predict_detection.py +7 -1
birder/scripts/train.py +27 -11
birder/scripts/train_capi.py +13 -10
birder/scripts/train_detection.py +18 -7
birder/scripts/train_franca.py +10 -2
birder/scripts/train_kd.py +28 -11
birder/tools/adversarial.py +5 -0
birder/tools/convert_model.py +101 -43
birder/tools/quantize_model.py +33 -16
birder/version.py +1 -1
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/METADATA +17 -10
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/RECORD +99 -75
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/WHEEL +1 -1
birder/scripts/evaluate.py +0 -176
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/entry_points.txt +0 -0
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/licenses/LICENSE +0 -0
{birder-0.4.1.dist-info → birder-0.4.4.dist-info}/top_level.txt +0 -0

birder/eval/_embeddings.py ADDED Viewed

@@ -0,0 +1,50 @@
+import logging
+from pathlib import Path
+import numpy as np
+import numpy.typing as npt
+import polars as pl
+logger = logging.getLogger(__name__)
+def l2_normalize(x: npt.NDArray[np.float32], eps: float = 1e-12) -> npt.NDArray[np.float32]:
+    norms = np.linalg.norm(x, axis=1, keepdims=True)
+    return x / np.clip(norms, eps, None)  # type: ignore[no-any-return]
+def load_embeddings(path: Path | str) -> tuple[list[str], npt.NDArray[np.float32]]:
+    """
+    Load embeddings from parquet file
+    Auto-detects format:
+    - If 'embedding' column exists: use directly
+    - If numeric column names (0, 1, 2, ...): treat as logits, convert to array
+    Returns
+    -------
+    sample_ids
+        List of sample identifiers (stem of 'sample' column path).
+    features
+        Array of shape (n_samples, embedding_dim), dtype float32.
+    """
+    if isinstance(path, str):
+        path = Path(path)
+    df = pl.read_parquet(path)
+    df = df.with_columns(pl.col("sample").map_elements(lambda p: Path(p).stem, return_dtype=pl.Utf8).alias("id"))
+    if "embedding" in df.columns:
+        df = df.select(["id", "embedding"])
+    else:
+        # Logits format - numeric column names
+        embed_cols = sorted([c for c in df.columns if c.isdigit()], key=int)
+        df = df.with_columns(
+            pl.concat_list(pl.col(embed_cols)).cast(pl.Array(pl.Float32, len(embed_cols))).alias("embedding")
+        ).select(["id", "embedding"])
+    sample_ids = df.get_column("id").to_list()
+    features = df.get_column("embedding").to_numpy().astype(np.float32, copy=False)
+    return (sample_ids, features)

birder/eval/adversarial.py ADDED Viewed

@@ -0,0 +1,315 @@
+import argparse
+import json
+import logging
+from typing import Any
+import torch
+from torch.utils.data import DataLoader
+from tqdm import tqdm
+from birder.adversarial.deepfool import DeepFool
+from birder.adversarial.fgsm import FGSM
+from birder.adversarial.pgd import PGD
+from birder.adversarial.simba import SimBA
+from birder.common import cli
+from birder.common import fs_ops
+from birder.common import lib
+from birder.conf import settings
+from birder.data.dataloader.webdataset import make_wds_loader
+from birder.data.datasets.directory import make_image_dataset
+from birder.data.datasets.webdataset import make_wds_dataset
+from birder.data.datasets.webdataset import prepare_wds_args
+from birder.data.datasets.webdataset import wds_args_from_info
+from birder.data.transforms.classification import RGBType
+from birder.data.transforms.classification import inference_preset
+logger = logging.getLogger(__name__)
+def _build_attack(
+    method: str,
+    net: torch.nn.Module,
+    rgb_stats: RGBType,
+    eps: float,
+    steps: int,
+    step_size: float | None,
+    deepfool_num_classes: int,
+) -> FGSM | PGD | DeepFool | SimBA:
+    if method == "fgsm":
+        return FGSM(net, eps=eps, rgb_stats=rgb_stats)
+    if method == "pgd":
+        return PGD(
+            net,
+            eps=eps,
+            steps=steps,
+            step_size=step_size,
+            random_start=False,
+            rgb_stats=rgb_stats,
+        )
+    if method == "deepfool":
+        return DeepFool(net, num_classes=deepfool_num_classes, overshoot=0.02, max_iter=steps, rgb_stats=rgb_stats)
+    if method == "simba":
+        return SimBA(
+            net,
+            step_size=step_size if step_size is not None else eps,
+            max_iter=steps,
+            rgb_stats=rgb_stats,
+        )
+    raise ValueError(f"Unsupported attack method '{method}'")
+# pylint: disable=too-many-locals,too-many-branches
+def evaluate_robust(args: argparse.Namespace) -> None:
+    if args.gpu is True:
+        device = torch.device("cuda")
+    elif args.mps is True:
+        device = torch.device("mps")
+    else:
+        device = torch.device("cpu")
+    if args.gpu_id is not None:
+        torch.cuda.set_device(args.gpu_id)
+    logger.info(f"Using device {device}")
+    if args.fast_matmul is True or args.amp is True:
+        torch.set_float32_matmul_precision("high")
+    if args.amp_dtype is None:
+        amp_dtype = torch.get_autocast_dtype(device.type)
+        logger.debug(f"AMP: {args.amp}, AMP dtype: {amp_dtype}")
+    else:
+        amp_dtype = getattr(torch, args.amp_dtype)
+    network_name = lib.get_network_name(args.network, tag=args.tag)
+    net, model_info = fs_ops.load_model(
+        device,
+        args.network,
+        tag=args.tag,
+        epoch=args.epoch,
+        new_size=args.size,
+        inference=True,
+        reparameterized=args.reparameterized,
+    )
+    class_to_idx = model_info.class_to_idx
+    rgb_stats = model_info.rgb_stats
+    if args.size is None:
+        size = lib.get_size_from_signature(model_info.signature)
+    else:
+        size = args.size
+    transform = inference_preset(size, rgb_stats, args.center_crop, args.simple_crop)
+    if args.wds is True:
+        wds_path: str | list[str]
+        if args.wds_info is not None:
+            wds_path, dataset_size = wds_args_from_info(args.wds_info, args.wds_split)
+            if args.wds_size is not None:
+                dataset_size = args.wds_size
+        else:
+            wds_path, dataset_size = prepare_wds_args(args.data_path[0], args.wds_size, device)
+        num_samples = dataset_size
+        dataset = make_wds_dataset(
+            wds_path,
+            dataset_size=dataset_size,
+            shuffle=False,
+            samples_names=True,
+            transform=transform,
+        )
+        dataloader = make_wds_loader(
+            dataset,
+            args.batch_size,
+            num_workers=args.num_workers,
+            prefetch_factor=None,
+            collate_fn=None,
+            world_size=1,
+            pin_memory=False,
+            exact=True,
+        )
+    else:
+        dataset = make_image_dataset(args.data_path, class_to_idx, transforms=transform)
+        num_samples = len(dataset)
+        dataloader = DataLoader(dataset, batch_size=args.batch_size, num_workers=args.num_workers)
+    attack = _build_attack(args.method, net, rgb_stats, args.eps, args.steps, args.step_size, args.deepfool_num_classes)
+    clean_correct = 0
+    adv_correct = 0
+    total = 0
+    skipped_unlabeled = 0
+    with tqdm(total=num_samples, unit="images", leave=False) as progress:
+        for _, inputs, targets in dataloader:
+            inputs = inputs.to(device)
+            targets = targets.to(device)
+            batch_size = inputs.size(0)
+            valid_mask = targets != settings.NO_LABEL
+            num_valid = int(valid_mask.sum().item())
+            skipped_unlabeled += batch_size - num_valid
+            if num_valid == 0:
+                progress.update(batch_size)
+                continue
+            inputs = inputs[valid_mask]
+            targets = targets[valid_mask]
+            with torch.no_grad():
+                with torch.amp.autocast(device.type, enabled=args.amp, dtype=amp_dtype):
+                    clean_logits = net(inputs)
+                clean_preds = clean_logits.argmax(dim=1)
+                clean_correct += (clean_preds == targets).sum().item()
+            result = attack(inputs, target=None)
+            adv_logits = result.adv_logits
+            adv_preds = adv_logits.argmax(dim=1)
+            adv_correct += (adv_preds == targets).sum().item()
+            total += num_valid
+            progress.update(batch_size)
+    if total == 0:
+        raise RuntimeError(f"No labeled samples found (all labels are {settings.NO_LABEL})")
+    if skipped_unlabeled > 0:
+        logger.warning(f"Skipped {skipped_unlabeled} unlabeled samples (label={settings.NO_LABEL})")
+    clean_accuracy = clean_correct / total
+    adv_accuracy = adv_correct / total
+    accuracy_drop = clean_accuracy - adv_accuracy
+    logger.info(
+        f"{network_name}: clean={clean_accuracy:.4f}, adv={adv_accuracy:.4f}, drop={accuracy_drop:.4f} "
+        f"(evaluated on {total} labeled samples)"
+    )
+    if args.dry_run is False:
+        output = {
+            "method": "robust",
+            "accuracy": adv_accuracy,
+            "clean_accuracy": clean_accuracy,
+            "accuracy_drop": accuracy_drop,
+            "attack_method": args.method,
+            "epsilon": args.eps,
+            "num_samples": total,
+            "num_skipped_unlabeled": skipped_unlabeled,
+        }
+        output_dir = settings.RESULTS_DIR.joinpath(args.dir)
+        output_dir.mkdir(parents=True, exist_ok=True)
+        epoch_str = f"_e{args.epoch}" if args.epoch is not None else ""
+        output_path = output_dir.joinpath(f"{network_name}{epoch_str}_{args.method}_eps{args.eps}.json")
+        with open(output_path, "w", encoding="utf-8") as f:
+            json.dump(output, f, indent=2)
+        logger.info(f"Results saved to {output_path}")
+def set_parser(subparsers: Any) -> None:
+    subparser = subparsers.add_parser(
+        "adversarial",
+        allow_abbrev=False,
+        help="evaluate adversarial robustness of a model on a dataset",
+        description="evaluate adversarial robustness of a model on a dataset",
+        epilog=(
+            "Usage examples:\n"
+            "python -m birder.eval adversarial -n resnet_v2_50 -e 100 --method pgd --eps 0.02 --gpu data/validation\n"
+            "python -m birder.eval adversarial -n vovnet_v2_39 -t il-common --method pgd --batch-size 4 "
+            "--gpu --gpu-id 1 --fast-matmul data/validation_il-common_packed\n"
+        ),
+        formatter_class=cli.ArgumentHelpFormatter,
+    )
+    subparser.add_argument("-n", "--network", type=str, help="neural network to evaluate")
+    subparser.add_argument("-t", "--tag", type=str, help="model tag")
+    subparser.add_argument("-e", "--epoch", type=int, metavar="N", help="model checkpoint epoch")
+    subparser.add_argument("--reparameterized", default=False, action="store_true", help="load reparameterized model")
+    subparser.add_argument(
+        "--method",
+        type=str,
+        choices=["fgsm", "pgd", "deepfool", "simba"],
+        help="adversarial attack method",
+    )
+    subparser.add_argument("--eps", type=float, default=0.007, help="perturbation budget in pixel space [0, 1]")
+    subparser.add_argument("--steps", type=int, default=10, help="number of iterations for iterative attacks")
+    subparser.add_argument("--step-size", type=float, help="step size in pixel space (defaults to eps/steps for PGD)")
+    subparser.add_argument(
+        "--deepfool-num-classes", type=int, default=10, help="number of top classes to consider for DeepFool"
+    )
+    subparser.add_argument(
+        "--size", type=int, nargs="+", metavar=("H", "W"), help="image size for inference (defaults to model signature)"
+    )
+    subparser.add_argument(
+        "--amp", default=False, action="store_true", help="use torch.amp.autocast for mixed precision inference"
+    )
+    subparser.add_argument(
+        "--amp-dtype",
+        type=str,
+        choices=["float16", "bfloat16"],
+        help="whether to use float16 or bfloat16 for mixed precision",
+    )
+    subparser.add_argument(
+        "--fast-matmul", default=False, action="store_true", help="use fast matrix multiplication (affects precision)"
+    )
+    subparser.add_argument("--batch-size", type=int, default=32, metavar="N", help="the batch size")
+    subparser.add_argument(
+        "-j", "--num-workers", type=int, default=8, metavar="N", help="number of preprocessing workers"
+    )
+    subparser.add_argument("--center-crop", type=float, default=1.0, help="center crop ratio to use during inference")
+    subparser.add_argument(
+        "--simple-crop",
+        default=False,
+        action="store_true",
+        help="use a simple crop that preserves aspect ratio but may trim parts of the image",
+    )
+    subparser.add_argument(
+        "--dir", type=str, default="robust", help="place all outputs in a sub-directory (relative to results)"
+    )
+    subparser.add_argument("--dry-run", default=False, action="store_true", help="skip saving results to file")
+    subparser.add_argument("--gpu", default=False, action="store_true", help="use gpu")
+    subparser.add_argument("--gpu-id", type=int, metavar="ID", help="gpu id to use")
+    subparser.add_argument(
+        "--mps", default=False, action="store_true", help="use mps (Metal Performance Shaders) device"
+    )
+    subparser.add_argument("--wds", default=False, action="store_true", help="evaluate a webdataset directory")
+    subparser.add_argument("--wds-size", type=int, metavar="N", help="size of the wds dataset")
+    subparser.add_argument("--wds-info", type=str, metavar="FILE", help="wds info file path")
+    subparser.add_argument(
+        "--wds-split", type=str, default="validation", metavar="NAME", help="wds dataset split to load"
+    )
+    subparser.add_argument("data_path", nargs="*", help="data files path (directories and files)")
+    subparser.set_defaults(func=main)
+def validate_args(args: argparse.Namespace) -> None:
+    args.size = cli.parse_size(args.size)
+    if args.network is None:
+        raise cli.ValidationError("--network is required")
+    if args.method is None:
+        raise cli.ValidationError("--method is required")
+    if args.center_crop > 1 or args.center_crop <= 0.0:
+        raise cli.ValidationError(f"--center-crop must be in range of (0, 1.0], got {args.center_crop}")
+    if args.wds is False and len(args.data_path) == 0:
+        raise cli.ValidationError("Must provide at least one data source, --data-path or --wds")
+    if args.wds is True:
+        if args.wds_info is None and len(args.data_path) == 0:
+            raise cli.ValidationError("--wds requires a data path unless --wds-info is provided")
+        if len(args.data_path) > 1:
+            raise cli.ValidationError(f"--wds can have at most 1 --data-path, got {len(args.data_path)}")
+        if args.wds_info is None and len(args.data_path) == 1:
+            data_path = args.data_path[0]
+            if "://" in data_path and args.wds_size is None:
+                raise cli.ValidationError("--wds-size is required for remote --data-path")
+def main(args: argparse.Namespace) -> None:
+    validate_args(args)
+    evaluate_robust(args)

birder/eval/benchmarks/__init__.py ADDED Viewed

File without changes

birder 0.4.1__py3-none-any.whl → 0.4.4__py3-none-any.whl

birder 0.4.1py3-none-any.whl → 0.4.4py3-none-any.whl