PyPI - erasus - Versions diffs - 0.1.0__tar.gz - Mend

erasus 0.1.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

erasus-0.1.0/PKG-INFO +547 -0
erasus-0.1.0/README.md +507 -0
erasus-0.1.0/erasus/__init__.py +30 -0
erasus-0.1.0/erasus/certification/__init__.py +8 -0
erasus-0.1.0/erasus/certification/bounds.py +197 -0
erasus-0.1.0/erasus/certification/certified_removal.py +129 -0
erasus-0.1.0/erasus/certification/verification.py +243 -0
erasus-0.1.0/erasus/cli/__init__.py +1 -0
erasus-0.1.0/erasus/cli/benchmark.py +133 -0
erasus-0.1.0/erasus/cli/evaluate.py +121 -0
erasus-0.1.0/erasus/cli/main.py +85 -0
erasus-0.1.0/erasus/cli/unlearn.py +208 -0
erasus-0.1.0/erasus/cli/visualize.py +148 -0
erasus-0.1.0/erasus/core/__init__.py +33 -0
erasus-0.1.0/erasus/core/base_metric.py +30 -0
erasus-0.1.0/erasus/core/base_selector.py +118 -0
erasus-0.1.0/erasus/core/base_strategy.py +59 -0
erasus-0.1.0/erasus/core/base_unlearner.py +180 -0
erasus-0.1.0/erasus/core/config.py +48 -0
erasus-0.1.0/erasus/core/exceptions.py +27 -0
erasus-0.1.0/erasus/core/registry.py +72 -0
erasus-0.1.0/erasus/core/types.py +18 -0
erasus-0.1.0/erasus/data/__init__.py +21 -0
erasus-0.1.0/erasus/data/augmentation.py +233 -0
erasus-0.1.0/erasus/data/datasets/__init__.py +21 -0
erasus-0.1.0/erasus/data/datasets/coco.py +114 -0
erasus-0.1.0/erasus/data/datasets/conceptual_captions.py +120 -0
erasus-0.1.0/erasus/data/datasets/i2p.py +91 -0
erasus-0.1.0/erasus/data/datasets/imagenet.py +163 -0
erasus-0.1.0/erasus/data/datasets/muse.py +160 -0
erasus-0.1.0/erasus/data/datasets/tofu.py +121 -0
erasus-0.1.0/erasus/data/datasets/wmdp.py +101 -0
erasus-0.1.0/erasus/data/datasets.py +60 -0
erasus-0.1.0/erasus/data/loaders.py +70 -0
erasus-0.1.0/erasus/data/multimodal.py +55 -0
erasus-0.1.0/erasus/data/partitioning.py +142 -0
erasus-0.1.0/erasus/data/preprocessing.py +131 -0
erasus-0.1.0/erasus/data/samplers.py +129 -0
erasus-0.1.0/erasus/data/splits.py +90 -0
erasus-0.1.0/erasus/data/synthetic/__init__.py +9 -0
erasus-0.1.0/erasus/data/synthetic/backdoor_generator.py +168 -0
erasus-0.1.0/erasus/data/synthetic/bias_generator.py +220 -0
erasus-0.1.0/erasus/data/synthetic/privacy_generator.py +284 -0
erasus-0.1.0/erasus/data/transforms.py +53 -0
erasus-0.1.0/erasus/experiments/__init__.py +9 -0
erasus-0.1.0/erasus/experiments/ablation_studies.py +135 -0
erasus-0.1.0/erasus/experiments/experiment_tracker.py +217 -0
erasus-0.1.0/erasus/experiments/hyperparameter_search.py +140 -0
erasus-0.1.0/erasus/integrations/__init__.py +8 -0
erasus-0.1.0/erasus/integrations/huggingface.py +382 -0
erasus-0.1.0/erasus/losses/__init__.py +7 -0
erasus-0.1.0/erasus/losses/adversarial_loss.py +72 -0
erasus-0.1.0/erasus/losses/contrastive.py +33 -0
erasus-0.1.0/erasus/losses/custom_losses.py +75 -0
erasus-0.1.0/erasus/losses/fisher_regularization.py +81 -0
erasus-0.1.0/erasus/losses/kl_divergence.py +20 -0
erasus-0.1.0/erasus/losses/l2_regularization.py +39 -0
erasus-0.1.0/erasus/losses/mmd.py +62 -0
erasus-0.1.0/erasus/losses/retain_anchor.py +33 -0
erasus-0.1.0/erasus/losses/triplet_loss.py +70 -0
erasus-0.1.0/erasus/metrics/__init__.py +92 -0
erasus-0.1.0/erasus/metrics/accuracy.py +54 -0
erasus-0.1.0/erasus/metrics/benchmarks.py +391 -0
erasus-0.1.0/erasus/metrics/efficiency/__init__.py +3 -0
erasus-0.1.0/erasus/metrics/efficiency/flops.py +62 -0
erasus-0.1.0/erasus/metrics/efficiency/memory_usage.py +97 -0
erasus-0.1.0/erasus/metrics/efficiency/speedup.py +126 -0
erasus-0.1.0/erasus/metrics/efficiency/time_complexity.py +120 -0
erasus-0.1.0/erasus/metrics/fid.py +139 -0
erasus-0.1.0/erasus/metrics/forgetting/__init__.py +3 -0
erasus-0.1.0/erasus/metrics/forgetting/activation_analysis.py +112 -0
erasus-0.1.0/erasus/metrics/forgetting/backdoor_activation.py +95 -0
erasus-0.1.0/erasus/metrics/forgetting/confidence.py +84 -0
erasus-0.1.0/erasus/metrics/forgetting/extraction_attack.py +142 -0
erasus-0.1.0/erasus/metrics/forgetting/feature_distance.py +134 -0
erasus-0.1.0/erasus/metrics/forgetting/mia.py +142 -0
erasus-0.1.0/erasus/metrics/forgetting/mia_variants.py +198 -0
erasus-0.1.0/erasus/metrics/membership_inference.py +100 -0
erasus-0.1.0/erasus/metrics/metric_suite.py +138 -0
erasus-0.1.0/erasus/metrics/perplexity.py +100 -0
erasus-0.1.0/erasus/metrics/privacy/__init__.py +3 -0
erasus-0.1.0/erasus/metrics/privacy/differential_privacy.py +187 -0
erasus-0.1.0/erasus/metrics/privacy/epsilon_delta.py +168 -0
erasus-0.1.0/erasus/metrics/privacy/privacy_audit.py +234 -0
erasus-0.1.0/erasus/metrics/retrieval.py +126 -0
erasus-0.1.0/erasus/metrics/retrieval_metrics.py +86 -0
erasus-0.1.0/erasus/metrics/utility/__init__.py +17 -0
erasus-0.1.0/erasus/metrics/utility/bleu.py +153 -0
erasus-0.1.0/erasus/metrics/utility/clip_score.py +109 -0
erasus-0.1.0/erasus/metrics/utility/downstream_tasks.py +98 -0
erasus-0.1.0/erasus/metrics/utility/inception_score.py +128 -0
erasus-0.1.0/erasus/metrics/utility/rouge.py +139 -0
erasus-0.1.0/erasus/models/__init__.py +5 -0
erasus-0.1.0/erasus/models/audio/__init__.py +9 -0
erasus-0.1.0/erasus/models/audio/clap.py +216 -0
erasus-0.1.0/erasus/models/audio/wav2vec.py +206 -0
erasus-0.1.0/erasus/models/audio/whisper.py +93 -0
erasus-0.1.0/erasus/models/diffusion/__init__.py +9 -0
erasus-0.1.0/erasus/models/diffusion/dalle.py +205 -0
erasus-0.1.0/erasus/models/diffusion/diffusion_utils.py +367 -0
erasus-0.1.0/erasus/models/diffusion/imagen.py +208 -0
erasus-0.1.0/erasus/models/diffusion/stable_diffusion.py +76 -0
erasus-0.1.0/erasus/models/llm/__init__.py +9 -0
erasus-0.1.0/erasus/models/llm/bert.py +87 -0
erasus-0.1.0/erasus/models/llm/gpt.py +54 -0
erasus-0.1.0/erasus/models/llm/llama.py +80 -0
erasus-0.1.0/erasus/models/llm/mistral.py +53 -0
erasus-0.1.0/erasus/models/llm/t5.py +248 -0
erasus-0.1.0/erasus/models/model_wrapper.py +117 -0
erasus-0.1.0/erasus/models/registry.py +8 -0
erasus-0.1.0/erasus/models/video/__init__.py +8 -0
erasus-0.1.0/erasus/models/video/video_clip.py +222 -0
erasus-0.1.0/erasus/models/video/videomae.py +90 -0
erasus-0.1.0/erasus/models/vlm/__init__.py +11 -0
erasus-0.1.0/erasus/models/vlm/blip.py +56 -0
erasus-0.1.0/erasus/models/vlm/clip.py +217 -0
erasus-0.1.0/erasus/models/vlm/flamingo.py +218 -0
erasus-0.1.0/erasus/models/vlm/llava.py +123 -0
erasus-0.1.0/erasus/models/vlm/vision_transformer.py +285 -0
erasus-0.1.0/erasus/privacy/__init__.py +16 -0
erasus-0.1.0/erasus/privacy/accountant.py +79 -0
erasus-0.1.0/erasus/privacy/certificates.py +52 -0
erasus-0.1.0/erasus/privacy/dp_mechanisms.py +29 -0
erasus-0.1.0/erasus/privacy/gradient_clipping.py +302 -0
erasus-0.1.0/erasus/privacy/influence_bounds.py +54 -0
erasus-0.1.0/erasus/privacy/secure_aggregation.py +329 -0
erasus-0.1.0/erasus/selectors/__init__.py +66 -0
erasus-0.1.0/erasus/selectors/auto_selector.py +56 -0
erasus-0.1.0/erasus/selectors/ensemble/__init__.py +6 -0
erasus-0.1.0/erasus/selectors/ensemble/voting.py +70 -0
erasus-0.1.0/erasus/selectors/ensemble/weighted_fusion.py +121 -0
erasus-0.1.0/erasus/selectors/full_selector.py +21 -0
erasus-0.1.0/erasus/selectors/geometry_based/__init__.py +1 -0
erasus-0.1.0/erasus/selectors/geometry_based/craig.py +15 -0
erasus-0.1.0/erasus/selectors/geometry_based/glister.py +75 -0
erasus-0.1.0/erasus/selectors/geometry_based/herding.py +84 -0
erasus-0.1.0/erasus/selectors/geometry_based/k_center.py +15 -0
erasus-0.1.0/erasus/selectors/geometry_based/kcenter.py +42 -0
erasus-0.1.0/erasus/selectors/geometry_based/kmeans_coreset.py +68 -0
erasus-0.1.0/erasus/selectors/geometry_based/submodular.py +92 -0
erasus-0.1.0/erasus/selectors/gradient_based/__init__.py +1 -0
erasus-0.1.0/erasus/selectors/gradient_based/el2n.py +77 -0
erasus-0.1.0/erasus/selectors/gradient_based/forgetting_score.py +21 -0
erasus-0.1.0/erasus/selectors/gradient_based/grad_match.py +99 -0
erasus-0.1.0/erasus/selectors/gradient_based/gradient_norm.py +133 -0
erasus-0.1.0/erasus/selectors/gradient_based/influence.py +179 -0
erasus-0.1.0/erasus/selectors/gradient_based/representer.py +93 -0
erasus-0.1.0/erasus/selectors/gradient_based/tracin.py +155 -0
erasus-0.1.0/erasus/selectors/learning_based/__init__.py +1 -0
erasus-0.1.0/erasus/selectors/learning_based/active_learning.py +184 -0
erasus-0.1.0/erasus/selectors/learning_based/data_shapley.py +45 -0
erasus-0.1.0/erasus/selectors/learning_based/forgetting_events.py +52 -0
erasus-0.1.0/erasus/selectors/learning_based/loss_accum.py +67 -0
erasus-0.1.0/erasus/selectors/learning_based/valuation_network.py +71 -0
erasus-0.1.0/erasus/selectors/quality_metrics.py +240 -0
erasus-0.1.0/erasus/selectors/random_selector.py +38 -0
erasus-0.1.0/erasus/strategies/__init__.py +90 -0
erasus-0.1.0/erasus/strategies/data_methods/__init__.py +1 -0
erasus-0.1.0/erasus/strategies/data_methods/amnesiac.py +119 -0
erasus-0.1.0/erasus/strategies/data_methods/certified_removal.py +209 -0
erasus-0.1.0/erasus/strategies/data_methods/knowledge_distillation.py +150 -0
erasus-0.1.0/erasus/strategies/data_methods/sisa.py +66 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/__init__.py +1 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/concept_erasure.py +109 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/noise_injection.py +111 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/safe_latents.py +151 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/timestep_masking.py +144 -0
erasus-0.1.0/erasus/strategies/diffusion_specific/unet_surgery.py +100 -0
erasus-0.1.0/erasus/strategies/ensemble_strategy.py +127 -0
erasus-0.1.0/erasus/strategies/gradient_methods/__init__.py +6 -0
erasus-0.1.0/erasus/strategies/gradient_methods/fisher_forgetting.py +154 -0
erasus-0.1.0/erasus/strategies/gradient_methods/gradient_ascent.py +100 -0
erasus-0.1.0/erasus/strategies/gradient_methods/modality_decoupling.py +215 -0
erasus-0.1.0/erasus/strategies/gradient_methods/negative_gradient.py +76 -0
erasus-0.1.0/erasus/strategies/gradient_methods/saliency_unlearning.py +177 -0
erasus-0.1.0/erasus/strategies/gradient_methods/scrub.py +116 -0
erasus-0.1.0/erasus/strategies/llm_specific/__init__.py +8 -0
erasus-0.1.0/erasus/strategies/llm_specific/attention_surgery.py +139 -0
erasus-0.1.0/erasus/strategies/llm_specific/causal_tracing.py +97 -0
erasus-0.1.0/erasus/strategies/llm_specific/embedding_alignment.py +102 -0
erasus-0.1.0/erasus/strategies/llm_specific/ssd.py +110 -0
erasus-0.1.0/erasus/strategies/llm_specific/token_masking.py +80 -0
erasus-0.1.0/erasus/strategies/parameter_methods/__init__.py +1 -0
erasus-0.1.0/erasus/strategies/parameter_methods/layer_freezing.py +162 -0
erasus-0.1.0/erasus/strategies/parameter_methods/lora_unlearning.py +150 -0
erasus-0.1.0/erasus/strategies/parameter_methods/mask_based.py +156 -0
erasus-0.1.0/erasus/strategies/parameter_methods/neuron_pruning.py +129 -0
erasus-0.1.0/erasus/strategies/parameter_methods/sparse_aware.py +92 -0
erasus-0.1.0/erasus/strategies/vlm_specific/__init__.py +5 -0
erasus-0.1.0/erasus/strategies/vlm_specific/attention_unlearning.py +113 -0
erasus-0.1.0/erasus/strategies/vlm_specific/contrastive_unlearning.py +122 -0
erasus-0.1.0/erasus/strategies/vlm_specific/cross_modal_decoupling.py +5 -0
erasus-0.1.0/erasus/strategies/vlm_specific/vision_text_split.py +237 -0
erasus-0.1.0/erasus/unlearners/__init__.py +25 -0
erasus-0.1.0/erasus/unlearners/audio_unlearner.py +101 -0
erasus-0.1.0/erasus/unlearners/diffusion_unlearner.py +123 -0
erasus-0.1.0/erasus/unlearners/erasus_unlearner.py +83 -0
erasus-0.1.0/erasus/unlearners/federated_unlearner.py +253 -0
erasus-0.1.0/erasus/unlearners/llm_unlearner.py +128 -0
erasus-0.1.0/erasus/unlearners/multimodal_unlearner.py +118 -0
erasus-0.1.0/erasus/unlearners/video_unlearner.py +101 -0
erasus-0.1.0/erasus/unlearners/vlm_unlearner.py +138 -0
erasus-0.1.0/erasus/utils/__init__.py +64 -0
erasus-0.1.0/erasus/utils/callbacks.py +154 -0
erasus-0.1.0/erasus/utils/checkpointing.py +38 -0
erasus-0.1.0/erasus/utils/distributed.py +102 -0
erasus-0.1.0/erasus/utils/early_stopping.py +83 -0
erasus-0.1.0/erasus/utils/helpers.py +130 -0
erasus-0.1.0/erasus/utils/logging.py +36 -0
erasus-0.1.0/erasus/utils/profiling.py +347 -0
erasus-0.1.0/erasus/utils/reproducibility.py +317 -0
erasus-0.1.0/erasus/utils/seed.py +21 -0
erasus-0.1.0/erasus/version.py +4 -0
erasus-0.1.0/erasus/visualization/__init__.py +39 -0
erasus-0.1.0/erasus/visualization/activation.py +201 -0
erasus-0.1.0/erasus/visualization/attention.py +158 -0
erasus-0.1.0/erasus/visualization/comparisons.py +165 -0
erasus-0.1.0/erasus/visualization/cross_modal.py +327 -0
erasus-0.1.0/erasus/visualization/embeddings.py +184 -0
erasus-0.1.0/erasus/visualization/feature_plots.py +79 -0
erasus-0.1.0/erasus/visualization/gradients.py +108 -0
erasus-0.1.0/erasus/visualization/influence_maps.py +201 -0
erasus-0.1.0/erasus/visualization/interactive.py +88 -0
erasus-0.1.0/erasus/visualization/loss_curves.py +42 -0
erasus-0.1.0/erasus/visualization/mia_plots.py +92 -0
erasus-0.1.0/erasus/visualization/reports.py +110 -0
erasus-0.1.0/erasus/visualization/surfaces.py +202 -0
erasus-0.1.0/erasus.egg-info/PKG-INFO +547 -0
erasus-0.1.0/erasus.egg-info/SOURCES.txt +240 -0
erasus-0.1.0/erasus.egg-info/dependency_links.txt +1 -0
erasus-0.1.0/erasus.egg-info/entry_points.txt +2 -0
erasus-0.1.0/erasus.egg-info/requires.txt +28 -0
erasus-0.1.0/erasus.egg-info/top_level.txt +1 -0
erasus-0.1.0/pyproject.toml +70 -0
erasus-0.1.0/setup.cfg +4 -0
erasus-0.1.0/tests/test_advanced.py +40 -0
erasus-0.1.0/tests/test_components.py +56 -0
erasus-0.1.0/tests/test_core.py +124 -0
erasus-0.1.0/tests/test_end_to_end.py +222 -0
erasus-0.1.0/tests/test_imports.py +60 -0
erasus-0.1.0/tests/test_integration.py +231 -0
erasus-0.1.0/tests/test_selectors.py +45 -0

erasus-0.1.0/PKG-INFO ADDED Viewed

@@ -0,0 +1,547 @@
+Metadata-Version: 2.4
+Name: erasus
+Version: 0.1.0
+Summary: Efficient Representative And Surgical Unlearning Selection — Universal Machine Unlearning via Coreset Selection
+Author-email: Avaya Aggarwal <aggarwal.avaya27@gmail.com>
+License: MIT
+Keywords: machine-unlearning,coreset,foundation-models,privacy,pytorch
+Classifier: Development Status :: 3 - Alpha
+Classifier: Intended Audience :: Science/Research
+Classifier: License :: OSI Approved :: MIT License
+Classifier: Programming Language :: Python :: 3
+Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
+Requires-Python: >=3.9
+Description-Content-Type: text/markdown
+Requires-Dist: torch>=2.0
+Requires-Dist: numpy>=1.24
+Requires-Dist: Pillow>=9.0
+Requires-Dist: tqdm>=4.60
+Requires-Dist: pyyaml>=6.0
+Requires-Dist: transformers>=4.30
+Provides-Extra: full
+Requires-Dist: diffusers>=0.20; extra == "full"
+Requires-Dist: opacus>=1.3; extra == "full"
+Requires-Dist: datasets>=2.14; extra == "full"
+Requires-Dist: scikit-learn>=1.2; extra == "full"
+Requires-Dist: matplotlib>=3.7; extra == "full"
+Requires-Dist: seaborn>=0.12; extra == "full"
+Requires-Dist: wandb>=0.15; extra == "full"
+Requires-Dist: peft>=0.5; extra == "full"
+Requires-Dist: huggingface_hub>=0.20; extra == "full"
+Provides-Extra: hub
+Requires-Dist: huggingface_hub>=0.20; extra == "hub"
+Requires-Dist: datasets>=2.14; extra == "hub"
+Provides-Extra: dev
+Requires-Dist: pytest>=7.4; extra == "dev"
+Requires-Dist: pytest-cov>=4.1; extra == "dev"
+Requires-Dist: ruff>=0.1; extra == "dev"
+Requires-Dist: mypy>=1.5; extra == "dev"
+Requires-Dist: pre-commit>=3.4; extra == "dev"
+<p align="center">
+  <h1 align="center">👻 Erasus</h1>
+  <p align="center">
+    <strong>Efficient Representative And Surgical Unlearning Selection</strong><br>
+    Universal Machine Unlearning via Coreset Selection
+  </p>
+  <p align="center">
+    <a href="#-quick-start"><img src="https://img.shields.io/badge/python-3.9+-blue.svg" alt="Python 3.9+"></a>
+    <a href="#-installation"><img src="https://img.shields.io/badge/pytorch-2.0+-ee4c2c.svg" alt="PyTorch 2.0+"></a>
+    <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green.svg" alt="License: MIT"></a>
+    <a href="#-test-status"><img src="https://img.shields.io/badge/tests-87%20passed-brightgreen.svg" alt="Tests"></a>
+    <a href="#-supported-models"><img src="https://img.shields.io/badge/models-10%20architectures-purple.svg" alt="Models"></a>
+    <a href="#-strategies--selectors"><img src="https://img.shields.io/badge/strategies-27%20methods-orange.svg" alt="Strategies"></a>
+  </p>
+</p>
+---
+**Erasus** is a research-grade Python framework for **Machine Unlearning** across all major foundation model types. It surgically removes specific data, concepts, or behaviors from trained models — without the computational cost of full retraining.
+It supports **Vision-Language Models**, **Large Language Models**, **Diffusion Models**, **Audio Models**, and **Video Models** through a unified API backed by 27 unlearning strategies, 19 coreset selectors, 7 loss functions, and a comprehensive evaluation suite with 15+ metrics.
+---
+## 🧠 How It Works
+Erasus operates in a three-stage pipeline:
+```
+┌──────────────────────┐     ┌──────────────────────┐     ┌──────────────────────┐
+│  1. CORESET SELECTION │────▶│  2. TARGETED          │────▶│  3. EVALUATION &     │
+│                      │     │     UNLEARNING         │     │     CERTIFICATION    │
+│  Pick the minimal    │     │                        │     │                      │
+│  set of samples that │     │  Apply gradient ascent,│     │  MIA, accuracy,      │
+│  define forgetting   │     │  Fisher, SCRUB, LoRA,  │     │  perplexity, FID,    │
+│  "support vectors"   │     │  or 16+ other methods  │     │  certified removal   │
+└──────────────────────┘     └──────────────────────┘     └──────────────────────┘
+```
+**Key Innovation:** Geometry-aware coreset selection identifies the *"support vectors of forgetting"* — proving that unlearning k% of the most influential samples approximates unlearning 100% with bounded utility loss.
+---
+## ⚡ Key Features
+| Feature | Description |
+|---------|-------------|
+| 🎯 **Coreset-Driven Forgetting** | 19 coreset selectors (influence functions, CRAIG, herding, k-center, EL2N, TracIn, Data Shapley) reduce compute by up to 90% |
+| 🧩 **Ensemble Unlearning** | Combine strategies sequentially or via weight averaging for robust forgetting |
+| 📷📝 **Multimodal Decoupling** | Unlearn image-text associations without breaking visual or textual generalization |
+| 🛡️ **Utility Preservation** | Retain-Anchor loss + Fisher regularization constrain model drift on safe data |
+| 🔐 **Certified Removal** | Formal (ε, δ)-removal verification with PAC-style guarantees |
+| 📊 **Integrated Evaluation** | MIA, confidence, feature distance, perplexity, FID, activation analysis, backdoor detection, 15+ metrics |
+| 📈 **Visualization Suite** | Loss landscapes, embedding plots, gradient flow, interactive Plotly dashboards, HTML reports |
+| 🔌 **Model Agnostic** | Works with any PyTorch model + HuggingFace Transformers |
+| 🖥️ **CLI + Python API** | `erasus unlearn`, `erasus benchmark`, `erasus visualize`, or full Python API |
+| 🧪 **Experiment Tracking** | Built-in W&B, MLflow, local JSON tracking + HPO with Optuna |
+| 📐 **Theoretical Bounds** | PAC-learning utility bounds, influence bounds, certified unlearning radius |
+---
+## 🏗️ Supported Models
+| Modality | Models | Unlearner |
+|----------|--------|-----------|
+| **Vision-Language** | CLIP, LLaVA, BLIP-2 | `VLMUnlearner` |
+| **Language** | LLaMA, Mistral, GPT-2/J, BERT | `LLMUnlearner` |
+| **Diffusion** | Stable Diffusion 1.x/2.x/XL | `DiffusionUnlearner` |
+| **Audio** | Whisper | `AudioUnlearner` |
+| **Video** | VideoMAE | `VideoUnlearner` |
+| **Any** | Auto-detect | `MultimodalUnlearner` |
+---
+## 📦 Installation
+```bash
+# From PyPI (once published)
+pip install erasus
+pip install erasus[full]   # with diffusers, datasets, wandb, etc.
+pip install erasus[hub]    # Hugging Face Hub push/pull
+# From source (development)
+git clone https://github.com/OnePunchMonk/erasus.git
+cd erasus
+pip install -e .
+# With all optional dependencies
+pip install -e ".[full]"
+# Hugging Face Hub (push/pull unlearned models)
+pip install -e ".[hub]"
+# Development
+pip install -e ".[dev]"
+```
+### Quick Setup Script
+```bash
+bash scripts/setup_env.sh          # CPU
+bash scripts/setup_env.sh --gpu    # CUDA 12.1
+```
+### Docker
+```bash
+docker compose -f docker/docker-compose.yml up test       # Run tests
+docker compose -f docker/docker-compose.yml run dev        # Dev shell
+docker compose -f docker/docker-compose.yml up benchmark   # GPU benchmarks
+```
+---
+## 🚀 Quick Start
+### Python API
+```python
+from erasus.unlearners import ErasusUnlearner
+# 1. Load your model
+model = ...  # Any PyTorch model
+# 2. Create unlearner
+unlearner = ErasusUnlearner(
+    model=model,
+    strategy="gradient_ascent",    # 27 strategies available
+    selector="influence",          # 19 selectors available
+    device="cuda",
+)
+# 3. Unlearn
+result = unlearner.fit(
+    forget_data=forget_loader,     # Data to remove
+    retain_data=retain_loader,     # Data to preserve
+    prune_ratio=0.1,               # Use top 10% coreset
+    epochs=5,
+)
+# 4. Evaluate
+metrics = unlearner.evaluate(
+    forget_data=forget_loader,
+    retain_data=retain_loader,
+)
+print(f"MIA AUC: {metrics['mia_auc']:.4f}")  # Should → 0.5
+```
+### Modality-Specific Unlearners
+```python
+from erasus.unlearners import VLMUnlearner, LLMUnlearner, DiffusionUnlearner
+# CLIP: Remove NSFW concepts
+vlm = VLMUnlearner(model=clip_model, strategy="modality_decoupling")
+vlm.fit(forget_data=nsfw_loader, retain_data=safe_loader)
+# LLaMA: Remove hazardous knowledge
+llm = LLMUnlearner(model=llama_model, strategy="gradient_ascent")
+llm.fit(forget_data=harmful_loader, retain_data=benign_loader)
+# Stable Diffusion: Remove artist styles
+diff = DiffusionUnlearner(model=sd_model, strategy="concept_erasure")
+diff.fit(forget_data=artist_loader, retain_data=general_loader)
+```
+### Auto-Detect Model Type
+```python
+from erasus.unlearners import MultimodalUnlearner
+# Automatically picks the right unlearner
+unlearner = MultimodalUnlearner.from_model(your_model)
+```
+### CLI
+```bash
+# Run unlearning
+erasus unlearn --config configs/default.yaml
+# Evaluate results
+erasus evaluate --config configs/default.yaml --checkpoint model.pt
+# Run benchmarks
+erasus benchmark --strategies gradient_ascent,scrub --selectors random,influence
+# Generate visualizations
+erasus visualize --type embeddings --method tsne --output embeddings.png
+erasus visualize --type comparison --output comparison.png
+erasus visualize --type report --output report.html
+```
+---
+## 🔧 Strategies & Selectors
+### Unlearning Strategies (27)
+| Category | Strategies |
+|----------|------------|
+| **Gradient Methods** | Gradient Ascent, SCRUB (CVPR 2024), Fisher Forgetting, Negative Gradient, Modality Decoupling, **Saliency Unlearning** |
+| **Parameter Methods** | LoRA Unlearning, Sparse-Aware, Mask-Based, Neuron Pruning, **Layer Freezing** |
+| **Data Methods** | Amnesiac ML, SISA, Certified Removal, **Knowledge Distillation** |
+| **LLM-Specific** | SSD (NeurIPS 2024), Token Masking, Embedding Alignment, Causal Tracing, **Attention Surgery** |
+| **Diffusion-Specific** | Concept Erasure (ICCV 2023), Noise Injection, U-Net Surgery, **Timestep Masking**, **Safe Latents** |
+| **VLM-Specific** | Contrastive Unlearning, Cross-Modal Decoupling, **Attention Unlearning** |
+| **Ensemble** | Sequential / Averaged multi-strategy combination |
+### Coreset Selectors (19)
+| Category | Selectors |
+|----------|-----------|
+| **Gradient-Based** | Influence Functions, TracIn, Gradient Norm, GradMatch/CRAIG, EL2N, Representer |
+| **Geometry-Based** | k-Center, Herding, GLISTER, Submodular, k-Means++ |
+| **Learning-Based** | Forgetting Events, Data Shapley, Valuation Network |
+| **Ensemble** | Voting Selector, Auto-Selector |
+---
+## 📊 Evaluation & Metrics
+```python
+from erasus.metrics import MetricSuite
+suite = MetricSuite(["accuracy", "mia", "perplexity"])
+results = suite.run(model, forget_loader, retain_loader)
+```
+| Category | Metrics |
+|----------|---------|
+| **Forgetting** | MIA (+ LiRA, LOSS variants), Confidence, Feature Distance, **Activation Analysis**, **Backdoor ASR** |
+| **Utility** | Accuracy, Perplexity, Retrieval (R@1/5/10), FID |
+| **Efficiency** | Time Complexity, Memory Usage, **Speedup Ratio**, **FLOPs Estimation** |
+| **Privacy** | Differential Privacy (ε, δ) |
+---
+## 📈 Visualization
+```python
+from erasus.visualization import (
+    EmbeddingVisualizer,
+    LossLandscapeVisualizer,
+    GradientVisualizer,
+    ReportGenerator,
+)
+from erasus.visualization.attention import AttentionVisualizer
+from erasus.visualization.comparisons import ComparisonVisualizer
+# t-SNE / PCA embeddings
+viz = EmbeddingVisualizer(model)
+viz.plot(data_loader, method="tsne")
+# Loss landscape
+landscape = LossLandscapeVisualizer(model)
+landscape.plot_2d_contour(data_loader)
+# Attention heatmaps (before vs. after)
+attn_viz = AttentionVisualizer(model_after)
+attn_viz.plot_attention_comparison(inputs, model_before)
+# Before/after comparisons
+comp = ComparisonVisualizer()
+comp.plot_prediction_shift(model_before, model_after, forget_loader)
+comp.plot_metric_comparison(metrics_before, metrics_after)
+# HTML report
+report = ReportGenerator("Unlearning Report")
+report.add_metrics(metrics)
+report.save("report.html")
+```
+---
+## 🔐 Certification & Privacy
+```python
+from erasus.certification import CertifiedRemovalVerifier, UnlearningVerifier
+# Formal (ε, δ)-removal verification
+verifier = CertifiedRemovalVerifier(epsilon=1.0, delta=1e-5)
+result = verifier.verify(unlearned_model, retrained_model, n_total=10000, n_forget=500)
+print(f"Certified: {result['certified']}")
+# Statistical verification
+stat_verifier = UnlearningVerifier(significance=0.05)
+tests = stat_verifier.verify_all(model, forget_loader, retain_loader)
+```
+### Theoretical Bounds
+```python
+from erasus.certification.bounds import TheoreticalBounds
+# PAC-learning utility bound
+bounds = TheoreticalBounds.pac_utility_bound(
+    n_total=50000, n_forget=500, n_retain=49500, delta=0.05, model=model,
+)
+print(f"Utility drop bound: {bounds['pac_utility_drop_bound']:.4f}")
+# Certified unlearning radius
+radius = TheoreticalBounds.unlearning_radius(
+    epsilon=1.0, delta=1e-5, n_forget=500,
+)
+print(f"Certified radius: {radius['certified_radius']:.4f}")
+```
+---
+## 📉 Loss Functions
+| Loss | Description |
+|------|-------------|
+| **Retain Anchor** | Cross-entropy on retain data to preserve utility |
+| **Contrastive** | CLIP-style contrastive loss for VLM alignment |
+| **KL Divergence** | Distribution matching between models |
+| **MMD** | Maximum Mean Discrepancy for distribution comparison |
+| **Fisher Regularization** | Fisher information-weighted parameter penalty |
+| **Adversarial** | GAN-style loss for indistinguishable forget/retain outputs |
+| **Triplet** | Push forget embeddings away from retain-set anchors |
+| **L2 Regularization** | Simple weight-drift penalty |
+---
+## 🧪 Experiment Tracking
+```python
+from erasus.experiments import ExperimentTracker, HyperparameterSearch, AblationStudy
+# Supports: "local", "wandb", "mlflow"
+with ExperimentTracker("clip_unlearning", backend="wandb") as tracker:
+    tracker.log_config({"strategy": "gradient_ascent", "lr": 1e-4})
+    result = unlearner.fit(...)
+    tracker.log_metrics({"mia_auc": 0.52, "accuracy": 0.94})
+    tracker.log_model(model)
+# Hyperparameter search (Optuna or random fallback)
+search = HyperparameterSearch(
+    objective_fn=my_objective,
+    param_space={"lr": {"type": "float", "low": 1e-5, "high": 1e-2, "log": True}},
+    n_trials=50,
+)
+best = search.run()
+# Ablation studies
+ablation = AblationStudy(base_config={...}, run_fn=run_trial)
+ablation.run_full_ablation({"lr": [1e-3, 1e-4, 1e-5], "strategy": ["ga", "scrub"]})
+print(ablation.summary())
+```
+---
+## 📁 Project Structure
+```
+erasus/
+├── core/           # Base classes, registry, config, types
+├── unlearners/     # High-level API (7 modality-specific unlearners)
+├── strategies/     # 27 unlearning algorithms (gradient, parameter, data, LLM, diffusion, VLM, ensemble)
+├── selectors/      # 19 coreset selection methods (gradient, geometry, learning, ensemble)
+├── metrics/        # 15+ evaluation metrics (forgetting, utility, efficiency, privacy)
+├── losses/         # 8 loss functions (retain-anchor, Fisher, adversarial, triplet, KL, MMD, L2)
+├── visualization/  # Embeddings, loss surfaces, gradients, attention heatmaps, comparisons, reports
+├── data/           # Dataset loaders (TOFU, WMDP, COCO, I2P, CC), preprocessing, partitioning
+├── models/         # 10 model wrappers (VLM, LLM, diffusion, audio, video)
+├── privacy/        # DP mechanisms, privacy accountant, certificates
+├── certification/  # Certified removal, statistical verification, theoretical bounds
+├── experiments/    # W&B / MLflow / local tracking, HPO, ablation studies
+├── cli/            # Command-line interface (unlearn, evaluate, benchmark, visualize)
+└── utils/          # Checkpointing, distributed, helpers, logging, callbacks, early stopping
+```
+---
+## 🏆 Benchmarks
+Run standardized benchmarks:
+```bash
+# TOFU Benchmark (LLM unlearning)
+python benchmarks/tofu/run.py --strategies gradient_ascent,scrub --epochs 5
+# WMDP Benchmark (hazardous knowledge)
+python benchmarks/wmdp/run.py --subsets bio,cyber
+# Full suite
+bash scripts/run_benchmarks.sh
+```
+---
+## 🧑‍💻 Examples
+| Example | Description |
+|---------|-------------|
+| [CLIP Coreset Comparison](examples/vision_language/clip_coreset_comparison.py) | Compare random vs. gradient_norm selectors |
+| [LLaVA Unlearning](examples/vision_language/llava_unlearning.py) | VLM unlearning with gradient ascent |
+| [LLaMA Concept Removal](examples/language_models/llama_concept_removal.py) | Remove concepts from LLaMA |
+| [GPT-2 Strategy Comparison](examples/language_models/gpt2_unlearning.py) | Compare gradient_ascent vs. negative_gradient |
+| [LoRA Efficient Unlearning](examples/language_models/lora_efficient_unlearning.py) | Parameter-efficient unlearning |
+| [SD NSFW Removal](examples/diffusion_models/stable_diffusion_nsfw.py) | Remove NSFW concepts |
+| [SD Artist Removal](examples/diffusion_models/stable_diffusion_artist.py) | Remove artist styles |
+| [TOFU Benchmark](examples/benchmarks/run_tofu_benchmark.py) | End-to-end benchmark |
+---
+## ✅ Test Status
+```
+87 tests passed ✅  |  0 failed  |  26s
+```
+```bash
+python -m pytest tests/ -v --tb=short
+```
+| Test Suite | Tests | Status |
+|-----------|:-----:|:------:|
+| Integration (pipelines) | 6 | ✅ |
+| End-to-end | 15 | ✅ |
+| Unit (selectors) | 9 | ✅ |
+| Unit (strategies) | 7 | ✅ |
+| Unit (metrics) | 8 | ✅ |
+| Core / imports / components | 42 | ✅ |
+---
+## 📚 Research References
+Erasus integrates and builds upon these key works:
+| Method | Paper | Venue |
+|--------|-------|-------|
+| SCRUB | Kurmanji et al. | CVPR 2024 |
+| Selective Synaptic Dampening | Foster et al. | NeurIPS 2024 |
+| Concept Erasure (ESD) | Gandikota et al. | ICCV 2023 |
+| Gradient Ascent | Golatkar et al. | NeurIPS 2020 |
+| Fisher Forgetting | Golatkar et al. | NeurIPS 2020 |
+| CRAIG | Mirzasoleiman et al. | NeurIPS 2020 |
+| GLISTER | Killamsetty et al. | ICLR 2021 |
+| Influence Functions | Koh & Liang | ICML 2017 |
+| TracIn | Pruthi et al. | NeurIPS 2020 |
+| Data Shapley | Ghorbani & Zou | ICML 2019 |
+| Forgetting Events | Toneva et al. | ICLR 2019 |
+| EL2N | Paul et al. | ICML 2021 |
+| Amnesiac ML | Graves et al. | S&P 2021 |
+---
+## 🗺️ Roadmap
+- [x] Core framework (base classes, registry, config)
+- [x] 10 model architectures
+- [x] 27 unlearning strategies (gradient, parameter, data, LLM, diffusion, VLM, ensemble)
+- [x] 19 coreset selectors
+- [x] 15+ evaluation metrics (forgetting, utility, efficiency, privacy)
+- [x] 8 loss functions (Fisher, adversarial, triplet, L2, retain-anchor, KL, MMD, contrastive)
+- [x] Visualization suite (embeddings, landscapes, gradients, attention, comparisons, reports)
+- [x] CLI (`erasus unlearn`, `erasus evaluate`, `erasus benchmark`, `erasus visualize`)
+- [x] Certification & privacy modules + theoretical bounds (PAC, influence, certified radius)
+- [x] Experiment tracking (W&B, MLflow, local) + HPO + ablation studies
+- [x] Benchmark runners (TOFU, WMDP)
+- [x] Callbacks & early stopping
+- [x] 87 passing tests
+- [ ] Additional model architectures (Flamingo, T5, DALL-E, Wav2Vec)
+- [ ] HuggingFace Hub integration
+- [ ] Interactive Gradio/Streamlit dashboard
+- [ ] Tutorial notebooks
+- [ ] PyPI release
+---
+## 🤝 Contributing
+Contributions are welcome! Whether it's new unlearning strategies, coreset selectors, model support, or documentation.
+```bash
+# Setup development environment
+git clone https://github.com/OnePunchMonk/erasus.git
+cd erasus
+pip install -e ".[dev]"
+python -m pytest tests/ -v
+```
+---
+## 📜 License
+MIT License — see [LICENSE](LICENSE) for details.
+---
+## 📖 Citation
+```bibtex
+@software{erasus2026,
+  title={Erasus: Universal Machine Unlearning via Coreset Selection},
+  author={Aggarwal, Avaya},
+  year={2026},
+  url={https://github.com/OnePunchMonk/erasus}
+}
+```
+---
+<p align="center">
+  <b>Built with ❤️ for the machine unlearning research community</b>
+</p>