PyPI - rc-foundry - Versions diffs - 0.1.1__py3-none-any.whl - Mend

rc-foundry 0.1.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (180) hide show

foundry/__init__.py +57 -0
foundry/callbacks/__init__.py +5 -0
foundry/callbacks/callback.py +116 -0
foundry/callbacks/health_logging.py +419 -0
foundry/callbacks/metrics_logging.py +211 -0
foundry/callbacks/timing_logging.py +67 -0
foundry/callbacks/train_logging.py +278 -0
foundry/common.py +108 -0
foundry/constants.py +28 -0
foundry/hydra/resolvers.py +77 -0
foundry/inference_engines/base.py +235 -0
foundry/inference_engines/checkpoint_registry.py +66 -0
foundry/metrics/__init__.py +12 -0
foundry/metrics/losses.py +30 -0
foundry/metrics/metric.py +319 -0
foundry/model/layers/blocks.py +47 -0
foundry/testing/__init__.py +6 -0
foundry/testing/fixtures.py +19 -0
foundry/testing/pytest_hooks.py +15 -0
foundry/trainers/fabric.py +923 -0
foundry/training/EMA.py +67 -0
foundry/training/checkpoint.py +61 -0
foundry/training/schedulers.py +91 -0
foundry/utils/alignment.py +86 -0
foundry/utils/components.py +415 -0
foundry/utils/datasets.py +405 -0
foundry/utils/ddp.py +103 -0
foundry/utils/instantiators.py +72 -0
foundry/utils/logging.py +279 -0
foundry/utils/rigid.py +1460 -0
foundry/utils/rotation_augmentation.py +65 -0
foundry/utils/squashfs.py +172 -0
foundry/utils/torch.py +317 -0
foundry/utils/weights.py +271 -0
foundry/version.py +34 -0
foundry_cli/__init__.py +3 -0
foundry_cli/download_checkpoints.py +281 -0
mpnn/__init__.py +1 -0
mpnn/collate/feature_collator.py +265 -0
mpnn/inference.py +53 -0
mpnn/inference_engines/mpnn.py +549 -0
mpnn/loss/nll_loss.py +122 -0
mpnn/metrics/nll.py +369 -0
mpnn/metrics/sequence_recovery.py +440 -0
mpnn/model/layers/graph_embeddings.py +2372 -0
mpnn/model/layers/message_passing.py +332 -0
mpnn/model/layers/position_wise_feed_forward.py +44 -0
mpnn/model/layers/positional_encoding.py +98 -0
mpnn/model/mpnn.py +2632 -0
mpnn/pipelines/mpnn.py +162 -0
mpnn/samplers/samplers.py +167 -0
mpnn/train.py +341 -0
mpnn/trainers/mpnn.py +193 -0
mpnn/transforms/feature_aggregation/mpnn.py +184 -0
mpnn/transforms/feature_aggregation/polymer_ligand_interface.py +76 -0
mpnn/transforms/feature_aggregation/token_encodings.py +132 -0
mpnn/transforms/feature_aggregation/user_settings.py +347 -0
mpnn/transforms/polymer_ligand_interface.py +164 -0
mpnn/utils/inference.py +2397 -0
mpnn/utils/probability.py +37 -0
mpnn/utils/weights.py +309 -0
rc_foundry-0.1.1.dist-info/METADATA +239 -0
rc_foundry-0.1.1.dist-info/RECORD +180 -0
rc_foundry-0.1.1.dist-info/WHEEL +4 -0
rc_foundry-0.1.1.dist-info/entry_points.txt +5 -0
rc_foundry-0.1.1.dist-info/licenses/LICENSE.md +28 -0
rf3/__init__.py +3 -0
rf3/_version.py +33 -0
rf3/alignment.py +79 -0
rf3/callbacks/dump_validation_structures.py +101 -0
rf3/callbacks/metrics_logging.py +324 -0
rf3/chemical.py +1529 -0
rf3/cli.py +77 -0
rf3/data/cyclic_transform.py +78 -0
rf3/data/extra_xforms.py +36 -0
rf3/data/ground_truth_template.py +463 -0
rf3/data/paired_msa.py +206 -0
rf3/data/pipeline_utils.py +128 -0
rf3/data/pipelines.py +558 -0
rf3/diffusion_samplers/inference_sampler.py +222 -0
rf3/inference.py +65 -0
rf3/inference_engines/__init__.py +5 -0
rf3/inference_engines/rf3.py +735 -0
rf3/kinematics.py +354 -0
rf3/loss/af3_confidence_loss.py +515 -0
rf3/loss/af3_losses.py +655 -0
rf3/loss/loss.py +179 -0
rf3/metrics/chiral.py +179 -0
rf3/metrics/clashing_chains.py +68 -0
rf3/metrics/distogram.py +421 -0
rf3/metrics/lddt.py +523 -0
rf3/metrics/metadata.py +43 -0
rf3/metrics/metric_utils.py +192 -0
rf3/metrics/predicted_error.py +134 -0
rf3/metrics/rasa.py +108 -0
rf3/metrics/selected_distances.py +91 -0
rf3/model/RF3.py +527 -0
rf3/model/RF3_blocks.py +92 -0
rf3/model/RF3_structure.py +303 -0
rf3/model/layers/af3_auxiliary_heads.py +255 -0
rf3/model/layers/af3_diffusion_transformer.py +544 -0
rf3/model/layers/attention.py +313 -0
rf3/model/layers/layer_utils.py +127 -0
rf3/model/layers/mlff.py +118 -0
rf3/model/layers/outer_product.py +59 -0
rf3/model/layers/pairformer_layers.py +783 -0
rf3/model/layers/structure_bias.py +56 -0
rf3/scoring.py +1787 -0
rf3/symmetry/resolve.py +284 -0
rf3/train.py +194 -0
rf3/trainers/rf3.py +570 -0
rf3/util_module.py +47 -0
rf3/utils/frames.py +109 -0
rf3/utils/inference.py +665 -0
rf3/utils/io.py +198 -0
rf3/utils/loss.py +72 -0
rf3/utils/predict_and_score.py +165 -0
rf3/utils/predicted_error.py +673 -0
rf3/utils/recycling.py +42 -0
rf3/validate.py +140 -0
rfd3/.gitignore +7 -0
rfd3/Makefile +76 -0
rfd3/__init__.py +12 -0
rfd3/callbacks.py +66 -0
rfd3/cli.py +41 -0
rfd3/constants.py +212 -0
rfd3/engine.py +543 -0
rfd3/inference/datasets.py +193 -0
rfd3/inference/input_parsing.py +1123 -0
rfd3/inference/legacy_input_parsing.py +717 -0
rfd3/inference/parsing.py +165 -0
rfd3/inference/symmetry/atom_array.py +298 -0
rfd3/inference/symmetry/checks.py +241 -0
rfd3/inference/symmetry/contigs.py +63 -0
rfd3/inference/symmetry/frames.py +355 -0
rfd3/inference/symmetry/symmetry_utils.py +398 -0
rfd3/metrics/design_metrics.py +465 -0
rfd3/metrics/hbonds_hbplus_metrics.py +308 -0
rfd3/metrics/hbonds_metrics.py +389 -0
rfd3/metrics/losses.py +325 -0
rfd3/metrics/metrics_utils.py +118 -0
rfd3/metrics/sidechain_metrics.py +349 -0
rfd3/model/RFD3.py +105 -0
rfd3/model/RFD3_diffusion_module.py +387 -0
rfd3/model/cfg_utils.py +81 -0
rfd3/model/inference_sampler.py +635 -0
rfd3/model/layers/attention.py +577 -0
rfd3/model/layers/block_utils.py +580 -0
rfd3/model/layers/blocks.py +777 -0
rfd3/model/layers/chunked_pairwise.py +377 -0
rfd3/model/layers/encoders.py +417 -0
rfd3/model/layers/layer_utils.py +197 -0
rfd3/model/layers/pairformer_layers.py +128 -0
rfd3/run_inference.py +45 -0
rfd3/testing/debug.py +139 -0
rfd3/testing/debug_utils.py +73 -0
rfd3/testing/testing_utils.py +356 -0
rfd3/train.py +194 -0
rfd3/trainer/dump_validation_structures.py +154 -0
rfd3/trainer/fabric_trainer.py +923 -0
rfd3/trainer/recycling.py +42 -0
rfd3/trainer/rfd3.py +485 -0
rfd3/trainer/trainer_utils.py +502 -0
rfd3/transforms/conditioning_base.py +508 -0
rfd3/transforms/conditioning_utils.py +200 -0
rfd3/transforms/design_transforms.py +807 -0
rfd3/transforms/dna_crop.py +523 -0
rfd3/transforms/hbonds.py +407 -0
rfd3/transforms/hbonds_hbplus.py +246 -0
rfd3/transforms/ncaa_transforms.py +153 -0
rfd3/transforms/pipelines.py +632 -0
rfd3/transforms/ppi_transforms.py +541 -0
rfd3/transforms/rasa.py +116 -0
rfd3/transforms/symmetry.py +76 -0
rfd3/transforms/training_conditions.py +552 -0
rfd3/transforms/util_transforms.py +498 -0
rfd3/transforms/virtual_atoms.py +305 -0
rfd3/utils/inference.py +648 -0
rfd3/utils/io.py +245 -0
rfd3/utils/vizualize.py +276 -0

foundry/hydra/resolvers.py ADDED Viewed

@@ -0,0 +1,77 @@
+"""Resolvers for Hydra configuration files.
+Documentation on custom resolvers:
+- https://omegaconf.readthedocs.io/en/latest/custom_resolvers.html
+"""
+import importlib
+from atomworks.enums import ChainType, ChainTypeInfo
+from beartype.typing import Any
+from omegaconf import OmegaConf
+from ..common import run_once
+#  (Custom resolvers)
+@run_once
+def register_resolvers():
+    resolvers = {
+        "resolve_import": resolve_import,
+        "chain_type_info_to_regex": chain_type_info_to_regex,
+    }
+    for name, resolver in resolvers.items():
+        OmegaConf.register_new_resolver(name, resolver)
+def resolve_import(module_path: str, attribute_path: str = None) -> Any:
+    """
+    Import a module and access a specific attribute from it.
+    Args:
+        module_path (str): The path to the module.
+        attribute_path (str): The path to the attribute within the module.
+    Returns:
+        The imported attribute.
+    """
+    module = importlib.import_module(module_path)
+    if attribute_path is not None:
+        # Split the attribute path to navigate through nested attributes
+        attributes = attribute_path.split(".")
+        attr = module
+        for attr_name in attributes:
+            attr = getattr(attr, attr_name)
+        return attr
+    else:
+        return module
+def chain_type_info_to_regex(*args) -> Any:
+    """Convert a combination of ChainType or ChainTypeInfo attributes to a regex string.
+    Primarily used for filtering a dataset by chain type prior to training/validation.
+    Example filter:
+    - "pn_unit_1_type.astype('str').str.match('${chain_type_info_to_regex:PROTEINS}')"
+    """
+    regex_str = ""
+    for arg in args:
+        if hasattr(ChainType, arg):
+            regex_str += f"{getattr(ChainType, arg).value}|"
+        elif hasattr(ChainTypeInfo, arg):
+            chain_types_list = getattr(ChainTypeInfo, arg)
+            for ct in chain_types_list:
+                regex_str += f"{ct.value}|"
+        else:
+            raise ValueError(
+                f"Attribute not found for ChainType or ChainTypeInfo: {arg}."
+            )
+    # Remove the trailing '|'
+    regex_str = regex_str[:-1]
+    return regex_str

foundry/inference_engines/base.py ADDED Viewed

@@ -0,0 +1,235 @@
+import logging
+import os
+from os import PathLike
+from pathlib import Path
+from typing import Any, Dict
+import hydra
+import torch
+from biotite.structure import AtomArray
+from lightning.fabric import seed_everything
+from omegaconf import OmegaConf
+from foundry.inference_engines.checkpoint_registry import REGISTERED_CHECKPOINTS
+from foundry.utils.ddp import RankedLogger, set_accelerator_based_on_availability
+from foundry.utils.logging import (
+    configure_minimal_inference_logging,
+    print_config_tree,
+)
+logging.basicConfig(
+    level=logging.INFO,
+    format="%(asctime)s %(levelname)s %(name)s: %(message)s",
+    datefmt="%H:%M:%S",
+)
+ranked_logger = RankedLogger(__name__, rank_zero_only=True)
+def merge(cfg, overrides: dict):
+    return OmegaConf.merge(cfg, OmegaConf.create(overrides))
+class BaseInferenceEngine:
+    """
+    Base inference engine.
+    Separates model setup (expensive, once) from inference (can run multiple times).
+    """
+    def __init__(
+        self,
+        ckpt_path: PathLike,
+        num_nodes: int = 1,
+        devices_per_node: int = 1,
+        # Config overrides
+        transform_overrides={},
+        inference_sampler_overrides={},
+        trainer_overrides={},
+        # Debug
+        verbose: bool = False,
+        seed: int | None = None,
+    ):
+        """Initialize inference engine and load model.
+        Model config is loaded from checkpoint and overridden with parameters provided here.
+        Args:
+          ckpt_path: Path to model checkpoint.
+          seed: Random seed. If None, uses external RNG state. Defaults to ``None``.
+          num_nodes: Number of nodes for distributed inference. Defaults to ``1``.
+          devices_per_node: Number of devices per node. Defaults to ``1``.
+          verbose: If True, show detailed logging and config trees. Defaults to ``False``.
+        """
+        if not verbose:
+            configure_minimal_inference_logging()
+        # Set attrs
+        self.initialized_ = False
+        self.trainer = None
+        self.pipeline = None
+        self.verbose = verbose
+        # Resolve checkpoint path
+        if '.' not in str(ckpt_path):
+            # Assume registered model
+            name = str(ckpt_path)
+            assert name in REGISTERED_CHECKPOINTS, 'Checkpoint provided not and not in registered checkpoints'
+            ckpt = REGISTERED_CHECKPOINTS[name]
+            ckpt_path = ckpt.get_default_path()
+            ranked_logger.info("Using checkpoint from default installation directory, got: {}".format(str(ckpt_path)))
+            assert os.path.exists(ckpt_path), 'Invalid checkpoint: {}. And could not find checkpoint in default installation location: {}'.format(name, ckpt_path)
+        self.ckpt_path = Path(ckpt_path).resolve()
+        # Set random seed (only if seed is not None)
+        if seed is not None:
+            ranked_logger.info(f"Seeding everything with seed={seed}...")
+            seed_everything(seed, workers=True, verbose=True)
+        else:
+            ranked_logger.info("Seed is None - using external RNG state")
+        self.seed = seed
+        # Stored for later;
+        self.transform_overrides = transform_overrides
+        self.overrides: dict[str, Any] = {}
+        base_overrides = {
+            "trainer.seed": seed,
+            "trainer.metrics": {},
+            "trainer.loss": None,
+            "trainer.num_nodes": num_nodes,
+            "trainer.devices_per_node": devices_per_node,
+        }
+        for key, value in base_overrides.items():
+            self._assign_override(key, value)
+        for key, value in trainer_overrides.items():
+            self._assign_override(f"trainer.{key}", value)
+        for key, value in inference_sampler_overrides.items():
+            self._assign_override(f"model.net.inference_sampler.{key}", value)
+    ###################################################################################
+    # Required subclasss methods
+    ###################################################################################
+    def initialize(self):
+        if self.initialized_:
+            return getattr(self, "cfg", None)
+        # Load checkpoint and config
+        ranked_logger.info(
+            f"Loading checkpoint from {Path(self.ckpt_path).resolve()}..."
+        )
+        checkpoint = torch.load(self.ckpt_path, "cpu", weights_only=False)
+        cfg = self._override_checkpoint_config(checkpoint["train_cfg"])
+        # Load pipeline first before trainer/model
+        self._construct_pipeline(cfg)
+        self._construct_trainer(cfg, checkpoint=checkpoint)
+        ranked_logger.info("Model loaded and ready for inference.")
+        self.initialized_ = True
+        return cfg
+    def run(
+        self,
+        inputs: (
+            Dict[str, dict] | AtomArray | list[AtomArray] | PathLike | list[PathLike]
+        ),
+        *_,
+    ) -> dict[str, dict] | None:
+        self.initialize()
+        raise NotImplementedError(
+            "Subclasses must implement inference logic in `run` method."
+        )
+    ###################################################################################
+    # Util methods
+    ###################################################################################
+    def _override_checkpoint_config(self, cfg):
+        cfg = merge(cfg, self.overrides)
+        cfg = set_accelerator_based_on_availability(cfg)
+        return cfg
+    def _construct_trainer(self, cfg, checkpoint=None):
+        """
+        Sets attr self.trainer
+        """
+        # Instantiate trainer
+        ranked_logger.info("Instantiating trainer...")
+        if self.verbose:
+            print_config_tree(
+                cfg.trainer, resolve=True, title="INFERENCE TRAINER CONFIGURATION"
+            )
+        trainer = hydra.utils.instantiate(
+            cfg.trainer,
+            _convert_="partial",
+            _recursive_=False,
+        )
+        # Setup model
+        ranked_logger.info("Setting up model...")
+        trainer.fabric.launch()
+        trainer.initialize_or_update_trainer_state(
+            {"train_cfg": cfg}
+        )  # config from training stores net params
+        trainer.construct_model()
+        ranked_logger.info("Loading model weights from checkpoint...")
+        trainer.load_checkpoint(checkpoint=checkpoint or self.ckpt_path)
+        # Ensure optimizer isn't loaded
+        trainer.state["optimizer"] = None
+        trainer.state["train_cfg"].model.optimizer = None
+        trainer.setup_model_optimizers_and_schedulers()
+        trainer.state["model"].eval()
+        self.trainer = trainer
+    def _assign_override(self, dotted_key: str, value: Any) -> None:
+        """Assign ``value`` into ``self.overrides`` using a dotted path."""
+        target = self.overrides
+        keys = dotted_key.split(".")
+        for key in keys[:-1]:
+            if key not in target or not isinstance(target[key], dict):
+                target[key] = {}
+            target = target[key]
+        target[keys[-1]] = value
+    def _construct_pipeline(self, cfg):
+        """
+        Sets attr self.pipeline
+        """
+        # Construct pipeline
+        ranked_logger.info("Building Transform pipeline...")
+        first_val_dataset_key, first_val_dataset = next(iter(cfg.datasets.val.items()))
+        ranked_logger.info(
+            f"Using settings from validation dataset: {first_val_dataset_key}."
+        )
+        transform = first_val_dataset.dataset.transform
+        transform = merge(transform, self.transform_overrides)
+        if self.verbose:
+            print_config_tree(
+                transform,
+                resolve=True,
+                title="INFERENCE TRANSFORM PIPELINE",
+            )
+        self.pipeline = hydra.utils.instantiate(transform)
+    # aliases for run
+    def forward(self, *args, **kwargs):
+        return self.run(*args, **kwargs)
+    def __call__(self, *args, **kwargs):
+        return self.run(*args, **kwargs)
+    # for use as a context manager: e.g. `with BaseInferenceEngine(...) as engine:` to automatically cleanup
+    def __enter__(self):
+        return self
+    def __exit__(self, exc_type, exc, tb):
+        self.trainer = None
+        self.pipeline = None
+        self.initialized_ = False

foundry/inference_engines/checkpoint_registry.py ADDED Viewed

@@ -0,0 +1,66 @@
+'''Management of checkpoints'''
+import os
+from dataclasses import dataclass
+from pathlib import Path
+def get_default_checkpoint_dir() -> Path:
+    """Get the default checkpoint directory.
+    Priority:
+    1. FOUNDRY_CHECKPOINTS_DIR environment variable
+    2. ~/.foundry/checkpoints
+    """
+    if "FOUNDRY_CHECKPOINTS_DIR" in os.environ and os.environ.get("FOUNDRY_CHECKPOINTS_DIR"):
+        return Path(os.environ["FOUNDRY_CHECKPOINTS_DIR"]).absolute()
+    return Path.home() / ".foundry" / "checkpoints"
+@dataclass
+class RegisteredCheckpoint:
+    url: str
+    filename: str
+    description: str
+    sha256: None = None  # Optional: add checksum for verification
+    def get_default_path(self):
+        return get_default_checkpoint_dir() / self.filename
+REGISTERED_CHECKPOINTS = {
+    "rfd3": RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/rfd3/rfd3_foundry_2025_12_01_remapped.ckpt",
+        filename = "rfd3_latest.ckpt",
+        description = "RFdiffusion3 checkpoint",
+    ),
+    "rf3":  RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/rf3/rf3_foundry_01_24_latest_remapped.ckpt",
+        filename= "rf3_foundry_01_24_latest_remapped.ckpt",
+        description= "latest RF3 checkpoint trained with data until 1/2024 (expect best performance)",
+    ),
+    "proteinmpnn":  RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/ligandmpnn/proteinmpnn_v_48_020.pt",
+        filename= "proteinmpnn_v_48_020.pt",
+        description= "ProteinMPNN checkpoint",
+    ),
+    "ligandmpnn": RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/ligandmpnn/ligandmpnn_v_32_010_25.pt",
+        filename= "ligandmpnn_v_32_010_25.pt",
+        description= "LigandMPNN checkpoint",
+    ),
+    # Other models
+    "rf3_preprint_921": RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/rf3/rf3_foundry_09_21_preprint_remapped.ckpt",
+        filename = "rf3_foundry_09_21_preprint_remapped.ckpt",
+        description = "RF3 preprint checkpoint trained with data until 9/2021",
+    ),
+    "rf3_preprint_124": RegisteredCheckpoint(
+        url = "https://files.ipd.uw.edu/pub/rf3/rf3_foundry_01_24_preprint_remapped.ckpt",
+        filename = "rf3_foundry_01_24_preprint_remapped.ckpt",
+        description= "RF3 preprint checkpoint trained with data until 1/2024",
+    ),
+    "solublempnn":  RegisteredCheckpoint(
+        url =  "https://files.ipd.uw.edu/pub/ligandmpnn/solublempnn_v_48_020.pt",
+        filename= "solublempnn_v_48_020.pt",
+        description= "SolubleMPNN checkpoint"
+    )
+}

foundry/metrics/__init__.py ADDED Viewed

@@ -0,0 +1,12 @@
+"""Metrics for model evaluation.
+This module provides the base metric framework.
+"""
+from foundry.metrics.metric import Metric, MetricInputError, MetricManager
+__all__ = [
+    "Metric",
+    "MetricManager",
+    "MetricInputError",
+]

foundry/metrics/losses.py ADDED Viewed

@@ -0,0 +1,30 @@
+import hydra
+import torch.nn as nn
+from omegaconf import DictConfig
+class Loss(nn.Module):
+    def __init__(self, **losses):
+        super().__init__()
+        self.to_compute = []
+        for loss_name, loss in losses.items():
+            loss_fn = hydra.utils.instantiate(loss)
+            self.to_compute.append(loss_fn)
+            assert not isinstance(
+                loss_fn, DictConfig
+            ), f"Loss {loss_name} was instantiated as a DictConfig. Is _target_ present?."
+    def forward(
+        self,
+        network_input,
+        network_output,
+        loss_input,
+    ):
+        loss_dict = {}
+        loss = 0
+        for loss_fn in self.to_compute:
+            loss_, loss_dict_ = loss_fn(network_input, network_output, loss_input)
+            loss += loss_
+            loss_dict.update(loss_dict_)
+        loss_dict["total_loss"] = loss.detach()
+        return loss, loss_dict