PyPI - rslearn - Versions diffs - 0.0.11__py3-none-any.whl → 0.0.12__py3-none-any.whl - Mend

rslearn 0.0.11py3-none-any.whl → 0.0.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

rslearn/models/anysat.py +5 -1
rslearn/models/dinov3.py +6 -1
rslearn/models/feature_center_crop.py +50 -0
rslearn/models/olmoearth_pretrain/model.py +87 -27
rslearn/models/prithvi.py +9 -1
rslearn/train/lightning_module.py +0 -3
rslearn/train/tasks/classification.py +2 -2
rslearn/train/tasks/detection.py +5 -5
rslearn/train/tasks/per_pixel_regression.py +5 -4
rslearn/train/tasks/regression.py +5 -5
rslearn/train/transforms/pad.py +3 -3
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/METADATA +2 -1
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/RECORD +18 -25
rslearn-0.0.12.dist-info/licenses/NOTICE +115 -0
rslearn/models/copernicusfm.py +0 -228
rslearn/models/copernicusfm_src/__init__.py +0 -1
rslearn/models/copernicusfm_src/aurora/area.py +0 -50
rslearn/models/copernicusfm_src/aurora/fourier.py +0 -134
rslearn/models/copernicusfm_src/dynamic_hypernetwork.py +0 -523
rslearn/models/copernicusfm_src/flexivit/patch_embed.py +0 -260
rslearn/models/copernicusfm_src/flexivit/utils.py +0 -69
rslearn/models/copernicusfm_src/model_vit.py +0 -348
rslearn/models/copernicusfm_src/util/pos_embed.py +0 -216
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/WHEEL +0 -0
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/entry_points.txt +0 -0
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/licenses/LICENSE +0 -0
{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/top_level.txt +0 -0

rslearn/models/copernicusfm_src/util/pos_embed.py DELETED Viewed

@@ -1,216 +0,0 @@
-# type: ignore
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-# This source code is licensed under the license found in the
-# LICENSE file in the root directory of this source tree.
-# --------------------------------------------------------
-# Position embedding utils
-# --------------------------------------------------------
-import numpy as np
-import torch
-# --------------------------------------------------------
-# 2D sine-cosine position embedding
-# References:
-# Transformer: https://github.com/tensorflow/models/blob/master/official/nlp/transformer/model_utils.py
-# MoCo v3: https://github.com/facebookresearch/moco-v3
-# --------------------------------------------------------
-def get_2d_sincos_pos_embed(embed_dim, grid_size, cls_token=False):
-    """grid_size: int of the grid height and width
-    return:
-    pos_embed: [grid_size*grid_size, embed_dim] or [1+grid_size*grid_size, embed_dim] (w/ or w/o cls_token)
-    """
-    grid_h = np.arange(grid_size, dtype=np.float32)
-    grid_w = np.arange(grid_size, dtype=np.float32)
-    grid = np.meshgrid(grid_w, grid_h)  # here w goes first
-    grid = np.stack(grid, axis=0)
-    grid = grid.reshape([2, 1, grid_size, grid_size])
-    pos_embed = get_2d_sincos_pos_embed_from_grid(embed_dim, grid)
-    if cls_token:
-        pos_embed = np.concatenate([np.zeros([1, embed_dim]), pos_embed], axis=0)
-    return pos_embed
-def get_2d_sincos_pos_embed_from_grid(embed_dim, grid):
-    assert embed_dim % 2 == 0
-    # use half of dimensions to encode grid_h
-    emb_h = get_1d_sincos_pos_embed_from_grid(embed_dim // 2, grid[0])  # (H*W, D/2)
-    emb_w = get_1d_sincos_pos_embed_from_grid(embed_dim // 2, grid[1])  # (H*W, D/2)
-    emb = np.concatenate([emb_h, emb_w], axis=1)  # (H*W, D)
-    return emb
-def get_1d_sincos_pos_embed_from_grid(embed_dim, pos):
-    """embed_dim: output dimension for each position
-    pos: a list of positions to be encoded: size (M,)
-    out: (M, D)
-    """
-    assert embed_dim % 2 == 0
-    # omega = np.arange(embed_dim // 2, dtype=np.float) # numpy deprecated in 1.20
-    omega = np.arange(embed_dim // 2, dtype=float)
-    omega /= embed_dim / 2.0
-    omega = 1.0 / 10000**omega  # (D/2,)
-    pos = pos.reshape(-1)  # (M,)
-    out = np.einsum("m,d->md", pos, omega)  # (M, D/2), outer product
-    emb_sin = np.sin(out)  # (M, D/2)
-    emb_cos = np.cos(out)  # (M, D/2)
-    emb = np.concatenate([emb_sin, emb_cos], axis=1)  # (M, D)
-    return emb
-# --------------------------------------------------------
-# Interpolate position embeddings for high-resolution
-# References:
-# DeiT: https://github.com/facebookresearch/deit
-# --------------------------------------------------------
-def interpolate_pos_embed(model, checkpoint_model):
-    if "pos_embed" in checkpoint_model:
-        pos_embed_checkpoint = checkpoint_model["pos_embed"]
-        embedding_size = pos_embed_checkpoint.shape[-1]
-        num_patches = model.patch_embed.num_patches
-        num_extra_tokens = model.pos_embed.shape[-2] - num_patches
-        # height (== width) for the checkpoint position embedding
-        orig_size = int((pos_embed_checkpoint.shape[-2] - num_extra_tokens) ** 0.5)
-        # height (== width) for the new position embedding
-        new_size = int(num_patches**0.5)
-        # class_token and dist_token are kept unchanged
-        if orig_size != new_size:
-            print(
-                "Position interpolate from %dx%d to %dx%d"
-                % (orig_size, orig_size, new_size, new_size)
-            )
-            extra_tokens = pos_embed_checkpoint[:, :num_extra_tokens]
-            # only the position tokens are interpolated
-            pos_tokens = pos_embed_checkpoint[:, num_extra_tokens:]
-            pos_tokens = pos_tokens.reshape(
-                -1, orig_size, orig_size, embedding_size
-            ).permute(0, 3, 1, 2)
-            pos_tokens = torch.nn.functional.interpolate(
-                pos_tokens,
-                size=(new_size, new_size),
-                mode="bicubic",
-                align_corners=False,
-            )
-            pos_tokens = pos_tokens.permute(0, 2, 3, 1).flatten(1, 2)
-            new_pos_embed = torch.cat((extra_tokens, pos_tokens), dim=1)
-            checkpoint_model["pos_embed"] = new_pos_embed
-def interpolate_pos_embed_ofa(model, checkpoint_model):
-    if "pos_embed" in checkpoint_model:
-        pos_embed_dict = checkpoint_model["pos_embed"]
-        for key, pos_embed in pos_embed_dict.items():
-            pos_embed_checkpoint = pos_embed
-            embedding_size = pos_embed_checkpoint.shape[-1]
-            num_patches = model.patch_embed[key].num_patches
-            num_extra_tokens = model.pos_embed[key].shape[-2] - num_patches
-            # height (== width) for the checkpoint position embedding
-            orig_size = int((pos_embed_checkpoint.shape[-2] - num_extra_tokens) ** 0.5)
-            # height (== width) for the new position embedding
-            new_size = int(num_patches**0.5)
-            # class_token and dist_token are kept unchanged
-            if orig_size != new_size:
-                print(
-                    "Position interpolate from %dx%d to %dx%d"
-                    % (orig_size, orig_size, new_size, new_size)
-                )
-                extra_tokens = pos_embed_checkpoint[:, :num_extra_tokens]
-                # only the position tokens are interpolated
-                pos_tokens = pos_embed_checkpoint[:, num_extra_tokens:]
-                pos_tokens = pos_tokens.reshape(
-                    -1, orig_size, orig_size, embedding_size
-                ).permute(0, 3, 1, 2)
-                pos_tokens = torch.nn.functional.interpolate(
-                    pos_tokens,
-                    size=(new_size, new_size),
-                    mode="bicubic",
-                    align_corners=False,
-                )
-                pos_tokens = pos_tokens.permute(0, 2, 3, 1).flatten(1, 2)
-                new_pos_embed = torch.cat((extra_tokens, pos_tokens), dim=1)
-                checkpoint_model["pos_embed"][key] = new_pos_embed
-def get_2d_sincos_pos_embed_with_resolution(
-    embed_dim, grid_size, res, cls_token=False, device="cpu"
-):
-    """grid_size: int of the grid height and width
-    res: array of size n, representing the resolution of a pixel (say, in meters),
-    Return:
-    pos_embed: [n,grid_size*grid_size, embed_dim] or [n,1+grid_size*grid_size, embed_dim] (w/ or w/o cls_token)
-    """
-    # res = torch.FloatTensor(res).to(device)
-    res = res.to(device)
-    grid_h = torch.arange(grid_size, dtype=torch.float32, device=device)
-    grid_w = torch.arange(grid_size, dtype=torch.float32, device=device)
-    grid = torch.meshgrid(
-        grid_w, grid_h, indexing="xy"
-    )  # here h goes first,direction reversed for numpy
-    grid = torch.stack(grid, dim=0)  # 2 x h x w
-    # grid = grid.reshape([2, 1, grid_size, grid_size])
-    grid = torch.einsum("chw,n->cnhw", grid, res)  # 2 x n x h x w
-    _, n, h, w = grid.shape
-    pos_embed = get_2d_sincos_pos_embed_from_grid_torch(
-        embed_dim, grid
-    )  #  # (nxH*W, D/2)
-    pos_embed = pos_embed.reshape(n, h * w, embed_dim)
-    if cls_token:
-        pos_embed = torch.cat(
-            [
-                torch.zeros(
-                    [n, 1, embed_dim], dtype=torch.float32, device=pos_embed.device
-                ),
-                pos_embed,
-            ],
-            dim=1,
-        )
-    return pos_embed
-def get_2d_sincos_pos_embed_from_grid_torch(embed_dim, grid):
-    assert embed_dim % 2 == 0
-    # use half of dimensions to encode grid_h
-    emb_h = get_1d_sincos_pos_embed_from_grid_torch(
-        embed_dim // 2, grid[0]
-    )  # (H*W, D/2)
-    emb_w = get_1d_sincos_pos_embed_from_grid_torch(
-        embed_dim // 2, grid[1]
-    )  # (H*W, D/2)
-    emb = torch.cat([emb_h, emb_w], dim=1)  # (H*W, D)
-    return emb
-def get_1d_sincos_pos_embed_from_grid_torch(embed_dim, pos):
-    """embed_dim: output dimension for each position
-    pos: a list of positions to be encoded: size (M,)
-    out: (M, D)
-    """
-    assert embed_dim % 2 == 0
-    old_shape = pos
-    omega = torch.arange(embed_dim // 2, dtype=torch.float32, device=pos.device)
-    omega /= embed_dim / 2.0
-    omega = 1.0 / 10000**omega  # (D/2,)
-    pos = pos.reshape(-1)  # (M,)
-    out = torch.einsum("m,d->md", pos, omega)  # (M, D/2), outer product
-    emb_sin = torch.sin(out)  # (M, D/2)
-    emb_cos = torch.cos(out)  # (M, D/2)
-    emb = torch.cat([emb_sin, emb_cos], dim=1)  # (M, D)
-    return emb

{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/WHEEL RENAMED Viewed

File without changes

{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{rslearn-0.0.11.dist-info → rslearn-0.0.12.dist-info}/top_level.txt RENAMED Viewed

File without changes

rslearn 0.0.11__py3-none-any.whl → 0.0.12__py3-none-any.whl

rslearn 0.0.11py3-none-any.whl → 0.0.12py3-none-any.whl