PyPI - adv-optm - Versions diffs - 2.4.dev1__tar.gz → 2.4.dev2__tar.gz - Mend

adv-optm 2.4.dev1tar.gz → 2.4.dev2tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: adv_optm
-Version: 2.4.dev1
+Version: 2.4.dev2
 Summary: A family of highly efficient, lightweight yet powerful optimizers.
 Home-page: https://github.com/Koratahiu/Advanced_Optimizers
 Author: Koratahiu

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/__init__.py RENAMED Viewed

@@ -22,4 +22,4 @@ __all__ = [
     "SignSGD_adv",
 ]
-__version__ = "2.4.dev1"
+__version__ = "2.4.dev2"

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/scaled_optm.py RENAMED Viewed

@@ -51,7 +51,7 @@ def scale_wds(wd: float, cwd: float, p: torch.Tensor) -> tuple[float, float]:
     if getattr(p, '_is_dora_scale', False):
         return wd, cwd
-    conflict = (wd != 0 and cwd != 0)
+    conflict = cwd != 0
     if getattr(p, '_is_oft', False):
         # Fallback to standard WD (using cwd value) if both are active.
@@ -85,7 +85,8 @@ def rms_normalization(update: torch.Tensor, dim: int | None, lr: float) -> torch
     """Performs Root Mean Square normalization on the update tensor."""
     n = update.numel() if dim is None else update.shape[dim]
     norm = torch.linalg.vector_norm(update, ord=2, dim=dim, keepdim=True).clamp_min_(1e-12)
-    return update.mul_(lr * (n**0.5) / norm)
+    scale_n = n**0.5
+    return update.mul_(lr * scale_n / norm)
 def is_spectral(p: torch.Tensor) -> bool:
@@ -111,6 +112,7 @@ def spectral_normalization(update: torch.Tensor, vector_state: torch.Tensor, lr:
     """
     d_out = update.shape[0]
     d_in = update.numel() // d_out
+    update = update.to(vector_state.dtype)
     update_flat = update.view(d_out, d_in)
     # Target scale derived from the "Modular Norm" paper
     target_scale = (d_out / d_in) ** 0.5

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: adv_optm
-Version: 2.4.dev1
+Version: 2.4.dev2
 Summary: A family of highly efficient, lightweight yet powerful optimizers.
 Home-page: https://github.com/Koratahiu/Advanced_Optimizers
 Author: Koratahiu

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/setup.py RENAMED Viewed

@@ -5,7 +5,7 @@ with open("README.md", "r", encoding="utf-8") as fh:
 setup(
     name="adv_optm",
-    version="2.4.dev1",
+    version="2.4.dev2",
     author="Koratahiu",
     author_email="hiuhonor@gmail.com",
     license='Apache 2.0',

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/LICENSE RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/README.md RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/AdaMuon_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/AdamW_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Adopt_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Lion_Prodigy_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Lion_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Muon_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Prodigy_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/SignSGD_adv.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/Simplified_AdEMAMix.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/optim/__init__.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/Kourkoutas.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/Muon_AuxAdam.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/Muon_util.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/OrthoGrad.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/__init__.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/centered_decay.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/factorization_util.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/lion_k.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/param_update.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm/util/update_util.py RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm.egg-info/requires.txt RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/adv_optm.egg-info/top_level.txt RENAMED Viewed

File without changes

{adv_optm-2.4.dev1 → adv_optm-2.4.dev2}/setup.cfg RENAMED Viewed

File without changes

adv-optm 2.4.dev1__tar.gz → 2.4.dev2__tar.gz

adv-optm 2.4.dev1tar.gz → 2.4.dev2tar.gz