PyPI - adv-optm - Versions diffs - 2.2.dev5__tar.gz → 2.2.1.dev2__tar.gz - Mend

adv-optm 2.2.dev5tar.gz → 2.2.1.dev2tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: adv_optm
-Version: 2.2.dev5
+Version: 2.2.1.dev2
 Summary: A family of highly efficient, lightweight yet powerful optimizers.
 Home-page: https://github.com/Koratahiu/Advanced_Optimizers
 Author: Koratahiu

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/__init__.py RENAMED Viewed

@@ -22,4 +22,4 @@ __all__ = [
     "SignSGD_adv",
 ]
-__version__ = "2.2.dev5"
+__version__ = "2.2.1.dev2"

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/AdaMuon_adv.py RENAMED Viewed

@@ -499,7 +499,8 @@ class AdaMuon_adv(torch.optim.Optimizer):
                 cns_a_bound=group['cns_a_bound'],
                 low_rank_ortho=group['low_rank_ortho'],
                 ortho_rank=group['ortho_rank'],
-                spectral_normalization=group.get('spectral_normalization', False)
+                spectral_normalization=group.get('spectral_normalization', False),
+                compiled=group.get('compiled_optimizer', False)
             )
             if group['normuon_variant']:
@@ -563,7 +564,8 @@ class AdaMuon_adv(torch.optim.Optimizer):
                 cns_a_bound=group['cns_a_bound'],
                 low_rank_ortho=group['low_rank_ortho'],
                 ortho_rank=group['ortho_rank'],
-                spectral_normalization=group.get('spectral_normalization', False)
+                spectral_normalization=group.get('spectral_normalization', False),
+                compiled=group.get('compiled_optimizer', False)
             )
             # NorMuon Logic

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Muon_adv.py RENAMED Viewed

@@ -461,7 +461,8 @@ class Muon_adv(torch.optim.Optimizer):
                 cns_a_bound=group['cns_a_bound'],
                 low_rank_ortho=group['low_rank_ortho'],
                 ortho_rank=group['ortho_rank'],
-                spectral_normalization=group.get('spectral_normalization', False)
+                spectral_normalization=group.get('spectral_normalization', False),
+                compiled=group.get('compiled_optimizer', False)
             )
             if group['normuon_variant']:
@@ -511,7 +512,8 @@ class Muon_adv(torch.optim.Optimizer):
                     cns_a_bound=group['cns_a_bound'],
                     low_rank_ortho=group['low_rank_ortho'],
                     ortho_rank=group['ortho_rank'],
-                    spectral_normalization=group.get('spectral_normalization', False)
+                    spectral_normalization=group.get('spectral_normalization', False),
+                    compiled=group.get('compiled_optimizer', False)
                 )
                 # NorMuon Logic

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/Muon_util.py RENAMED Viewed

@@ -120,6 +120,78 @@ def _newton_schulz_iteration(
     return X.to(G.dtype)
+@torch.no_grad()
+def _compiled_newton_schulz_iteration(
+    G: torch.Tensor,
+    steps: int = 5,
+    eps: float = 1e-7,
+    coeffs: tuple[float, float, float] = (3.4445, -4.7750, 2.0315),
+    cns: bool = False,
+    cns_a_bound: float = 1e-4,
+    spectral_normalization: bool = False,
+) -> torch.Tensor:
+    """
+    Newton-Schulz iteration refactored for torch.compile compatibility.
+    Removes mutable buffers and in-place operations in favor of functional graph construction.
+    """
+    assert G.ndim in (2, 3), f"Input must be 2D or 3D, got {G.ndim}D"
+    a, b, c = coeffs
+    X = G.to(torch.bfloat16)
+    # Transpose if needed
+    transposed = X.size(-2) > X.size(-1)
+    if transposed:
+        X = X.mT
+    # Normalize spectral norm to at most 1
+    if spectral_normalization:
+        X.div_(X.norm(dim=(-2, -1), keepdim=True).add_(eps))
+    else:
+        X.div_(X.norm(dim=(-2, -1), keepdim=True).clamp_min_(eps))
+    if cns:
+        # Chebyshev-accelerated Newton-Schulz (CANS)
+        lower_bound = cns_a_bound
+        upper_bound = 1.0
+        for _ in range(steps):
+            lb, ub = lower_bound, upper_bound
+            lb_ub = lb * ub
+            # Calculate Mean Square Error term
+            e_sq = (lb**2 + lb_ub + ub**2) / 3.0
+            # Calculate components for alpha and bounds update
+            K = 2.0 * e_sq**1.5
+            L = lb_ub * (lb + ub)
+            denom = K + L
+            alpha = 6.0 / denom
+            c1 = alpha * e_sq
+            c3 = -alpha / 3.0
+            # Apply the 3rd-order Newton-Schulz update
+            A = X @ X.mT
+            X = c1 * X + c3 * (A @ X)
+            # Update the singular value bounds for the next iteration based on the error
+            eps_val = (K - L) / denom
+            lower_bound, upper_bound = 1.0 - eps_val, 1.0 + eps_val
+    else:
+        # Standard Quintic Newton-Schulz
+        # Update: X = a*X + b*(A@X) + c*(A@A@X)
+        for _ in range(steps):
+            A = X @ X.mT
+            B = b * A + c * (A @ A)
+            X = a * X + B @ X
+    # Transpose back if necessary
+    if transposed:
+        X = X.mT
+    return X.to(G.dtype)
 @torch.no_grad()
 def newton_schulz(
@@ -132,6 +204,7 @@ def newton_schulz(
     low_rank_ortho: bool = False,
     ortho_rank: int = 128,
     spectral_normalization: bool = False,
+    compiled: bool = False,
 ) -> torch.Tensor:
     """
     Public entry point for Muon orthogonalization.
@@ -149,6 +222,11 @@ def newton_schulz(
         low_rank_ortho (bool): Whether to project to low rank before orthogonalizing.
         ortho_rank (int): Rank for low-rank projection.
     """
+    if compiled:
+        ns_fn = _compiled_newton_schulz_iteration
+    else:
+        ns_fn = _newton_schulz_iteration
     if low_rank_ortho:
         # Low-Rank Orthogonalization via Gaussian Sketching
         M = G
@@ -172,7 +250,7 @@ def newton_schulz(
             projected_M = Q.T @ M
             # 4. Orthogonalize the smaller projected matrix
-            ortho_projected_M = _newton_schulz_iteration(
+            ortho_projected_M = ns_fn(
                 projected_M,
                 steps=steps,
                 eps=eps,
@@ -186,7 +264,7 @@ def newton_schulz(
             return Q @ ortho_projected_M
     # Standard Path
-    return _newton_schulz_iteration(
+    return ns_fn(
         G,
         steps=steps,
         eps=eps,

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/param_update.py RENAMED Viewed

@@ -60,6 +60,7 @@ def apply_parameter_update(
         if random_int_tensor is not None:
             # Compiled path: use the pre-computed random tensor
             _copy_stochastic_core_(p, p_fp32, random_int_tensor)
+            del random_int_tensor
         else:
             # Uncompiled path: generate randoms inside
             copy_stochastic_(p, p_fp32)
@@ -132,7 +133,7 @@ def _copy_stochastic_core_(target: Tensor, source: Tensor, random_int_tensor: Te
     Core logic for stochastic rounding using a pre-computed random integer tensor.
     This version is designed to be torch.compile-friendly.
     """
-    result = random_int_tensor.clone()
+    result = random_int_tensor
     # add the random number to the lower 16 bit of the mantissa
     result.add_(source.view(dtype=torch.int32))
@@ -142,8 +143,6 @@ def _copy_stochastic_core_(target: Tensor, source: Tensor, random_int_tensor: Te
     # copy the higher 16 bit into the target tensor
     target.copy_(result.view(dtype=torch.float32))
-    del result
 def copy_stochastic_(target: Tensor, source: Tensor):
     """

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: adv_optm
-Version: 2.2.dev5
+Version: 2.2.1.dev2
 Summary: A family of highly efficient, lightweight yet powerful optimizers.
 Home-page: https://github.com/Koratahiu/Advanced_Optimizers
 Author: Koratahiu

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/setup.py RENAMED Viewed

@@ -5,7 +5,7 @@ with open("README.md", "r", encoding="utf-8") as fh:
 setup(
     name="adv_optm",
-    version="2.2.dev5",
+    version="2.2.1.dev2",
     author="Koratahiu",
     author_email="hiuhonor@gmail.com",
     license='Apache 2.0',

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/LICENSE RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/README.md RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/AdamW_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Adopt_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Lion_Prodigy_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Lion_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Prodigy_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/SignSGD_adv.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/Simplified_AdEMAMix.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/optim/__init__.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/Kourkoutas.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/Muon_AuxAdam.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/OrthoGrad.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/__init__.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/factorization_util.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/lion_k.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm/util/update_util.py RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm.egg-info/requires.txt RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/adv_optm.egg-info/top_level.txt RENAMED Viewed

File without changes

{adv_optm-2.2.dev5 → adv_optm-2.2.1.dev2}/setup.cfg RENAMED Viewed

File without changes

adv-optm 2.2.dev5__tar.gz → 2.2.1.dev2__tar.gz

adv-optm 2.2.dev5tar.gz → 2.2.1.dev2tar.gz