PyPI - mps-flash-attn - Versions diffs - 0.2.5__tar.gz → 0.2.7__tar.gz - Mend - Supply Chain Defender

mps-flash-attn 0.2.5tar.gz → 0.2.7tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (40) hide show

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: mps-flash-attn
-Version: 0.2.5
+Version: 0.2.7
 Summary: Flash Attention for PyTorch on Apple Silicon (M1/M2/M3/M4)
 Author: imperatormk
 License-Expression: MIT

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/__init__.py RENAMED Viewed

@@ -4,7 +4,7 @@ MPS Flash Attention - Flash Attention for PyTorch on Apple Silicon
 This package provides memory-efficient attention using Metal Flash Attention kernels.
 """
-__version__ = "0.2.5"
+__version__ = "0.2.7"
 import torch
 from typing import Optional
@@ -217,17 +217,17 @@ def replace_sdpa():
     def patched_sdpa(query, key, value, attn_mask=None, dropout_p=0.0,
                      is_causal=False, scale=None, enable_gqa=False, **kwargs):
         # Use MFA for MPS tensors without dropout
-        # Only use MFA for seq_len >= 1024 where it outperforms PyTorch's math backend
+        # Only use MFA for seq_len >= 512 where it outperforms PyTorch's math backend
         # For shorter sequences, PyTorch's simpler matmul+softmax approach is faster
         # Benchmark results (B=1-4, H=8, D=64-128, fp16/bf16):
-        #   seq=512:  0.3-0.5x (MFA slower)
-        #   seq=1024: 1.1-2.0x (MFA faster)
-        #   seq=2048: 1.7-3.7x (MFA much faster)
-        #   seq=4096: 2.0-3.9x (MFA much faster)
+        #   seq=512:  1.2-1.6x (MFA faster)
+        #   seq=1024: 2.3-3.7x (MFA much faster)
+        #   seq=2048: 2.2-3.9x (MFA much faster)
+        #   seq=4096: 2.1-3.7x (MFA much faster)
         if (query.device.type == 'mps' and
             dropout_p == 0.0 and
             _HAS_MFA and
-            query.shape[2] >= 1024):
+            query.shape[2] >= 512):
             try:
                 # Convert float mask to bool mask if needed
                 # PyTorch SDPA uses additive masks (0 = attend, -inf = mask)

mps_flash_attn-0.2.7/mps_flash_attn/lib/libMFABridge.dylib ADDED Viewed

Binary file

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: mps-flash-attn
-Version: 0.2.5
+Version: 0.2.7
 Summary: Flash Attention for PyTorch on Apple Silicon (M1/M2/M3/M4)
 Author: imperatormk
 License-Expression: MIT

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 [project]
 name = "mps-flash-attn"
-version = "0.2.5"
+version = "0.2.7"
 description = "Flash Attention for PyTorch on Apple Silicon (M1/M2/M3/M4)"
 readme = "README.md"
 license = "MIT"

mps_flash_attn-0.2.5/mps_flash_attn/lib/libMFABridge.dylib DELETED Viewed

Binary file

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/LICENSE RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/README.md RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/benchmark.py RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/csrc/mps_flash_attn.mm RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/06c421e7a01418cf64aafa07f6b1df0558148583959c596d9a7ce260987f89f0.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/09b9615289be632fdf05444004a0b3b67fb1b70b05a7e0fce8e0ba3a95e3921c.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/0c36461301fb52cbad786d0642b020ad2bfc7229b487ccb5dff44d198423b347.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/2ca9312d1151f792e1a95617db9186928300e3d0ffbe016f0ad53b62ab840bac.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2_1024_1024.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2_2048_2048.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2_4096_4096.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2_512_512.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/73254c55475c6b7f7b009f095398994b1f9ae8215beafcf810f100357ccc99b2_8192_8192.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/771935bf47d248650e287da82bc82e04bff7c4c52964823e7a12462ccd23408e.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/975aece2b4d3d78035be08a0735a7deacf2e544adee5af81c9c0a3a42a926129.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/a5e2c5c401e3872af0899c1fb3e30b5f52a6070fc49c9dac02982cc1c2f25849.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/ac4573fb201e92310867c59bd569a8ae68f859d60a9352d9d4d5d41c1547c83c.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/adc0f77ff05156bbda8fe78afd9ba8a8d3c890ba8fea0902ae79a6ae8c4f04c3.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f_1024_1024.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f_2048_2048.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f_4096_4096.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f_512_512.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/eab4f40de4b0ebd2765b41c25dba7ccab5db4abf6a6eb87d76fff7b5e0829b2f_8192_8192.bin RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/f08fe0efd72e055177e068154dae01e08c4d52d3cb883330a04f1431d274aece.metallib RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn/kernels/manifest.json RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn.egg-info/requires.txt RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/mps_flash_attn.egg-info/top_level.txt RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/setup.cfg RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/setup.py RENAMED Viewed

File without changes

{mps_flash_attn-0.2.5 → mps_flash_attn-0.2.7}/tests/test_mfa_v2.py RENAMED Viewed

File without changes