PyPI - compressed-tensors - Versions diffs - 0.13.0__py3-none-any.whl → 0.13.1a20260108__py3-none-any.whl - Mend

compressed-tensors 0.13.0py3-none-any.whl → 0.13.1a20260108py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

compressed_tensors/compressors/base.py CHANGED Viewed

@@ -19,7 +19,7 @@ import torch
 from compressed_tensors.config import SparsityCompressionConfig
 from compressed_tensors.quantization import QuantizationArgs, QuantizationConfig
 from compressed_tensors.registry import RegistryMixin
-from compressed_tensors.utils import has_offloaded_params
+from compressed_tensors.utils import has_offloaded_params, register_offload_parameter
 from torch import Tensor
 from torch.nn import Module
@@ -185,10 +185,16 @@ class BaseCompressor(RegistryMixin, ABC):
         for name, parameter in module.named_parameters():
             compressed_data[name] = parameter
-        return self.decompress_weight(
+        decompressed_weight = self.decompress_weight(
             compressed_data=compressed_data, quantization_args=quantization_args
         ).to(device)
+        for name in ("weight_scale", "weight_zero_point"):
+            if hasattr(module, name):
+                register_offload_parameter(module, name, compressed_data[name])
+        return decompressed_weight
     def decompress_weight(
         self, compressed_data: Dict[str, Tensor], **kwargs
     ) -> torch.Tensor:

compressed_tensors/compressors/model_compressors/model_compressor.py CHANGED Viewed

@@ -36,6 +36,7 @@ from compressed_tensors.config import CompressionFormat, SparsityCompressionConf
 from compressed_tensors.config.format import (
     infer_and_set_per_module_quantization_format,
 )
+from compressed_tensors.linear.compressed_linear import CompressedLinear
 from compressed_tensors.quantization import (
     DEFAULT_QUANTIZATION_METHOD,
     QuantizationConfig,
@@ -474,6 +475,9 @@ class ModelCompressor:
             ),
             desc="Compressing model",
         ):
+            if isinstance(module, CompressedLinear):
+                continue  # already compressed
             module_device = get_execution_device(module)
             is_meta = module_device.type == "meta"

compressed_tensors/compressors/quantized_compressors/fp4_quantized.py CHANGED Viewed

@@ -127,6 +127,11 @@ class NVFP4PackedCompressor(BaseQuantizationCompressor):
         m, n = weight.shape
         # TODO: use a user provided dequant dtype
         unpacked = unpack_fp4_from_uint8(weight, m, n * 2)
+        # decompress scale
+        scale = scale.to(unpacked.dtype)
+        compressed_data["weight_scale"] = torch.nn.Parameter(scale, requires_grad=False)
         decompressed_weight = dequantize(
             x_q=unpacked, scale=scale, global_scale=global_scale, dtype=unpacked.dtype
         )

compressed_tensors/compressors/quantized_compressors/pack_quantized.py CHANGED Viewed

@@ -175,6 +175,10 @@ class PackedQuantizationCompressor(BaseQuantizationCompressor):
             zero_point = unpack_from_int32(
                 zero_point, num_bits, original_zp_shape, packed_dim=0
             )
+            # Update the compressed_data dict with unpacked zero_point
+            compressed_data["weight_zero_point"] = torch.nn.Parameter(
+                zero_point, requires_grad=False
+            )
         decompressed_weight = dequantize(
             x_q=unpacked, scale=scale, zero_point=zero_point, g_idx=g_idx

compressed_tensors/version.py CHANGED Viewed

@@ -17,5 +17,5 @@ __version__: str
 __version_tuple__: VERSION_TUPLE
 version_tuple: VERSION_TUPLE
-__version__ = version = '0.13.0'
-__version_tuple__ = version_tuple = (0, 13, 0)
+__version__ = version = '0.13.1.a20260108'
+__version_tuple__ = version_tuple = (0, 13, 1)

{compressed_tensors-0.13.0.dist-info → compressed_tensors-0.13.1a20260108.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: compressed-tensors
-Version: 0.13.0
+Version: 0.13.1a20260108
 Summary: Library for utilization of compressed safetensors of neural network models
 Home-page: https://github.com/vllm-project/compressed-tensors
 Author: Neuralmagic, Inc.

{compressed_tensors-0.13.0.dist-info → compressed_tensors-0.13.1a20260108.dist-info}/RECORD RENAMED Viewed

@@ -1,17 +1,17 @@
 compressed_tensors/__init__.py,sha256=SRqNYFVvxAaLa4SImhoiIBKfoOSj7EUdx0CxXjGC2PA,884
 compressed_tensors/base.py,sha256=dKAVgQAp9GPH6YspvF_cbGXCrbiqAeLEIPydYAO40WE,859
 compressed_tensors/logger.py,sha256=sTm1Od1cV0aDxBm3YN-PPvsOATxY_2tBV62TQE4HiPw,4032
-compressed_tensors/version.py,sha256=irlt-ETr2vtyV_bhp1DlVRDx0Kx9LTwnA5UW4gdE8ZA,513
+compressed_tensors/version.py,sha256=D9Tr1A6Ar4IfaCyjHY6AXHVcNJ-8knOr1SKszH6r8ZM,523
 compressed_tensors/compressors/__init__.py,sha256=smSygTSfcfuujRrAXDc6uZm4L_ccV1tWZewqVnOb4lM,825
-compressed_tensors/compressors/base.py,sha256=nvWsv4xEw1Tkxkxth6TmHplDYXfBeP22xWxOsZERyDY,7204
+compressed_tensors/compressors/base.py,sha256=Ou_BVtGlCq9hSs1WxkRXXSnNkaqLECWptT8xyqs1EBY,7461
 compressed_tensors/compressors/helpers.py,sha256=OK6qxX9j3bHwF9JfIYSGMgBJe2PWjlTA3byXKCJaTIQ,5431
 compressed_tensors/compressors/model_compressors/__init__.py,sha256=5RGGPFu4YqEt_aOdFSQYFYFDjcZFJN0CsMqRtDZz3Js,666
-compressed_tensors/compressors/model_compressors/model_compressor.py,sha256=zPe3T0hyHuvIzSXHBWHPiqJ3sQcdVY3tgwF1aBeG7oo,38044
+compressed_tensors/compressors/model_compressors/model_compressor.py,sha256=Xh_3e4GO_ByuCH-FzHmSknLLaKqJSZSCN-mFpQnBcB8,38218
 compressed_tensors/compressors/quantized_compressors/__init__.py,sha256=Yzje89SRQ6VdlNFhob2sG8afXbSzAHaJyTwRNAzP7g8,743
 compressed_tensors/compressors/quantized_compressors/base.py,sha256=eO-9HSzrI1yOsP462BzOlg71CTPLIi60qobOyEocHxY,10347
-compressed_tensors/compressors/quantized_compressors/fp4_quantized.py,sha256=eApXKF0CoUOSyo5HtQZTelnNjGZEwLXsqN0i1tPKESA,8332
+compressed_tensors/compressors/quantized_compressors/fp4_quantized.py,sha256=jaG3_xL55YjpT_uh9-xSKLVChykQt4WXezIyrNXvEHg,8491
 compressed_tensors/compressors/quantized_compressors/naive_quantized.py,sha256=0ANDcuD8aXPqTYNPY6GnX9iS6eXJw6P0TzNV_rYS2l8,5369
-compressed_tensors/compressors/quantized_compressors/pack_quantized.py,sha256=lvEA403q3mzpJLz-YFP94MHZzQCH0nNkgA0u8GzodXs,10978
+compressed_tensors/compressors/quantized_compressors/pack_quantized.py,sha256=SljqFdcqchwX_N2sJmxvb59KSYW6OZXyVRk0g0sewjc,11182
 compressed_tensors/compressors/sparse_compressors/__init__.py,sha256=Atuz-OdEgn8OCUhx7Ovd6gXdyImAI186uCR-uR0t_Nk,737
 compressed_tensors/compressors/sparse_compressors/base.py,sha256=YNZWcHjDleAlqbgRZQ6oJf44MQb_UDNvJGOqhl26uFA,8098
 compressed_tensors/compressors/sparse_compressors/dense.py,sha256=-OujJ1e0iXBvxYVULrIGvAZ9l-IC0mXczZRnimQdgo4,2314
@@ -69,8 +69,8 @@ compressed_tensors/utils/permutations_24.py,sha256=kx6fsfDHebx94zsSzhXGyCyuC9sVy
 compressed_tensors/utils/safetensors_load.py,sha256=Vql34aCTDHwmTZXJHzCyBISJo7iA7EQ78LdTlMjdpZo,12023
 compressed_tensors/utils/semi_structured_conversions.py,sha256=XKNffPum54kPASgqKzgKvyeqWPAkair2XEQXjkp7ho8,13489
 compressed_tensors/utils/type.py,sha256=bNwoo_FWlvLuDpYAGGzZJITRg0JA_Ngk9LGPo-kvjeU,2554
-compressed_tensors-0.13.0.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
-compressed_tensors-0.13.0.dist-info/METADATA,sha256=UYfXtfT2KmVRBDA_Wa_OWk9H6es1P2M3_gTrEeoxn_E,7018
-compressed_tensors-0.13.0.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
-compressed_tensors-0.13.0.dist-info/top_level.txt,sha256=w2i-GyPs2s1UwVxvutSvN_lM22SXC2hQFBmoMcPnV7Y,19
-compressed_tensors-0.13.0.dist-info/RECORD,,
+compressed_tensors-0.13.1a20260108.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
+compressed_tensors-0.13.1a20260108.dist-info/METADATA,sha256=xb0w2YRYhgiXU9NrSMgsVgQMN7Tapw3WZ2oFBtt-QnA,7027
+compressed_tensors-0.13.1a20260108.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+compressed_tensors-0.13.1a20260108.dist-info/top_level.txt,sha256=w2i-GyPs2s1UwVxvutSvN_lM22SXC2hQFBmoMcPnV7Y,19
+compressed_tensors-0.13.1a20260108.dist-info/RECORD,,

{compressed_tensors-0.13.0.dist-info → compressed_tensors-0.13.1a20260108.dist-info}/WHEEL RENAMED Viewed

File without changes

{compressed_tensors-0.13.0.dist-info → compressed_tensors-0.13.1a20260108.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{compressed_tensors-0.13.0.dist-info → compressed_tensors-0.13.1a20260108.dist-info}/top_level.txt RENAMED Viewed

File without changes

compressed-tensors 0.13.0__py3-none-any.whl → 0.13.1a20260108__py3-none-any.whl

compressed-tensors 0.13.0py3-none-any.whl → 0.13.1a20260108py3-none-any.whl