PyPI - optimum-rbln - Versions diffs - 0.7.4a9__py3-none-any.whl → 0.7.5a1__py3-none-any.whl - Mend

optimum-rbln 0.7.4a9py3-none-any.whl → 0.7.5a1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

optimum/rbln/transformers/models/whisper/whisper_architecture.py CHANGED Viewed

@@ -313,6 +313,7 @@ class WhisperSelfAttention(WhisperAttention):
             args["mask"] = attention_mask.unsqueeze(2)
             attn_output = torch.ops.rbln_custom_ops.paged_attn_decode(**args)
         else:
+            args["mask"] = None
             attn_output = torch.ops.rbln_custom_ops.paged_causal_attn_decode(**args)
         attn_output = attn_output.view(bsz, self.num_heads, tgt_len, self.head_dim)

optimum/rbln/transformers/utils/rbln_quantization.py CHANGED Viewed

@@ -12,94 +12,82 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
-import functools
 import glob
 import os
-from typing import Any, Callable, Dict, Optional
+from typing import Any, Dict, Optional, Union
 import torch
 from safetensors.torch import load_file
 from torch.nn import Linear, Parameter
 from torch.nn import functional as F
+from ...configuration_utils import RBLNSerializableConfigProtocol
 from ...utils.logging import get_logger
 logger = get_logger()
-SUPPORTED_QUANTIZATIONS: Dict[str, list[str]] = {
-    "rbln": ["w4a16"],
-}
+class RBLNQuantizationConfig(RBLNSerializableConfigProtocol):
+    SUPPORTED_FORMATS = ["rbln"]
+    SUPPORTED_WEIGHTS = ["int4", "fp16"]
+    SUPPORTED_ACTIVATIONS = ["fp16"]
-class QuantizationManager:
     # The RBLN_QUANT_BITS environment variable defines the precision of each layer during the graph compilation process.
     # It specifies the quantization bit depth. For instance, setting RBLN_QUANT_BITS=4 will apply 4-bit precision for quantization.
     RBLN_QUANT_BITS_ENV = "RBLN_QUANT_BITS"
-    @staticmethod
-    def _raise_invalid_config_error(
-        key: str, value: str, valid_values: list[str], context: Optional[str] = None
-    ) -> None:
-        context_info = f" for {context}" if context else ""
-        valid_values_str = ", ".join(valid_values)
-        raise ValueError(f"Invalid {key}: {value}{context_info}. Supported values are: {valid_values_str}")
-    @staticmethod
-    def validate_quantization_config(quantize_config: Optional[dict]) -> Optional[dict]:
-        if not quantize_config:
-            return None
-        q_format = quantize_config.get("format")
-        q_precision = quantize_config.get("precision")
-        if q_format not in SUPPORTED_QUANTIZATIONS:
-            QuantizationManager._raise_invalid_config_error(
-                "quantization format", q_format, list(SUPPORTED_QUANTIZATIONS.keys())
+    def __init__(
+        self,
+        format: Optional[str] = None,
+        precision: Optional[str] = None,
+        weights: Optional[str] = None,
+        activations: Optional[str] = None,
+    ):
+        self.format = format
+        if precision is not None:
+            logger.warning("The `precision` argument is deprecated. Use `weights` and `activations` instead.")
+            if any(precision_arg is not None for precision_arg in (weights, activations)):
+                raise ValueError("`precision` and `weights` or `activations` cannot be set at the same time.")
+            if precision == "w4a16":
+                weights = "int4"
+                activations = "fp16"
+            else:
+                raise ValueError(f"Invalid precision: {precision}")
+        self.weights = weights or "fp16"
+        self.activations = activations or "fp16"
+        self._validate()
+    def _validate(self):
+        if self.format not in self.SUPPORTED_FORMATS:
+            raise ValueError(f"Invalid format: {self.format}, supported formats are: {self.SUPPORTED_FORMATS}")
+        if self.weights not in self.SUPPORTED_WEIGHTS:
+            raise ValueError(f"Invalid weights: {self.weights}, supported weights are: {self.SUPPORTED_WEIGHTS}")
+        if self.activations not in self.SUPPORTED_ACTIVATIONS:
+            raise ValueError(
+                f"Invalid activations: {self.activations}, supported activations are: {self.SUPPORTED_ACTIVATIONS}"
             )
+        if self.weights == "fp16" and self.activations == "fp16":
+            raise ValueError("weights and activations cannot be both fp16. It is meaningless.")
-        if q_precision not in SUPPORTED_QUANTIZATIONS[q_format]:
-            QuantizationManager._raise_invalid_config_error(
-                "precision", q_precision, SUPPORTED_QUANTIZATIONS[q_format], q_format
-            )
+    def _prepare_for_serialization(self) -> Dict[str, Any]:
+        return {
+            "format": self.format,
+            "weights": self.weights,
+            "activations": self.activations,
+        }
-        return quantize_config
-    @classmethod
-    def _set_env_var(cls, name: str, value: str) -> None:
-        os.environ[name] = value
-    @classmethod
-    def _unset_env_var(cls, name: str) -> None:
-        os.environ.pop(name, None)
-    @classmethod
-    def set_quantization_env(cls, quantize_config: Optional[dict]) -> Optional[str]:
-        quantize_config = cls.validate_quantization_config(quantize_config)
-        if quantize_config:
-            q_precision: str = quantize_config["precision"]
-            quant_bits = q_precision.split("w")[1].split("a")[0]
-            cls._set_env_var(cls.RBLN_QUANT_BITS_ENV, quant_bits)
-            return cls.RBLN_QUANT_BITS_ENV
-        return None
-    @classmethod
-    def reset_quantization_env(cls, env_var_name: Optional[str]) -> None:
-        if env_var_name:
-            cls._unset_env_var(env_var_name)
-    @classmethod
-    def with_quantization_env(cls, func: Callable) -> Callable:
-        @functools.wraps(func)
-        def wrapper(*args, **kwargs):
-            quantize_config = kwargs.get("quantize_config")
-            quantize_env_var = cls.set_quantization_env(quantize_config)
-            try:
-                return func(*args, **kwargs)
-            finally:
-                cls.reset_quantization_env(quantize_env_var)
-        return wrapper
+    def maybe_set_quantization_env(self):
+        quant_bits = None
+        if self.weights == "int4":
+            quant_bits = "4"
+            os.environ[self.RBLN_QUANT_BITS_ENV] = quant_bits
+    def maybe_reset_quantization_env(self):
+        if self.RBLN_QUANT_BITS_ENV in os.environ:
+            os.environ.pop(self.RBLN_QUANT_BITS_ENV)
 # Constants
@@ -114,12 +102,31 @@ QUANTIZED_WEIGHTS = {
 }
-def prepare_model_for_quantization(model: torch.nn.Module, model_id: str, n_layer: Optional[int] = None) -> None:
+def prepare_model_for_quantization(
+    model: torch.nn.Module,
+    model_id: str,
+    n_layer: Optional[int] = None,
+    use_auth_token: Optional[Union[bool, str]] = None,
+    revision: Optional[str] = None,
+    cache_dir: Optional[str] = None,
+    force_download: bool = False,
+    local_files_only: bool = False,
+) -> torch.nn.Module:
     """
     Prepare the model for quantization by updating specified linear layers to quantized (qlinear) layers.
     """
     update_layers_to_quantize(model)
-    load_weights(model, model_id, n_layer)
+    load_weights(
+        model,
+        model_id,
+        n_layer,
+        use_auth_token=use_auth_token,
+        revision=revision,
+        cache_dir=cache_dir,
+        force_download=force_download,
+        local_files_only=local_files_only,
+    )
+    return model
 def update_layers_to_quantize(module: torch.nn.Module) -> None:
@@ -140,18 +147,57 @@ def update_layers_to_quantize(module: torch.nn.Module) -> None:
         logger.debug(f"Updated the following linear layers to quantized layers:\n {{{', '.join(processed_layers)}}}")
-def load_weights(model, model_id, n_layer=None):
+def load_weights(
+    model,
+    model_id,
+    n_layer=None,
+    use_auth_token=None,
+    revision=None,
+    cache_dir=None,
+    force_download=False,
+    local_files_only=False,
+):
     """
     Load safetensor file data directly into the model, filtering by layer if n_layer is provided.
     """
-    logger.debug("Loading the quantized weights into the CPU.")  # TODO(jongho): remove.
     model_params = dict(model.named_parameters(recurse=True))
     model_buffers = dict(model.named_buffers(recurse=True))
-    safetensor_files = glob.glob(f"{model_id}/*.safetensors")
+    if os.path.isdir(model_id):
+        safetensor_files = glob.glob(f"{model_id}/*.safetensors")
+    else:
+        from huggingface_hub import hf_hub_download, list_repo_files
+        try:
+            # List all files in the repository
+            repo_files = list_repo_files(model_id, revision=revision, token=use_auth_token)
+            # Filter for safetensors files
+            safetensor_files = []
+            for file in repo_files:
+                if file.endswith(".safetensors"):
+                    # Download the safetensors file
+                    downloaded_file = hf_hub_download(
+                        repo_id=model_id,
+                        filename=file,
+                        revision=revision,
+                        token=use_auth_token,
+                        cache_dir=cache_dir,
+                        force_download=force_download,
+                        local_files_only=local_files_only,
+                    )
+                    safetensor_files.append(downloaded_file)
+        except Exception as e:
+            logger.error(f"Failed to download safetensors files from Hugging Face Hub: {e}")
+            raise e
+    if not safetensor_files:
+        raise FileNotFoundError(f"No safetensors files found for model_id: {model_id}")
     target_layers = list(range(n_layer)) if n_layer is not None else None
+    unloaded_keys = []
     for safetensor_file in safetensor_files:
         file_data = load_file(safetensor_file)
         for key, value in file_data.items():
@@ -165,8 +211,11 @@ def load_weights(model, model_id, n_layer=None):
                 model_params[key].data.copy_(value)
             elif key in model_buffers:
                 model_buffers[key].data.copy_(value)
+            else:
+                unloaded_keys.append(key)
-    logger.debug("Loaded the quantized weights into the CPU.")
+    if len(unloaded_keys) > 0:
+        logger.warning(f"There are unexpected parameters/buffers on the checkpoint: {unloaded_keys}")
 def is_target_for_qlinear_replacement(layer_name: str, layer: torch.nn.Module) -> bool:

optimum/rbln/utils/import_utils.py CHANGED Viewed

@@ -144,10 +144,27 @@ def check_version_compats() -> None:
         except importlib.metadata.PackageNotFoundError:
             warnings.warn(f"optimum-rbln requires {compat.package_name} to be installed.", ImportWarning)
             continue
+        # For versions 0.7.2 and above, don't show warning for rebel-compiler if base versions match
-        if not Version(compat.min_version) <= Version(dep_version) < Version(compat.max_version):
-            warnings.warn(
-                f"optimum-rbln v{my_version} is compatible to {compat.package_name} v{compat.min_version} to v{compat.max_version}. (you are currently using v{dep_version})\n"
-                "Please refer to our SDK release notes at https://docs.rbln.ai/about_atom/release_note.html",
-                ImportWarning,
-            )
+        if compat.package_name == "rebel-compiler":
+            # For optimum-rbln versions 0.7.2 and above, suppress the warning if the base versions of
+            # optimum-rbln and rebel-compiler match (e.g., 0.7.x with 0.7.y).
+            if (
+                Version(my_version) >= Version("0.7.2")
+                and Version(my_version).base_version == Version(dep_version).base_version
+            ):
+                continue
+            else:
+                warnings.warn(
+                    f"Version mismatch detected: optimum-rbln v{my_version} and {compat.package_name} v{dep_version} have different base versions. "
+                    f"For optimal performance and compatibility, please ensure both packages share the same major and minor version numbers. "
+                    "Please refer to our SDK release notes at https://docs.rbln.ai/about_atom/release_note.html",
+                    ImportWarning,
+                )
+        else:
+            if not Version(compat.min_version) <= Version(dep_version) < Version(compat.max_version):
+                warnings.warn(
+                    f"optimum-rbln v{my_version} is compatible to {compat.package_name} v{compat.min_version} to v{compat.max_version}. (you are currently using v{dep_version})\n"
+                    "Please refer to our SDK release notes at https://docs.rbln.ai/about_atom/release_note.html",
+                    ImportWarning,
+                )

optimum/rbln/utils/submodule.py CHANGED Viewed

@@ -13,8 +13,11 @@
 # limitations under the License.
 import importlib
+from pathlib import Path
 from typing import TYPE_CHECKING, Any, Dict, List, Type
+from transformers import PretrainedConfig
 from ..configuration_utils import RBLNModelConfig
@@ -38,6 +41,10 @@ class SubModulesMixin:
         for submodule_meta, submodule in zip(self._rbln_submodules, rbln_submodules):
             setattr(self, submodule_meta["name"], submodule)
+    @classmethod
+    def _update_submodule_config(cls, model: "PreTrainedModel", rbln_config: RBLNModelConfig):
+        return rbln_config
     @classmethod
     def _export_submodules_from_model(
         cls, model: "PreTrainedModel", model_save_dir: str, rbln_config: RBLNModelConfig, **kwargs
@@ -62,6 +69,8 @@ class SubModulesMixin:
                 submodule_rbln_config = submodule_rbln_config_class(**submodule_rbln_config)
                 setattr(rbln_config, submodule_name, submodule_rbln_config)
+            submodule_rbln_config = submodule_cls._update_submodule_config(model, submodule_rbln_config)
             rbln_submodule = submodule_cls.from_model(
                 model=torch_submodule,
                 config=torch_submodule.config,
@@ -90,9 +99,12 @@ class SubModulesMixin:
                 importlib.import_module("optimum.rbln"), submodule_rbln_config.rbln_model_cls_name
             )
+            json_file_path = Path(model_save_dir) / submodule_name / "config.json"
+            config = PretrainedConfig.from_json_file(json_file_path)
             rbln_submodule = submodule_cls._from_pretrained(
                 model_id=model_save_dir,
-                config=None,
+                config=config,
                 subfolder=submodule_name,
                 rbln_config=submodule_rbln_config,
                 **kwargs,

{optimum_rbln-0.7.4a9.dist-info → optimum_rbln-0.7.5a1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: optimum-rbln
-Version: 0.7.4a9
+Version: 0.7.5a1
 Summary: Optimum RBLN is the interface between the HuggingFace Transformers and Diffusers libraries and RBLN accelerators. It provides a set of tools enabling easy model loading and inference on single and multiple rbln device settings for different downstream tasks.
 Project-URL: Homepage, https://rebellions.ai
 Project-URL: Documentation, https://docs.rbln.ai

{optimum_rbln-0.7.4a9.dist-info → optimum_rbln-0.7.5a1.dist-info}/RECORD RENAMED Viewed

@@ -1,7 +1,7 @@
-optimum/rbln/__init__.py,sha256=c2whRR6XkelNLlH1MwAKYMoaBEhmGxSQFrhfKS1JC-I,13186
-optimum/rbln/__version__.py,sha256=GuANUTgAHXrhQ4V27YBqp-zK5jY_U9soaBj4Ef2cU3A,519
-optimum/rbln/configuration_utils.py,sha256=rOXG9_ptYwzLlDIebd-CoiT3i6xaZl5IVPplLIrUyoE,31106
-optimum/rbln/modeling.py,sha256=qDXB69Oq0jx9hfONebDiSNe2_DgKYhnAGLTbGAtwYVw,9677
+optimum/rbln/__init__.py,sha256=MXUvNNwbZhrPpxjpDSIV5fCQIT_rcNaLPstQgUYj4gE,13970
+optimum/rbln/__version__.py,sha256=mPJDzmeS5WyCHJnuvAR_w6Lpxp2T9tocDUBPoe9Zwoo,519
+optimum/rbln/configuration_utils.py,sha256=gvAjRFEGw5rnSoH0IoyuLrE4fkxtk3DN1pikqrN_Rpk,31277
+optimum/rbln/modeling.py,sha256=4Xwi3ovWDHOOqxUDH_ZgsgTuea8Kyg25D9s81zVYpr0,9669
 optimum/rbln/modeling_base.py,sha256=iQKw2IORu1cN6sOK0xeBVrhatt-ZPeinT_v6l2FnGRw,24173
 optimum/rbln/diffusers/__init__.py,sha256=XL6oKPHbPCV6IVCw3fu0-M9mD2KO_x6unx5kJdAtpVY,6180
 optimum/rbln/diffusers/modeling_diffusers.py,sha256=bPyP5RMbOFLb2DfEAuLVp7hTuQWJvWid7El72wGmFrY,19535
@@ -20,16 +20,16 @@ optimum/rbln/diffusers/configurations/pipelines/configuration_stable_diffusion.p
 optimum/rbln/diffusers/configurations/pipelines/configuration_stable_diffusion_3.py,sha256=54NTvVur7RADGgjGwO33s76dgKQ4zVNvmFl68rQFapw,6370
 optimum/rbln/diffusers/configurations/pipelines/configuration_stable_diffusion_xl.py,sha256=H0hqsqpAfqb9gBIK5KsfUf9gX9cTnggK9Nt2aqfzeIM,5528
 optimum/rbln/diffusers/models/__init__.py,sha256=mkCvJyH1KcwrsUvYSq_bVC79oOfyqtBSFDyPS1_48wA,1478
-optimum/rbln/diffusers/models/controlnet.py,sha256=m2hHKrom1ladsDO4bTSZ7o_bIRrLRpzv7XBI2BlesxY,10224
+optimum/rbln/diffusers/models/controlnet.py,sha256=kzDbUckGlioor8t0kKBvwi-hzNaG15XluEzTa7xZs1Q,10292
 optimum/rbln/diffusers/models/autoencoders/__init__.py,sha256=dg17ZTUsiqTcbIaEE4fqew9uRbao0diQ21PXvRKIqKg,679
 optimum/rbln/diffusers/models/autoencoders/autoencoder_kl.py,sha256=qjReFNmuQEjnHjoI8f7ClAp_rRTA1vIk-3dwxJi6s7U,7905
 optimum/rbln/diffusers/models/autoencoders/vae.py,sha256=_fyFco2697uT1zo_P_fGML-_zqZw2sUQp3tRRjA5pg4,4172
 optimum/rbln/diffusers/models/autoencoders/vq_model.py,sha256=DC8Nee8_BabGhagJgpCUDhA-oaTpZMg-lCVzXJ6dNEw,6134
 optimum/rbln/diffusers/models/transformers/__init__.py,sha256=V8rSR7WzHs-i8Cwb_MNxhY2NFbwPgxu24vGtkwl-6tk,706
 optimum/rbln/diffusers/models/transformers/prior_transformer.py,sha256=d7CYmm88lozepqXjmrFr4qsQ-lRE_10wQRwnenMSflU,4989
-optimum/rbln/diffusers/models/transformers/transformer_sd3.py,sha256=qBdk8fBxOnlRywUDKMab1G4YpFDVnMOkTyhKW9LPops,6503
+optimum/rbln/diffusers/models/transformers/transformer_sd3.py,sha256=ywWiRAYQ0wfKMMZBrJ9C34GBwIu92F5QXSG8qi7Cr6s,6579
 optimum/rbln/diffusers/models/unets/__init__.py,sha256=MaICuK9CWjgzejXy8y2NDrphuEq1rkzanF8u45k6O5I,655
-optimum/rbln/diffusers/models/unets/unet_2d_condition.py,sha256=bFFidMPZ2JgZf5tQVi2WNrDtT_yRDyqzNlkZ-wvQm7M,15481
+optimum/rbln/diffusers/models/unets/unet_2d_condition.py,sha256=dyrez3vS0_YSxTVwcjlSijDJhe6XchdsLsCFv74HiFQ,15555
 optimum/rbln/diffusers/pipelines/__init__.py,sha256=5KLZ5LrpMzBya2e_3_PvEoPwG24U8JMexfw_ygZREKc,3140
 optimum/rbln/diffusers/pipelines/controlnet/__init__.py,sha256=n1Ef22TSeax-kENi_d8K6wGGHSNEo9QkUeygELHgcao,983
 optimum/rbln/diffusers/pipelines/controlnet/multicontrolnet.py,sha256=Cv__E0Boc6TSOIv8TdXVE821zIiPG4MVI_lnaGSqquk,4102
@@ -55,18 +55,19 @@ optimum/rbln/diffusers/pipelines/stable_diffusion_xl/__init__.py,sha256=9iIMZYvp
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl.py,sha256=9GQIzBSgBae2kE9esGycg7WqNwO8TGF5c97rMx9934Y,1029
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl_img2img.py,sha256=BtzoyVd6Np5BPu3-OyXjbVMM8tl2ARF3HeFZab9NLXU,1071
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl_inpaint.py,sha256=7_ezUBCaH24e25VS19vrhJHBvmEOFnBpgfslpjL6aT4,1071
-optimum/rbln/ops/__init__.py,sha256=rSz6mfC0aGbNYjMaNSsOZSPYxPRenW8DWbNpAkjTfAc,703
-optimum/rbln/ops/attn.py,sha256=x02yFLk7FcONFqfow0ROmVy9fmxo5Pw0SPCiDY3AZNg,9012
-optimum/rbln/ops/flash_attn.py,sha256=NmCqUdMTzgJ4sbYGj8IWXJEsLWvbuCMponR01w5DK6w,4121
+optimum/rbln/ops/__init__.py,sha256=SPepB2VbmvEgathWAs_oCbDOPVyBhPey3wZX2X6dIBM,738
+optimum/rbln/ops/attn.py,sha256=lFAypLsboLq9p74y3n-x7iwYTjaKdCZGTKLgvFWkXTI,9481
+optimum/rbln/ops/flash_attn.py,sha256=z39DJZSk94630ueoOCkiybxR5gzvNR-SRADHs0F6pzU,4346
 optimum/rbln/ops/kv_cache_update.py,sha256=HjnHBR-oFrJQibsVnkYb0P5_-wEma8jl0mkjkylwakU,1270
 optimum/rbln/ops/linear.py,sha256=1_7Hg-9wXxhu97fqPobotLQx17k7VPeSSL91_9Z7EDg,1018
-optimum/rbln/transformers/__init__.py,sha256=P89UOclQWiLgNkH90GXdnwWD2492O2tusM-fZApfBNg,8084
+optimum/rbln/ops/sliding_window_attn.py,sha256=EQrV_yRGc5z6kvwEsAcLP028bJWkQg2UPI3xubt9skU,3487
+optimum/rbln/transformers/__init__.py,sha256=M9hEzEWIwLdkS-T0-sMof8BtYeFH-NAj4iX73mB3Rj8,8767
 optimum/rbln/transformers/configuration_alias.py,sha256=qFVfg6ohsR7a6b-CBgxjBUPDrk9MyiJwtO8AQah_RTU,1505
 optimum/rbln/transformers/configuration_generic.py,sha256=XIiZ1-5p1CMHhG7Sr2qR4SLYKcYw9aph7eGlga3Opx0,5056
 optimum/rbln/transformers/modeling_alias.py,sha256=yx7FnZQWAnrWzivaO5hI7T6i-fyLzt2tMIXG2oDNbPo,1657
 optimum/rbln/transformers/modeling_generic.py,sha256=nT_lytAILkYtwBVJKxXg0dxmh0UpjGYO6zOdLoMs1uU,12891
 optimum/rbln/transformers/modeling_rope_utils.py,sha256=3zwkhYUyTZhxCJUSmwCc88iiY1TppRWEY9ShwUqNB2k,14293
-optimum/rbln/transformers/models/__init__.py,sha256=72eMPN5UYGJ9P5gnJ2yi25cGdX1jV7viTOKmsX2OqBg,7221
+optimum/rbln/transformers/models/__init__.py,sha256=rofipeYNupozWru5PfSV9BudskognIUuNRIo7z-TEKE,8039
 optimum/rbln/transformers/models/auto/__init__.py,sha256=GvGbb3ZpMv-h6euXeZ42jSizoOfrL2O1uvpAnfKxYEo,1034
 optimum/rbln/transformers/models/auto/auto_factory.py,sha256=Uf5rCUoxec2qhIAwbAeZNZN4NIMFaLurSB1EdI79lwA,7044
 optimum/rbln/transformers/models/auto/modeling_auto.py,sha256=Un9qoqdy3dO8JBza_bTJF_6_fRVNM9QisihSgTRFI-o,3933
@@ -77,13 +78,16 @@ optimum/rbln/transformers/models/bart/modeling_bart.py,sha256=q42gQ42Ldkfrw_rv0_
 optimum/rbln/transformers/models/bert/__init__.py,sha256=86FuGRBLw315_Roa9D5OUx6Ku2PM0DqSPZ-YSqbF-io,806
 optimum/rbln/transformers/models/bert/configuration_bert.py,sha256=NIlBRn-zrnNirkEfJ4Uv2TZRIBL761PLJ9-cZaPyzpg,1017
 optimum/rbln/transformers/models/bert/modeling_bert.py,sha256=XxsRhBhexZ2w3mRCvKl73pIyGdqcFR1RrOKG7h4EAyk,1223
+optimum/rbln/transformers/models/blip_2/__init__.py,sha256=L01gPXcUCa8Vg-bcng20vZvBIN_jlqCzwUSFuq0QOag,855
+optimum/rbln/transformers/models/blip_2/configuration_blip_2.py,sha256=Dh_gbeF46Tg3DKK4lq9DRblweI3B7XZHE2PlxO8qStU,3662
+optimum/rbln/transformers/models/blip_2/modeling_blip_2.py,sha256=4-EWHRau363-YoZQcTfLXqm97IsAs3-Uya2L1IVGfxE,10830
 optimum/rbln/transformers/models/clip/__init__.py,sha256=TLeXDqcFK6M6v9x7Xr64kBbqGu3hFHM7p754dQ8UVQc,938
 optimum/rbln/transformers/models/clip/configuration_clip.py,sha256=wgfZeVvcVdSzrN9tcnt7DKJQ0NLR0REvW7MyUXyv2Bg,2976
 optimum/rbln/transformers/models/clip/modeling_clip.py,sha256=UslcDN6otyQ_psou7F_YcdK5vCImEtgIdcbwmexSfOM,7256
 optimum/rbln/transformers/models/decoderonly/__init__.py,sha256=vQYZDDdoddwA7yKc5zzrq2Zs9sax-0p8rNF_aYfF4bk,1006
-optimum/rbln/transformers/models/decoderonly/configuration_decoderonly.py,sha256=b1W7zS0MUmeDd048bLp5AkZMrWd3LIhHaVy8NvlwdCw,4116
-optimum/rbln/transformers/models/decoderonly/decoderonly_architecture.py,sha256=NG2tKC3gT57r34PYKgU0evZHctEHzJGRrk2FOjLyK7Q,41748
-optimum/rbln/transformers/models/decoderonly/modeling_decoderonly.py,sha256=5o2m_xPVjfCovP_jcW8E17sSKkLqcVblr4mFLbv-VDU,42991
+optimum/rbln/transformers/models/decoderonly/configuration_decoderonly.py,sha256=WQlHUjcMuD_3BPLo1Ytzz-xAI-8J9BYfr7dEzmpLVks,6389
+optimum/rbln/transformers/models/decoderonly/decoderonly_architecture.py,sha256=89I4A0WEdY0bOX_iGeG5qS7Cd2RPbwvdgYjfZIhcUy4,42035
+optimum/rbln/transformers/models/decoderonly/modeling_decoderonly.py,sha256=iaB1lgElTaCfq5-HY5mbOcbQ8CICyTONckJf25RPjpU,48565
 optimum/rbln/transformers/models/dpt/__init__.py,sha256=Nzep9mlzKyL1kV726IBqY8DnLp1DkH9JzFeknWSRhok,714
 optimum/rbln/transformers/models/dpt/configuration_dpt.py,sha256=4fW6bzVhaAxym4wGV3F785rvUOoWPyw_gdEMqB08Leg,755
 optimum/rbln/transformers/models/dpt/modeling_dpt.py,sha256=oKLX7MQZvfk1QB8wOtcdi7AmZH2fOIVbypa9A3RA9MI,733
@@ -101,14 +105,14 @@ optimum/rbln/transformers/models/gpt2/gpt2_architecture.py,sha256=1IxqHmB-GlH2Dv
 optimum/rbln/transformers/models/gpt2/modeling_gpt2.py,sha256=qBDanUk_O-HtOIVCA4IE3FYyCsnL9xIDK00vft-0caw,1490
 optimum/rbln/transformers/models/idefics3/__init__.py,sha256=ulxE7HEfXsNJhd25J9Fvi6vggo9aZH9sLKJjWB6LlzQ,814
 optimum/rbln/transformers/models/idefics3/configuration_idefics3.py,sha256=sM0pXsvkxcpDXagoKlqwKdBAcNdayB9KlWdYC9xlyDU,1889
-optimum/rbln/transformers/models/idefics3/modeling_idefics3.py,sha256=Rr9BJDyoOqJFQ8dJV78QU4Tjjhhj3aqRk05JcDqFv6Y,17904
+optimum/rbln/transformers/models/idefics3/modeling_idefics3.py,sha256=oSF08arqwjoodq9_A304jhRlQbk_FEIkR4EhJqiNAzk,18062
 optimum/rbln/transformers/models/llama/__init__.py,sha256=knxvRkPx8x6-WOxqSq_PlaKYD-9F9Q8dh7r095Esey0,708
 optimum/rbln/transformers/models/llama/configuration_llama.py,sha256=B9gr4pTn9yiv3-8DIk0P7_AQdIHEc7SuLaH9gZAmP8E,773
 optimum/rbln/transformers/models/llama/llama_architecture.py,sha256=S7MCPfyjG5eUqgaS-QNBB0ApUD6wnb5fR0RHq7k7-pA,728
 optimum/rbln/transformers/models/llama/modeling_llama.py,sha256=Z3iony7icoFhRQ11MAuFx9UF03uJCsvJQZ6bxHXlrgk,1530
 optimum/rbln/transformers/models/llava_next/__init__.py,sha256=kDXKr7wMkp1XqE__DER2B8kQF_NYMxhzsQS5ytGg56I,752
 optimum/rbln/transformers/models/llava_next/configuration_llava_next.py,sha256=QPreWZyohwRL23GOyvoAfKtk5UNg7IJ_Y_pNfUDe7cU,1838
-optimum/rbln/transformers/models/llava_next/modeling_llava_next.py,sha256=xOXc1XUIK4oLSFvAq7Q0lxiOLlDFMbFdOcg5JvLnVkI,25979
+optimum/rbln/transformers/models/llava_next/modeling_llava_next.py,sha256=Igq_VCcOgSxltzm7eV9F5MiHS-vyDAp4DIswH80q76c,26022
 optimum/rbln/transformers/models/midm/__init__.py,sha256=IC3FETwgYinbp3wDj7tp4zIHJhbqM-c6GfTRdYcMNj8,913
 optimum/rbln/transformers/models/midm/configuration_midm.py,sha256=Kv5g5dIsBrhGcZ2_pFUOPNB80np4Xiw0wPH1IZm1PHI,772
 optimum/rbln/transformers/models/midm/midm_architecture.py,sha256=357iviqQkzI0s_lU_teH1sVOChNRDUABe3GA0HuhZZY,5444
@@ -117,6 +121,10 @@ optimum/rbln/transformers/models/mistral/__init__.py,sha256=9FE64bCYfSIyrBkRcwlq
 optimum/rbln/transformers/models/mistral/configuration_mistral.py,sha256=zCHZnmjTXs7UKYIIRR2IYjccROm5ODXfonWploITNxg,775
 optimum/rbln/transformers/models/mistral/mistral_architecture.py,sha256=_aU8TE_tdvfo0K7QpgTlz_d0qwk4O82dl9268lPL16E,733
 optimum/rbln/transformers/models/mistral/modeling_mistral.py,sha256=7nrddoBIHf8S12LZWBUpotnvG3gND11vMQda9yYXJ-s,1560
+optimum/rbln/transformers/models/opt/__init__.py,sha256=w0v8GzbzlR5_4yL851njGDSJgX89TrYxrHnpNfMHZEI,700
+optimum/rbln/transformers/models/opt/configuration_opt.py,sha256=1BIxum4m6An5dsYpw1Kmf-QIHSGQK8uDjMd2hUkRvzE,771
+optimum/rbln/transformers/models/opt/modeling_opt.py,sha256=A40krCtNLOWDex4tHx894wBTcWhyrsQBtGgZZDDc3fg,3005
+optimum/rbln/transformers/models/opt/opt_architecture.py,sha256=7ANZ1aIK0HZ8HPrAl22V1Hc0B-8gBigsa4VNMh9HVk8,2592
 optimum/rbln/transformers/models/phi/__init__.py,sha256=uqQb-sO1HXuaju2hfo7qJHk_IWhnptY-qFjNjK_uOc0,700
 optimum/rbln/transformers/models/phi/configuration_phi.py,sha256=9Mk06ZNymGnC2P0eiU02oguH1KFKxL-LYtMJSNqpmmo,771
 optimum/rbln/transformers/models/phi/modeling_phi.py,sha256=j-6Pqd5rR2JE8I1pnKFlCi4nW5Dv3wZjoPWxohissoo,1516
@@ -127,12 +135,15 @@ optimum/rbln/transformers/models/qwen2/modeling_qwen2.py,sha256=9-aFDvjMzPNUyGOz
 optimum/rbln/transformers/models/qwen2/qwen2_architecture.py,sha256=XlNAMYAcDLohnSAhIFGKOPuCB5XLgzYs5ABWdeQSaZs,720
 optimum/rbln/transformers/models/qwen2_5_vl/__init__.py,sha256=rAW3DKQUzGL6EMwa5r1iLu94yhpiZpk6zfoD7TtYXrc,865
 optimum/rbln/transformers/models/qwen2_5_vl/configuration_qwen2_5_vl.py,sha256=dPcGNaLwJf61PIvVbyt-lvBflp_dvK0hubhNoA3len0,3123
-optimum/rbln/transformers/models/qwen2_5_vl/modeling_qwen2_5_vl.py,sha256=sKsDAiMGWtbquTw6_PITK4ijL0aHBZqgs2nPObEiFN8,24951
-optimum/rbln/transformers/models/qwen2_5_vl/qwen2_5_vl_architecture.py,sha256=YRy7Ylm-UQLovt5BmxhayJMKzF3rj0_HIc4tUXaiPO0,7474
+optimum/rbln/transformers/models/qwen2_5_vl/modeling_qwen2_5_vl.py,sha256=etE0y5UlNpNcRZO_68TAYK1Wg2TsqZUiM0L2qeTZacs,25144
+optimum/rbln/transformers/models/qwen2_5_vl/qwen2_5_vl_architecture.py,sha256=OR-tTu8uzeFryenohoqRwgIVqw5zM7dcsZHwKL_jD0A,7232
 optimum/rbln/transformers/models/seq2seq/__init__.py,sha256=6WKstWiS1kW0oFDn_jyrKMW5QEJAWkmsSRAaadNedDM,715
 optimum/rbln/transformers/models/seq2seq/configuration_seq2seq2.py,sha256=vSNP1eILfL32cbiLOAD58Ocz6lk3hYFnhIRLDVqlSoI,2624
 optimum/rbln/transformers/models/seq2seq/modeling_seq2seq.py,sha256=7MN6CNVyYg4JsULYXDfQ_KkDd3w-1TXuxndSrM-CX8w,16980
-optimum/rbln/transformers/models/seq2seq/seq2seq_architecture.py,sha256=w5pMnWbJhgYmpl5NT_vJEzcb4RfEbHfalJ371IL3wp8,18685
+optimum/rbln/transformers/models/seq2seq/seq2seq_architecture.py,sha256=i2YXcusNvWjqYmS3ZvrWJiilovKIlfozB92fqDrtwq8,18729
+optimum/rbln/transformers/models/siglip/__init__.py,sha256=39MdhvWLZU0_9julQtJYVEiWI4csPrryS9krMauEA3s,730
+optimum/rbln/transformers/models/siglip/configuration_siglip.py,sha256=tXzkTXeFamOwRnafJMYmjIPDODKwM6xNsW-UTf5cH38,2625
+optimum/rbln/transformers/models/siglip/modeling_siglip.py,sha256=hvffh55rYxHx7CLHe5TR_5nfCGUhVd3dUmCwUasLjwE,5941
 optimum/rbln/transformers/models/t5/__init__.py,sha256=R1Q8Z1vaIdx4rDjeCmm_ZMSgewWaqaI0l93AHwewtew,818
 optimum/rbln/transformers/models/t5/configuration_t5.py,sha256=cOa2NAAocNSSECTtLpOsVVLfn4-7l7K7jz3nf6CSNCs,912
 optimum/rbln/transformers/models/t5/modeling_t5.py,sha256=cnN76IAw6QaJN8Oodfk5Y4Dte6m84Fy_CRgnqquzzTI,2990
@@ -148,22 +159,22 @@ optimum/rbln/transformers/models/whisper/__init__.py,sha256=ErquiUlYycSYPsDcq9Iw
 optimum/rbln/transformers/models/whisper/configuration_whisper.py,sha256=-Su7pbkg3gkYTf-ECRJyxkpD3JtUJX4y5Mfml8tJJBI,2612
 optimum/rbln/transformers/models/whisper/generation_whisper.py,sha256=GIHTca3b1VtW81kp7BzKQ7f77c2t9OsEsbZetripgDo,4582
 optimum/rbln/transformers/models/whisper/modeling_whisper.py,sha256=7VcOjxV3ZAHBYFDLiSc6wVJ3PZLqzmbBAIkQ4JVfpNM,17538
-optimum/rbln/transformers/models/whisper/whisper_architecture.py,sha256=zEwfn8DDTbt2TN7lHKMZG9JXZc5WdW9Cp8mH4OVfo3s,13949
+optimum/rbln/transformers/models/whisper/whisper_architecture.py,sha256=fKUbAMIl20o6EBMVcLg9TDSsJ1FDp8NKcl4jT9RWCEM,13981
 optimum/rbln/transformers/models/xlm_roberta/__init__.py,sha256=mFeFTiF6xY_n1glUsvZ420uKKwkeVOS5Oag0L6E4Qs8,718
 optimum/rbln/transformers/models/xlm_roberta/configuration_xlm_roberta.py,sha256=XBICzoxTaZ8DhBtr8qos2tDJar4jvCiKOZwXGImlTAw,779
 optimum/rbln/transformers/models/xlm_roberta/modeling_xlm_roberta.py,sha256=rro7kH_BLDIlKSBRUfeuX-qQu6MeO5SzbVcf0AbFxEk,757
 optimum/rbln/transformers/utils/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-optimum/rbln/transformers/utils/rbln_quantization.py,sha256=gwBVHf97sQgPNmGa0wq87E8mPyrtXYhMnO4X4sKp3c8,7639
+optimum/rbln/transformers/utils/rbln_quantization.py,sha256=um0N2ZruU_lNibo6rlzgwHAI2_8QOrYE7W7pA1qfXKM,9396
 optimum/rbln/utils/__init__.py,sha256=ieDBT2VFTt2E0M4v_POLBpuGW9LxSydpb_DuPd6PQqc,712
 optimum/rbln/utils/decorator_utils.py,sha256=xu-TrsNi33SRC2a7DBsyoo6-pEQxWKZPZSmM9QlDe2Y,3745
 optimum/rbln/utils/hub.py,sha256=Z_R9Ic9VAew8bUmlaAlxZf5JGMDBivHvvFRI557pILY,4196
-optimum/rbln/utils/import_utils.py,sha256=uMldLJmDVMj5uHvxBfb96uV29bfGEDvlksLY26GOHAs,4389
+optimum/rbln/utils/import_utils.py,sha256=fpOERIIxXm-cDYGn1NN6c7aWDPQYVitPQW2MiyZ9NEY,5471
 optimum/rbln/utils/logging.py,sha256=VKKBmlQSdg6iZCGmAXaWYiW67K84jyp1QJhLQSSjPPE,3453
 optimum/rbln/utils/model_utils.py,sha256=V2kFpUe2aqVzLwbpztD8JOVFQqRHncvIWwJbgnUPr4E,1274
 optimum/rbln/utils/runtime_utils.py,sha256=LoKNK3AQNV_BSScstIZWjICkJf265MnUgy360BOocVI,5454
 optimum/rbln/utils/save_utils.py,sha256=hG5uOtYmecSXZuGTvCXsTM-SiyZpr5q3InUGCCq_jzQ,3619
-optimum/rbln/utils/submodule.py,sha256=TtcH3OLctFd2Dosc-zNMGZ8xOXKKUfE91dLQ1v09E8Q,4636
-optimum_rbln-0.7.4a9.dist-info/METADATA,sha256=s2GSC8Y7NFqtsFxZFbkYzQdMRBuyzA6zjKeON7ov8G0,5299
-optimum_rbln-0.7.4a9.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-optimum_rbln-0.7.4a9.dist-info/licenses/LICENSE,sha256=QwcOLU5TJoTeUhuIXzhdCEEDDvorGiC6-3YTOl4TecE,11356
-optimum_rbln-0.7.4a9.dist-info/RECORD,,
+optimum/rbln/utils/submodule.py,sha256=ZfI7e3YzbjbbBW4Yjfucj8NygEsukfIkaJi3PtwHrhc,5105
+optimum_rbln-0.7.5a1.dist-info/METADATA,sha256=r1huaKWrPkBuoc7Zm743oYmueJxP7g5hlz9Ywtxf-r8,5299
+optimum_rbln-0.7.5a1.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+optimum_rbln-0.7.5a1.dist-info/licenses/LICENSE,sha256=QwcOLU5TJoTeUhuIXzhdCEEDDvorGiC6-3YTOl4TecE,11356
+optimum_rbln-0.7.5a1.dist-info/RECORD,,

{optimum_rbln-0.7.4a9.dist-info → optimum_rbln-0.7.5a1.dist-info}/WHEEL RENAMED Viewed

File without changes

{optimum_rbln-0.7.4a9.dist-info → optimum_rbln-0.7.5a1.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

optimum-rbln 0.7.4a9__py3-none-any.whl → 0.7.5a1__py3-none-any.whl

optimum-rbln 0.7.4a9py3-none-any.whl → 0.7.5a1py3-none-any.whl