PyPI - optimum-rbln - Versions diffs - 0.7.5a0__py3-none-any.whl → 0.7.5rc0__py3-none-any.whl - Mend

optimum-rbln 0.7.5a0py3-none-any.whl → 0.7.5rc0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (46) hide show

optimum/rbln/transformers/models/siglip/modeling_siglip.py ADDED Viewed

@@ -0,0 +1,146 @@
+# Copyright 2025 Rebellions Inc. All rights reserved.
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at:
+#     http://www.apache.org/licenses/LICENSE-2.0
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from typing import TYPE_CHECKING, Optional, Tuple, Union
+import torch
+from transformers import SiglipVisionConfig, SiglipVisionModel
+from transformers.modeling_outputs import BaseModelOutputWithPooling
+from transformers.models.siglip.modeling_siglip import SiglipVisionModelOutput
+from ....configuration_utils import RBLNCompileConfig
+from ....modeling import RBLNModel
+from ....utils.logging import get_logger
+from .configuration_siglip import RBLNSiglipVisionModelConfig
+logger = get_logger(__name__)
+if TYPE_CHECKING:
+    from transformers import AutoFeatureExtractor, AutoProcessor, AutoTokenizer, PreTrainedModel
+    from ....diffusers.modeling_diffusers import RBLNDiffusionMixin, RBLNDiffusionMixinConfig
+class _SiglipVisionModel(torch.nn.Module):
+    def __init__(self, model: SiglipVisionModel, interpolate_pos_encoding: bool, output_hidden_states: bool):
+        super().__init__()
+        self.vision_model = model.vision_model
+        self.interpolate_pos_encoding = interpolate_pos_encoding
+        self.output_hidden_states = output_hidden_states
+    def forward(self, inp):
+        enc_out = self.vision_model(
+            inp,
+            output_hidden_states=self.output_hidden_states,
+            return_dict=False,
+            interpolate_pos_encoding=self.interpolate_pos_encoding,
+        )
+        return tuple(x for x in enc_out if x is not None)
+class RBLNSiglipVisionModel(RBLNModel):
+    @classmethod
+    def wrap_model_if_needed(cls, model: torch.nn.Module, rbln_config: RBLNSiglipVisionModelConfig) -> torch.nn.Module:
+        wrapper_cfg = {
+            "interpolate_pos_encoding": rbln_config.interpolate_pos_encoding,
+            "output_hidden_states": rbln_config.output_hidden_states,
+        }
+        return _SiglipVisionModel(model, **wrapper_cfg).eval()
+    @classmethod
+    def update_rbln_config_using_pipe(
+        cls, pipe: "RBLNDiffusionMixin", rbln_config: "RBLNDiffusionMixinConfig", submodule_name: str
+    ) -> "RBLNDiffusionMixinConfig":
+        return rbln_config
+    @classmethod
+    def _update_rbln_config(
+        cls,
+        preprocessors: Union["AutoFeatureExtractor", "AutoProcessor", "AutoTokenizer"],
+        model: Optional["PreTrainedModel"] = None,
+        model_config: "SiglipVisionConfig" = None,
+        rbln_config: Optional[RBLNSiglipVisionModelConfig] = None,
+    ) -> RBLNSiglipVisionModelConfig:
+        if rbln_config.image_size is None:
+            rbln_config.image_size = getattr(model_config, "image_size", None)
+        if isinstance(rbln_config.image_size, int):
+            rbln_config.image_size = (rbln_config.image_size, rbln_config.image_size)
+        if rbln_config.image_size is None:
+            raise ValueError("`rbln_image_size` should be specified!")
+        if rbln_config.output_hidden_states is None:
+            rbln_config.output_hidden_states = model_config.output_hidden_states
+        rbln_compile_config = RBLNCompileConfig(
+            input_info=[
+                (
+                    "pixel_values",
+                    [
+                        rbln_config.batch_size,
+                        3,
+                        rbln_config.image_height,
+                        rbln_config.image_width,
+                    ],
+                    "float32",
+                )
+            ]
+        )
+        rbln_config.set_compile_cfgs([rbln_compile_config])
+        return rbln_config
+    def forward(
+        self,
+        pixel_values: Optional[torch.FloatTensor] = None,
+        return_dict: bool = None,
+        interpolate_pos_encoding: bool = False,
+        **kwargs,
+    ) -> Union[Tuple, SiglipVisionModelOutput]:
+        if len(kwargs) > 0 and any(kwargs.values()):
+            logger.warning(f"Currently, optimum-rbln does not support kwargs {kwargs.keys()} for {self.__class__}.")
+        if interpolate_pos_encoding != self.rbln_config.interpolate_pos_encoding:
+            raise ValueError(
+                f"Variable interpolate_pos_encoding {interpolate_pos_encoding} is not equal to rbln_config.interpolate_pos_encoding {self.rbln_config.interpolate_pos_encoding}"
+                f"Please compile again with the correct argument."
+            )
+        output = super().forward(pixel_values, return_dict=return_dict)
+        return output
+    def _prepare_output(self, output, return_dict):
+        """
+        Prepare model output based on return_dict flag.
+        This method can be overridden by subclasses to provide task-specific output handling.
+        """
+        if not return_dict:
+            return (output,) if not isinstance(output, (tuple, list)) else output
+        else:
+            last_hidden_state = (
+                output[0]
+                if self.rbln_config.interpolate_pos_encoding or self.rbln_config.output_hidden_states
+                else output
+            )
+            pooler_output = output[1] if self.rbln_config.interpolate_pos_encoding else None
+            if self.rbln_config.output_hidden_states:
+                hidden_states = (output[2:] if self.rbln_config.interpolate_pos_encoding else output[1:],)
+            else:
+                hidden_states = None
+            return BaseModelOutputWithPooling(
+                last_hidden_state=last_hidden_state,
+                pooler_output=pooler_output,
+                hidden_states=hidden_states,
+            )

optimum/rbln/transformers/models/whisper/whisper_architecture.py CHANGED Viewed

@@ -313,6 +313,7 @@ class WhisperSelfAttention(WhisperAttention):
             args["mask"] = attention_mask.unsqueeze(2)
             attn_output = torch.ops.rbln_custom_ops.paged_attn_decode(**args)
         else:
+            args["mask"] = None
             attn_output = torch.ops.rbln_custom_ops.paged_causal_attn_decode(**args)
         attn_output = attn_output.view(bsz, self.num_heads, tgt_len, self.head_dim)

optimum/rbln/transformers/utils/rbln_quantization.py CHANGED Viewed

@@ -12,94 +12,82 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
-import functools
 import glob
 import os
-from typing import Any, Callable, Dict, Optional
+from typing import Any, Dict, Optional, Union
 import torch
 from safetensors.torch import load_file
 from torch.nn import Linear, Parameter
 from torch.nn import functional as F
+from ...configuration_utils import RBLNSerializableConfigProtocol
 from ...utils.logging import get_logger
 logger = get_logger()
-SUPPORTED_QUANTIZATIONS: Dict[str, list[str]] = {
-    "rbln": ["w4a16"],
-}
+class RBLNQuantizationConfig(RBLNSerializableConfigProtocol):
+    SUPPORTED_FORMATS = ["rbln"]
+    SUPPORTED_WEIGHTS = ["int4", "fp16"]
+    SUPPORTED_ACTIVATIONS = ["fp16"]
-class QuantizationManager:
     # The RBLN_QUANT_BITS environment variable defines the precision of each layer during the graph compilation process.
     # It specifies the quantization bit depth. For instance, setting RBLN_QUANT_BITS=4 will apply 4-bit precision for quantization.
     RBLN_QUANT_BITS_ENV = "RBLN_QUANT_BITS"
-    @staticmethod
-    def _raise_invalid_config_error(
-        key: str, value: str, valid_values: list[str], context: Optional[str] = None
-    ) -> None:
-        context_info = f" for {context}" if context else ""
-        valid_values_str = ", ".join(valid_values)
-        raise ValueError(f"Invalid {key}: {value}{context_info}. Supported values are: {valid_values_str}")
-    @staticmethod
-    def validate_quantization_config(quantize_config: Optional[dict]) -> Optional[dict]:
-        if not quantize_config:
-            return None
-        q_format = quantize_config.get("format")
-        q_precision = quantize_config.get("precision")
-        if q_format not in SUPPORTED_QUANTIZATIONS:
-            QuantizationManager._raise_invalid_config_error(
-                "quantization format", q_format, list(SUPPORTED_QUANTIZATIONS.keys())
+    def __init__(
+        self,
+        format: Optional[str] = None,
+        precision: Optional[str] = None,
+        weights: Optional[str] = None,
+        activations: Optional[str] = None,
+    ):
+        self.format = format
+        if precision is not None:
+            logger.warning("The `precision` argument is deprecated. Use `weights` and `activations` instead.")
+            if any(precision_arg is not None for precision_arg in (weights, activations)):
+                raise ValueError("`precision` and `weights` or `activations` cannot be set at the same time.")
+            if precision == "w4a16":
+                weights = "int4"
+                activations = "fp16"
+            else:
+                raise ValueError(f"Invalid precision: {precision}")
+        self.weights = weights or "fp16"
+        self.activations = activations or "fp16"
+        self._validate()
+    def _validate(self):
+        if self.format not in self.SUPPORTED_FORMATS:
+            raise ValueError(f"Invalid format: {self.format}, supported formats are: {self.SUPPORTED_FORMATS}")
+        if self.weights not in self.SUPPORTED_WEIGHTS:
+            raise ValueError(f"Invalid weights: {self.weights}, supported weights are: {self.SUPPORTED_WEIGHTS}")
+        if self.activations not in self.SUPPORTED_ACTIVATIONS:
+            raise ValueError(
+                f"Invalid activations: {self.activations}, supported activations are: {self.SUPPORTED_ACTIVATIONS}"
             )
+        if self.weights == "fp16" and self.activations == "fp16":
+            raise ValueError("weights and activations cannot be both fp16. It is meaningless.")
-        if q_precision not in SUPPORTED_QUANTIZATIONS[q_format]:
-            QuantizationManager._raise_invalid_config_error(
-                "precision", q_precision, SUPPORTED_QUANTIZATIONS[q_format], q_format
-            )
+    def _prepare_for_serialization(self) -> Dict[str, Any]:
+        return {
+            "format": self.format,
+            "weights": self.weights,
+            "activations": self.activations,
+        }
-        return quantize_config
-    @classmethod
-    def _set_env_var(cls, name: str, value: str) -> None:
-        os.environ[name] = value
-    @classmethod
-    def _unset_env_var(cls, name: str) -> None:
-        os.environ.pop(name, None)
-    @classmethod
-    def set_quantization_env(cls, quantize_config: Optional[dict]) -> Optional[str]:
-        quantize_config = cls.validate_quantization_config(quantize_config)
-        if quantize_config:
-            q_precision: str = quantize_config["precision"]
-            quant_bits = q_precision.split("w")[1].split("a")[0]
-            cls._set_env_var(cls.RBLN_QUANT_BITS_ENV, quant_bits)
-            return cls.RBLN_QUANT_BITS_ENV
-        return None
-    @classmethod
-    def reset_quantization_env(cls, env_var_name: Optional[str]) -> None:
-        if env_var_name:
-            cls._unset_env_var(env_var_name)
-    @classmethod
-    def with_quantization_env(cls, func: Callable) -> Callable:
-        @functools.wraps(func)
-        def wrapper(*args, **kwargs):
-            quantize_config = kwargs.get("quantize_config")
-            quantize_env_var = cls.set_quantization_env(quantize_config)
-            try:
-                return func(*args, **kwargs)
-            finally:
-                cls.reset_quantization_env(quantize_env_var)
-        return wrapper
+    def maybe_set_quantization_env(self):
+        quant_bits = None
+        if self.weights == "int4":
+            quant_bits = "4"
+            os.environ[self.RBLN_QUANT_BITS_ENV] = quant_bits
+    def maybe_reset_quantization_env(self):
+        if self.RBLN_QUANT_BITS_ENV in os.environ:
+            os.environ.pop(self.RBLN_QUANT_BITS_ENV)
 # Constants
@@ -114,12 +102,31 @@ QUANTIZED_WEIGHTS = {
 }
-def prepare_model_for_quantization(model: torch.nn.Module, model_id: str, n_layer: Optional[int] = None) -> None:
+def prepare_model_for_quantization(
+    model: torch.nn.Module,
+    model_id: str,
+    n_layer: Optional[int] = None,
+    use_auth_token: Optional[Union[bool, str]] = None,
+    revision: Optional[str] = None,
+    cache_dir: Optional[str] = None,
+    force_download: bool = False,
+    local_files_only: bool = False,
+) -> torch.nn.Module:
     """
     Prepare the model for quantization by updating specified linear layers to quantized (qlinear) layers.
     """
     update_layers_to_quantize(model)
-    load_weights(model, model_id, n_layer)
+    load_weights(
+        model,
+        model_id,
+        n_layer,
+        use_auth_token=use_auth_token,
+        revision=revision,
+        cache_dir=cache_dir,
+        force_download=force_download,
+        local_files_only=local_files_only,
+    )
+    return model
 def update_layers_to_quantize(module: torch.nn.Module) -> None:
@@ -140,18 +147,57 @@ def update_layers_to_quantize(module: torch.nn.Module) -> None:
         logger.debug(f"Updated the following linear layers to quantized layers:\n {{{', '.join(processed_layers)}}}")
-def load_weights(model, model_id, n_layer=None):
+def load_weights(
+    model,
+    model_id,
+    n_layer=None,
+    use_auth_token=None,
+    revision=None,
+    cache_dir=None,
+    force_download=False,
+    local_files_only=False,
+):
     """
     Load safetensor file data directly into the model, filtering by layer if n_layer is provided.
     """
-    logger.debug("Loading the quantized weights into the CPU.")  # TODO(jongho): remove.
     model_params = dict(model.named_parameters(recurse=True))
     model_buffers = dict(model.named_buffers(recurse=True))
-    safetensor_files = glob.glob(f"{model_id}/*.safetensors")
+    if os.path.isdir(model_id):
+        safetensor_files = glob.glob(f"{model_id}/*.safetensors")
+    else:
+        from huggingface_hub import hf_hub_download, list_repo_files
+        try:
+            # List all files in the repository
+            repo_files = list_repo_files(model_id, revision=revision, token=use_auth_token)
+            # Filter for safetensors files
+            safetensor_files = []
+            for file in repo_files:
+                if file.endswith(".safetensors"):
+                    # Download the safetensors file
+                    downloaded_file = hf_hub_download(
+                        repo_id=model_id,
+                        filename=file,
+                        revision=revision,
+                        token=use_auth_token,
+                        cache_dir=cache_dir,
+                        force_download=force_download,
+                        local_files_only=local_files_only,
+                    )
+                    safetensor_files.append(downloaded_file)
+        except Exception as e:
+            logger.error(f"Failed to download safetensors files from Hugging Face Hub: {e}")
+            raise e
+    if not safetensor_files:
+        raise FileNotFoundError(f"No safetensors files found for model_id: {model_id}")
     target_layers = list(range(n_layer)) if n_layer is not None else None
+    unloaded_keys = []
     for safetensor_file in safetensor_files:
         file_data = load_file(safetensor_file)
         for key, value in file_data.items():
@@ -165,8 +211,11 @@ def load_weights(model, model_id, n_layer=None):
                 model_params[key].data.copy_(value)
             elif key in model_buffers:
                 model_buffers[key].data.copy_(value)
+            else:
+                unloaded_keys.append(key)
-    logger.debug("Loaded the quantized weights into the CPU.")
+    if len(unloaded_keys) > 0:
+        logger.warning(f"There are unexpected parameters/buffers on the checkpoint: {unloaded_keys}")
 def is_target_for_qlinear_replacement(layer_name: str, layer: torch.nn.Module) -> bool:

optimum/rbln/utils/submodule.py CHANGED Viewed

@@ -13,8 +13,11 @@
 # limitations under the License.
 import importlib
+from pathlib import Path
 from typing import TYPE_CHECKING, Any, Dict, List, Type
+from transformers import PretrainedConfig
 from ..configuration_utils import RBLNModelConfig
@@ -38,6 +41,10 @@ class SubModulesMixin:
         for submodule_meta, submodule in zip(self._rbln_submodules, rbln_submodules):
             setattr(self, submodule_meta["name"], submodule)
+    @classmethod
+    def _update_submodule_config(cls, model: "PreTrainedModel", rbln_config: RBLNModelConfig):
+        return rbln_config
     @classmethod
     def _export_submodules_from_model(
         cls, model: "PreTrainedModel", model_save_dir: str, rbln_config: RBLNModelConfig, **kwargs
@@ -62,6 +69,8 @@ class SubModulesMixin:
                 submodule_rbln_config = submodule_rbln_config_class(**submodule_rbln_config)
                 setattr(rbln_config, submodule_name, submodule_rbln_config)
+            submodule_rbln_config = submodule_cls._update_submodule_config(model, submodule_rbln_config)
             rbln_submodule = submodule_cls.from_model(
                 model=torch_submodule,
                 config=torch_submodule.config,
@@ -90,9 +99,12 @@ class SubModulesMixin:
                 importlib.import_module("optimum.rbln"), submodule_rbln_config.rbln_model_cls_name
             )
+            json_file_path = Path(model_save_dir) / submodule_name / "config.json"
+            config = PretrainedConfig.from_json_file(json_file_path)
             rbln_submodule = submodule_cls._from_pretrained(
                 model_id=model_save_dir,
-                config=None,
+                config=config,
                 subfolder=submodule_name,
                 rbln_config=submodule_rbln_config,
                 **kwargs,

{optimum_rbln-0.7.5a0.dist-info → optimum_rbln-0.7.5rc0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: optimum-rbln
-Version: 0.7.5a0
+Version: 0.7.5rc0
 Summary: Optimum RBLN is the interface between the HuggingFace Transformers and Diffusers libraries and RBLN accelerators. It provides a set of tools enabling easy model loading and inference on single and multiple rbln device settings for different downstream tasks.
 Project-URL: Homepage, https://rebellions.ai
 Project-URL: Documentation, https://docs.rbln.ai

{optimum_rbln-0.7.5a0.dist-info → optimum_rbln-0.7.5rc0.dist-info}/RECORD RENAMED Viewed

@@ -1,7 +1,7 @@
-optimum/rbln/__init__.py,sha256=89QJBCQbW1u83pFzFif2gwnJ09eAWYEUEuiVF_mDHBI,13238
-optimum/rbln/__version__.py,sha256=bJpxWEb0lqqNtDNdD8kjIjXRVQ1JbWhjYWAaVwJIkmU,519
-optimum/rbln/configuration_utils.py,sha256=Bz4mDuKQAbIvd1F1E5hssLenqUIwGWYZIRAe0UCaHbU,31050
-optimum/rbln/modeling.py,sha256=qDXB69Oq0jx9hfONebDiSNe2_DgKYhnAGLTbGAtwYVw,9677
+optimum/rbln/__init__.py,sha256=oAnsJSMrPYwBGEttUt3CMXTIESVNe15ftTWRTShwhZI,14386
+optimum/rbln/__version__.py,sha256=34rdkaF19JfWW5k_S6Q9ZJaeOOAsCoPR3_vN57l-b28,521
+optimum/rbln/configuration_utils.py,sha256=gvAjRFEGw5rnSoH0IoyuLrE4fkxtk3DN1pikqrN_Rpk,31277
+optimum/rbln/modeling.py,sha256=4Xwi3ovWDHOOqxUDH_ZgsgTuea8Kyg25D9s81zVYpr0,9669
 optimum/rbln/modeling_base.py,sha256=iQKw2IORu1cN6sOK0xeBVrhatt-ZPeinT_v6l2FnGRw,24173
 optimum/rbln/diffusers/__init__.py,sha256=XL6oKPHbPCV6IVCw3fu0-M9mD2KO_x6unx5kJdAtpVY,6180
 optimum/rbln/diffusers/modeling_diffusers.py,sha256=bPyP5RMbOFLb2DfEAuLVp7hTuQWJvWid7El72wGmFrY,19535
@@ -55,21 +55,22 @@ optimum/rbln/diffusers/pipelines/stable_diffusion_xl/__init__.py,sha256=9iIMZYvp
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl.py,sha256=9GQIzBSgBae2kE9esGycg7WqNwO8TGF5c97rMx9934Y,1029
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl_img2img.py,sha256=BtzoyVd6Np5BPu3-OyXjbVMM8tl2ARF3HeFZab9NLXU,1071
 optimum/rbln/diffusers/pipelines/stable_diffusion_xl/pipeline_stable_diffusion_xl_inpaint.py,sha256=7_ezUBCaH24e25VS19vrhJHBvmEOFnBpgfslpjL6aT4,1071
-optimum/rbln/ops/__init__.py,sha256=rSz6mfC0aGbNYjMaNSsOZSPYxPRenW8DWbNpAkjTfAc,703
-optimum/rbln/ops/attn.py,sha256=x02yFLk7FcONFqfow0ROmVy9fmxo5Pw0SPCiDY3AZNg,9012
-optimum/rbln/ops/flash_attn.py,sha256=NmCqUdMTzgJ4sbYGj8IWXJEsLWvbuCMponR01w5DK6w,4121
+optimum/rbln/ops/__init__.py,sha256=SPepB2VbmvEgathWAs_oCbDOPVyBhPey3wZX2X6dIBM,738
+optimum/rbln/ops/attn.py,sha256=lFAypLsboLq9p74y3n-x7iwYTjaKdCZGTKLgvFWkXTI,9481
+optimum/rbln/ops/flash_attn.py,sha256=z39DJZSk94630ueoOCkiybxR5gzvNR-SRADHs0F6pzU,4346
 optimum/rbln/ops/kv_cache_update.py,sha256=HjnHBR-oFrJQibsVnkYb0P5_-wEma8jl0mkjkylwakU,1270
 optimum/rbln/ops/linear.py,sha256=1_7Hg-9wXxhu97fqPobotLQx17k7VPeSSL91_9Z7EDg,1018
-optimum/rbln/transformers/__init__.py,sha256=P89UOclQWiLgNkH90GXdnwWD2492O2tusM-fZApfBNg,8084
+optimum/rbln/ops/sliding_window_attn.py,sha256=EQrV_yRGc5z6kvwEsAcLP028bJWkQg2UPI3xubt9skU,3487
+optimum/rbln/transformers/__init__.py,sha256=LW6abfb0W0jHziE8dIEDBeyb4Cj-aq8dUldOYKNR6_E,9183
 optimum/rbln/transformers/configuration_alias.py,sha256=qFVfg6ohsR7a6b-CBgxjBUPDrk9MyiJwtO8AQah_RTU,1505
 optimum/rbln/transformers/configuration_generic.py,sha256=XIiZ1-5p1CMHhG7Sr2qR4SLYKcYw9aph7eGlga3Opx0,5056
 optimum/rbln/transformers/modeling_alias.py,sha256=yx7FnZQWAnrWzivaO5hI7T6i-fyLzt2tMIXG2oDNbPo,1657
 optimum/rbln/transformers/modeling_generic.py,sha256=nT_lytAILkYtwBVJKxXg0dxmh0UpjGYO6zOdLoMs1uU,12891
 optimum/rbln/transformers/modeling_rope_utils.py,sha256=3zwkhYUyTZhxCJUSmwCc88iiY1TppRWEY9ShwUqNB2k,14293
-optimum/rbln/transformers/models/__init__.py,sha256=72eMPN5UYGJ9P5gnJ2yi25cGdX1jV7viTOKmsX2OqBg,7221
-optimum/rbln/transformers/models/auto/__init__.py,sha256=GvGbb3ZpMv-h6euXeZ42jSizoOfrL2O1uvpAnfKxYEo,1034
+optimum/rbln/transformers/models/__init__.py,sha256=qNh_d7bBKxhxBbUImXJ66n0Vo0NW1m7tMIU5M2ZxGmw,8510
+optimum/rbln/transformers/models/auto/__init__.py,sha256=34Xghf1ogG4u-jhBMlj134nHdgnR3JEHSeZTPuy3MpY,1071
 optimum/rbln/transformers/models/auto/auto_factory.py,sha256=Uf5rCUoxec2qhIAwbAeZNZN4NIMFaLurSB1EdI79lwA,7044
-optimum/rbln/transformers/models/auto/modeling_auto.py,sha256=Un9qoqdy3dO8JBza_bTJF_6_fRVNM9QisihSgTRFI-o,3933
+optimum/rbln/transformers/models/auto/modeling_auto.py,sha256=Ex2ARRRIt3LtKhazr0UWy67R6WFAwSKRoi5n6B8TvoI,4213
 optimum/rbln/transformers/models/bart/__init__.py,sha256=fVo-gZEmJ0yxkIxEX6ciuRAGgXNyuvaXE2s88bhbjAE,830
 optimum/rbln/transformers/models/bart/bart_architecture.py,sha256=Oo-Cdne7igKEex8wwP-gztKJHgs5GLHQjK1oc3IZIDE,5801
 optimum/rbln/transformers/models/bart/configuration_bart.py,sha256=iIuotDRU0IZteTNUY97jnsecIEYokaJ0BF5Sv_MJk00,909
@@ -77,62 +78,76 @@ optimum/rbln/transformers/models/bart/modeling_bart.py,sha256=q42gQ42Ldkfrw_rv0_
 optimum/rbln/transformers/models/bert/__init__.py,sha256=86FuGRBLw315_Roa9D5OUx6Ku2PM0DqSPZ-YSqbF-io,806
 optimum/rbln/transformers/models/bert/configuration_bert.py,sha256=NIlBRn-zrnNirkEfJ4Uv2TZRIBL761PLJ9-cZaPyzpg,1017
 optimum/rbln/transformers/models/bert/modeling_bert.py,sha256=XxsRhBhexZ2w3mRCvKl73pIyGdqcFR1RrOKG7h4EAyk,1223
+optimum/rbln/transformers/models/blip_2/__init__.py,sha256=L01gPXcUCa8Vg-bcng20vZvBIN_jlqCzwUSFuq0QOag,855
+optimum/rbln/transformers/models/blip_2/configuration_blip_2.py,sha256=Dh_gbeF46Tg3DKK4lq9DRblweI3B7XZHE2PlxO8qStU,3662
+optimum/rbln/transformers/models/blip_2/modeling_blip_2.py,sha256=4-EWHRau363-YoZQcTfLXqm97IsAs3-Uya2L1IVGfxE,10830
 optimum/rbln/transformers/models/clip/__init__.py,sha256=TLeXDqcFK6M6v9x7Xr64kBbqGu3hFHM7p754dQ8UVQc,938
 optimum/rbln/transformers/models/clip/configuration_clip.py,sha256=wgfZeVvcVdSzrN9tcnt7DKJQ0NLR0REvW7MyUXyv2Bg,2976
 optimum/rbln/transformers/models/clip/modeling_clip.py,sha256=UslcDN6otyQ_psou7F_YcdK5vCImEtgIdcbwmexSfOM,7256
 optimum/rbln/transformers/models/decoderonly/__init__.py,sha256=vQYZDDdoddwA7yKc5zzrq2Zs9sax-0p8rNF_aYfF4bk,1006
-optimum/rbln/transformers/models/decoderonly/configuration_decoderonly.py,sha256=tIBzKmts1Ea-CZWXC7RtJqeE9bd5wjmkugZg269wmVg,5962
-optimum/rbln/transformers/models/decoderonly/decoderonly_architecture.py,sha256=NG2tKC3gT57r34PYKgU0evZHctEHzJGRrk2FOjLyK7Q,41748
-optimum/rbln/transformers/models/decoderonly/modeling_decoderonly.py,sha256=n5Kh5hE49m8Rl94DDwe2aDD3Y-dCPwRcENn-x9qkpzM,45245
+optimum/rbln/transformers/models/decoderonly/configuration_decoderonly.py,sha256=WQlHUjcMuD_3BPLo1Ytzz-xAI-8J9BYfr7dEzmpLVks,6389
+optimum/rbln/transformers/models/decoderonly/decoderonly_architecture.py,sha256=m_wTGXSK8cBG3NjLDNLTxSWyErl7MB4PPU9fQ6zijEI,45991
+optimum/rbln/transformers/models/decoderonly/modeling_decoderonly.py,sha256=bYhw5co6aeueDNR2VHc9vwzhn9JL_fHTJS7E2bE6500,49471
 optimum/rbln/transformers/models/dpt/__init__.py,sha256=Nzep9mlzKyL1kV726IBqY8DnLp1DkH9JzFeknWSRhok,714
 optimum/rbln/transformers/models/dpt/configuration_dpt.py,sha256=4fW6bzVhaAxym4wGV3F785rvUOoWPyw_gdEMqB08Leg,755
 optimum/rbln/transformers/models/dpt/modeling_dpt.py,sha256=oKLX7MQZvfk1QB8wOtcdi7AmZH2fOIVbypa9A3RA9MI,733
 optimum/rbln/transformers/models/exaone/__init__.py,sha256=eUL0mq3yGVzCQfjLlOtVF2MecIN3DQWm07EmXubGSTs,921
 optimum/rbln/transformers/models/exaone/configuration_exaone.py,sha256=97r1wkO9cgwErePk2UX6n7WeVkOmWUeGgpK6qAGOUi4,774
-optimum/rbln/transformers/models/exaone/exaone_architecture.py,sha256=ZM5vvz8KBipOiMVi8vqfvejkDSknW69xh4GrvJix-g0,3350
+optimum/rbln/transformers/models/exaone/exaone_architecture.py,sha256=UTpMOLFOt3r9eziNRd8qWU6ekVmM3CxTxg5x8mA12MI,3511
 optimum/rbln/transformers/models/exaone/modeling_exaone.py,sha256=WjyH8PmsMljSea7kJn_Cq1FJ96OXwXAoU7hv2Q8zUnI,1747
 optimum/rbln/transformers/models/gemma/__init__.py,sha256=VqPIlokw3kjn_ZoLXINCLXw3vaysQFo5oPGGy6bnt4Q,708
 optimum/rbln/transformers/models/gemma/configuration_gemma.py,sha256=ek7PiMWx4LDAJ0mCedJ55o_TKTiOCSGD5V-1o1Fy4f8,773
-optimum/rbln/transformers/models/gemma/gemma_architecture.py,sha256=bmCx405FVcffhgrQ53qMMZDbSlPxWOjucMHbvq19Gnw,2286
+optimum/rbln/transformers/models/gemma/gemma_architecture.py,sha256=_Ip8J4IKEkXwEiynKvoj7NEYDR0eJ4IEWXqgjXibBy4,2447
 optimum/rbln/transformers/models/gemma/modeling_gemma.py,sha256=-U3w3cEOv3ps1S8aL7uOq6Kq2siCPZz7Z8MXhDQgQqo,1530
+optimum/rbln/transformers/models/gemma3/__init__.py,sha256=6rugk3615SEt4lh7gduo_J9VyGiSReuEIvL0Uno0eaI,790
+optimum/rbln/transformers/models/gemma3/configuration_gemma3.py,sha256=nndcYVwDYkOige_qO4td-YwLNtUz6aLiSQDIfPdGG9A,2840
+optimum/rbln/transformers/models/gemma3/gemma3_architecture.py,sha256=Uer27wG06hgV1WNf92x1ZeUpl4Q0zskfCqzlLhtgtNU,17348
+optimum/rbln/transformers/models/gemma3/modeling_gemma3.py,sha256=OUGsML-H6FOKldld7KRW9l0nRoT4DojWBDl8ZHpfXVA,44982
 optimum/rbln/transformers/models/gpt2/__init__.py,sha256=socBMIBZSiLbrVN12rQ4nL9gFeT0axMgz6SWaCaD4Ac,704
 optimum/rbln/transformers/models/gpt2/configuration_gpt2.py,sha256=vKvJD8P9Li4W9wdVoQcqMEr1MwEXojPBnF2NE85VXAo,772
-optimum/rbln/transformers/models/gpt2/gpt2_architecture.py,sha256=1IxqHmB-GlH2Dv2Yk4z0rMxL9CpxMGHhSu_x8_4cxvs,3008
+optimum/rbln/transformers/models/gpt2/gpt2_architecture.py,sha256=kf5jk7Djv9XXX3Q83oTosiMpt9g44TF_gCT-vMiWDJk,3097
 optimum/rbln/transformers/models/gpt2/modeling_gpt2.py,sha256=qBDanUk_O-HtOIVCA4IE3FYyCsnL9xIDK00vft-0caw,1490
 optimum/rbln/transformers/models/idefics3/__init__.py,sha256=ulxE7HEfXsNJhd25J9Fvi6vggo9aZH9sLKJjWB6LlzQ,814
 optimum/rbln/transformers/models/idefics3/configuration_idefics3.py,sha256=sM0pXsvkxcpDXagoKlqwKdBAcNdayB9KlWdYC9xlyDU,1889
-optimum/rbln/transformers/models/idefics3/modeling_idefics3.py,sha256=Rr9BJDyoOqJFQ8dJV78QU4Tjjhhj3aqRk05JcDqFv6Y,17904
+optimum/rbln/transformers/models/idefics3/modeling_idefics3.py,sha256=oSF08arqwjoodq9_A304jhRlQbk_FEIkR4EhJqiNAzk,18062
 optimum/rbln/transformers/models/llama/__init__.py,sha256=knxvRkPx8x6-WOxqSq_PlaKYD-9F9Q8dh7r095Esey0,708
 optimum/rbln/transformers/models/llama/configuration_llama.py,sha256=B9gr4pTn9yiv3-8DIk0P7_AQdIHEc7SuLaH9gZAmP8E,773
 optimum/rbln/transformers/models/llama/llama_architecture.py,sha256=S7MCPfyjG5eUqgaS-QNBB0ApUD6wnb5fR0RHq7k7-pA,728
 optimum/rbln/transformers/models/llama/modeling_llama.py,sha256=Z3iony7icoFhRQ11MAuFx9UF03uJCsvJQZ6bxHXlrgk,1530
 optimum/rbln/transformers/models/llava_next/__init__.py,sha256=kDXKr7wMkp1XqE__DER2B8kQF_NYMxhzsQS5ytGg56I,752
 optimum/rbln/transformers/models/llava_next/configuration_llava_next.py,sha256=QPreWZyohwRL23GOyvoAfKtk5UNg7IJ_Y_pNfUDe7cU,1838
-optimum/rbln/transformers/models/llava_next/modeling_llava_next.py,sha256=xOXc1XUIK4oLSFvAq7Q0lxiOLlDFMbFdOcg5JvLnVkI,25979
+optimum/rbln/transformers/models/llava_next/modeling_llava_next.py,sha256=Igq_VCcOgSxltzm7eV9F5MiHS-vyDAp4DIswH80q76c,26022
 optimum/rbln/transformers/models/midm/__init__.py,sha256=IC3FETwgYinbp3wDj7tp4zIHJhbqM-c6GfTRdYcMNj8,913
 optimum/rbln/transformers/models/midm/configuration_midm.py,sha256=Kv5g5dIsBrhGcZ2_pFUOPNB80np4Xiw0wPH1IZm1PHI,772
-optimum/rbln/transformers/models/midm/midm_architecture.py,sha256=357iviqQkzI0s_lU_teH1sVOChNRDUABe3GA0HuhZZY,5444
+optimum/rbln/transformers/models/midm/midm_architecture.py,sha256=I2oEE6IjV0Khx5X9t2NpOzEF59zacw6XJgEFxKL26cA,5533
 optimum/rbln/transformers/models/midm/modeling_midm.py,sha256=GG25BozEZriAL-OPFGpzOjyDtSFB-NfeiLJTDAqxe20,1734
 optimum/rbln/transformers/models/mistral/__init__.py,sha256=9FE64bCYfSIyrBkRcwlqF8QyacSJFWvwEufHFi1ZIrM,716
 optimum/rbln/transformers/models/mistral/configuration_mistral.py,sha256=zCHZnmjTXs7UKYIIRR2IYjccROm5ODXfonWploITNxg,775
 optimum/rbln/transformers/models/mistral/mistral_architecture.py,sha256=_aU8TE_tdvfo0K7QpgTlz_d0qwk4O82dl9268lPL16E,733
 optimum/rbln/transformers/models/mistral/modeling_mistral.py,sha256=7nrddoBIHf8S12LZWBUpotnvG3gND11vMQda9yYXJ-s,1560
+optimum/rbln/transformers/models/opt/__init__.py,sha256=w0v8GzbzlR5_4yL851njGDSJgX89TrYxrHnpNfMHZEI,700
+optimum/rbln/transformers/models/opt/configuration_opt.py,sha256=1BIxum4m6An5dsYpw1Kmf-QIHSGQK8uDjMd2hUkRvzE,771
+optimum/rbln/transformers/models/opt/modeling_opt.py,sha256=NteN2EIW0le-QT_gWyGUb7yC-eAqHrI1x1UflCldu6Q,3131
+optimum/rbln/transformers/models/opt/opt_architecture.py,sha256=zrgOrZ2C_mdHcX-beOu6TB52rjNhe3PLqS5BpC-_UpU,2681
 optimum/rbln/transformers/models/phi/__init__.py,sha256=uqQb-sO1HXuaju2hfo7qJHk_IWhnptY-qFjNjK_uOc0,700
 optimum/rbln/transformers/models/phi/configuration_phi.py,sha256=9Mk06ZNymGnC2P0eiU02oguH1KFKxL-LYtMJSNqpmmo,771
 optimum/rbln/transformers/models/phi/modeling_phi.py,sha256=j-6Pqd5rR2JE8I1pnKFlCi4nW5Dv3wZjoPWxohissoo,1516
-optimum/rbln/transformers/models/phi/phi_architecture.py,sha256=TueyqmjPXWmOPOxBm4dIFyd0X3iV1jgw0U6c26iCAPk,4090
+optimum/rbln/transformers/models/phi/phi_architecture.py,sha256=MioLLM4uxZvJqaWQn25WvDo85pI_rXKTJqlwaptqZ80,4191
 optimum/rbln/transformers/models/qwen2/__init__.py,sha256=Tu4_AXy3ktTvxGwxED3kewiv62S75HgDWD6-TeC1DfA,708
 optimum/rbln/transformers/models/qwen2/configuration_qwen2.py,sha256=sQBu4UjM8Ctiy696FLjKeck1t49MR31zWTCN_bMvBl4,773
 optimum/rbln/transformers/models/qwen2/modeling_qwen2.py,sha256=9-aFDvjMzPNUyGOz0qo33RE18bUFGYZ3Wt_68zb5uJY,1530
 optimum/rbln/transformers/models/qwen2/qwen2_architecture.py,sha256=XlNAMYAcDLohnSAhIFGKOPuCB5XLgzYs5ABWdeQSaZs,720
 optimum/rbln/transformers/models/qwen2_5_vl/__init__.py,sha256=rAW3DKQUzGL6EMwa5r1iLu94yhpiZpk6zfoD7TtYXrc,865
 optimum/rbln/transformers/models/qwen2_5_vl/configuration_qwen2_5_vl.py,sha256=dPcGNaLwJf61PIvVbyt-lvBflp_dvK0hubhNoA3len0,3123
-optimum/rbln/transformers/models/qwen2_5_vl/modeling_qwen2_5_vl.py,sha256=sKsDAiMGWtbquTw6_PITK4ijL0aHBZqgs2nPObEiFN8,24951
-optimum/rbln/transformers/models/qwen2_5_vl/qwen2_5_vl_architecture.py,sha256=YRy7Ylm-UQLovt5BmxhayJMKzF3rj0_HIc4tUXaiPO0,7474
+optimum/rbln/transformers/models/qwen2_5_vl/modeling_qwen2_5_vl.py,sha256=DUlTQc24IJwWMTIi3ou3F7eraYJy9WERjH7yAZo80u4,25172
+optimum/rbln/transformers/models/qwen2_5_vl/qwen2_5_vl_architecture.py,sha256=OR-tTu8uzeFryenohoqRwgIVqw5zM7dcsZHwKL_jD0A,7232
 optimum/rbln/transformers/models/seq2seq/__init__.py,sha256=6WKstWiS1kW0oFDn_jyrKMW5QEJAWkmsSRAaadNedDM,715
 optimum/rbln/transformers/models/seq2seq/configuration_seq2seq2.py,sha256=vSNP1eILfL32cbiLOAD58Ocz6lk3hYFnhIRLDVqlSoI,2624
 optimum/rbln/transformers/models/seq2seq/modeling_seq2seq.py,sha256=7MN6CNVyYg4JsULYXDfQ_KkDd3w-1TXuxndSrM-CX8w,16980
-optimum/rbln/transformers/models/seq2seq/seq2seq_architecture.py,sha256=w5pMnWbJhgYmpl5NT_vJEzcb4RfEbHfalJ371IL3wp8,18685
+optimum/rbln/transformers/models/seq2seq/seq2seq_architecture.py,sha256=i2YXcusNvWjqYmS3ZvrWJiilovKIlfozB92fqDrtwq8,18729
+optimum/rbln/transformers/models/siglip/__init__.py,sha256=39MdhvWLZU0_9julQtJYVEiWI4csPrryS9krMauEA3s,730
+optimum/rbln/transformers/models/siglip/configuration_siglip.py,sha256=tXzkTXeFamOwRnafJMYmjIPDODKwM6xNsW-UTf5cH38,2625
+optimum/rbln/transformers/models/siglip/modeling_siglip.py,sha256=hvffh55rYxHx7CLHe5TR_5nfCGUhVd3dUmCwUasLjwE,5941
 optimum/rbln/transformers/models/t5/__init__.py,sha256=R1Q8Z1vaIdx4rDjeCmm_ZMSgewWaqaI0l93AHwewtew,818
 optimum/rbln/transformers/models/t5/configuration_t5.py,sha256=cOa2NAAocNSSECTtLpOsVVLfn4-7l7K7jz3nf6CSNCs,912
 optimum/rbln/transformers/models/t5/modeling_t5.py,sha256=cnN76IAw6QaJN8Oodfk5Y4Dte6m84Fy_CRgnqquzzTI,2990
@@ -148,12 +163,12 @@ optimum/rbln/transformers/models/whisper/__init__.py,sha256=ErquiUlYycSYPsDcq9Iw
 optimum/rbln/transformers/models/whisper/configuration_whisper.py,sha256=-Su7pbkg3gkYTf-ECRJyxkpD3JtUJX4y5Mfml8tJJBI,2612
 optimum/rbln/transformers/models/whisper/generation_whisper.py,sha256=GIHTca3b1VtW81kp7BzKQ7f77c2t9OsEsbZetripgDo,4582
 optimum/rbln/transformers/models/whisper/modeling_whisper.py,sha256=7VcOjxV3ZAHBYFDLiSc6wVJ3PZLqzmbBAIkQ4JVfpNM,17538
-optimum/rbln/transformers/models/whisper/whisper_architecture.py,sha256=zEwfn8DDTbt2TN7lHKMZG9JXZc5WdW9Cp8mH4OVfo3s,13949
+optimum/rbln/transformers/models/whisper/whisper_architecture.py,sha256=fKUbAMIl20o6EBMVcLg9TDSsJ1FDp8NKcl4jT9RWCEM,13981
 optimum/rbln/transformers/models/xlm_roberta/__init__.py,sha256=mFeFTiF6xY_n1glUsvZ420uKKwkeVOS5Oag0L6E4Qs8,718
 optimum/rbln/transformers/models/xlm_roberta/configuration_xlm_roberta.py,sha256=XBICzoxTaZ8DhBtr8qos2tDJar4jvCiKOZwXGImlTAw,779
 optimum/rbln/transformers/models/xlm_roberta/modeling_xlm_roberta.py,sha256=rro7kH_BLDIlKSBRUfeuX-qQu6MeO5SzbVcf0AbFxEk,757
 optimum/rbln/transformers/utils/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-optimum/rbln/transformers/utils/rbln_quantization.py,sha256=gwBVHf97sQgPNmGa0wq87E8mPyrtXYhMnO4X4sKp3c8,7639
+optimum/rbln/transformers/utils/rbln_quantization.py,sha256=um0N2ZruU_lNibo6rlzgwHAI2_8QOrYE7W7pA1qfXKM,9396
 optimum/rbln/utils/__init__.py,sha256=ieDBT2VFTt2E0M4v_POLBpuGW9LxSydpb_DuPd6PQqc,712
 optimum/rbln/utils/decorator_utils.py,sha256=xu-TrsNi33SRC2a7DBsyoo6-pEQxWKZPZSmM9QlDe2Y,3745
 optimum/rbln/utils/hub.py,sha256=Z_R9Ic9VAew8bUmlaAlxZf5JGMDBivHvvFRI557pILY,4196
@@ -162,8 +177,8 @@ optimum/rbln/utils/logging.py,sha256=VKKBmlQSdg6iZCGmAXaWYiW67K84jyp1QJhLQSSjPPE
 optimum/rbln/utils/model_utils.py,sha256=V2kFpUe2aqVzLwbpztD8JOVFQqRHncvIWwJbgnUPr4E,1274
 optimum/rbln/utils/runtime_utils.py,sha256=LoKNK3AQNV_BSScstIZWjICkJf265MnUgy360BOocVI,5454
 optimum/rbln/utils/save_utils.py,sha256=hG5uOtYmecSXZuGTvCXsTM-SiyZpr5q3InUGCCq_jzQ,3619
-optimum/rbln/utils/submodule.py,sha256=TtcH3OLctFd2Dosc-zNMGZ8xOXKKUfE91dLQ1v09E8Q,4636
-optimum_rbln-0.7.5a0.dist-info/METADATA,sha256=4whxRZ9ifF1V_E6GUaWfwDfEW8oM0ahTpV_KttLvsrE,5299
-optimum_rbln-0.7.5a0.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-optimum_rbln-0.7.5a0.dist-info/licenses/LICENSE,sha256=QwcOLU5TJoTeUhuIXzhdCEEDDvorGiC6-3YTOl4TecE,11356
-optimum_rbln-0.7.5a0.dist-info/RECORD,,
+optimum/rbln/utils/submodule.py,sha256=ZfI7e3YzbjbbBW4Yjfucj8NygEsukfIkaJi3PtwHrhc,5105
+optimum_rbln-0.7.5rc0.dist-info/METADATA,sha256=aXeccsNinGR5xXxBOKIMhxfeHyF-wQE5DxWtOrt2WyI,5300
+optimum_rbln-0.7.5rc0.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+optimum_rbln-0.7.5rc0.dist-info/licenses/LICENSE,sha256=QwcOLU5TJoTeUhuIXzhdCEEDDvorGiC6-3YTOl4TecE,11356
+optimum_rbln-0.7.5rc0.dist-info/RECORD,,

{optimum_rbln-0.7.5a0.dist-info → optimum_rbln-0.7.5rc0.dist-info}/WHEEL RENAMED Viewed

File without changes

{optimum_rbln-0.7.5a0.dist-info → optimum_rbln-0.7.5rc0.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

optimum-rbln 0.7.5a0__py3-none-any.whl → 0.7.5rc0__py3-none-any.whl

optimum-rbln 0.7.5a0py3-none-any.whl → 0.7.5rc0py3-none-any.whl