PyPI - mct-nightly - Versions diffs - 2.1.0.20240806.441__py3-none-any.whl → 2.1.0.20240808.431__py3-none-any.whl - Mend

mct-nightly 2.1.0.20240806.441py3-none-any.whl → 2.1.0.20240808.431py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

model_compression_toolkit/gptq/keras/quantization_facade.py CHANGED Viewed

@@ -31,7 +31,7 @@ from model_compression_toolkit.core.runner import core_runner
 from model_compression_toolkit.gptq.runner import gptq_runner
 from model_compression_toolkit.core.analyzer import analyzer_model_quantization
 from model_compression_toolkit.target_platform_capabilities.target_platform.targetplatform2framework import TargetPlatformCapabilities
-from model_compression_toolkit.metadata import get_versions_dict
+from model_compression_toolkit.metadata import get_versions_dict, create_model_metadata
 LR_DEFAULT = 0.15
 LR_REST_DEFAULT = 1e-4
@@ -208,15 +208,15 @@ if FOUND_TF:
         fw_impl = GPTQKerasImplemantation()
-        tg, bit_widths_config, hessian_info_service = core_runner(in_model=in_model,
-                                                                  representative_data_gen=representative_data_gen,
-                                                                  core_config=core_config,
-                                                                  fw_info=DEFAULT_KERAS_INFO,
-                                                                  fw_impl=fw_impl,
-                                                                  tpc=target_platform_capabilities,
-                                                                  target_resource_utilization=target_resource_utilization,
-                                                                  tb_w=tb_w,
-                                                                  running_gptq=True)
+        tg, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=in_model,
+                                                                                   representative_data_gen=representative_data_gen,
+                                                                                   core_config=core_config,
+                                                                                   fw_info=DEFAULT_KERAS_INFO,
+                                                                                   fw_impl=fw_impl,
+                                                                                   tpc=target_platform_capabilities,
+                                                                                   target_resource_utilization=target_resource_utilization,
+                                                                                   tb_w=tb_w,
+                                                                                   running_gptq=True)
         float_graph = copy.deepcopy(tg)
@@ -242,7 +242,9 @@ if FOUND_TF:
         exportable_model, user_info = get_exportable_keras_model(tg_gptq)
         if target_platform_capabilities.tp_model.add_metadata:
-            exportable_model = add_metadata(exportable_model, get_versions_dict(target_platform_capabilities))
+            exportable_model = add_metadata(exportable_model,
+                                            create_model_metadata(tpc=target_platform_capabilities,
+                                                                  scheduling_info=scheduling_info))
         return exportable_model, user_info
 else:

model_compression_toolkit/gptq/pytorch/quantization_facade.py CHANGED Viewed

@@ -31,7 +31,7 @@ from model_compression_toolkit.core.analyzer import analyzer_model_quantization
 from model_compression_toolkit.core import CoreConfig
 from model_compression_toolkit.core.common.mixed_precision.mixed_precision_quantization_config import \
     MixedPrecisionQuantizationConfig
-from model_compression_toolkit.metadata import get_versions_dict
+from model_compression_toolkit.metadata import get_versions_dict, create_model_metadata
 LR_DEFAULT = 1e-4
 LR_REST_DEFAULT = 1e-4
@@ -177,15 +177,15 @@ if FOUND_TORCH:
         # ---------------------- #
         # Core Runner
         # ---------------------- #
-        graph, bit_widths_config, hessian_info_service = core_runner(in_model=model,
-                                                                     representative_data_gen=representative_data_gen,
-                                                                     core_config=core_config,
-                                                                     fw_info=DEFAULT_PYTORCH_INFO,
-                                                                     fw_impl=fw_impl,
-                                                                     tpc=target_platform_capabilities,
-                                                                     target_resource_utilization=target_resource_utilization,
-                                                                     tb_w=tb_w,
-                                                                     running_gptq=True)
+        graph, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=model,
+                                                                                      representative_data_gen=representative_data_gen,
+                                                                                      core_config=core_config,
+                                                                                      fw_info=DEFAULT_PYTORCH_INFO,
+                                                                                      fw_impl=fw_impl,
+                                                                                      tpc=target_platform_capabilities,
+                                                                                      target_resource_utilization=target_resource_utilization,
+                                                                                      tb_w=tb_w,
+                                                                                      running_gptq=True)
         float_graph = copy.deepcopy(graph)
@@ -212,7 +212,9 @@ if FOUND_TORCH:
         exportable_model, user_info = get_exportable_pytorch_model(graph_gptq)
         if target_platform_capabilities.tp_model.add_metadata:
-            exportable_model = add_metadata(exportable_model, get_versions_dict(target_platform_capabilities))
+            exportable_model = add_metadata(exportable_model,
+                                            create_model_metadata(tpc=target_platform_capabilities,
+                                                                  scheduling_info=scheduling_info))
         return exportable_model, user_info

model_compression_toolkit/metadata.py CHANGED Viewed

@@ -13,8 +13,31 @@
 # limitations under the License.
 # ==============================================================================
-from typing import Dict
-from model_compression_toolkit.constants import MCT_VERSION, TPC_VERSION
+from typing import Dict, Any
+from model_compression_toolkit.constants import MCT_VERSION, TPC_VERSION, OPERATORS_SCHEDULING, FUSED_NODES_MAPPING, \
+    CUTS, MAX_CUT, OP_ORDER, OP_RECORD, SHAPE, NODE_OUTPUT_INDEX, NODE_NAME, TOTAL_SIZE, MEM_ELEMENTS
+from model_compression_toolkit.core.common.graph.memory_graph.compute_graph_max_cut import SchedulerInfo
+from model_compression_toolkit.target_platform_capabilities.target_platform import TargetPlatformCapabilities
+def create_model_metadata(tpc: TargetPlatformCapabilities,
+                          scheduling_info: SchedulerInfo = None) -> Dict:
+    """
+    Creates and returns a metadata dictionary for the model, including version information
+    and optional scheduling information.
+    Args:
+        tpc: A TPC object to get the version.
+        scheduling_info: An object containing scheduling details and metadata. Default is None.
+    Returns:
+        Dict: A dictionary containing the model's version information and optional scheduling information.
+    """
+    _metadata = get_versions_dict(tpc)
+    if scheduling_info:
+        scheduler_metadata = get_scheduler_metadata(scheduler_info=scheduling_info)
+        _metadata['scheduling_info'] = scheduler_metadata
+    return _metadata
 def get_versions_dict(tpc) -> Dict:
@@ -27,3 +50,39 @@ def get_versions_dict(tpc) -> Dict:
     from model_compression_toolkit import __version__ as mct_version
     tpc_version = f'{tpc.name}.{tpc.version}'
     return {MCT_VERSION: mct_version, TPC_VERSION: tpc_version}
+def get_scheduler_metadata(scheduler_info: SchedulerInfo) -> Dict[str, Any]:
+    """
+    Extracts and returns metadata from SchedulerInfo.
+    Args:
+        scheduler_info (SchedulerInfo): The scheduler information object containing scheduling details like cuts and
+        fusing mapping.
+    Returns:
+        Dict[str, Any]: A dictionary containing extracted metadata, including schedule, maximum cut,
+        cuts information, and fused nodes mapping.
+    """
+    scheduler_metadata = {
+        OPERATORS_SCHEDULING: [str(layer) for layer in scheduler_info.operators_scheduling],
+        MAX_CUT: scheduler_info.max_cut,
+        CUTS: [
+            {
+                OP_ORDER: [op.name for op in cut.op_order],
+                OP_RECORD: [op.name for op in cut.op_record],
+                MEM_ELEMENTS: [
+                    {
+                        SHAPE: list(tensor.shape),
+                        NODE_NAME: tensor.node_name,
+                        TOTAL_SIZE: float(tensor.total_size),
+                        NODE_OUTPUT_INDEX: tensor.node_output_index
+                    }
+                    for tensor in cut.mem_elements.elements
+                ]
+            }
+            for cut in scheduler_info.cuts
+        ],
+        FUSED_NODES_MAPPING: scheduler_info.fused_nodes_mapping
+    }
+    return scheduler_metadata

model_compression_toolkit/ptq/keras/quantization_facade.py CHANGED Viewed

@@ -28,7 +28,7 @@ from model_compression_toolkit.core.common.mixed_precision.mixed_precision_quant
 from model_compression_toolkit.target_platform_capabilities.target_platform.targetplatform2framework import TargetPlatformCapabilities
 from model_compression_toolkit.core.runner import core_runner
 from model_compression_toolkit.ptq.runner import ptq_runner
-from model_compression_toolkit.metadata import get_versions_dict
+from model_compression_toolkit.metadata import create_model_metadata
 if FOUND_TF:
     from model_compression_toolkit.core.keras.default_framework_info import DEFAULT_KERAS_INFO
@@ -134,14 +134,14 @@ if FOUND_TF:
         fw_impl = KerasImplementation()
         # Ignore returned hessian service as PTQ does not use it
-        tg, bit_widths_config, _ = core_runner(in_model=in_model,
-                                               representative_data_gen=representative_data_gen,
-                                               core_config=core_config,
-                                               fw_info=fw_info,
-                                               fw_impl=fw_impl,
-                                               tpc=target_platform_capabilities,
-                                               target_resource_utilization=target_resource_utilization,
-                                               tb_w=tb_w)
+        tg, bit_widths_config, _, scheduling_info = core_runner(in_model=in_model,
+                                                                representative_data_gen=representative_data_gen,
+                                                                core_config=core_config,
+                                                                fw_info=fw_info,
+                                                                fw_impl=fw_impl,
+                                                                tpc=target_platform_capabilities,
+                                                                target_resource_utilization=target_resource_utilization,
+                                                                tb_w=tb_w)
         # At this point, tg is a graph that went through substitutions (such as BN folding) and is
         # ready for quantization (namely, it holds quantization params, etc.) but the weights are
@@ -168,7 +168,9 @@ if FOUND_TF:
         exportable_model, user_info = get_exportable_keras_model(graph_with_stats_correction)
         if target_platform_capabilities.tp_model.add_metadata:
-            exportable_model = add_metadata(exportable_model, get_versions_dict(target_platform_capabilities))
+            exportable_model = add_metadata(exportable_model,
+                                            create_model_metadata(tpc=target_platform_capabilities,
+                                                                  scheduling_info=scheduling_info))
         return exportable_model, user_info

model_compression_toolkit/ptq/pytorch/quantization_facade.py CHANGED Viewed

@@ -16,7 +16,6 @@ import copy
 from typing import Callable
-from model_compression_toolkit.core import common
 from model_compression_toolkit.core.common.visualization.tensorboard_writer import init_tensorboard_writer
 from model_compression_toolkit.logger import Logger
 from model_compression_toolkit.constants import PYTORCH, FOUND_TORCH
@@ -29,8 +28,7 @@ from model_compression_toolkit.core.runner import core_runner
 from model_compression_toolkit.ptq.runner import ptq_runner
 from model_compression_toolkit.core.analyzer import analyzer_model_quantization
 from model_compression_toolkit.core.common.quantization.quantize_graph_weights import quantize_graph_weights
-from model_compression_toolkit.metadata import get_versions_dict
+from model_compression_toolkit.metadata import create_model_metadata
 if FOUND_TORCH:
     from model_compression_toolkit.core.pytorch.default_framework_info import DEFAULT_PYTORCH_INFO
@@ -109,14 +107,14 @@ if FOUND_TORCH:
         fw_impl = PytorchImplementation()
         # Ignore hessian info service as it is not used here yet.
-        tg, bit_widths_config, _ = core_runner(in_model=in_module,
-                                               representative_data_gen=representative_data_gen,
-                                               core_config=core_config,
-                                               fw_info=fw_info,
-                                               fw_impl=fw_impl,
-                                               tpc=target_platform_capabilities,
-                                               target_resource_utilization=target_resource_utilization,
-                                               tb_w=tb_w)
+        tg, bit_widths_config, _, scheduling_info = core_runner(in_model=in_module,
+                                                                representative_data_gen=representative_data_gen,
+                                                                core_config=core_config,
+                                                                fw_info=fw_info,
+                                                                fw_impl=fw_impl,
+                                                                tpc=target_platform_capabilities,
+                                                                target_resource_utilization=target_resource_utilization,
+                                                                tb_w=tb_w)
         # At this point, tg is a graph that went through substitutions (such as BN folding) and is
         # ready for quantization (namely, it holds quantization params, etc.) but the weights are
@@ -143,7 +141,9 @@ if FOUND_TORCH:
         exportable_model, user_info = get_exportable_pytorch_model(graph_with_stats_correction)
         if target_platform_capabilities.tp_model.add_metadata:
-            exportable_model = add_metadata(exportable_model, get_versions_dict(target_platform_capabilities))
+            exportable_model = add_metadata(exportable_model,
+                                            create_model_metadata(tpc=target_platform_capabilities,
+                                                                  scheduling_info=scheduling_info))
         return exportable_model, user_info

model_compression_toolkit/qat/keras/quantization_facade.py CHANGED Viewed

@@ -187,14 +187,14 @@ if FOUND_TF:
         fw_impl = KerasImplementation()
         # Ignore hessian service since is not used in QAT at the moment
-        tg, bit_widths_config, _ = core_runner(in_model=in_model,
-                                               representative_data_gen=representative_data_gen,
-                                               core_config=core_config,
-                                               fw_info=DEFAULT_KERAS_INFO,
-                                               fw_impl=fw_impl,
-                                               tpc=target_platform_capabilities,
-                                               target_resource_utilization=target_resource_utilization,
-                                               tb_w=tb_w)
+        tg, bit_widths_config, _, _ = core_runner(in_model=in_model,
+                                                  representative_data_gen=representative_data_gen,
+                                                  core_config=core_config,
+                                                  fw_info=DEFAULT_KERAS_INFO,
+                                                  fw_impl=fw_impl,
+                                                  tpc=target_platform_capabilities,
+                                                  target_resource_utilization=target_resource_utilization,
+                                                  tb_w=tb_w)
         tg = ptq_runner(tg, representative_data_gen, core_config, DEFAULT_KERAS_INFO, fw_impl, tb_w)

model_compression_toolkit/qat/pytorch/quantization_facade.py CHANGED Viewed

@@ -154,14 +154,14 @@ if FOUND_TORCH:
         fw_impl = PytorchImplementation()
         # Ignore hessian scores service as we do not use it here
-        tg, bit_widths_config, _ = core_runner(in_model=in_model,
-                                               representative_data_gen=representative_data_gen,
-                                               core_config=core_config,
-                                               fw_info=DEFAULT_PYTORCH_INFO,
-                                               fw_impl=fw_impl,
-                                               tpc=target_platform_capabilities,
-                                               target_resource_utilization=target_resource_utilization,
-                                               tb_w=tb_w)
+        tg, bit_widths_config, _, _ = core_runner(in_model=in_model,
+                                                  representative_data_gen=representative_data_gen,
+                                                  core_config=core_config,
+                                                  fw_info=DEFAULT_PYTORCH_INFO,
+                                                  fw_impl=fw_impl,
+                                                  tpc=target_platform_capabilities,
+                                                  target_resource_utilization=target_resource_utilization,
+                                                  tb_w=tb_w)
         tg = ptq_runner(tg, representative_data_gen, core_config, DEFAULT_PYTORCH_INFO, fw_impl, tb_w)

model_compression_toolkit/target_platform_capabilities/target_platform/__init__.py CHANGED Viewed

@@ -17,7 +17,8 @@ from model_compression_toolkit.target_platform_capabilities.target_platform.fusi
 from model_compression_toolkit.target_platform_capabilities.target_platform.targetplatform2framework.attribute_filter import AttributeFilter
 from model_compression_toolkit.target_platform_capabilities.target_platform.targetplatform2framework import TargetPlatformCapabilities, OperationsSetToLayers, Smaller, SmallerEq, NotEq, Eq, GreaterEq, Greater, LayerFilterParams, OperationsToLayers, get_current_tpc
 from model_compression_toolkit.target_platform_capabilities.target_platform.target_platform_model import get_default_quantization_config_options, TargetPlatformModel
-from model_compression_toolkit.target_platform_capabilities.target_platform.op_quantization_config import OpQuantizationConfig, QuantizationConfigOptions, AttributeQuantizationConfig
+from model_compression_toolkit.target_platform_capabilities.target_platform.op_quantization_config import \
+    OpQuantizationConfig, QuantizationConfigOptions, AttributeQuantizationConfig, Signedness
 from model_compression_toolkit.target_platform_capabilities.target_platform.operators import OperatorsSet, OperatorSetConcat
 from mct_quantizers import QuantizationMethod

model_compression_toolkit/target_platform_capabilities/target_platform/op_quantization_config.py CHANGED Viewed

@@ -15,12 +15,26 @@
 import copy
 from typing import List, Dict, Union, Any, Tuple
+from enum import Enum
 from mct_quantizers import QuantizationMethod
 from model_compression_toolkit.constants import FLOAT_BITWIDTH
 from model_compression_toolkit.logger import Logger
+class Signedness(Enum):
+    """
+    An enum for choosing the signedness of the quantization method:
+    AUTO - Signedness decided automatically by quantization.
+    SIGNED - Force signed quantization.
+    UNSIGNED - Force unsigned quantization.
+    """
+    AUTO = 0
+    SIGNED = 1
+    UNSIGNED = 2
 def clone_and_edit_object_params(obj: Any, **kwargs: Dict) -> Any:
     """
     Clones the given object and edit some of its parameters.
@@ -120,7 +134,7 @@ class OpQuantizationConfig:
                  fixed_scale: float,
                  fixed_zero_point: int,
                  simd_size: int,
-                 is_signed: bool = None
+                 signedness: Signedness
                  ):
         """
@@ -134,8 +148,8 @@ class OpQuantizationConfig:
             quantization_preserving (bool): Whether quantization parameters should be the same for an operator's input and output.
             fixed_scale (float): Scale to use for an operator quantization parameters.
             fixed_zero_point (int): Zero-point to use for an operator quantization parameters.
-            is_signed (bool): Force activation quantization signedness (None means don't force).
             simd_size (int): Per op integer representing the Single Instruction, Multiple Data (SIMD) width of an operator. It indicates the number of data elements that can be fetched and processed simultaneously in a single instruction.
+            signedness (bool): Set activation quantization signedness.
         """
@@ -154,7 +168,7 @@ class OpQuantizationConfig:
         self.quantization_preserving = quantization_preserving
         self.fixed_scale = fixed_scale
         self.fixed_zero_point = fixed_zero_point
-        self.is_signed = is_signed
+        self.signedness = signedness
         self.simd_size = simd_size
     def get_info(self):
@@ -206,7 +220,7 @@ class OpQuantizationConfig:
             self.activation_n_bits == other.activation_n_bits and \
             self.supported_input_activation_n_bits == other.supported_input_activation_n_bits and \
             self.enable_activation_quantization == other.enable_activation_quantization and \
-            self.is_signed == other.is_signed and \
+            self.signedness == other.signedness and \
             self.simd_size == other.simd_size
     @property

model_compression_toolkit/target_platform_capabilities/tpc_models/get_target_platform_capabilities.py CHANGED Viewed

@@ -16,17 +16,17 @@
 from model_compression_toolkit.target_platform_capabilities.target_platform import TargetPlatformCapabilities
 from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.target_platform_capabilities import \
-    tpc_dict as imx500_tpc_dict
+    get_tpc_dict_by_fw as get_imx500_tpc
 from model_compression_toolkit.target_platform_capabilities.tpc_models.tflite_tpc.target_platform_capabilities import \
-    tpc_dict as tflite_tpc_dict
+    get_tpc_dict_by_fw as get_tflite_tpc
 from model_compression_toolkit.target_platform_capabilities.tpc_models.qnnpack_tpc.target_platform_capabilities import \
-    tpc_dict as qnnpack_tpc_dict
+    get_tpc_dict_by_fw as get_qnnpack_tpc
 from model_compression_toolkit.target_platform_capabilities.constants import DEFAULT_TP_MODEL, IMX500_TP_MODEL, TFLITE_TP_MODEL, QNNPACK_TP_MODEL,  LATEST
-tpc_dict = {DEFAULT_TP_MODEL: imx500_tpc_dict,
-            IMX500_TP_MODEL: imx500_tpc_dict,
-            TFLITE_TP_MODEL: tflite_tpc_dict,
-            QNNPACK_TP_MODEL: qnnpack_tpc_dict}
+tpc_dict = {DEFAULT_TP_MODEL: get_imx500_tpc,
+            IMX500_TP_MODEL: get_imx500_tpc,
+            TFLITE_TP_MODEL: get_tflite_tpc,
+            QNNPACK_TP_MODEL: get_qnnpack_tpc}
 def get_target_platform_capabilities(fw_name: str,
@@ -47,13 +47,10 @@ def get_target_platform_capabilities(fw_name: str,
     """
     assert target_platform_name in tpc_dict, f'Target platform {target_platform_name} is not defined!'
     fw_tpc = tpc_dict.get(target_platform_name)
-    assert fw_name in fw_tpc, f'Framework {fw_name} is not supported in {target_platform_name}. Please make sure the relevant ' \
-                              f'packages are installed when using MCT for optimizing a {fw_name} model. ' \
-                              f'For Tensorflow, please install tensorflow. ' \
-                              f'For PyTorch, please install torch.'
-    tpc_versions = fw_tpc.get(fw_name)
+    tpc_versions = fw_tpc(fw_name)
     if target_platform_version is None:
         target_platform_version = LATEST
     else:
-        assert target_platform_version in tpc_versions, f'TPC version {target_platform_version} is not supported for framework {fw_name}.'
+        assert target_platform_version in tpc_versions, (f'TPC version {target_platform_version} is not supported for '
+                                                         f'framework {fw_name}.')
     return tpc_versions[target_platform_version]()

model_compression_toolkit/target_platform_capabilities/tpc_models/imx500_tpc/target_platform_capabilities.py CHANGED Viewed

@@ -12,61 +12,74 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ==============================================================================
+from model_compression_toolkit.logger import Logger
 from model_compression_toolkit.constants import FOUND_TF, FOUND_TORCH, TENSORFLOW, PYTORCH
 from model_compression_toolkit.target_platform_capabilities.constants import LATEST
-###############################
-# Build Tensorflow TPC models
-###############################
-keras_tpc_models_dict = None
-if FOUND_TF:
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.latest import get_keras_tpc_latest
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1.tpc_keras import get_keras_tpc as get_keras_tpc_v1
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_lut.tpc_keras import get_keras_tpc as get_keras_tpc_v1_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_pot.tpc_keras import get_keras_tpc as get_keras_tpc_v1_pot
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2.tpc_keras import get_keras_tpc as get_keras_tpc_v2
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2_lut.tpc_keras import get_keras_tpc as get_keras_tpc_v2_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3.tpc_keras import get_keras_tpc as get_keras_tpc_v3
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3_lut.tpc_keras import get_keras_tpc as get_keras_tpc_v3_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v4.tpc_keras import get_keras_tpc as get_keras_tpc_v4
-    # Keras: TPC versioning
-    keras_tpc_models_dict = {'v1': get_keras_tpc_v1,
-                             'v1_lut': get_keras_tpc_v1_lut,
-                             'v1_pot': get_keras_tpc_v1_pot,
-                             'v2': get_keras_tpc_v2,
-                             'v2_lut': get_keras_tpc_v2_lut,
-                             'v3': get_keras_tpc_v3,
-                             'v3_lut': get_keras_tpc_v3_lut,
-                             'v4': get_keras_tpc_v4,
-                             LATEST: get_keras_tpc_latest}
+def get_tpc_dict_by_fw(fw_name):
+    tpc_models_dict = None
+    if fw_name == TENSORFLOW:
+        ###############################
+        # Build Tensorflow TPC models
+        ###############################
+        if FOUND_TF:
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.latest import \
+                get_keras_tpc_latest
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v1
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_lut.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v1_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_pot.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v1_pot
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v2
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2_lut.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v2_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v3
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3_lut.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v3_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v4.tpc_keras import \
+                get_keras_tpc as get_keras_tpc_v4
-###############################
-# Build Pytorch TPC models
-###############################
-pytorch_tpc_models_dict = None
-if FOUND_TORCH:
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.latest import get_pytorch_tpc_latest
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v1
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_pot.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v1_pot
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_lut.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v1_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v2
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2_lut.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v2_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v3
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3_lut.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v3_lut
-    from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v4.tpc_pytorch import \
-        get_pytorch_tpc as get_pytorch_tpc_v4
+            # Keras: TPC versioning
+            tpc_models_dict = {'v1': get_keras_tpc_v1,
+                               'v1_lut': get_keras_tpc_v1_lut,
+                               'v1_pot': get_keras_tpc_v1_pot,
+                               'v2': get_keras_tpc_v2,
+                               'v2_lut': get_keras_tpc_v2_lut,
+                               'v3': get_keras_tpc_v3,
+                               'v3_lut': get_keras_tpc_v3_lut,
+                               'v4': get_keras_tpc_v4,
+                               LATEST: get_keras_tpc_latest}
+    elif fw_name == PYTORCH:
+        ###############################
+        # Build Pytorch TPC models
+        ###############################
+        if FOUND_TORCH:
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.latest import \
+                get_pytorch_tpc_latest
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v1
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_pot.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v1_pot
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v1_lut.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v1_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v2
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v2_lut.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v2_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v3
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v3_lut.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v3_lut
+            from model_compression_toolkit.target_platform_capabilities.tpc_models.imx500_tpc.v4.tpc_pytorch import \
+                get_pytorch_tpc as get_pytorch_tpc_v4
-    # Pytorch: TPC versioning
-    pytorch_tpc_models_dict = {'v1': get_pytorch_tpc_v1,
+            # Pytorch: TPC versioning
+            tpc_models_dict = {'v1': get_pytorch_tpc_v1,
                                'v1_lut': get_pytorch_tpc_v1_lut,
                                'v1_pot': get_pytorch_tpc_v1_pot,
                                'v2': get_pytorch_tpc_v2,
@@ -75,7 +88,10 @@ if FOUND_TORCH:
                                'v3_lut': get_pytorch_tpc_v3_lut,
                                'v4': get_pytorch_tpc_v4,
                                LATEST: get_pytorch_tpc_latest}
-tpc_dict = {TENSORFLOW: keras_tpc_models_dict,
-            PYTORCH: pytorch_tpc_models_dict}
+    if tpc_models_dict is not None:
+        return tpc_models_dict
+    else:
+        Logger.critical(f'Framework {fw_name} is not supported in imx500 or the relevant packages are not '
+                        f'installed. Please make sure the relevant packages are installed when using MCT for optimizing'
+                        f' a {fw_name} model. For Tensorflow, please install tensorflow. For PyTorch, please install '
+                        f'torch.')  # pragma: no cover

model_compression_toolkit/target_platform_capabilities/tpc_models/imx500_tpc/v1/tp_model.py CHANGED Viewed

@@ -18,7 +18,7 @@ import model_compression_toolkit as mct
 from model_compression_toolkit.constants import FLOAT_BITWIDTH
 from model_compression_toolkit.target_platform_capabilities.constants import KERNEL_ATTR, BIAS_ATTR, WEIGHTS_N_BITS
 from model_compression_toolkit.target_platform_capabilities.target_platform import OpQuantizationConfig, \
-    TargetPlatformModel
+    TargetPlatformModel, Signedness
 from model_compression_toolkit.target_platform_capabilities.target_platform.op_quantization_config import \
     AttributeQuantizationConfig
@@ -98,7 +98,8 @@ def get_op_quantization_configs() -> Tuple[OpQuantizationConfig, List[OpQuantiza
         quantization_preserving=False,
         fixed_scale=None,
         fixed_zero_point=None,
-        simd_size=32)
+        simd_size=32,
+        signedness=Signedness.AUTO)
     # We define an 8-bit config for linear operations quantization, that include a kernel and bias attributes.
     linear_eight_bits = tp.OpQuantizationConfig(
@@ -111,7 +112,8 @@ def get_op_quantization_configs() -> Tuple[OpQuantizationConfig, List[OpQuantiza
         quantization_preserving=False,
         fixed_scale=None,
         fixed_zero_point=None,
-        simd_size=32)
+        simd_size=32,
+        signedness=Signedness.AUTO)
     # To quantize a model using mixed-precision, create
     # a list with more than one OpQuantizationConfig.

model_compression_toolkit/target_platform_capabilities/tpc_models/imx500_tpc/v1_lut/tp_model.py CHANGED Viewed

@@ -19,7 +19,7 @@ from model_compression_toolkit.constants import FLOAT_BITWIDTH
 from model_compression_toolkit.target_platform_capabilities.constants import KERNEL_ATTR, BIAS_ATTR, WEIGHTS_N_BITS, \
     WEIGHTS_QUANTIZATION_METHOD
 from model_compression_toolkit.target_platform_capabilities.target_platform import OpQuantizationConfig, \
-    TargetPlatformModel
+    TargetPlatformModel, Signedness
 from model_compression_toolkit.target_platform_capabilities.target_platform.op_quantization_config import \
     AttributeQuantizationConfig
@@ -94,7 +94,8 @@ def get_op_quantization_configs() -> Tuple[OpQuantizationConfig, List[OpQuantiza
         quantization_preserving=False,
         fixed_scale=None,
         fixed_zero_point=None,
-        simd_size=32)
+        simd_size=32,
+        signedness=Signedness.AUTO)
     # We define an 8-bit config for linear operations quantization, that include a kernel and bias attributes.
     linear_eight_bits = tp.OpQuantizationConfig(
@@ -107,7 +108,8 @@ def get_op_quantization_configs() -> Tuple[OpQuantizationConfig, List[OpQuantiza
         quantization_preserving=False,
         fixed_scale=None,
         fixed_zero_point=None,
-        simd_size=32)
+        simd_size=32,
+        signedness=Signedness.AUTO)
     # To quantize a model using mixed-precision, create
     # a list with more than one OpQuantizationConfig.

mct-nightly 2.1.0.20240806.441__py3-none-any.whl → 2.1.0.20240808.431__py3-none-any.whl

mct-nightly 2.1.0.20240806.441py3-none-any.whl → 2.1.0.20240808.431py3-none-any.whl