PyPI - tico - Versions diffs - 0.1.0.dev250714__py3-none-any.whl → 0.1.0.dev251102__py3-none-any.whl - Mend

tico 0.1.0.dev250714py3-none-any.whl → 0.1.0.dev251102py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (181) hide show

tico/serialize/circle_serializer.py CHANGED Viewed

@@ -18,20 +18,16 @@ from typing import Dict
 import flatbuffers
 import torch
 from circle_schema import circle
-from torch.export.exported_program import (
-    ConstantArgument,
-    ExportedProgram,
-    InputKind,
-    TensorArgument,
-)
-from tico.serialize.circle_mapping import to_circle_dtype
+from torch.export.exported_program import ConstantArgument, ExportedProgram, InputKind
+from tico.config import CompileConfigBase, get_default_config
+from tico.serialize.circle_mapping import to_circle_dtype, to_circle_shape
 from tico.serialize.operators import *
 from tico.serialize.circle_graph import CircleModel, CircleSubgraph
 from tico.serialize.operators.hashable_opcode import OpCode
 from tico.serialize.operators.node_visitor import get_node_visitors
 from tico.utils import logging
-from tico.utils.serialize import finalise_tensor_names
+from tico.utils.serialize import finalise_tensor_names, validate_tensor_shapes
 multiple_output_ops = [
@@ -39,161 +35,58 @@ multiple_output_ops = [
     torch.ops.aten.max.dim,
 ]
-# Build circle model from ExportedProgram
-# Return raw bytes of circle model
-def build_circle(edge_program: ExportedProgram) -> bytes:
-    logger = logging.getLogger(__name__)
-    builder = flatbuffers.Builder()
+def _initialize_model() -> tuple[CircleModel, CircleSubgraph]:
+    """Initialize a new Circle model and subgraph.
-    # Init Model
+    Returns:
+        Tuple containing the model and subgraph
+    """
     model = CircleModel()
-    # Add empty buffer at the front (convention)
-    model.add_buffer(circle.Buffer.BufferT())
-    # Create an empty subgraph (assume a single subgraph)
+    model.add_buffer(circle.Buffer.BufferT())  # Add empty buffer at the front
     graph = CircleSubgraph(model)
+    return model, graph
-    # Export tensors
-    logger.debug("---------------Export tensors--------------")
-    buf_name_to_data = {name: buf for name, buf in edge_program.named_buffers()}
-    for node in edge_program.graph.nodes:
-        if node.op == "call_function":
-            if node.target in multiple_output_ops:
-                continue
-            node_val = node.meta["val"]
-            if node_val.layout != torch.strided:
-                raise RuntimeError(
-                    f"Only support dense tensors (node layout: {node_val.layout})"
-                )
-            graph.add_tensor_from_node(node)
-            logger.debug(f"call_function: {node.name} tensor exported.")
-        # placeholder: function input (including parameters, buffers, constant tensors)
-        elif node.op == "placeholder":
-            # placeholder invariants
-            assert node.args is None or len(node.args) == 0  # Not support default param
-            # parameters
-            if node.name in edge_program.graph_signature.inputs_to_parameters:
-                param_name = edge_program.graph_signature.inputs_to_parameters[
-                    node.name
-                ]
-                param_data = edge_program.state_dict[param_name]
-                assert isinstance(
-                    param_data, torch.Tensor
-                ), "Expect parameters to be a tensor"
-                param_value = param_data.cpu().detach().numpy()
-                graph.add_tensor_from_node(node, param_value)
-                logger.debug(f"placeholder(param): {node.name} tensor exported.")
-            elif node.name in edge_program.graph_signature.inputs_to_buffers:
-                buffer_name = edge_program.graph_signature.inputs_to_buffers[node.name]
-                assert buffer_name in buf_name_to_data
-                buffer_data = buf_name_to_data[buffer_name]
-                assert isinstance(
-                    buffer_data, torch.Tensor
-                ), "Expect buffers to be a tensor"
-                buffer_value = buffer_data.cpu().detach().numpy()
-                graph.add_tensor_from_node(node, buffer_value)
-                logger.debug(f"placeholder(buffer): {node.name} tensor exported.")
-            elif (
-                node.name
-                in edge_program.graph_signature.inputs_to_lifted_tensor_constants
-            ):
-                ctensor_name = (
-                    edge_program.graph_signature.inputs_to_lifted_tensor_constants[
-                        node.name
-                    ]
-                )
-                ctensor_data = edge_program.constants[ctensor_name]
-                assert isinstance(
-                    ctensor_data, torch.Tensor
-                ), "Expect constant tensor to be a tensor"
-                ctensor_value = ctensor_data.cpu().detach().numpy()
-                graph.add_tensor_from_node(node, ctensor_value)
-                logger.debug(
-                    f"placeholder(constant tensor): {node.name} tensor exported."
-                )
-            else:
-                user_inputs = [
-                    specs
-                    for specs in edge_program.graph_signature.input_specs
-                    if specs.kind == InputKind.USER_INPUT
-                ]
-                constant_inputs = [
-                    specs
-                    for specs in user_inputs
-                    if isinstance(specs.arg, ConstantArgument)
-                ]
-                name_to_value = {
-                    specs.arg.name: specs.arg.value for specs in constant_inputs
-                }
-                # NoneType ConstantArgument is ignored.
-                if node.name in name_to_value and name_to_value[node.name] == None:
-                    continue
-                graph.add_tensor_from_node(node)
-                logger.debug(f"placeholder: {node.name} tensor exported.")
-        # get_attr: retrieve parameter
-        elif node.op == "get_attr":
-            # node.name: Place where fetched attribute is saved
-            # node.target: Attribute in the module
-            attr_tensor = getattr(node.graph.owning_module, node.target)
-            assert isinstance(attr_tensor, torch.Tensor)
+def build_circle(
+    ep: ExportedProgram, config: CompileConfigBase = get_default_config()
+) -> bytes:
+    """Convert ExportedProgram to Circle format.
-            graph.add_tensor_from_scratch(
-                prefix=node.name,
-                shape=list(attr_tensor.shape),
-                dtype=to_circle_dtype(attr_tensor.dtype),
-                source_node=node,
-            )
-            logger.debug(f"get_attr: {node.name} tensor exported.")
-        # output: function output
-        elif node.op == "output":
-            # output node itself does not need a buffer
-            # argument of output node is assumed to be exported beforehand
-            for output in node.args[0]:
-                if isinstance(output, torch.fx.Node):
-                    assert graph.has_tensor(output.name)
-            continue
+    Args:
+        ep: The exported PyTorch program to convert
-        # call_method: call method
-        elif node.op == "call_method":
-            raise AssertionError("Not yet implemented")
-        # call_module: call 'forward' of module
-        elif node.op == "call_module":
-            raise AssertionError("Not yet implemented")
+    Returns:
+        bytes: Raw bytes of the Circle model
+    """
+    logger = logging.getLogger(__name__)
+    builder = flatbuffers.Builder()
+    model, graph = _initialize_model()
-        else:
-            # Add more if fx.Node is extended
-            raise AssertionError(f"Unknown fx.Node op {node.op}")
+    # Export tensors
+    _export_tensors(graph, ep)
     # Register inputs
     logger.debug("---------------Register inputs--------------")
-    for in_spec in edge_program.graph_signature.input_specs:
+    for in_spec in ep.graph_signature.input_specs:
         if in_spec.kind != InputKind.USER_INPUT:
             continue
-        # NoneType ConstantArgument is ignored.
-        if isinstance(in_spec.arg, ConstantArgument) and in_spec.arg.value == None:
-            continue
+        if isinstance(in_spec.arg, ConstantArgument):
+            # ConstantArgument is ignored when option is given
+            if config.get("remove_constant_input"):
+                continue
+            # NoneType ConstantArgument is ignored.
+            if in_spec.arg.value == None:
+                continue
         arg_name = in_spec.arg.name
         graph.add_input(arg_name)
         logger.debug(f"Registered input: {arg_name}")
     # Register outputs
     logger.debug("---------------Register outputs--------------")
-    for user_output in edge_program.graph_signature.user_outputs:
+    for user_output in ep.graph_signature.user_outputs:
         if user_output == None:
-            logger.debug(f"Ignore 'None' output")
+            logger.debug("Ignore 'None' output")
             continue
         graph.add_output(user_output)
@@ -203,7 +96,7 @@ def build_circle(edge_program: ExportedProgram) -> bytes:
     logger.debug("---------------Export operators--------------")
     op_codes: Dict[OpCode, int] = {}
     visitors = get_node_visitors(op_codes, graph)
-    for node in edge_program.graph.nodes:
+    for node in ep.graph.nodes:
         if node.op != "call_function":
             continue
@@ -218,8 +111,10 @@ def build_circle(edge_program: ExportedProgram) -> bytes:
             graph.add_operator(circle_op)
             logger.debug(f"call_function: {node.name} ({opcode}) Op exported.")
-    # Register subgraph
     finalise_tensor_names(graph)
+    validate_tensor_shapes(graph)
+    # Register subgraph
     model.subgraphs.append(graph)
     # Encode operator codes
@@ -227,10 +122,8 @@ def build_circle(edge_program: ExportedProgram) -> bytes:
         code for code, _ in sorted(op_codes.items(), key=lambda x: x[1])
     ]
-    # Description
+    # Final model settings
     model.description = "circle"
-    # Set version
     model.version = 0
     # Finish model
@@ -238,3 +131,215 @@ def build_circle(edge_program: ExportedProgram) -> bytes:
     buf = builder.Output()
     return bytes(buf)
+def _export_tensors(graph: CircleSubgraph, ep: ExportedProgram) -> None:
+    """Export all tensors from the exported program to the circle graph.
+    Args:
+        graph: The CircleSubgraph to add tensors to
+        ep: The exported PyTorch program
+    """
+    logger = logging.getLogger(__name__)
+    logger.debug("---------------Export tensors--------------")
+    buf_name_to_data = {name: buf for name, buf in ep.named_buffers()}
+    for node in ep.graph.nodes:
+        if node.op == "call_function":
+            if node.target in multiple_output_ops:
+                continue
+            node_val = node.meta["val"]
+            if node_val.layout != torch.strided:
+                raise RuntimeError(
+                    f"Only support dense tensors (node layout: {node_val.layout})"
+                )
+            graph.add_tensor_from_node(node)
+            logger.debug(f"call_function: {node.name} tensor exported.")
+        elif node.op == "placeholder":
+            _handle_placeholder_node(graph, node, ep, buf_name_to_data)
+        elif node.op == "get_attr":
+            _handle_get_attr_node(graph, node)
+        elif node.op == "output":
+            for output in node.args[0]:
+                if isinstance(output, torch.fx.Node):
+                    assert graph.has_tensor(output.name)
+            continue
+        elif node.op == "call_method":
+            raise AssertionError("Not yet implemented")
+        elif node.op == "call_module":
+            raise AssertionError("Not yet implemented")
+        else:
+            raise AssertionError(f"Unknown fx.Node op {node.op}")
+def _handle_placeholder_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+    ep: ExportedProgram,
+    buf_name_to_data: dict,
+) -> None:
+    """Handle a placeholder node during tensor export."""
+    # placeholder invariants
+    assert node.args is None or len(node.args) == 0  # Not support default param
+    if node.name in ep.graph_signature.inputs_to_parameters:
+        _handle_parameter_node(graph, node, ep)
+    elif node.name in ep.graph_signature.inputs_to_buffers:
+        _handle_buffer_node(graph, node, ep, buf_name_to_data)
+    elif node.name in ep.graph_signature.inputs_to_lifted_tensor_constants:
+        _handle_constant_tensor_node(graph, node, ep)
+    else:
+        _handle_user_input_node(graph, node, ep)
+def _handle_parameter_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+    ep: ExportedProgram,
+) -> None:
+    """Handle a parameter placeholder node by exporting its tensor data.
+    Args:
+        graph: CircleSubgraph to add tensor to
+        node: The parameter node to process
+        ep: ExportedProgram containing parameter data
+    """
+    param_name = ep.graph_signature.inputs_to_parameters[node.name]
+    param_data = ep.state_dict[param_name]
+    if not isinstance(param_data, torch.Tensor):
+        raise ValueError(f"Parameter {param_name} is not a tensor")
+    tensor_value = param_data.cpu().detach().numpy()
+    graph.add_tensor_from_node(node, tensor_value)
+    logger = logging.getLogger(__name__)
+    logger.debug(f"Exported parameter tensor: {node.name}")
+def _handle_buffer_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+    ep: ExportedProgram,
+    buf_name_to_data: dict,
+) -> None:
+    """Handle a buffer placeholder node by exporting its tensor data.
+    Args:
+        graph: CircleSubgraph to add tensor to
+        node: The buffer node to process
+        ep: ExportedProgram containing buffer info
+        buf_name_to_data: Mapping of buffer names to data
+    """
+    buffer_name = ep.graph_signature.inputs_to_buffers[node.name]
+    if buffer_name not in buf_name_to_data:
+        raise ValueError(f"Buffer {buffer_name} not found in buffer data")
+    buffer_data = buf_name_to_data[buffer_name]
+    if not isinstance(buffer_data, torch.Tensor):
+        raise ValueError(f"Buffer {buffer_name} is not a tensor")
+    tensor_value = buffer_data.cpu().detach().numpy()
+    graph.add_tensor_from_node(node, tensor_value)
+    logger = logging.getLogger(__name__)
+    logger.debug(f"Exported buffer tensor: {node.name}")
+def _handle_constant_tensor_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+    ep: ExportedProgram,
+) -> None:
+    """Handle a constant tensor placeholder node by exporting its tensor data.
+    Args:
+        graph: CircleSubgraph to add tensor to
+        node: The constant tensor node to process
+        ep: ExportedProgram containing constant data
+    """
+    ctensor_name = ep.graph_signature.inputs_to_lifted_tensor_constants[node.name]
+    if ctensor_name not in ep.constants:
+        raise ValueError(f"Constant tensor {ctensor_name} not found")
+    ctensor_data = ep.constants[ctensor_name]
+    if not isinstance(ctensor_data, torch.Tensor):
+        raise ValueError(f"Constant tensor {ctensor_name} is not a tensor")
+    tensor_value = ctensor_data.cpu().detach().numpy()
+    graph.add_tensor_from_node(node, tensor_value)
+    logger = logging.getLogger(__name__)
+    logger.debug(f"Exported constant tensor: {node.name}")
+def _handle_user_input_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+    ep: ExportedProgram,
+) -> None:
+    """Handle a user input placeholder node by exporting its tensor data.
+    Args:
+        graph: CircleSubgraph to add tensor to
+        node: The user input node to process
+        ep: ExportedProgram containing input specs
+    """
+    user_inputs = [
+        specs
+        for specs in ep.graph_signature.input_specs
+        if specs.kind == InputKind.USER_INPUT
+    ]
+    constant_inputs = [
+        specs for specs in user_inputs if isinstance(specs.arg, ConstantArgument)
+    ]
+    name_to_value = {specs.arg.name: specs.arg.value for specs in constant_inputs}
+    # Skip NoneType ConstantArgument
+    if node.name in name_to_value and name_to_value[node.name] is None:
+        return
+    graph.add_tensor_from_node(node)
+    logger = logging.getLogger(__name__)
+    logger.debug(f"Exported user input tensor: {node.name}")
+def _handle_get_attr_node(
+    graph: CircleSubgraph,
+    node: torch.fx.Node,
+) -> None:
+    """Handle a get_attr node by exporting its tensor data.
+    Args:
+        graph: CircleSubgraph to add tensor to
+        node: The get_attr node to process
+    """
+    assert isinstance(node.target, str)
+    attr_tensor = getattr(node.graph.owning_module, node.target)
+    if not isinstance(attr_tensor, torch.Tensor):
+        raise ValueError(f"Attribute {node.target} is not a tensor")
+    attr_shape, attr_shape_signature = to_circle_shape(attr_tensor.shape)
+    graph.add_tensor_from_scratch(
+        prefix=node.name,
+        shape=attr_shape,
+        shape_signature=attr_shape_signature,
+        dtype=to_circle_dtype(attr_tensor.dtype),
+        source_node=node,
+    )
+    logger = logging.getLogger(__name__)
+    logger.debug(f"Exported attribute tensor: {node.name}")

tico/serialize/operators/adapters/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ # DO NOT REMOVE THIS FILE

tico/serialize/operators/adapters/llama_rmsnorm.py ADDED Viewed

@@ -0,0 +1,35 @@
+# Copyright (c) 2025 Samsung Electronics Co., Ltd. All Rights Reserved
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#    http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from contextlib import contextmanager
+import torch
+from transformers.models.llama.modeling_llama import LlamaRMSNorm
+def llama_rmsnorm_forward_adapter(self: LlamaRMSNorm, hidden_states: torch.Tensor):
+    return torch.ops.circle_custom.rms_norm(
+        hidden_states, self.weight, self.variance_epsilon
+    )
+@contextmanager
+def patched_llama_rmsnorm():
+    orig = LlamaRMSNorm.forward
+    LlamaRMSNorm.forward = llama_rmsnorm_forward_adapter
+    try:
+        yield
+    finally:
+        LlamaRMSNorm.forward = orig

tico/serialize/operators/op_any.py CHANGED Viewed

@@ -22,7 +22,7 @@ from circle_schema import circle
 from tico.serialize.circle_graph import CircleSubgraph
 from tico.serialize.circle_mapping import (
     circle_legalize_dtype_to,
-    extract_circle_dtype,
+    extract_circle_shape,
     extract_shape,
     extract_torch_dtype,
 )
@@ -100,19 +100,10 @@ class AnyVisitor(NodeVisitor):
         keepdim = args.keepdim
         input_shape = list(extract_shape(input))
-        output_shape = list(extract_shape(node))
-        dim_i32 = None
         if dim is None:
-            dims = tuple(i for i in range(0, len(input_shape)))
-            dim_i32 = tuple(
-                circle_legalize_dtype_to(dim, dtype=torch.int32) for dim in dims
-            )
-        if isinstance(dim, int):
-            dim_i32 = circle_legalize_dtype_to(dim, dtype=torch.int32)
-        if isinstance(dim, tuple):
-            dim_i32 = tuple(circle_legalize_dtype_to(d, dtype=torch.int32) for d in dim)
-        assert dim_i32 is not None
+            dim = tuple(i for i in range(0, len(input_shape)))
+        dim_i32 = circle_legalize_dtype_to(dim, dtype=torch.int32)
         inputs = [
             input,
@@ -126,9 +117,11 @@ class AnyVisitor(NodeVisitor):
         if dtype_torch in [torch.int32, torch.int64, torch.float32, torch.float64]:
             dst_dtype_circle = circle.TensorType.TensorType.BOOL
             dst_dtype_torch = torch.bool
+            dst_shape, dst_shape_signature = extract_circle_shape(input)
             ne_tensor: circle.Tensor.TensorT = self.graph.add_tensor_from_scratch(
                 prefix=f"{input.name}_ne",
-                shape=input_shape,
+                shape=dst_shape,
+                shape_signature=dst_shape_signature,
                 dtype=dst_dtype_circle,
                 source_node=input,
             )

tico/serialize/operators/op_avg_pool2d.py CHANGED Viewed

@@ -22,7 +22,11 @@ import torch
 from circle_schema import circle
 from tico.serialize.circle_graph import CircleSubgraph
-from tico.serialize.circle_mapping import extract_circle_dtype, extract_shape
+from tico.serialize.circle_mapping import (
+    extract_circle_dtype,
+    extract_shape,
+    to_circle_shape,
+)
 from tico.serialize.operators.hashable_opcode import OpCode
 from tico.serialize.operators.node_visitor import NodeVisitor, register_node_visitor
 from tico.serialize.operators.utils import create_builtin_operator, get_op_index
@@ -57,7 +61,7 @@ class AvgPool2DVisitor(NodeVisitor):
             return True
     def has_same_padding(self, args: AvgPool2dArgs) -> bool:
-        input_shape = list(extract_shape(args.input))
+        input_shape: torch.Size = extract_shape(args.input)
         kernel_size = args.kernel_size
         stride = args.stride
         assert stride
@@ -137,7 +141,7 @@ class AvgPool2DVisitor(NodeVisitor):
                 ],
                 dtype=torch.int32,
             )
-            input_shape = list(extract_shape(input))
+            input_shape = extract_shape(input)
             input_dtype: int = extract_circle_dtype(input)
             padded_input_shape = [
                 input_shape[0],
@@ -147,10 +151,13 @@ class AvgPool2DVisitor(NodeVisitor):
             ]
             padded_input_shape[1] += padding[0] * 2
             padded_input_shape[2] += padding[1] * 2
             # create padded input tensor
+            padded_cshape, padded_cshape_signature = to_circle_shape(padded_input_shape)
             padded_input_tensor = self.graph.add_tensor_from_scratch(
                 prefix=f"{input.name}_pad_output",
-                shape=padded_input_shape,
+                shape=padded_cshape,
+                shape_signature=padded_cshape_signature,
                 dtype=input_dtype,
                 source_node=node,
             )

tico/serialize/operators/op_clamp.py CHANGED Viewed

@@ -21,12 +21,9 @@ import torch
 from circle_schema import circle
 from tico.passes import ops
+from tico.serialize.circle_graph import CircleSubgraph
-from tico.serialize.circle_graph import (
-    CircleSubgraph,
-    extract_circle_dtype,
-    extract_shape,
-)
+from tico.serialize.circle_mapping import extract_circle_dtype, extract_circle_shape
 from tico.serialize.operators.hashable_opcode import OpCode
 from tico.serialize.operators.node_visitor import NodeVisitor, register_node_visitor
 from tico.serialize.operators.utils import create_builtin_operator, get_op_index
@@ -104,12 +101,13 @@ class ClampVisitor(NodeVisitor):
             return self.define_minimum_node([input, max_val], [node])
         elif min_val is not None and max_val is not None:
-            input_shape = extract_shape(input)
+            input_shape, input_shape_signature = extract_circle_shape(input)
             input_dtype = extract_circle_dtype(input)
             minimum_tensor = self.graph.add_tensor_from_scratch(
                 prefix=f"{input.name}_min",
                 dtype=input_dtype,
-                shape=list(input_shape),
+                shape=input_shape,
+                shape_signature=input_shape_signature,
                 source_node=node,
             )
             minimum_opertor = self.define_minimum_node(

tico 0.1.0.dev250714__py3-none-any.whl → 0.1.0.dev251102__py3-none-any.whl

tico 0.1.0.dev250714py3-none-any.whl → 0.1.0.dev251102py3-none-any.whl