PyPI - emx-onnx-cgen - Versions diffs - 0.3.7__py3-none-any.whl → 0.4.1.dev0__py3-none-any.whl - Mend

emx-onnx-cgen 0.3.7py3-none-any.whl → 0.4.1.dev0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (137) hide show

emx_onnx_cgen/_build_info.py +1 -1
emx_onnx_cgen/_version.py +2 -2
emx_onnx_cgen/cli.py +1025 -162
emx_onnx_cgen/codegen/__init__.py +2 -0
emx_onnx_cgen/codegen/c_emitter.py +2081 -458
emx_onnx_cgen/compiler.py +157 -75
emx_onnx_cgen/determinism.py +39 -0
emx_onnx_cgen/ir/context.py +25 -15
emx_onnx_cgen/ir/model.py +1 -0
emx_onnx_cgen/ir/op_base.py +32 -7
emx_onnx_cgen/ir/ops/__init__.py +20 -0
emx_onnx_cgen/ir/ops/elementwise.py +138 -22
emx_onnx_cgen/ir/ops/misc.py +95 -0
emx_onnx_cgen/ir/ops/nn.py +361 -38
emx_onnx_cgen/ir/ops/reduce.py +1 -16
emx_onnx_cgen/lowering/__init__.py +9 -0
emx_onnx_cgen/lowering/arg_reduce.py +0 -4
emx_onnx_cgen/lowering/average_pool.py +157 -27
emx_onnx_cgen/lowering/bernoulli.py +73 -0
emx_onnx_cgen/lowering/common.py +48 -0
emx_onnx_cgen/lowering/concat.py +41 -7
emx_onnx_cgen/lowering/conv.py +19 -8
emx_onnx_cgen/lowering/conv_integer.py +103 -0
emx_onnx_cgen/lowering/dequantize_linear.py +128 -0
emx_onnx_cgen/lowering/elementwise.py +140 -43
emx_onnx_cgen/lowering/gather.py +11 -2
emx_onnx_cgen/lowering/gemm.py +7 -124
emx_onnx_cgen/lowering/global_max_pool.py +0 -5
emx_onnx_cgen/lowering/gru.py +323 -0
emx_onnx_cgen/lowering/hamming_window.py +104 -0
emx_onnx_cgen/lowering/hardmax.py +1 -37
emx_onnx_cgen/lowering/identity.py +7 -6
emx_onnx_cgen/lowering/logsoftmax.py +1 -35
emx_onnx_cgen/lowering/lp_pool.py +15 -4
emx_onnx_cgen/lowering/matmul.py +3 -105
emx_onnx_cgen/lowering/optional_has_element.py +28 -0
emx_onnx_cgen/lowering/qlinear_mul.py +116 -0
emx_onnx_cgen/lowering/reduce.py +0 -5
emx_onnx_cgen/lowering/reshape.py +7 -16
emx_onnx_cgen/lowering/shape.py +14 -8
emx_onnx_cgen/lowering/slice.py +14 -4
emx_onnx_cgen/lowering/softmax.py +1 -35
emx_onnx_cgen/lowering/split.py +37 -3
emx_onnx_cgen/lowering/tfidf_vectorizer.py +199 -0
emx_onnx_cgen/lowering/tile.py +38 -1
emx_onnx_cgen/lowering/topk.py +1 -5
emx_onnx_cgen/lowering/transpose.py +9 -3
emx_onnx_cgen/lowering/unsqueeze.py +11 -16
emx_onnx_cgen/lowering/upsample.py +151 -0
emx_onnx_cgen/lowering/variadic.py +1 -1
emx_onnx_cgen/lowering/where.py +0 -5
emx_onnx_cgen/onnx_import.py +578 -14
emx_onnx_cgen/ops.py +3 -0
emx_onnx_cgen/templates/adagrad_op.c.j2 +16 -0
emx_onnx_cgen/templates/arg_reduce_op.c.j2 +18 -0
emx_onnx_cgen/templates/attention_op.c.j2 +189 -0
emx_onnx_cgen/templates/average_pool_op.c.j2 +126 -0
emx_onnx_cgen/templates/batch_norm_op.c.j2 +11 -0
emx_onnx_cgen/templates/bernoulli_op.c.j2 +34 -0
emx_onnx_cgen/templates/binary_op.c.j2 +9 -0
emx_onnx_cgen/templates/cast_op.c.j2 +9 -0
emx_onnx_cgen/templates/clip_op.c.j2 +14 -0
emx_onnx_cgen/templates/concat_op.c.j2 +28 -0
emx_onnx_cgen/templates/constant_of_shape_op.c.j2 +10 -0
emx_onnx_cgen/templates/conv_integer_op.c.j2 +34 -0
emx_onnx_cgen/templates/conv_op.c.j2 +32 -0
emx_onnx_cgen/templates/conv_transpose_op.c.j2 +43 -0
emx_onnx_cgen/templates/cumsum_op.c.j2 +51 -0
emx_onnx_cgen/templates/depth_to_space_op.c.j2 +26 -0
emx_onnx_cgen/templates/dequantize_linear_op.c.j2 +10 -0
emx_onnx_cgen/templates/einsum_op.c.j2 +55 -0
emx_onnx_cgen/templates/expand_op.c.j2 +14 -0
emx_onnx_cgen/templates/eye_like_op.c.j2 +27 -0
emx_onnx_cgen/templates/gather_elements_op.c.j2 +13 -0
emx_onnx_cgen/templates/gather_nd_op.c.j2 +29 -0
emx_onnx_cgen/templates/gather_op.c.j2 +13 -0
emx_onnx_cgen/templates/gemm_op.c.j2 +35 -0
emx_onnx_cgen/templates/grid_sample_op.c.j2 +184 -0
emx_onnx_cgen/templates/group_normalization_op.c.j2 +46 -0
emx_onnx_cgen/templates/gru_op.c.j2 +152 -0
emx_onnx_cgen/templates/hamming_window_op.c.j2 +12 -0
emx_onnx_cgen/templates/hardmax_op.c.j2 +24 -0
emx_onnx_cgen/templates/identity_op.c.j2 +9 -0
emx_onnx_cgen/templates/instance_normalization_op.c.j2 +35 -0
emx_onnx_cgen/templates/layer_normalization_op.c.j2 +65 -0
emx_onnx_cgen/templates/logsoftmax_op.c.j2 +27 -0
emx_onnx_cgen/templates/lp_normalization_op.c.j2 +27 -0
emx_onnx_cgen/templates/lp_pool_op.c.j2 +24 -0
emx_onnx_cgen/templates/lrn_op.c.j2 +20 -0
emx_onnx_cgen/templates/lstm_op.c.j2 +175 -0
emx_onnx_cgen/templates/matmul_op.c.j2 +13 -0
emx_onnx_cgen/templates/maxpool_op.c.j2 +118 -0
emx_onnx_cgen/templates/mean_variance_normalization_op.c.j2 +34 -0
emx_onnx_cgen/templates/multi_input_op.c.j2 +15 -0
emx_onnx_cgen/templates/negative_log_likelihood_loss_op.c.j2 +54 -0
emx_onnx_cgen/templates/nonmax_suppression_op.c.j2 +179 -0
emx_onnx_cgen/templates/nonzero_op.c.j2 +15 -0
emx_onnx_cgen/templates/one_hot_op.c.j2 +25 -0
emx_onnx_cgen/templates/optional_has_element_op.c.j2 +4 -0
emx_onnx_cgen/templates/pad_op.c.j2 +80 -0
emx_onnx_cgen/templates/qlinear_matmul_op.c.j2 +33 -0
emx_onnx_cgen/templates/qlinear_mul_op.c.j2 +18 -0
emx_onnx_cgen/templates/quantize_linear_op.c.j2 +13 -0
emx_onnx_cgen/templates/range_op.c.j2 +8 -0
emx_onnx_cgen/templates/reduce_op.c.j2 +28 -0
emx_onnx_cgen/templates/reduce_op_dynamic.c.j2 +77 -0
emx_onnx_cgen/templates/reshape_op.c.j2 +18 -0
emx_onnx_cgen/templates/resize_op.c.j2 +277 -0
emx_onnx_cgen/templates/rms_normalization_op.c.j2 +28 -0
emx_onnx_cgen/templates/rotary_embedding_op.c.j2 +66 -0
emx_onnx_cgen/templates/scatter_nd_op.c.j2 +52 -0
emx_onnx_cgen/templates/shape_op.c.j2 +6 -0
emx_onnx_cgen/templates/size_op.c.j2 +4 -0
emx_onnx_cgen/templates/slice_op.c.j2 +9 -0
emx_onnx_cgen/templates/slice_op_dynamic.c.j2 +70 -0
emx_onnx_cgen/templates/softmax_cross_entropy_loss_op.c.j2 +105 -0
emx_onnx_cgen/templates/softmax_op.c.j2 +26 -0
emx_onnx_cgen/templates/space_to_depth_op.c.j2 +22 -0
emx_onnx_cgen/templates/split_op.c.j2 +18 -0
emx_onnx_cgen/templates/tensor_scatter_op.c.j2 +44 -0
emx_onnx_cgen/templates/testbench.c.j2 +161 -0
emx_onnx_cgen/templates/tfidf_vectorizer_op.c.j2 +144 -0
emx_onnx_cgen/templates/tile_op.c.j2 +14 -0
emx_onnx_cgen/templates/topk_op.c.j2 +50 -0
emx_onnx_cgen/templates/transpose_op.c.j2 +9 -0
emx_onnx_cgen/templates/trilu_op.c.j2 +33 -0
emx_onnx_cgen/templates/unary_op.c.j2 +23 -0
emx_onnx_cgen/templates/where_op.c.j2 +9 -0
emx_onnx_cgen/verification.py +45 -5
{emx_onnx_cgen-0.3.7.dist-info → emx_onnx_cgen-0.4.1.dev0.dist-info}/METADATA +33 -15
emx_onnx_cgen-0.4.1.dev0.dist-info/RECORD +190 -0
{emx_onnx_cgen-0.3.7.dist-info → emx_onnx_cgen-0.4.1.dev0.dist-info}/WHEEL +1 -1
emx_onnx_cgen/runtime/__init__.py +0 -1
emx_onnx_cgen/runtime/evaluator.py +0 -2955
emx_onnx_cgen-0.3.7.dist-info/RECORD +0 -107
{emx_onnx_cgen-0.3.7.dist-info → emx_onnx_cgen-0.4.1.dev0.dist-info}/entry_points.txt +0 -0
{emx_onnx_cgen-0.3.7.dist-info → emx_onnx_cgen-0.4.1.dev0.dist-info}/top_level.txt +0 -0

emx_onnx_cgen/compiler.py CHANGED Viewed

@@ -3,7 +3,8 @@ from __future__ import annotations
 from dataclasses import dataclass, fields
 import hashlib
 from pathlib import Path
-from typing import Mapping
+import time
+from typing import Callable, Mapping, TypeVar
 import numpy as np
 import onnx
@@ -29,21 +30,27 @@ from .lowering import load_lowering_registry
 from .lowering.common import ensure_supported_dtype, shape_product, value_dtype
 from .lowering.registry import get_lowering_registry
 from .onnx_import import import_onnx
-from .runtime.evaluator import Evaluator
 @dataclass(frozen=True)
 class CompilerOptions:
-    template_dir: Path
+    template_dir: Path | None = None
     model_name: str = "model"
     emit_testbench: bool = False
     command_line: str | None = None
     model_checksum: str | None = None
     restrict_arrays: bool = True
+    fp32_accumulation_strategy: str = "fp64"
+    fp16_accumulation_strategy: str = "fp32"
     testbench_inputs: Mapping[str, np.ndarray] | None = None
+    testbench_optional_inputs: Mapping[str, bool] | None = None
     truncate_weights_after: int | None = None
     large_temp_threshold_bytes: int = 1024
-    large_weight_threshold: int = 1024 * 1024
+    large_weight_threshold: int = 100 * 1024
+    timings: dict[str, float] | None = None
+_T = TypeVar("_T")
 def _onnx_elem_type(dtype: np.dtype) -> int:
@@ -53,90 +60,155 @@ def _onnx_elem_type(dtype: np.dtype) -> int:
     raise UnsupportedOpError(f"Unsupported dtype {dtype} for ONNX output")
+def _optional_flag_name(name: str) -> str:
+    return f"{name}_present"
 class Compiler:
     def __init__(self, options: CompilerOptions | None = None) -> None:
         if options is None:
-            options = CompilerOptions(template_dir=Path("templates"))
+            options = CompilerOptions()
         self._options = options
         self._emitter = CEmitter(
             options.template_dir,
             restrict_arrays=options.restrict_arrays,
+            fp32_accumulation_strategy=options.fp32_accumulation_strategy,
+            fp16_accumulation_strategy=options.fp16_accumulation_strategy,
             truncate_weights_after=options.truncate_weights_after,
             large_temp_threshold_bytes=options.large_temp_threshold_bytes,
             large_weight_threshold=options.large_weight_threshold,
         )
         load_lowering_registry()
+    def _time_step(self, label: str, func: Callable[[], _T]) -> _T:
+        timings = self._options.timings
+        if timings is None:
+            return func()
+        started = time.perf_counter()
+        result = func()
+        timings[label] = time.perf_counter() - started
+        return result
     def compile(self, model: onnx.ModelProto) -> str:
-        graph = import_onnx(model)
-        graph = self._concretize_graph_shapes(model, graph)
-        testbench_inputs = self._resolve_testbench_inputs(graph)
-        variable_dim_inputs, variable_dim_outputs = self._collect_variable_dims(
-            graph
+        graph = self._time_step("import_onnx", lambda: import_onnx(model))
+        graph = self._time_step(
+            "concretize_shapes",
+            lambda: self._concretize_graph_shapes(model, graph),
+        )
+        testbench_inputs = self._time_step(
+            "resolve_testbench_inputs", lambda: self._resolve_testbench_inputs(graph)
+        )
+        variable_dim_inputs, variable_dim_outputs = self._time_step(
+            "collect_variable_dims", lambda: self._collect_variable_dims(graph)
         )
-        lowered = self._lower_model(model, graph)
-        return self._emitter.emit_model(
-            lowered,
-            emit_testbench=self._options.emit_testbench,
-            testbench_inputs=testbench_inputs,
-            variable_dim_inputs=variable_dim_inputs,
-            variable_dim_outputs=variable_dim_outputs,
+        lowered = self._time_step(
+            "lower_model", lambda: self._lower_model(model, graph)
+        )
+        return self._time_step(
+            "emit_model",
+            lambda: self._emitter.emit_model(
+                lowered,
+                emit_testbench=self._options.emit_testbench,
+                testbench_inputs=testbench_inputs,
+                testbench_optional_inputs=self._options.testbench_optional_inputs,
+                variable_dim_inputs=variable_dim_inputs,
+                variable_dim_outputs=variable_dim_outputs,
+            ),
         )
     def compile_with_data_file(self, model: onnx.ModelProto) -> tuple[str, str]:
-        graph = import_onnx(model)
-        graph = self._concretize_graph_shapes(model, graph)
-        testbench_inputs = self._resolve_testbench_inputs(graph)
-        variable_dim_inputs, variable_dim_outputs = self._collect_variable_dims(
-            graph
+        graph = self._time_step("import_onnx", lambda: import_onnx(model))
+        graph = self._time_step(
+            "concretize_shapes",
+            lambda: self._concretize_graph_shapes(model, graph),
+        )
+        testbench_inputs = self._time_step(
+            "resolve_testbench_inputs", lambda: self._resolve_testbench_inputs(graph)
+        )
+        variable_dim_inputs, variable_dim_outputs = self._time_step(
+            "collect_variable_dims", lambda: self._collect_variable_dims(graph)
+        )
+        lowered = self._time_step(
+            "lower_model", lambda: self._lower_model(model, graph)
         )
-        lowered = self._lower_model(model, graph)
-        return self._emitter.emit_model_with_data_file(
-            lowered,
-            emit_testbench=self._options.emit_testbench,
-            testbench_inputs=testbench_inputs,
-            variable_dim_inputs=variable_dim_inputs,
-            variable_dim_outputs=variable_dim_outputs,
+        return self._time_step(
+            "emit_model_with_data_file",
+            lambda: self._emitter.emit_model_with_data_file(
+                lowered,
+                emit_testbench=self._options.emit_testbench,
+                testbench_inputs=testbench_inputs,
+                testbench_optional_inputs=self._options.testbench_optional_inputs,
+                variable_dim_inputs=variable_dim_inputs,
+                variable_dim_outputs=variable_dim_outputs,
+            ),
         )
     def compile_with_weight_data(
         self, model: onnx.ModelProto
     ) -> tuple[str, bytes | None]:
-        graph = import_onnx(model)
-        graph = self._concretize_graph_shapes(model, graph)
-        testbench_inputs = self._resolve_testbench_inputs(graph)
-        variable_dim_inputs, variable_dim_outputs = self._collect_variable_dims(
-            graph
-        )
-        lowered = self._lower_model(model, graph)
-        generated = self._emitter.emit_model(
-            lowered,
-            emit_testbench=self._options.emit_testbench,
-            testbench_inputs=testbench_inputs,
-            variable_dim_inputs=variable_dim_inputs,
-            variable_dim_outputs=variable_dim_outputs,
-        )
-        weight_data = self._emitter.collect_weight_data(lowered.constants)
+        graph = self._time_step("import_onnx", lambda: import_onnx(model))
+        graph = self._time_step(
+            "concretize_shapes",
+            lambda: self._concretize_graph_shapes(model, graph),
+        )
+        testbench_inputs = self._time_step(
+            "resolve_testbench_inputs", lambda: self._resolve_testbench_inputs(graph)
+        )
+        variable_dim_inputs, variable_dim_outputs = self._time_step(
+            "collect_variable_dims", lambda: self._collect_variable_dims(graph)
+        )
+        lowered = self._time_step(
+            "lower_model", lambda: self._lower_model(model, graph)
+        )
+        generated = self._time_step(
+            "emit_model",
+            lambda: self._emitter.emit_model(
+                lowered,
+                emit_testbench=self._options.emit_testbench,
+                testbench_inputs=testbench_inputs,
+                testbench_optional_inputs=self._options.testbench_optional_inputs,
+                variable_dim_inputs=variable_dim_inputs,
+                variable_dim_outputs=variable_dim_outputs,
+            ),
+        )
+        weight_data = self._time_step(
+            "collect_weight_data",
+            lambda: self._emitter.collect_weight_data(lowered.constants),
+        )
         return generated, weight_data
     def compile_with_data_file_and_weight_data(
         self, model: onnx.ModelProto
     ) -> tuple[str, str, bytes | None]:
-        graph = import_onnx(model)
-        graph = self._concretize_graph_shapes(model, graph)
-        testbench_inputs = self._resolve_testbench_inputs(graph)
-        variable_dim_inputs, variable_dim_outputs = self._collect_variable_dims(
-            graph
-        )
-        lowered = self._lower_model(model, graph)
-        generated, data_source = self._emitter.emit_model_with_data_file(
-            lowered,
-            emit_testbench=self._options.emit_testbench,
-            testbench_inputs=testbench_inputs,
-            variable_dim_inputs=variable_dim_inputs,
-            variable_dim_outputs=variable_dim_outputs,
-        )
-        weight_data = self._emitter.collect_weight_data(lowered.constants)
+        graph = self._time_step("import_onnx", lambda: import_onnx(model))
+        graph = self._time_step(
+            "concretize_shapes",
+            lambda: self._concretize_graph_shapes(model, graph),
+        )
+        testbench_inputs = self._time_step(
+            "resolve_testbench_inputs", lambda: self._resolve_testbench_inputs(graph)
+        )
+        variable_dim_inputs, variable_dim_outputs = self._time_step(
+            "collect_variable_dims", lambda: self._collect_variable_dims(graph)
+        )
+        lowered = self._time_step(
+            "lower_model", lambda: self._lower_model(model, graph)
+        )
+        generated, data_source = self._time_step(
+            "emit_model_with_data_file",
+            lambda: self._emitter.emit_model_with_data_file(
+                lowered,
+                emit_testbench=self._options.emit_testbench,
+                testbench_inputs=testbench_inputs,
+                testbench_optional_inputs=self._options.testbench_optional_inputs,
+                variable_dim_inputs=variable_dim_inputs,
+                variable_dim_outputs=variable_dim_outputs,
+            ),
+        )
+        weight_data = self._time_step(
+            "collect_weight_data",
+            lambda: self._emitter.collect_weight_data(lowered.constants),
+        )
         return generated, data_source, weight_data
     @staticmethod
@@ -165,9 +237,11 @@ class Compiler:
         self._validate_graph(graph)
         (
             input_names,
+            input_optional_names,
             input_shapes,
             input_dtypes,
             output_names,
+            output_optional_names,
             output_shapes,
             output_dtypes,
         ) = self._collect_io_specs(graph)
@@ -220,9 +294,11 @@ class Compiler:
         return LoweredModel(
             name=self._options.model_name,
             input_names=input_names,
+            input_optional_names=input_optional_names,
             input_shapes=input_shapes,
             input_dtypes=input_dtypes,
             output_names=output_names,
+            output_optional_names=output_optional_names,
             output_shapes=output_shapes,
             output_dtypes=output_dtypes,
             constants=constants,
@@ -248,7 +324,6 @@ class Compiler:
                 "Testbench inputs include unknown inputs: "
                 + ", ".join(unknown_inputs)
             )
-        resolved: dict[str, tuple[float | int | bool, ...]] = {}
         for name, values in self._options.testbench_inputs.items():
             if not isinstance(values, np.ndarray):
                 raise CodegenError(
@@ -265,9 +340,7 @@ class Compiler:
                     "Testbench input "
                     f"{name} has {array.size} elements, expected {expected_count}"
                 )
-            array = array.reshape(expected_shape)
-            resolved[name] = tuple(array.ravel().tolist())
-        return resolved
+        return None
     def _concretize_graph_shapes(
         self, model: onnx.ModelProto, graph: Graph
@@ -337,6 +410,7 @@ class Compiler:
                     dtype=value.type.dtype,
                     shape=shape,
                     dim_params=(None,) * len(shape),
+                    is_optional=value.type.is_optional,
                 ),
             )
@@ -361,27 +435,39 @@ class Compiler:
         self, graph: Graph
     ) -> tuple[
         tuple[str, ...],
+        tuple[str | None, ...],
         tuple[tuple[int, ...], ...],
         tuple[ScalarType, ...],
         tuple[str, ...],
+        tuple[str | None, ...],
         tuple[tuple[int, ...], ...],
         tuple[ScalarType, ...],
     ]:
         input_names = tuple(value.name for value in graph.inputs)
+        input_optional_names = tuple(
+            _optional_flag_name(value.name) if value.type.is_optional else None
+            for value in graph.inputs
+        )
         input_shapes = tuple(value.type.shape for value in graph.inputs)
         input_dtypes = tuple(
             value_dtype(graph, value.name) for value in graph.inputs
         )
         output_names = tuple(value.name for value in graph.outputs)
+        output_optional_names = tuple(
+            _optional_flag_name(value.name) if value.type.is_optional else None
+            for value in graph.outputs
+        )
         output_shapes = tuple(value.type.shape for value in graph.outputs)
         output_dtypes = tuple(
             value_dtype(graph, value.name) for value in graph.outputs
         )
         return (
             input_names,
+            input_optional_names,
             input_shapes,
             input_dtypes,
             output_names,
+            output_optional_names,
             output_shapes,
             output_dtypes,
         )
@@ -439,26 +525,22 @@ class Compiler:
             initializer_count=len(graph.initializers),
         )
-    def run(
-        self, model: onnx.ModelProto, feeds: Mapping[str, np.ndarray]
-    ) -> dict[str, np.ndarray]:
-        graph = import_onnx(model)
-        evaluator = Evaluator(graph)
-        return evaluator.run(feeds)
 def _lowered_constants(graph: Graph | GraphContext) -> tuple[ConstTensor, ...]:
+    used_initializers = {value.name for value in graph.outputs}
+    for node in graph.nodes:
+        used_initializers.update(node.inputs)
     constants: list[ConstTensor] = []
     for initializer in graph.initializers:
+        if initializer.name not in used_initializers:
+            continue
         dtype = ensure_supported_dtype(initializer.type.dtype)
+        data_array = initializer.data.astype(dtype.np_dtype, copy=False)
+        data_tuple = tuple(data_array.ravel().tolist())
         constants.append(
             ConstTensor(
                 name=initializer.name,
                 shape=initializer.type.shape,
-                data=tuple(
-                    dtype.np_dtype.type(value)
-                    for value in initializer.data.ravel()
-                ),
+                data=data_tuple,
                 dtype=dtype,
             )
         )

emx_onnx_cgen/determinism.py ADDED Viewed

@@ -0,0 +1,39 @@
+from __future__ import annotations
+from contextlib import contextmanager
+import os
+from typing import Iterator
+THREAD_ENV_VARS = (
+    "OMP_NUM_THREADS",
+    "OPENBLAS_NUM_THREADS",
+    "MKL_NUM_THREADS",
+    "VECLIB_MAXIMUM_THREADS",
+    "NUMEXPR_NUM_THREADS",
+    "BLIS_NUM_THREADS",
+)
+@contextmanager
+def deterministic_reference_runtime() -> Iterator[None]:
+    previous = {name: os.environ.get(name) for name in THREAD_ENV_VARS}
+    for name in THREAD_ENV_VARS:
+        os.environ[name] = "1"
+    limits_context = None
+    try:
+        try:
+            from threadpoolctl import threadpool_limits
+        except Exception:
+            threadpool_limits = None
+        if threadpool_limits is not None:
+            limits_context = threadpool_limits(limits=1)
+            limits_context.__enter__()
+        yield
+    finally:
+        if limits_context is not None:
+            limits_context.__exit__(None, None, None)
+        for name, value in previous.items():
+            if value is None:
+                os.environ.pop(name, None)
+            else:
+                os.environ[name] = value

emx_onnx_cgen/ir/context.py CHANGED Viewed

@@ -14,9 +14,28 @@ class GraphContext:
     _shape_cache: dict[str, tuple[int, ...]] = field(default_factory=dict)
     _initializer_cache: dict[str, Initializer] = field(default_factory=dict)
     _producer_cache: dict[str, Node] = field(default_factory=dict)
+    _value_cache: dict[str, Value] = field(default_factory=dict)
+    def __post_init__(self) -> None:
+        for value in self.graph.inputs + self.graph.outputs + self.graph.values:
+            self._value_cache[value.name] = value
+        for initializer in self.graph.initializers:
+            if initializer.name not in self._value_cache:
+                self._value_cache[initializer.name] = Value(
+                    name=initializer.name,
+                    type=initializer.type,
+                )
+            self._initializer_cache[initializer.name] = initializer
+        for node in self.graph.nodes:
+            for output in node.outputs:
+                if output and output not in self._producer_cache:
+                    self._producer_cache[output] = node
     def find_value(self, name: str) -> Value:
-        return self.graph.find_value(name)
+        value = self._value_cache.get(name)
+        if value is None:
+            raise KeyError(name)
+        return value
     def dtype(self, name: str, node: Node | None = None) -> ScalarType:
         if name in self._dtype_cache:
@@ -55,23 +74,14 @@ class GraphContext:
     def set_shape(self, name: str, shape: tuple[int, ...]) -> None:
         self._shape_cache[name] = shape
+    def has_shape(self, name: str) -> bool:
+        return name in self._shape_cache
     def initializer(self, name: str) -> Initializer | None:
-        if name in self._initializer_cache:
-            return self._initializer_cache[name]
-        for initializer in self.graph.initializers:
-            if initializer.name == name:
-                self._initializer_cache[name] = initializer
-                return initializer
-        return None
+        return self._initializer_cache.get(name)
     def producer(self, output_name: str) -> Node | None:
-        if output_name in self._producer_cache:
-            return self._producer_cache[output_name]
-        for node in self.graph.nodes:
-            if output_name in node.outputs:
-                self._producer_cache[output_name] = node
-                return node
-        return None
+        return self._producer_cache.get(output_name)
     def opset_version(self, domain: str = "") -> int | None:
         if domain in {"", "ai.onnx"}:

emx_onnx_cgen/ir/model.py CHANGED Viewed

@@ -13,6 +13,7 @@ class TensorType:
     dtype: ScalarType
     shape: tuple[int, ...]
     dim_params: tuple[str | None, ...]
+    is_optional: bool = False
 @dataclass(frozen=True)

emx_onnx_cgen/ir/op_base.py CHANGED Viewed

@@ -414,19 +414,20 @@ class VariadicLikeOpBase(RenderableOpBase):
     def infer_shapes(self, ctx: OpContext) -> None:
         input_shapes = tuple(ctx.shape(name) for name in self._variadic_inputs())
-        output_shape = BroadcastingOpBase.broadcast_shapes(*input_shapes)
-        for shape in input_shapes:
-            if shape != output_shape:
-                raise UnsupportedOpError(
-                    f"{self._variadic_kind()} expects identical input/output shapes"
-                )
+        try:
+            output_shape = BroadcastingOpBase.broadcast_shapes(*input_shapes)
+        except ShapeInferenceError as exc:
+            raise UnsupportedOpError(
+                f"{self._variadic_kind()} expects broadcastable input shapes"
+            ) from exc
         try:
             expected = ctx.shape(self._variadic_output())
         except ShapeInferenceError:
             expected = None
         if expected is not None and expected != output_shape:
             raise UnsupportedOpError(
-                f"{self._variadic_kind()} expects identical input/output shapes"
+                f"{self._variadic_kind()} output shape must be {output_shape}, "
+                f"got {expected}"
             )
         ctx.set_shape(self._variadic_output(), output_shape)
@@ -469,6 +470,30 @@ class ReduceOpBase(RenderableOpBase):
 class BroadcastingOpBase(RenderableOpBase):
+    @staticmethod
+    def unidirectional_broadcastable(
+        source: tuple[int, ...],
+        target: tuple[int, ...],
+    ) -> bool:
+        if len(source) > len(target):
+            return False
+        padded = (1,) * (len(target) - len(source)) + source
+        for source_dim, target_dim in zip(padded, target):
+            if source_dim not in {1, target_dim}:
+                return False
+        return True
+    @staticmethod
+    def prelu_channel_axis(
+        input_shape: tuple[int, ...],
+        slope_shape: tuple[int, ...],
+    ) -> int | None:
+        if len(input_shape) < 2 or len(slope_shape) != 1:
+            return None
+        if slope_shape[0] != input_shape[1]:
+            return None
+        return 1
     @staticmethod
     def broadcast_shapes(
         *shapes: tuple[int, ...],

emx_onnx_cgen/ir/ops/__init__.py CHANGED Viewed

@@ -3,28 +3,35 @@ from .elementwise import (
     ClipOp,
     IdentityOp,
     MultiInputBinaryOp,
+    PowOp,
+    QLinearMulOp,
     UnaryOp,
     VariadicOp,
     WhereOp,
 )
 from .misc import (
+    BernoulliOp,
     CastOp,
     ConcatOp,
     ConstantOfShapeOp,
     CumSumOp,
     DepthToSpaceOp,
+    DequantizeLinearOp,
     ExpandOp,
     EyeLikeOp,
     GatherElementsOp,
     GatherNDOp,
     GatherOp,
     GridSampleOp,
+    HammingWindowOp,
     NonMaxSuppressionOp,
     NonZeroOp,
     OneHotOp,
+    OptionalHasElementOp,
     PadOp,
     QuantizeLinearOp,
     RangeOp,
+    HammingWindowOp,
     ReshapeOp,
     ResizeOp,
     ScatterNDOp,
@@ -34,6 +41,7 @@ from .misc import (
     SpaceToDepthOp,
     SplitOp,
     TensorScatterOp,
+    TfIdfVectorizerOp,
     TileOp,
     TransposeOp,
     TriluOp,
@@ -44,10 +52,12 @@ from .nn import (
     AveragePoolOp,
     BatchNormOp,
     ConvOp,
+    ConvIntegerOp,
     ConvTransposeOp,
     EinsumKind,
     EinsumOp,
     GemmOp,
+    GruOp,
     GroupNormalizationOp,
     HardmaxOp,
     InstanceNormalizationOp,
@@ -75,15 +85,18 @@ __all__ = [
     "AttentionOp",
     "AveragePoolOp",
     "BatchNormOp",
+    "BernoulliOp",
     "BinaryOp",
     "CastOp",
     "ClipOp",
     "ConcatOp",
     "ConstantOfShapeOp",
     "ConvOp",
+    "ConvIntegerOp",
     "ConvTransposeOp",
     "CumSumOp",
     "DepthToSpaceOp",
+    "DequantizeLinearOp",
     "EinsumKind",
     "EinsumOp",
     "ExpandOp",
@@ -93,6 +106,8 @@ __all__ = [
     "GatherOp",
     "GemmOp",
     "GridSampleOp",
+    "GruOp",
+    "HammingWindowOp",
     "GroupNormalizationOp",
     "HardmaxOp",
     "IdentityOp",
@@ -111,10 +126,14 @@ __all__ = [
     "NonMaxSuppressionOp",
     "NonZeroOp",
     "OneHotOp",
+    "OptionalHasElementOp",
     "PadOp",
+    "PowOp",
     "QuantizeLinearOp",
+    "QLinearMulOp",
     "QLinearMatMulOp",
     "RangeOp",
+    "HammingWindowOp",
     "ReduceOp",
     "ReshapeOp",
     "ResizeOp",
@@ -129,6 +148,7 @@ __all__ = [
     "SpaceToDepthOp",
     "SplitOp",
     "TensorScatterOp",
+    "TfIdfVectorizerOp",
     "TileOp",
     "TopKOp",
     "TransposeOp",

emx-onnx-cgen 0.3.7__py3-none-any.whl → 0.4.1.dev0__py3-none-any.whl

emx-onnx-cgen 0.3.7py3-none-any.whl → 0.4.1.dev0py3-none-any.whl