PyPI - da4ml - Versions diffs - 0.5.1.post1__cp311-cp311-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl - Mend

da4ml 0.5.1.post1__cp311-cp311-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (96) hide show

da4ml/__init__.py +4 -0
da4ml/_binary/__init__.py +15 -0
da4ml/_binary/dais_bin.cpython-311-x86_64-linux-gnu.so +0 -0
da4ml/_binary/dais_bin.pyi +5 -0
da4ml/_cli/__init__.py +30 -0
da4ml/_cli/convert.py +204 -0
da4ml/_cli/report.py +295 -0
da4ml/_version.py +32 -0
da4ml/cmvm/__init__.py +4 -0
da4ml/cmvm/api.py +264 -0
da4ml/cmvm/core/__init__.py +221 -0
da4ml/cmvm/core/indexers.py +83 -0
da4ml/cmvm/core/state_opr.py +284 -0
da4ml/cmvm/types.py +739 -0
da4ml/cmvm/util/__init__.py +7 -0
da4ml/cmvm/util/bit_decompose.py +86 -0
da4ml/cmvm/util/mat_decompose.py +121 -0
da4ml/codegen/__init__.py +9 -0
da4ml/codegen/hls/__init__.py +4 -0
da4ml/codegen/hls/hls_codegen.py +196 -0
da4ml/codegen/hls/hls_model.py +255 -0
da4ml/codegen/hls/source/ap_types/ap_binary.h +78 -0
da4ml/codegen/hls/source/ap_types/ap_common.h +376 -0
da4ml/codegen/hls/source/ap_types/ap_decl.h +212 -0
da4ml/codegen/hls/source/ap_types/ap_fixed.h +360 -0
da4ml/codegen/hls/source/ap_types/ap_fixed_base.h +2354 -0
da4ml/codegen/hls/source/ap_types/ap_fixed_ref.h +718 -0
da4ml/codegen/hls/source/ap_types/ap_fixed_special.h +230 -0
da4ml/codegen/hls/source/ap_types/ap_int.h +330 -0
da4ml/codegen/hls/source/ap_types/ap_int_base.h +1885 -0
da4ml/codegen/hls/source/ap_types/ap_int_ref.h +1346 -0
da4ml/codegen/hls/source/ap_types/ap_int_special.h +223 -0
da4ml/codegen/hls/source/ap_types/ap_shift_reg.h +138 -0
da4ml/codegen/hls/source/ap_types/etc/ap_private.h +7199 -0
da4ml/codegen/hls/source/ap_types/hls_math.h +27 -0
da4ml/codegen/hls/source/ap_types/hls_stream.h +263 -0
da4ml/codegen/hls/source/ap_types/utils/x_hls_utils.h +80 -0
da4ml/codegen/hls/source/binder_util.hh +71 -0
da4ml/codegen/hls/source/build_binder.mk +22 -0
da4ml/codegen/hls/source/vitis_bitshift.hh +32 -0
da4ml/codegen/rtl/__init__.py +15 -0
da4ml/codegen/rtl/common_source/binder_util.hh +99 -0
da4ml/codegen/rtl/common_source/build_binder.mk +34 -0
da4ml/codegen/rtl/common_source/build_quartus_prj.tcl +104 -0
da4ml/codegen/rtl/common_source/build_vivado_prj.tcl +111 -0
da4ml/codegen/rtl/common_source/ioutil.hh +124 -0
da4ml/codegen/rtl/common_source/template.sdc +27 -0
da4ml/codegen/rtl/common_source/template.xdc +30 -0
da4ml/codegen/rtl/rtl_model.py +486 -0
da4ml/codegen/rtl/verilog/__init__.py +10 -0
da4ml/codegen/rtl/verilog/comb.py +239 -0
da4ml/codegen/rtl/verilog/io_wrapper.py +113 -0
da4ml/codegen/rtl/verilog/pipeline.py +67 -0
da4ml/codegen/rtl/verilog/source/lookup_table.v +27 -0
da4ml/codegen/rtl/verilog/source/multiplier.v +37 -0
da4ml/codegen/rtl/verilog/source/mux.v +58 -0
da4ml/codegen/rtl/verilog/source/negative.v +31 -0
da4ml/codegen/rtl/verilog/source/shift_adder.v +59 -0
da4ml/codegen/rtl/vhdl/__init__.py +9 -0
da4ml/codegen/rtl/vhdl/comb.py +206 -0
da4ml/codegen/rtl/vhdl/io_wrapper.py +120 -0
da4ml/codegen/rtl/vhdl/pipeline.py +71 -0
da4ml/codegen/rtl/vhdl/source/lookup_table.vhd +52 -0
da4ml/codegen/rtl/vhdl/source/multiplier.vhd +40 -0
da4ml/codegen/rtl/vhdl/source/mux.vhd +102 -0
da4ml/codegen/rtl/vhdl/source/negative.vhd +35 -0
da4ml/codegen/rtl/vhdl/source/shift_adder.vhd +101 -0
da4ml/converter/__init__.py +63 -0
da4ml/converter/hgq2/__init__.py +3 -0
da4ml/converter/hgq2/layers/__init__.py +11 -0
da4ml/converter/hgq2/layers/_base.py +132 -0
da4ml/converter/hgq2/layers/activation.py +81 -0
da4ml/converter/hgq2/layers/attn.py +148 -0
da4ml/converter/hgq2/layers/batchnorm.py +15 -0
da4ml/converter/hgq2/layers/conv.py +149 -0
da4ml/converter/hgq2/layers/dense.py +39 -0
da4ml/converter/hgq2/layers/ops.py +246 -0
da4ml/converter/hgq2/layers/pool.py +107 -0
da4ml/converter/hgq2/layers/table.py +176 -0
da4ml/converter/hgq2/parser.py +161 -0
da4ml/trace/__init__.py +6 -0
da4ml/trace/fixed_variable.py +965 -0
da4ml/trace/fixed_variable_array.py +600 -0
da4ml/trace/ops/__init__.py +13 -0
da4ml/trace/ops/einsum_utils.py +305 -0
da4ml/trace/ops/quantization.py +74 -0
da4ml/trace/ops/reduce_utils.py +105 -0
da4ml/trace/pipeline.py +181 -0
da4ml/trace/tracer.py +186 -0
da4ml/typing/__init__.py +3 -0
da4ml-0.5.1.post1.dist-info/METADATA +85 -0
da4ml-0.5.1.post1.dist-info/RECORD +96 -0
da4ml-0.5.1.post1.dist-info/WHEEL +6 -0
da4ml-0.5.1.post1.dist-info/entry_points.txt +3 -0
da4ml-0.5.1.post1.dist-info/sboms/auditwheel.cdx.json +1 -0
da4ml.libs/libgomp-e985bcbb.so.1.0.0 +0 -0

da4ml/converter/hgq2/layers/table.py ADDED Viewed

@@ -0,0 +1,176 @@
+from collections.abc import Callable
+from math import prod, sqrt
+import keras
+import numpy as np
+from hgq.layers.table import QConvT1D, QConvT2D, QConvTBase, QDenseT
+from hgq.quantizer.internal import FixedPointQuantizerBase
+from keras import ops
+from ....trace import FixedVariableArray
+from ....trace.fixed_variable import FixedVariable
+from ....trace.ops import _quantize
+from ._base import ReplayOperationBase, mirror_quantizer, to_np_arr
+from .conv import symbolic_extract_patches
+def keras_act_to_numpy(act: Callable) -> Callable:
+    match act:
+        case keras.activations.relu:
+            return lambda x: np.maximum(0, x)
+        case keras.activations.tanh:
+            return np.tanh
+        case keras.activations.softmax:
+            raise ValueError('Non-local activation must not be used')
+        case keras.activations.linear:
+            return lambda x: x
+        case keras.activations.sigmoid:
+            return lambda x: 1 / (1 + np.exp(-x))
+        case keras.activations.swish:
+            return lambda x: x / (1 + np.exp(-x))
+        case keras.activations.gelu:
+            return lambda x: 0.5 * x * (1 + np.tanh(np.sqrt(2 / np.pi) * (x + 0.044715 * np.power(x, 3))))
+        case keras.activations.elu:
+            return lambda x: np.where(x > 0, x, np.exp(x) - 1)
+        case keras.activations.selu:
+            alpha = 1.6732632423543772
+            scale = 1.0507009873554805
+            return lambda x: scale * np.where(x > 0, x, alpha * (np.exp(x) - 1))
+        case keras.activations.softplus:
+            return lambda x: np.log1p(np.exp(x))
+        case keras.activations.softsign:
+            return lambda x: x / (1 + np.abs(x))
+        case keras.activations.exponential:
+            return lambda x: np.exp(x)
+        case keras.activations.hard_silu:
+            return lambda x: x * np.minimum(1, np.maximum(0, (x + 1) / 2))
+        case _:
+            return lambda x: ops.convert_to_numpy(act(ops.convert_to_tensor(x)))
+def gather_weights_and_activation(model: keras.Sequential):
+    ws: list[np.ndarray] = []
+    bs: list[np.ndarray | None] = []
+    acts: list[Callable[[np.ndarray], np.ndarray]] = []
+    for layer in model.layers:
+        layer: keras.layers.EinsumDense
+        w, *b = layer.get_weights()
+        act = keras_act_to_numpy(layer.activation)
+        if len(b) != 0:
+            assert len(b) == 1
+            b = b[0]
+        else:
+            b = None
+        if w.ndim == 3:
+            w = w[..., None]
+            if b is not None:
+                b = b[..., None]
+        ws.append(w)
+        bs.append(b)
+        acts.append(act)
+    return ws, bs, acts
+class ReplayDenseTable(ReplayOperationBase):
+    handles = (QDenseT,)
+    __input_quantizer_handled__ = True
+    def call(self, inputs: FixedVariableArray) -> FixedVariableArray:
+        op: QDenseT = self.op  # type: ignore
+        out = np.broadcast_to(inputs[..., None], inputs.shape + (op.n_out,))  # type: ignore
+        out = mirror_quantizer(op.iq, out)
+        l, h, s = out.lhs
+        table_sizes: np.ndarray = np.round((h - l) / s).astype(np.uint32) + 1
+        model = op.module
+        ws, bs, acts = gather_weights_and_activation(model)
+        out_shape: tuple[int, ...] = inputs.shape + (op.n_out,)
+        tables: list[np.ndarray] = [None] * prod(out_shape)  # type: ignore
+        n, loc = np.unique(table_sizes, return_inverse=True)
+        for i in range(n.size):
+            mask: np.ndarray = loc == i
+            _l, _h = l[mask], h[mask]
+            inp = np.linspace(_l, _h, n[i])
+            _out = inp[..., None]
+            idxs = np.where(mask.ravel())[0]
+            mask = mask.reshape(-1, *mask.shape[-2:])
+            for w, b, act in zip(ws, bs, acts):
+                w = np.concatenate([w[_mask] for _mask in mask], axis=0)
+                if b is not None:
+                    b = np.concatenate([b[_mask] for _mask in mask], axis=0)
+                else:
+                    b = 0
+                _out = act(np.einsum('...ni,nij->...nj', _out, w, optimize='optimal') + b)
+            _out = _out[..., 0]
+            for j, idx in enumerate(idxs):
+                tables[idx] = _out[..., j]
+        if op.enable_bn:
+            bn = op.bn_module
+            beta: np.ndarray = ops.convert_to_numpy(bn.beta) if bn.center else 1  # type: ignore
+            gamma: np.ndarray = ops.convert_to_numpy(bn.gamma) if bn.scale else 1  # type: ignore
+            m_mean: np.ndarray = ops.convert_to_numpy(bn.moving_mean)  # type: ignore
+            m_var: np.ndarray = ops.convert_to_numpy(bn.moving_variance)  # type: ignore
+            epsilon = bn.epsilon
+            scaler = gamma / np.sqrt(m_var + epsilon)
+            offset = beta - m_mean * scaler
+            for i in range(len(tables)):
+                tables[i][:] = (tables[i] * scaler[i % op.n_out] + offset[i % op.n_out]) / sqrt(op.n_in)
+        assert all(v is not None for v in tables), tables
+        toq = op.toq
+        toq_internal: FixedPointQuantizerBase = toq.quantizer
+        kk, ki, kf = toq_internal.kif
+        _shape = (1,) + out.shape
+        kk = toq_internal.bw_mapper.bw_to_x(kk, _shape)
+        ki = toq_internal.bw_mapper.bw_to_x(ki, _shape)
+        kf = toq_internal.bw_mapper.bw_to_x(kf, _shape)
+        k, i, f = map(lambda x: to_np_arr(x).astype(np.int32).ravel(), (kk, ki, kf))
+        round_mode, overflow_mode = toq_internal.round_mode, toq_internal.overflow_mode
+        round_mode = round_mode[2:] if round_mode.startswith('S_') else round_mode
+        for arr, _k, _i, _f in zip(tables, k, i, f):
+            arr[:] = _quantize(arr, _k, _i, _f, overflow_mode, round_mode)
+        ret_vars: list[FixedVariable] = [None] * len(tables)  # type: ignore
+        _vars = out.ravel()._vars
+        for i in range(len(tables)):
+            ret_vars[i] = _vars[i].lookup(tables[i])
+        out = FixedVariableArray(np.array(ret_vars).reshape(out_shape), solver_options=out.solver_options)
+        out = np.sum(out, axis=-2)  # type: ignore
+        return out
+class ReplayConvTable(ReplayDenseTable):
+    handles = (QConvT2D, QConvT1D, QConvTBase)
+    def call(self, inputs: FixedVariableArray):
+        op: QConvTBase = self.op
+        if op.rank == 1:
+            inputs = inputs[:, None]
+        inputs = symbolic_extract_patches(inputs, **op.im2col_params)
+        if op.rank == 1:
+            inputs = inputs[:, 0]
+        return super().call(inputs)
+__all__ = ['ReplayDenseTable', 'ReplayConvTable']

da4ml/converter/hgq2/parser.py ADDED Viewed

@@ -0,0 +1,161 @@
+from collections.abc import Sequence
+from dataclasses import dataclass
+from typing import Any
+import keras
+import numpy as np
+from keras import KerasTensor, Operation
+from ...cmvm.api import solver_options_t
+from ...trace import FixedVariableArray, FixedVariableArrayInput, HWConfig, comb_trace
+from ...trace.fixed_variable import FixedVariable
+from .layers import _registry
+@dataclass
+class OpObj:
+    operation: Operation
+    args: list
+    kwargs: dict
+    produces: tuple[KerasTensor, ...]
+    requires: tuple[KerasTensor, ...]
+def parse_model(model: keras.Model):
+    if isinstance(model, keras.Sequential):
+        model = model._functional
+    operators: dict[int, list[OpObj]] = {}
+    for depth, nodes in model._nodes_by_depth.items():
+        _oprs = []
+        for node in nodes:
+            assert isinstance(node.operation, keras.Operation)
+            opr = OpObj(
+                operation=node.operation,
+                args=node.arguments.args,
+                kwargs=node.arguments.kwargs,
+                produces=node.outputs,
+                requires=node.arguments.keras_tensors,
+            )
+            _oprs.append(opr)
+        operators[depth] = _oprs
+    return [operators[i] for i in range(max(operators.keys()), -1, -1)]
+def replace_tensors(tensor_map: dict[KerasTensor, FixedVariableArray], obj: Any) -> Any:
+    if isinstance(obj, KerasTensor):
+        return tensor_map[obj]
+    if isinstance(obj, list):
+        return [replace_tensors(tensor_map, o) for o in obj]
+    if isinstance(obj, tuple):
+        return tuple(replace_tensors(tensor_map, o) for o in obj)
+    if isinstance(obj, dict):
+        return {k: replace_tensors(tensor_map, v) for k, v in obj.items()}
+    return obj
+def _flatten_arr(args: Any) -> FixedVariableArray:
+    if isinstance(args, FixedVariableArray):
+        return np.ravel(args)  # type: ignore
+    if isinstance(args, FixedVariable):
+        return FixedVariableArray(np.array([args]))
+    if not isinstance(args, Sequence):
+        return None  # type: ignore
+    args = [_flatten_arr(a) for a in args]
+    args = [a for a in args if a is not None]
+    return np.concatenate(args)  # type: ignore
+def _apply_nn(
+    model: keras.Model,
+    inputs: FixedVariableArray | Sequence[FixedVariableArray],
+    verbose: bool = False,
+    dump: bool = False,
+    n_nested: int = 0,
+) -> tuple[FixedVariableArray, ...] | dict[str, FixedVariableArray]:
+    """
+    Apply a keras model to a fixed variable array or a sequence of fixed variable arrays.
+    Parameters
+    ----------
+    model : keras.Model
+        The keras model to apply.
+    inputs : FixedVariableArray or Sequence[FixedVariableArray]
+        The input fixed variable array or sequence of fixed variable arrays.
+    Returns
+    -------
+    tuple of FixedVariableArray
+        A tuple containing the output(s) of the model as FixedVariableArray.
+    """
+    if isinstance(inputs, FixedVariableArray):
+        inputs = (inputs,)
+    assert len(model.inputs) == len(inputs), f'Model has {len(model.inputs)} inputs, got {len(inputs)}'
+    tensor_map = {keras_tensor: da_tensor for keras_tensor, da_tensor in zip(model.inputs, inputs)}
+    _inputs = _flatten_arr(inputs)
+    if verbose and n_nested:
+        print(' -> enter:')
+    for ops in parse_model(model):
+        for op in ops:
+            assert all(t in tensor_map for t in op.requires)
+            args = replace_tensors(tensor_map, op.args)
+            kwargs: dict[str, Any] = replace_tensors(tensor_map, op.kwargs)
+            if op.operation.__class__ is keras.layers.InputLayer:
+                continue
+            if verbose:
+                indent = '    ' * n_nested
+                print(f'{indent}{op.operation.name} ({op.operation.__class__.__name__})', end='')
+            if isinstance(op.operation, keras.Model):
+                sub_model = op.operation._functional if isinstance(op.operation, keras.Sequential) else op.operation
+                outputs: tuple[FixedVariableArray, ...] = _apply_nn(
+                    sub_model,
+                    args,
+                    verbose=verbose,
+                    dump=False,
+                    n_nested=n_nested + 1,
+                )  # type: ignore
+            else:
+                mirror_op = _registry[op.operation.__class__](op.operation)
+                outputs = mirror_op(*args, **kwargs)
+            if verbose:
+                comb = comb_trace(_inputs, _flatten_arr(outputs))
+                print(f' cumcost: {comb.cost}, latency: {comb.latency[1]}')
+            for keras_tensor, da_tensor in zip(op.produces, outputs):
+                tensor_map[keras_tensor] = da_tensor
+    if verbose and n_nested:
+        indent = '    ' * (n_nested - 1)
+        print(f'{indent}<- exit', end='')
+    if not dump:
+        return tuple(tensor_map[keras_tensor] for keras_tensor in model.outputs)
+    else:
+        return {k.name: v for k, v in tensor_map.items()}
+def trace_model(  # type: ignore
+    model: keras.Model,
+    hwconf: HWConfig | tuple[int, int, int] = HWConfig(1, -1, -1),
+    solver_options: solver_options_t | None = None,
+    verbose: bool = False,
+    inputs: tuple[FixedVariableArray, ...] | None = None,
+    inputs_kif: tuple[int, int, int] | None = None,
+    dump=False,
+):
+    if inputs is None:
+        inputs = tuple(
+            FixedVariableArrayInput(inp.shape[1:], hwconf=hwconf, solver_options=solver_options) for inp in model.inputs
+        )
+        if inputs_kif is not None:
+            inputs = tuple(inp.quantize(*inputs_kif) for inp in inputs)
+    outputs = _apply_nn(model, inputs, verbose=verbose, dump=dump)
+    if not dump:
+        return _flatten_arr(inputs), _flatten_arr(outputs)
+    else:
+        return {k: _flatten_arr(v) for k, v in outputs.items()}  # type: ignore

da4ml/trace/__init__.py ADDED Viewed

@@ -0,0 +1,6 @@
+from .fixed_variable import FixedVariable, HWConfig
+from .fixed_variable_array import FixedVariableArray, FixedVariableArrayInput
+from .pipeline import to_pipeline
+from .tracer import comb_trace
+__all__ = ['to_pipeline', 'comb_trace', 'FixedVariableArray', 'FixedVariable', 'HWConfig', 'FixedVariableArrayInput']