PyPI - onnx-diagnostic - Versions diffs - 0.2.2__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

onnx-diagnostic 0.2.2py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (54) hide show

onnx_diagnostic/__init__.py +1 -1
onnx_diagnostic/__main__.py +4 -0
onnx_diagnostic/_command_lines_parser.py +452 -0
onnx_diagnostic/doc.py +4 -4
onnx_diagnostic/export/__init__.py +2 -1
onnx_diagnostic/export/dynamic_shapes.py +574 -23
onnx_diagnostic/export/validate.py +170 -0
onnx_diagnostic/ext_test_case.py +151 -31
onnx_diagnostic/helpers/__init__.py +1 -0
onnx_diagnostic/helpers/bench_run.py +450 -0
onnx_diagnostic/helpers/cache_helper.py +216 -0
onnx_diagnostic/helpers/config_helper.py +80 -0
onnx_diagnostic/{helpers.py → helpers/helper.py} +341 -662
onnx_diagnostic/helpers/memory_peak.py +249 -0
onnx_diagnostic/helpers/onnx_helper.py +921 -0
onnx_diagnostic/{ort_session.py → helpers/ort_session.py} +4 -3
onnx_diagnostic/helpers/rt_helper.py +47 -0
onnx_diagnostic/{torch_test_helper.py → helpers/torch_test_helper.py} +149 -55
onnx_diagnostic/reference/ops/op_cast_like.py +1 -1
onnx_diagnostic/reference/ort_evaluator.py +7 -2
onnx_diagnostic/tasks/__init__.py +48 -0
onnx_diagnostic/tasks/automatic_speech_recognition.py +165 -0
onnx_diagnostic/tasks/fill_mask.py +67 -0
onnx_diagnostic/tasks/image_classification.py +96 -0
onnx_diagnostic/tasks/image_text_to_text.py +145 -0
onnx_diagnostic/tasks/sentence_similarity.py +67 -0
onnx_diagnostic/tasks/text2text_generation.py +172 -0
onnx_diagnostic/tasks/text_classification.py +67 -0
onnx_diagnostic/tasks/text_generation.py +248 -0
onnx_diagnostic/tasks/zero_shot_image_classification.py +106 -0
onnx_diagnostic/torch_export_patches/onnx_export_errors.py +111 -146
onnx_diagnostic/torch_export_patches/onnx_export_serialization.py +346 -57
onnx_diagnostic/torch_export_patches/patch_inputs.py +203 -0
onnx_diagnostic/torch_export_patches/patches/patch_torch.py +41 -2
onnx_diagnostic/torch_export_patches/patches/patch_transformers.py +39 -49
onnx_diagnostic/torch_models/hghub/__init__.py +1 -0
onnx_diagnostic/torch_models/hghub/hub_api.py +254 -0
onnx_diagnostic/torch_models/hghub/hub_data.py +203 -0
onnx_diagnostic/torch_models/hghub/hub_data_cached_configs.py +3571 -0
onnx_diagnostic/torch_models/hghub/model_inputs.py +151 -0
onnx_diagnostic/torch_models/test_helper.py +1250 -0
onnx_diagnostic/torch_models/untrained/llm_phi2.py +3 -4
onnx_diagnostic/torch_models/untrained/llm_tiny_llm.py +3 -4
onnx_diagnostic/torch_onnx/__init__.py +0 -0
onnx_diagnostic/torch_onnx/sbs.py +439 -0
{onnx_diagnostic-0.2.2.dist-info → onnx_diagnostic-0.4.0.dist-info}/METADATA +14 -4
onnx_diagnostic-0.4.0.dist-info/RECORD +86 -0
{onnx_diagnostic-0.2.2.dist-info → onnx_diagnostic-0.4.0.dist-info}/WHEEL +1 -1
onnx_diagnostic/cache_helpers.py +0 -104
onnx_diagnostic/onnx_tools.py +0 -260
onnx_diagnostic-0.2.2.dist-info/RECORD +0 -59
/onnx_diagnostic/{args.py → helpers/args_helper.py} +0 -0
{onnx_diagnostic-0.2.2.dist-info → onnx_diagnostic-0.4.0.dist-info}/licenses/LICENSE.txt +0 -0
{onnx_diagnostic-0.2.2.dist-info → onnx_diagnostic-0.4.0.dist-info}/top_level.txt +0 -0

onnx_diagnostic/__init__.py CHANGED Viewed

@@ -3,5 +3,5 @@ Investigates onnx models.
 Functions, classes to dig into a model when this one is right, slow, wrong...
 """
-__version__ = "0.2.2"
+__version__ = "0.4.0"
 __author__ = "Xavier Dupré"

onnx_diagnostic/__main__.py ADDED Viewed

@@ -0,0 +1,4 @@
+from ._command_lines_parser import main
+if __name__ == "__main__":
+    main()

onnx_diagnostic/_command_lines_parser.py ADDED Viewed

@@ -0,0 +1,452 @@
+import argparse
+import json
+import sys
+import textwrap
+import onnx
+from typing import Any, List, Optional
+from argparse import ArgumentParser, RawTextHelpFormatter, BooleanOptionalAction
+from textwrap import dedent
+def get_parser_lighten() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="lighten",
+        description=dedent(
+            """
+        Removes the weights from a heavy model, stores statistics to restore
+        random weights.
+        """
+        ),
+        epilog="This is mostly used to write unit tests without adding "
+        "a big onnx file to the repository.",
+    )
+    parser.add_argument(
+        "-i",
+        "--input",
+        type=str,
+        required=True,
+        help="onnx model to lighten",
+    )
+    parser.add_argument(
+        "-o",
+        "--output",
+        type=str,
+        required=True,
+        help="onnx model to output",
+    )
+    parser.add_argument(
+        "-v",
+        "--verbose",
+        default=0,
+        required=False,
+        help="verbosity",
+    )
+    return parser
+def _cmd_lighten(argv: List[Any]):
+    from .helpers.onnx_helper import onnx_lighten
+    parser = get_parser_lighten()
+    args = parser.parse_args(argv[1:])
+    onx = onnx.load(args.input)
+    new_onx, stats = onnx_lighten(onx, verbose=args.verbose)
+    jstats = json.dumps(stats)
+    if args.verbose:
+        print("save file {args.input!r}")
+    if args.verbose:
+        print("write file {args.output!r}")
+    with open(args.output, "wb") as f:
+        f.write(new_onx.SerializeToString())
+    name = f"{args.output}.stats"
+    with open(name, "w") as f:
+        f.write(jstats)
+    if args.verbose:
+        print("done")
+def get_parser_unlighten() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="unlighten",
+        description=dedent(
+            """
+        Restores random weights for a model reduces with command lighten,
+        the command expects to find a file nearby with extension '.stats'.
+        """
+        ),
+        epilog="This is mostly used to write unit tests without adding "
+        "a big onnx file to the repository.",
+    )
+    parser.add_argument(
+        "-i",
+        "--input",
+        type=str,
+        required=True,
+        help="onnx model to unlighten",
+    )
+    parser.add_argument(
+        "-o",
+        "--output",
+        type=str,
+        required=True,
+        help="onnx model to output",
+    )
+    parser.add_argument(
+        "-v",
+        "--verbose",
+        default=0,
+        required=False,
+        help="verbosity",
+    )
+    return parser
+def _cmd_unlighten(argv: List[Any]):
+    from .helpers.onnx_helper import onnx_unlighten
+    parser = get_parser_lighten()
+    args = parser.parse_args(argv[1:])
+    new_onx = onnx_unlighten(args.input, verbose=args.verbose)
+    if args.verbose:
+        print(f"save file {args.output}")
+    with open(args.output, "wb") as f:
+        f.write(new_onx.SerializeToString())
+    if args.verbose:
+        print("done")
+def get_parser_print() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="print",
+        description=dedent(
+            """
+        Prints the model on the standard output.
+        """
+        ),
+        epilog="To show a model.",
+    )
+    parser.add_argument(
+        "fmt", choices=["pretty", "raw"], help="Format to use.", default="pretty"
+    )
+    parser.add_argument("input", type=str, help="onnx model to load")
+    return parser
+def _cmd_print(argv: List[Any]):
+    parser = get_parser_print()
+    args = parser.parse_args(argv[1:])
+    onx = onnx.load(args.input)
+    if args.fmt == "raw":
+        print(onx)
+    elif args.fmt == "pretty":
+        from .helpers.onnx_helper import pretty_onnx
+        print(pretty_onnx(onx))
+    else:
+        raise ValueError(f"Unexpected value fmt={args.fmt!r}")
+def get_parser_find() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="find",
+        description=dedent(
+            """
+        Look into a model and search for a set of names,
+        tells which node is consuming or producing it.
+        """
+        ),
+        epilog="Enables Some quick validation.",
+    )
+    parser.add_argument(
+        "-i",
+        "--input",
+        type=str,
+        required=True,
+        help="onnx model to unlighten",
+    )
+    parser.add_argument(
+        "-n",
+        "--names",
+        type=str,
+        required=False,
+        help="names to look at comma separated values",
+    )
+    parser.add_argument(
+        "-v",
+        "--verbose",
+        default=0,
+        required=False,
+        help="verbosity",
+    )
+    return parser
+def _cmd_find(argv: List[Any]):
+    from .helpers.onnx_helper import onnx_find
+    parser = get_parser_find()
+    args = parser.parse_args(argv[1:])
+    onnx_find(args.input, verbose=args.verbose, watch=set(args.names.split(",")))
+def get_parser_config() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="config",
+        description=dedent(
+            """
+        Prints out a configuration for a model id,
+        prints the associated task as well.
+        """
+        ),
+        epilog="",
+    )
+    parser.add_argument(
+        "-m",
+        "--mid",
+        type=str,
+        required=True,
+        help="model id, usually <author>/<name>",
+    )
+    parser.add_argument(
+        "-t",
+        "--task",
+        default=False,
+        action=BooleanOptionalAction,
+        help="displays the task as well",
+    )
+    return parser
+def _cmd_config(argv: List[Any]):
+    from .torch_models.hghub.hub_api import get_pretrained_config, task_from_id
+    parser = get_parser_config()
+    args = parser.parse_args(argv[1:])
+    print(get_pretrained_config(args.mid))
+    if args.task:
+        print("------")
+        print(f"task: {task_from_id(args.mid)}")
+class _ParseDict(argparse.Action):
+    def __call__(self, parser, namespace, values, option_string=None):
+        d = getattr(namespace, self.dest) or {}
+        if values:
+            for item in values:
+                split_items = item.split("=", 1)
+                key = split_items[0].strip()  # we remove blanks around keys, as is logical
+                value = split_items[1]
+                d[key] = value
+        setattr(namespace, self.dest, d)
+def get_parser_validate() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="test",
+        description=dedent(
+            """
+        Prints out dummy inputs for a particular task or a model id.
+        If both mid and task are empty, the command line displays the list
+        of supported tasks.
+        """
+        ),
+        epilog="If the model id is specified, one untrained version of it is instantiated.",
+    )
+    parser.add_argument("-m", "--mid", type=str, help="model id, usually <author>/<name>")
+    parser.add_argument("-t", "--task", default=None, help="force the task to use")
+    parser.add_argument("-e", "--export", help="export the model with this exporter")
+    parser.add_argument("--opt", help="optimization to apply after the export")
+    parser.add_argument(
+        "-r",
+        "--run",
+        default=False,
+        action=BooleanOptionalAction,
+        help="runs the model to check it runs",
+    )
+    parser.add_argument(
+        "-q",
+        "--quiet",
+        default=False,
+        action=BooleanOptionalAction,
+        help="catches exception, report them in the summary",
+    )
+    parser.add_argument(
+        "-p",
+        "--patch",
+        default=True,
+        action=BooleanOptionalAction,
+        help="applies patches before exporting",
+    )
+    parser.add_argument(
+        "--stop-if-static",
+        default=0,
+        type=int,
+        help="raises an exception if a dynamic dimension becomes static",
+    )
+    parser.add_argument(
+        "--trained",
+        default=False,
+        action=BooleanOptionalAction,
+        help="validate the trained model (requires downloading)",
+    )
+    parser.add_argument(
+        "-o",
+        "--dump-folder",
+        help="if not empty, a folder is created to dumps statistics, "
+        "exported program, onnx...",
+    )
+    parser.add_argument(
+        "--drop",
+        help="drops the following inputs names, it should be a list "
+        "with comma separated values",
+    )
+    parser.add_argument(
+        "--ortfusiontype",
+        required=False,
+        help="applies onnxruntime fusion, this parameter should contain the "
+        "model type or multiple values separated by `|`. `ALL` can be used "
+        "to run them all",
+    )
+    parser.add_argument("-v", "--verbose", default=0, type=int, help="verbosity")
+    parser.add_argument("--dtype", help="changes dtype if necessary")
+    parser.add_argument("--device", help="changes the device if necessary")
+    parser.add_argument(
+        "--iop",
+        metavar="KEY=VALUE",
+        nargs="*",
+        help="Additional input options, use to change the default "
+        "inputs use to export, example: --iop cls_cache=SlidingWindowCache",
+        action=_ParseDict,
+    )
+    return parser
+def _cmd_validate(argv: List[Any]):
+    from .helpers import string_type
+    from .torch_models.test_helper import get_inputs_for_task, validate_model
+    from .tasks import supported_tasks
+    parser = get_parser_validate()
+    args = parser.parse_args(argv[1:])
+    if not args.task and not args.mid:
+        print("-- list of supported tasks:")
+        print("\n".join(supported_tasks()))
+    elif not args.mid:
+        data = get_inputs_for_task(args.task)
+        if args.verbose:
+            print(f"task: {args.task}")
+        max_length = max(len(k) for k in data["inputs"]) + 1
+        print("-- inputs")
+        for k, v in data["inputs"].items():
+            print(f"  + {k.ljust(max_length)}: {string_type(v, with_shape=True)}")
+        print("-- dynamic_shapes")
+        for k, v in data["dynamic_shapes"].items():
+            print(f"  + {k.ljust(max_length)}: {string_type(v)}")
+    else:
+        # Let's skip any invalid combination if known to be unsupported
+        if (
+            "onnx" not in (args.export or "")
+            and "custom" not in (args.export or "")
+            and (args.opt or "")
+        ):
+            print(f"validate - unsupported args: export={args.export!r}, opt={args.opt!r}")
+            return
+        summary, _data = validate_model(
+            model_id=args.mid,
+            task=args.task,
+            do_run=args.run,
+            verbose=args.verbose,
+            quiet=args.quiet,
+            trained=args.trained,
+            dtype=args.dtype,
+            device=args.device,
+            patch=args.patch,
+            stop_if_static=args.stop_if_static,
+            optimization=args.opt,
+            exporter=args.export,
+            dump_folder=args.dump_folder,
+            drop_inputs=None if not args.drop else args.drop.split(","),
+            ortfusiontype=args.ortfusiontype,
+            input_options=args.iop,
+        )
+        print("")
+        print("-- summary --")
+        for k, v in sorted(summary.items()):
+            print(f":{k},{v};")
+def get_main_parser() -> ArgumentParser:
+    parser = ArgumentParser(
+        prog="onnx_diagnostic",
+        description="onnx_diagnostic main command line.\n",
+        formatter_class=RawTextHelpFormatter,
+        epilog=textwrap.dedent(
+            """
+        Type 'python -m onnx_diagnostic <cmd> --help'
+        to get help for a specific command.
+        config     - prints a configuration for a model id
+        find       - find node consuming or producing a result
+        lighten    - makes an onnx model lighter by removing the weights,
+        unlighten  - restores an onnx model produces by the previous experiment
+        print      - prints the model on standard output
+        validate   - validate a model
+        """
+        ),
+    )
+    parser.add_argument(
+        "cmd",
+        choices=["config", "find", "lighten", "print", "unlighten", "validate"],
+        help="Selects a command.",
+    )
+    return parser
+def main(argv: Optional[List[Any]] = None):
+    fcts = dict(
+        lighten=_cmd_lighten,
+        unlighten=_cmd_unlighten,
+        print=_cmd_print,
+        find=_cmd_find,
+        config=_cmd_config,
+        validate=_cmd_validate,
+    )
+    if argv is None:
+        argv = sys.argv[1:]
+    if (
+        len(argv) == 0
+        or (len(argv) <= 1 and argv[0] not in fcts)
+        or argv[-1] in ("--help", "-h")
+    ):
+        if len(argv) < 2:
+            parser = get_main_parser()
+            parser.parse_args(argv)
+        else:
+            parsers = dict(
+                lighten=get_parser_lighten,
+                unlighten=get_parser_unlighten,
+                print=get_parser_print,
+                find=get_parser_find,
+                config=get_parser_config,
+                validate=get_parser_validate,
+            )
+            cmd = argv[0]
+            if cmd not in parsers:
+                raise ValueError(
+                    f"Unknown command {cmd!r}, it should be in {list(sorted(parsers))}."
+                )
+            parser = parsers[cmd]()
+            parser.parse_args(argv[1:])
+        raise RuntimeError("The programme should have exited before.")
+    cmd = argv[0]
+    if cmd in fcts:
+        fcts[cmd](argv)
+    else:
+        raise ValueError(
+            f"Unknown command {cmd!r}, use --help to get the list of known command."
+        )

onnx_diagnostic/doc.py CHANGED Viewed

@@ -8,14 +8,14 @@ def reset_torch_transformers(gallery_conf, fname):
 def plot_legend(
-    text: str, text_bottom: str = "", color: str = "green", fontsize: int = 35
+    text: str, text_bottom: str = "", color: str = "green", fontsize: int = 15
 ) -> "matplotlib.axes.Axes":  # noqa: F821
     import matplotlib.pyplot as plt
-    fig = plt.figure()
+    fig = plt.figure(figsize=(2, 2))
     ax = fig.add_subplot()
     ax.axis([0, 5, 0, 5])
-    ax.text(2.5, 4, "END", fontsize=50, horizontalalignment="center")
+    ax.text(2.5, 4, "END", fontsize=10, horizontalalignment="center")
     ax.text(
         2.5,
         2.5,
@@ -26,7 +26,7 @@ def plot_legend(
         verticalalignment="center",
     )
     if text_bottom:
-        ax.text(4.5, 0.5, text_bottom, fontsize=20, horizontalalignment="right")
+        ax.text(4.5, 0.5, text_bottom, fontsize=7, horizontalalignment="right")
     ax.grid(False)
     ax.set_axis_off()
     return ax

onnx_diagnostic/export/__init__.py CHANGED Viewed

@@ -1 +1,2 @@
-from .dynamic_shapes import ModelInputs
+from .dynamic_shapes import CoupleInputsDynamicShapes, ModelInputs
+from .validate import validate_ep

onnx-diagnostic 0.2.2__py3-none-any.whl → 0.4.0__py3-none-any.whl

onnx-diagnostic 0.2.2py3-none-any.whl → 0.4.0py3-none-any.whl