PyPI - onnxtr - Versions diffs - 0.3.2__py3-none-any.whl → 0.4.1__py3-none-any.whl - Mend

onnxtr 0.3.2py3-none-any.whl → 0.4.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (23) hide show

onnxtr/models/__init__.py +1 -0
onnxtr/models/classification/models/mobilenet.py +1 -0
onnxtr/models/detection/models/differentiable_binarization.py +2 -0
onnxtr/models/detection/models/fast.py +1 -0
onnxtr/models/detection/models/linknet.py +1 -0
onnxtr/models/engine.py +2 -0
onnxtr/models/factory/__init__.py +1 -0
onnxtr/models/factory/hub.py +224 -0
onnxtr/models/predictor/base.py +2 -2
onnxtr/models/predictor/predictor.py +2 -0
onnxtr/models/recognition/models/crnn.py +2 -0
onnxtr/models/recognition/models/master.py +1 -0
onnxtr/models/recognition/models/parseq.py +2 -0
onnxtr/models/recognition/models/sar.py +2 -0
onnxtr/models/recognition/models/vitstr.py +1 -0
onnxtr/utils/vocabs.py +11 -4
onnxtr/version.py +1 -1
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/METADATA +112 -38
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/RECORD +23 -21
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/WHEEL +1 -1
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/LICENSE +0 -0
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/top_level.txt +0 -0
{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/zip-safe +0 -0

onnxtr/models/__init__.py CHANGED Viewed

@@ -3,3 +3,4 @@ from .classification import *
 from .detection import *
 from .recognition import *
 from .zoo import *
+from .factory import *

onnxtr/models/classification/models/mobilenet.py CHANGED Viewed

@@ -56,6 +56,7 @@ class MobileNetV3(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.cfg = cfg
     def __call__(

onnxtr/models/detection/models/differentiable_binarization.py CHANGED Viewed

@@ -64,8 +64,10 @@ class DBNet(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.cfg = cfg
         self.assume_straight_pages = assume_straight_pages
         self.postprocessor = GeneralDetectionPostProcessor(
             assume_straight_pages=self.assume_straight_pages, bin_thresh=bin_thresh, box_thresh=box_thresh
         )

onnxtr/models/detection/models/fast.py CHANGED Viewed

@@ -62,6 +62,7 @@ class FAST(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.cfg = cfg
         self.assume_straight_pages = assume_straight_pages

onnxtr/models/detection/models/linknet.py CHANGED Viewed

@@ -64,6 +64,7 @@ class LinkNet(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.cfg = cfg
         self.assume_straight_pages = assume_straight_pages

onnxtr/models/engine.py CHANGED Viewed

@@ -90,6 +90,8 @@ class Engine:
     def __init__(self, url: str, engine_cfg: Optional[EngineConfig] = None, **kwargs: Any) -> None:
         engine_cfg = engine_cfg if isinstance(engine_cfg, EngineConfig) else EngineConfig()
         archive_path = download_from_url(url, cache_subdir="models", **kwargs) if "http" in url else url
+        # Store model path for each model
+        self.model_path = archive_path
         self.session_options = engine_cfg.session_options
         self.providers = engine_cfg.providers
         self.runtime = InferenceSession(archive_path, providers=self.providers, sess_options=self.session_options)

onnxtr/models/factory/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .hub import *

onnxtr/models/factory/hub.py ADDED Viewed

@@ -0,0 +1,224 @@
+# Copyright (C) 2021-2024, Mindee | Felix Dittrich.
+# This program is licensed under the Apache License 2.0.
+# See LICENSE or go to <https://opensource.org/licenses/Apache-2.0> for full license details.
+# Inspired by: https://github.com/rwightman/pytorch-image-models/blob/master/timm/models/hub.py
+import json
+import logging
+import os
+import shutil
+import subprocess
+import textwrap
+from pathlib import Path
+from typing import Any, Optional
+from huggingface_hub import (
+    HfApi,
+    Repository,
+    get_token,
+    get_token_permission,
+    hf_hub_download,
+    login,
+)
+from onnxtr import models
+from onnxtr.models.engine import EngineConfig
+__all__ = ["login_to_hub", "push_to_hf_hub", "from_hub", "_save_model_and_config_for_hf_hub"]
+AVAILABLE_ARCHS = {
+    "classification": models.classification.zoo.ORIENTATION_ARCHS,
+    "detection": models.detection.zoo.ARCHS,
+    "recognition": models.recognition.zoo.ARCHS,
+}
+def login_to_hub() -> None:  # pragma: no cover
+    """Login to huggingface hub"""
+    access_token = get_token()
+    if access_token is not None and get_token_permission(access_token):
+        logging.info("Huggingface Hub token found and valid")
+        login(token=access_token, write_permission=True)
+    else:
+        login()
+    # check if git lfs is installed
+    try:
+        subprocess.call(["git", "lfs", "version"])
+    except FileNotFoundError:
+        raise OSError(
+            "Looks like you do not have git-lfs installed, please install. \
+                      You can install from https://git-lfs.github.com/. \
+                      Then run `git lfs install` (you only have to do this once)."
+        )
+def _save_model_and_config_for_hf_hub(model: Any, save_dir: str, arch: str, task: str) -> None:
+    """Save model and config to disk for pushing to huggingface hub
+    Args:
+    ----
+        model: Onnx model to be saved
+        save_dir: directory to save model and config
+        arch: architecture name
+        task: task name
+    """
+    save_directory = Path(save_dir)
+    shutil.copy2(model.model_path, save_directory / "model.onnx")
+    config_path = save_directory / "config.json"
+    # add model configuration
+    model_config = model.cfg
+    model_config["arch"] = arch
+    model_config["task"] = task
+    with config_path.open("w") as f:
+        json.dump(model_config, f, indent=2, ensure_ascii=False)
+def push_to_hf_hub(
+    model: Any, model_name: str, task: str, override: bool = False, **kwargs
+) -> None:  # pragma: no cover
+    """Save model and its configuration on HF hub
+    >>> from onnxtr.models import login_to_hub, push_to_hf_hub
+    >>> from onnxtr.models.recognition import crnn_mobilenet_v3_small
+    >>> login_to_hub()
+    >>> model = crnn_mobilenet_v3_small()
+    >>> push_to_hf_hub(model, 'my-model', 'recognition', arch='crnn_mobilenet_v3_small')
+    Args:
+    ----
+        model: Onnx model to be saved
+        model_name: name of the model which is also the repository name
+        task: task name
+        override: whether to override the existing model / repo on HF hub
+        **kwargs: keyword arguments for push_to_hf_hub
+    """
+    run_config = kwargs.get("run_config", None)
+    arch = kwargs.get("arch", None)
+    if run_config is None and arch is None:
+        raise ValueError("run_config or arch must be specified")
+    if task not in ["classification", "detection", "recognition"]:
+        raise ValueError("task must be one of classification, detection, recognition")
+    # default readme
+    readme = textwrap.dedent(
+        f"""
+    ---
+    language:
+    - en
+    - fr
+    license: apache-2.0
+    ---
+    <p align="center">
+    <img src="https://github.com/felixdittrich92/OnnxTR/raw/main/docs/images/logo.jpg" width="40%">
+    </p>
+    **Optical Character Recognition made seamless & accessible to anyone, powered by Onnxruntime**
+    ## Task: {task}
+    https://github.com/felixdittrich92/OnnxTR
+    ### Example usage:
+    ```python
+    >>> from onnxtr.io import DocumentFile
+    >>> from onnxtr.models import ocr_predictor, from_hub
+    >>> img = DocumentFile.from_images(['<image_path>'])
+    >>> # Load your model from the hub
+    >>> model = from_hub('onnxtr/my-model')
+    >>> # Pass it to the predictor
+    >>> # If your model is a recognition model:
+    >>> predictor = ocr_predictor(det_arch='db_mobilenet_v3_large',
+    >>>                           reco_arch=model)
+    >>> # If your model is a detection model:
+    >>> predictor = ocr_predictor(det_arch=model,
+    >>>                           reco_arch='crnn_mobilenet_v3_small')
+    >>> # Get your predictions
+    >>> res = predictor(img)
+    ```
+    """
+    )
+    # add run configuration to readme if available
+    if run_config is not None:
+        arch = run_config.arch
+        readme += textwrap.dedent(
+            f"""### Run Configuration
+                                  \n{json.dumps(vars(run_config), indent=2, ensure_ascii=False)}"""
+        )
+    if arch not in AVAILABLE_ARCHS[task]:
+        raise ValueError(
+            f"Architecture: {arch} for task: {task} not found.\
+                         \nAvailable architectures: {AVAILABLE_ARCHS}"
+        )
+    commit_message = f"Add {model_name} model"
+    local_cache_dir = os.path.join(os.path.expanduser("~"), ".cache", "huggingface", "hub", model_name)
+    repo_url = HfApi().create_repo(model_name, token=get_token(), exist_ok=override)
+    repo = Repository(local_dir=local_cache_dir, clone_from=repo_url)
+    with repo.commit(commit_message):
+        _save_model_and_config_for_hf_hub(model, repo.local_dir, arch=arch, task=task)
+        readme_path = Path(repo.local_dir) / "README.md"
+        readme_path.write_text(readme)
+    repo.git_push()
+def from_hub(repo_id: str, engine_cfg: Optional[EngineConfig] = None, **kwargs: Any):
+    """Instantiate & load a pretrained model from HF hub.
+    >>> from onnxtr.models import from_hub
+    >>> model = from_hub("onnxtr/my-model")
+    Args:
+    ----
+        repo_id: HuggingFace model hub repo
+        engine_cfg: configuration for the inference engine (optional)
+        kwargs: kwargs of `hf_hub_download`
+    Returns:
+    -------
+        Model loaded with the checkpoint
+    """
+    # Get the config
+    with open(hf_hub_download(repo_id, filename="config.json", **kwargs), "rb") as f:
+        cfg = json.load(f)
+        model_path = hf_hub_download(repo_id, filename="model.onnx", **kwargs)
+    arch = cfg["arch"]
+    task = cfg["task"]
+    cfg.pop("arch")
+    cfg.pop("task")
+    if task == "classification":
+        model = models.classification.__dict__[arch](model_path, classes=cfg["classes"], engine_cfg=engine_cfg)
+    elif task == "detection":
+        model = models.detection.__dict__[arch](model_path, engine_cfg=engine_cfg)
+    elif task == "recognition":
+        model = models.recognition.__dict__[arch](
+            model_path, input_shape=cfg["input_shape"], vocab=cfg["vocab"], engine_cfg=engine_cfg
+        )
+    # convert all values which are lists to tuples
+    for key, value in cfg.items():
+        if isinstance(value, list):
+            cfg[key] = tuple(value)
+    # update model cfg
+    model.cfg = cfg
+    return model

onnxtr/models/predictor/base.py CHANGED Viewed

@@ -112,8 +112,8 @@ class _OCRPredictor:
             ]
         )
         return [
-            # We exapnd if the page is wider than tall and the angle is 90 or -90
-            rotate_image(page, angle, expand=page.shape[1] > page.shape[0] and abs(angle) == 90)
+            # expand if height and width are not equal
+            rotate_image(page, angle, expand=page.shape[0] != page.shape[1])
             for page, angle in zip(pages, origin_pages_orientations)
         ]

onnxtr/models/predictor/predictor.py CHANGED Viewed

@@ -100,6 +100,8 @@ class OCRPredictor(NestedObject, _OCRPredictor):
             origin_pages_orientations = None
         if self.straighten_pages:
             pages = self._straighten_pages(pages, seg_maps, general_pages_orientations, origin_pages_orientations)
+            # update page shapes after straightening
+            origin_page_shapes = [page.shape[:2] for page in pages]
             # forward again to get predictions on straight pages
             loc_preds = self.det_predictor(pages, **kwargs)  # type: ignore[assignment]

onnxtr/models/recognition/models/crnn.py CHANGED Viewed

@@ -129,8 +129,10 @@ class CRNN(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.vocab = vocab
         self.cfg = cfg
         self.postprocessor = CRNNPostProcessor(self.vocab)
     def __call__(

onnxtr/models/recognition/models/master.py CHANGED Viewed

@@ -53,6 +53,7 @@ class MASTER(Engine):
         self.vocab = vocab
         self.cfg = cfg
         self.postprocessor = MASTERPostProcessor(vocab=self.vocab)
     def __call__(

onnxtr/models/recognition/models/parseq.py CHANGED Viewed

@@ -49,8 +49,10 @@ class PARSeq(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.vocab = vocab
         self.cfg = cfg
         self.postprocessor = PARSeqPostProcessor(vocab=self.vocab)
     def __call__(

onnxtr/models/recognition/models/sar.py CHANGED Viewed

@@ -49,8 +49,10 @@ class SAR(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.vocab = vocab
         self.cfg = cfg
         self.postprocessor = SARPostProcessor(self.vocab)
     def __call__(

onnxtr/models/recognition/models/vitstr.py CHANGED Viewed

@@ -57,6 +57,7 @@ class ViTSTR(Engine):
         **kwargs: Any,
     ) -> None:
         super().__init__(url=model_path, engine_cfg=engine_cfg, **kwargs)
         self.vocab = vocab
         self.cfg = cfg

onnxtr/utils/vocabs.py CHANGED Viewed

@@ -17,9 +17,14 @@ VOCABS: Dict[str, str] = {
     "ancient_greek": "αβγδεζηθικλμνξοπρστυφχψωΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ",
     "arabic_letters": "ءآأؤإئابةتثجحخدذرزسشصضطظعغـفقكلمنهوىي",
     "persian_letters": "پچڢڤگ",
-    "hindi_digits": "٠١٢٣٤٥٦٧٨٩",
+    "arabic_digits": "٠١٢٣٤٥٦٧٨٩",
     "arabic_diacritics": "ًٌٍَُِّْ",
     "arabic_punctuation": "؟؛«»—",
+    "hindi_letters": "अआइईउऊऋॠऌॡएऐओऔअंअःकखगघङचछजझञटठडढणतथदधनपफबभमयरलवशषसह",
+    "hindi_digits": "०१२३४५६७८९",
+    "hindi_punctuation": "।,?!:्ॐ॰॥॰",
+    "bangla_letters": "অআইঈউঊঋএঐওঔকখগঘঙচছজঝঞটঠডঢণতথদধনপফবভমযরলশষসহ়ঽািীুূৃেৈোৌ্ৎংঃঁ",
+    "bangla_digits": "০১২৩৪৫৬৭৮৯",
 }
 VOCABS["latin"] = VOCABS["digits"] + VOCABS["ascii_letters"] + VOCABS["punctuation"]
@@ -32,7 +37,7 @@ VOCABS["italian"] = VOCABS["english"] + "àèéìíîòóùúÀÈÉÌÍÎÒÓÙ
 VOCABS["german"] = VOCABS["english"] + "äöüßÄÖÜẞ"
 VOCABS["arabic"] = (
     VOCABS["digits"]
-    + VOCABS["hindi_digits"]
+    + VOCABS["arabic_digits"]
     + VOCABS["arabic_letters"]
     + VOCABS["persian_letters"]
     + VOCABS["arabic_diacritics"]
@@ -48,10 +53,12 @@ VOCABS["finnish"] = VOCABS["english"] + "äöÄÖ"
 VOCABS["swedish"] = VOCABS["english"] + "åäöÅÄÖ"
 VOCABS["vietnamese"] = (
     VOCABS["english"]
-    + "áàảạãăắằẳẵặâấầẩẫậéèẻẽẹêếềểễệóòỏõọôốồổộỗơớờởợỡúùủũụưứừửữựiíìỉĩịýỳỷỹỵ"
-    + "ÁÀẢẠÃĂẮẰẲẴẶÂẤẦẨẪẬÉÈẺẼẸÊẾỀỂỄỆÓÒỎÕỌÔỐỒỔỘỖƠỚỜỞỢỠÚÙỦŨỤƯỨỪỬỮỰIÍÌỈĨỊÝỲỶỸỴ"
+    + "áàảạãăắằẳẵặâấầẩẫậđéèẻẽẹêếềểễệóòỏõọôốồổộỗơớờởợỡúùủũụưứừửữựiíìỉĩịýỳỷỹỵ"
+    + "ÁÀẢẠÃĂẮẰẲẴẶÂẤẦẨẪẬĐÉÈẺẼẸÊẾỀỂỄỆÓÒỎÕỌÔỐỒỔỘỖƠỚỜỞỢỠÚÙỦŨỤƯỨỪỬỮỰIÍÌỈĨỊÝỲỶỸỴ"
 )
 VOCABS["hebrew"] = VOCABS["english"] + "אבגדהוזחטיכלמנסעפצקרשת" + "₪"
+VOCABS["hindi"] = VOCABS["hindi_letters"] + VOCABS["hindi_digits"] + VOCABS["hindi_punctuation"]
+VOCABS["bangla"] = VOCABS["bangla_letters"] + VOCABS["bangla_digits"]
 VOCABS["multilingual"] = "".join(
     dict.fromkeys(
         VOCABS["french"]

onnxtr/version.py CHANGED Viewed

	@@ -1 +1 @@
1	- __version__ = 'v0.3.2'
1	+ __version__ = 'v0.4.1'

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: onnxtr
-Version: 0.3.2
+Version: 0.4.1
 Summary: Onnx Text Recognition (OnnxTR): docTR Onnx-Wrapper for high-performance OCR on documents.
 Author-email: Felix Dittrich <felixdittrich92@gmail.com>
 Maintainer: Felix Dittrich
@@ -225,46 +225,47 @@ Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
 Requires-Python: <4,>=3.9.0
 Description-Content-Type: text/markdown
 License-File: LICENSE
-Requires-Dist: numpy <2.0.0,>=1.16.0
-Requires-Dist: scipy <2.0.0,>=1.4.0
-Requires-Dist: opencv-python <5.0.0,>=4.5.0
-Requires-Dist: pypdfium2 <5.0.0,>=4.11.0
-Requires-Dist: pyclipper <2.0.0,>=1.2.0
-Requires-Dist: shapely <3.0.0,>=1.6.0
-Requires-Dist: rapidfuzz <4.0.0,>=3.0.0
-Requires-Dist: langdetect <2.0.0,>=1.0.9
-Requires-Dist: Pillow >=9.2.0
-Requires-Dist: defusedxml >=0.7.0
-Requires-Dist: anyascii >=0.3.2
-Requires-Dist: tqdm >=4.30.0
+Requires-Dist: numpy<3.0.0,>=1.16.0
+Requires-Dist: scipy<2.0.0,>=1.4.0
+Requires-Dist: opencv-python<5.0.0,>=4.5.0
+Requires-Dist: pypdfium2<5.0.0,>=4.11.0
+Requires-Dist: pyclipper<2.0.0,>=1.2.0
+Requires-Dist: shapely<3.0.0,>=1.6.0
+Requires-Dist: rapidfuzz<4.0.0,>=3.0.0
+Requires-Dist: langdetect<2.0.0,>=1.0.9
+Requires-Dist: huggingface-hub<1.0.0,>=0.23.0
+Requires-Dist: Pillow>=9.2.0
+Requires-Dist: defusedxml>=0.7.0
+Requires-Dist: anyascii>=0.3.2
+Requires-Dist: tqdm>=4.30.0
 Provides-Extra: cpu
-Requires-Dist: onnxruntime >=1.11.0 ; extra == 'cpu'
+Requires-Dist: onnxruntime>=1.11.0; extra == "cpu"
 Provides-Extra: dev
-Requires-Dist: onnxruntime >=1.11.0 ; extra == 'dev'
-Requires-Dist: weasyprint >=55.0 ; extra == 'dev'
-Requires-Dist: matplotlib >=3.1.0 ; extra == 'dev'
-Requires-Dist: mplcursors >=0.3 ; extra == 'dev'
-Requires-Dist: pytest >=5.3.2 ; extra == 'dev'
-Requires-Dist: coverage[toml] >=4.5.4 ; extra == 'dev'
-Requires-Dist: requests >=2.20.0 ; extra == 'dev'
-Requires-Dist: ruff >=0.1.5 ; extra == 'dev'
-Requires-Dist: mypy >=0.812 ; extra == 'dev'
-Requires-Dist: pre-commit >=2.17.0 ; extra == 'dev'
+Requires-Dist: onnxruntime>=1.11.0; extra == "dev"
+Requires-Dist: weasyprint>=55.0; extra == "dev"
+Requires-Dist: matplotlib>=3.1.0; extra == "dev"
+Requires-Dist: mplcursors>=0.3; extra == "dev"
+Requires-Dist: pytest>=5.3.2; extra == "dev"
+Requires-Dist: coverage[toml]>=4.5.4; extra == "dev"
+Requires-Dist: requests>=2.20.0; extra == "dev"
+Requires-Dist: ruff>=0.1.5; extra == "dev"
+Requires-Dist: mypy>=0.812; extra == "dev"
+Requires-Dist: pre-commit>=2.17.0; extra == "dev"
 Provides-Extra: gpu
-Requires-Dist: onnxruntime-gpu >=1.11.0 ; extra == 'gpu'
+Requires-Dist: onnxruntime-gpu>=1.11.0; extra == "gpu"
 Provides-Extra: html
-Requires-Dist: weasyprint >=55.0 ; extra == 'html'
+Requires-Dist: weasyprint>=55.0; extra == "html"
 Provides-Extra: quality
-Requires-Dist: ruff >=0.1.5 ; extra == 'quality'
-Requires-Dist: mypy >=0.812 ; extra == 'quality'
-Requires-Dist: pre-commit >=2.17.0 ; extra == 'quality'
+Requires-Dist: ruff>=0.1.5; extra == "quality"
+Requires-Dist: mypy>=0.812; extra == "quality"
+Requires-Dist: pre-commit>=2.17.0; extra == "quality"
 Provides-Extra: testing
-Requires-Dist: pytest >=5.3.2 ; extra == 'testing'
-Requires-Dist: coverage[toml] >=4.5.4 ; extra == 'testing'
-Requires-Dist: requests >=2.20.0 ; extra == 'testing'
+Requires-Dist: pytest>=5.3.2; extra == "testing"
+Requires-Dist: coverage[toml]>=4.5.4; extra == "testing"
+Requires-Dist: requests>=2.20.0; extra == "testing"
 Provides-Extra: viz
-Requires-Dist: matplotlib >=3.1.0 ; extra == 'viz'
-Requires-Dist: mplcursors >=0.3 ; extra == 'viz'
+Requires-Dist: matplotlib>=3.1.0; extra == "viz"
+Requires-Dist: mplcursors>=0.3; extra == "viz"
 <p align="center">
   <img src="https://github.com/felixdittrich92/OnnxTR/raw/main/docs/images/logo.jpg" width="40%">
@@ -275,7 +276,7 @@ Requires-Dist: mplcursors >=0.3 ; extra == 'viz'
 [![codecov](https://codecov.io/gh/felixdittrich92/OnnxTR/graph/badge.svg?token=WVFRCQBOLI)](https://codecov.io/gh/felixdittrich92/OnnxTR)
 [![Codacy Badge](https://app.codacy.com/project/badge/Grade/4fff4d764bb14fb8b4f4afeb9587231b)](https://app.codacy.com/gh/felixdittrich92/OnnxTR/dashboard?utm_source=gh&utm_medium=referral&utm_content=&utm_campaign=Badge_grade)
 [![CodeFactor](https://www.codefactor.io/repository/github/felixdittrich92/onnxtr/badge)](https://www.codefactor.io/repository/github/felixdittrich92/onnxtr)
-[![Pypi](https://img.shields.io/badge/pypi-v0.3.1-blue.svg)](https://pypi.org/project/OnnxTR/)
+[![Pypi](https://img.shields.io/badge/pypi-v0.4.1-blue.svg)](https://pypi.org/project/OnnxTR/)
 > :warning: Please note that this is a wrapper around the [doctr](https://github.com/mindee/doctr) library to provide a Onnx pipeline for docTR. For feature requests, which are not directly related to the Onnx pipeline, please refer to the base project.
@@ -449,6 +450,69 @@ det_model = linknet_resnet18("path_to_custom_model.onnx")
 model = ocr_predictor(det_arch=det_model, reco_arch=reco_model)
 ```
+## Loading models from HuggingFace Hub
+You can also load models from the HuggingFace Hub:
+```python
+from onnxtr.io import DocumentFile
+from onnxtr.models import ocr_predictor, from_hub
+img = DocumentFile.from_images(['<image_path>'])
+# Load your model from the hub
+model = from_hub('onnxtr/my-model')
+# Pass it to the predictor
+# If your model is a recognition model:
+predictor = ocr_predictor(
+    det_arch='db_mobilenet_v3_large',
+    reco_arch=model
+)
+# If your model is a detection model:
+predictor = ocr_predictor(
+    det_arch=model,
+    reco_arch='crnn_mobilenet_v3_small'
+)
+# Get your predictions
+res = predictor(img)
+```
+HF Hub search: [here](https://huggingface.co/models?search=onnxtr).
+Collection: [here](https://huggingface.co/collections/Felix92/onnxtr-66bf213a9f88f7346c90e842)
+Or push your own models to the hub:
+```python
+from onnxtr.models import parseq, push_to_hf_hub, login_to_hub
+from onnxtr.utils.vocabs import VOCABS
+# Login to the hub
+login_to_hub()
+# Recogniton model
+model = parseq("~/onnxtr-parseq-multilingual-v1.onnx", vocab=VOCABS["multilingual"])
+push_to_hf_hub(
+    model,
+    model_name="onnxtr-parseq-multilingual-v1",
+    task="recognition",  # The task for which the model is intended [detection, recognition, classification]
+    arch="parseq",  # The name of the model architecture
+    override=False  # Set to `True` if you want to override an existing model / repository
+)
+# Detection model
+model = linknet_resnet18("~/onnxtr-linknet-resnet18.onnx")
+push_to_hf_hub(
+    model,
+    model_name="onnxtr-linknet-resnet18",
+    task="detection",
+    arch="linknet_resnet18",
+    override=True
+)
+```
 ## Models architectures
 Credits where it's due: this repository provides ONNX models for the following architectures, converted from the docTR models:
@@ -525,8 +589,8 @@ The smallest combination in OnnxTR (docTR) of `db_mobilenet_v3_large` and `crnn_
 |Library                          |FUNSD (199 pages)              |CORD  (900 pages)              |
 |---------------------------------|-------------------------------|-------------------------------|
 |docTR (CPU) - v0.8.1             | ~1.29s / Page                 | ~0.60s / Page                 |
-|**OnnxTR (CPU)** - v0.1.2        | ~0.57s / Page                 | **~0.25s / Page**             |
-|**OnnxTR (CPU) 8-bit** - v0.1.2  | **~0.38s / Page**             | **~0.14s / Page**             |
+|**OnnxTR (CPU)** - v0.4.1        | ~0.57s / Page                 | **~0.25s / Page**             |
+|**OnnxTR (CPU) 8-bit** - v0.4.1  | **~0.38s / Page**             | **~0.14s / Page**             |
 |EasyOCR (CPU) - v1.7.1           | ~1.96s / Page                 | ~1.75s / Page                 |
 |**PyTesseract (CPU)** - v0.3.10  | **~0.50s / Page**             | ~0.52s / Page                 |
 |Surya (line) (CPU) - v0.4.4      | ~48.76s / Page                | ~35.49s / Page                |
@@ -538,7 +602,7 @@ The smallest combination in OnnxTR (docTR) of `db_mobilenet_v3_large` and `crnn_
 |-------------------------------------|-------------------------------|-------------------------------|
 |docTR (GPU) - v0.8.1                 | ~0.07s / Page                 | ~0.05s / Page                 |
 |**docTR (GPU) float16** - v0.8.1     | **~0.06s / Page**             | **~0.03s / Page**             |
-|OnnxTR (GPU) - v0.1.2                | **~0.06s / Page**             | ~0.04s / Page                 |
+|OnnxTR (GPU) - v0.4.1                | **~0.06s / Page**             | ~0.04s / Page                 |
 |EasyOCR (GPU) - v1.7.1               | ~0.31s / Page                 | ~0.19s / Page                 |
 |Surya (GPU) float16 - v0.4.4         | ~3.70s / Page                 | ~2.81s / Page                 |
 |**PaddleOCR (GPU) - no cls - v2.7.3**| ~0.08s / Page                 | **~0.03s / Page**             |
@@ -557,6 +621,16 @@ If you wish to cite please refer to the base project citation, feel free to use
 }
 ```
+```bibtex
+@misc{onnxtr2024,
+    title={OnnxTR: Optical Character Recognition made seamless & accessible to anyone, powered by Onnx},
+    author={Felix Dittrich},
+    year={2024},
+    publisher = {GitHub},
+    howpublished = {\url{https://github.com/felixdittrich92/OnnxTR}}
+}
+```
 ## License
 Distributed under the Apache 2.0 License. See [`LICENSE`](https://github.com/felixdittrich92/OnnxTR?tab=Apache-2.0-1-ov-file#readme) for more information.

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/RECORD RENAMED Viewed

@@ -1,7 +1,7 @@
 onnxtr/__init__.py,sha256=h7Wc2tuHLsaoCk5xNpEFEK-g11A6SJA7nAasA76TQ_Y,100
 onnxtr/file_utils.py,sha256=WjUKalEdR53aoeIY4e-ihy3r7J_C9qFxL40JHGPfutc,1107
 onnxtr/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-onnxtr/version.py,sha256=Mqv-IS8XNTfhjRfomiPmqTyHtOUKl9tLeE2KEmYIkeM,23
+onnxtr/version.py,sha256=FMLDI1-41V4TL8AtTJYDQPs1_pJ9uac4WXnI9j16CjY,23
 onnxtr/contrib/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 onnxtr/contrib/artefacts.py,sha256=tdmfhvfXVRYEH7uj4_hqf2cuUGoTieyNK8bXsD3zHwo,5383
 onnxtr/contrib/base.py,sha256=KyJ8_zDSKEWSFBszgCbLjEeI7SKg4N_iH_ZQNf90SWQ,3288
@@ -11,15 +11,15 @@ onnxtr/io/html.py,sha256=Em_7PjZ56SugJ9bjjcWLCMVe5ee6uUMKeZovNxJFAXw,737
 onnxtr/io/image.py,sha256=4tLTh2bGdA0ohh3a6mV6xD0KqNOtIVi5lJ06XSmeyMI,1759
 onnxtr/io/pdf.py,sha256=tD0klmxI-gkMXp56f_ZXWyPHLsUBKa_xlhNTtGV6tpU,1367
 onnxtr/io/reader.py,sha256=BA7DPhW-Gkmce_ZfzrOl4H3pSXVy2JBeQEuY3pWrBFg,2852
-onnxtr/models/__init__.py,sha256=Rg-5P2e622q-5ScfxVE3G8GXa51HUPS7b0jkvdukFzM,134
+onnxtr/models/__init__.py,sha256=QTfZlqUyv1d7NUCbGIUFM1DLOOXe-cqHZ7uaKkGdXvk,157
 onnxtr/models/_utils.py,sha256=KncsNcoWqbsxFwduce2STuGHLhv63nXEHv7CMuh6wYA,6606
 onnxtr/models/builder.py,sha256=Bzg-XHZc5k16Ti2XeV9hm4POTHofe581Azq1a3d1O6E,14296
-onnxtr/models/engine.py,sha256=fPpQzX_wNoxkPcECbGHFoIYtphHVQD9YkJG9hXFu42E,4756
+onnxtr/models/engine.py,sha256=w1vzEduzVDHuxOb0JEkhPp2whrK7ViP03KZiNUNbe4I,4837
 onnxtr/models/zoo.py,sha256=Zcx0mOfMwUR2YAMd7ug06RvXeG2T1PzR2twS6y9X19A,5352
 onnxtr/models/classification/__init__.py,sha256=h1bZs55iLJBMATtzS4ntTKwfD6OGXBiiqGv_hEnOFnE,41
 onnxtr/models/classification/zoo.py,sha256=jzZMf7hKqN9omGAPHJR83rVDaaWhPm-Rk55Xn4bGaIs,3436
 onnxtr/models/classification/models/__init__.py,sha256=rohbM6ZQslfYchi7feZwwh-sX3XXRUhgtEJQeurAytQ,24
-onnxtr/models/classification/models/mobilenet.py,sha256=_hWUfQfjSLDPT2v_Ru6KcNZYMRTSPBlFpOdgGeE2jD0,4880
+onnxtr/models/classification/models/mobilenet.py,sha256=l6Ch7ZwL4tqoN94YhSmudY6XYl5fIILzzu4T9JUwZKs,4881
 onnxtr/models/classification/predictor/__init__.py,sha256=ERmmOxz_9mUkIuccNbzUa5Y6gVLLVDdyc4cCxbCCUbY,20
 onnxtr/models/classification/predictor/base.py,sha256=Xfaj2XlaJuQ2R81XqF5RB0Wcvzd4wh7Z6j1ifn2niFc,2097
 onnxtr/models/detection/__init__.py,sha256=h1bZs55iLJBMATtzS4ntTKwfD6OGXBiiqGv_hEnOFnE,41
@@ -28,16 +28,18 @@ onnxtr/models/detection/zoo.py,sha256=5kz4l67Xkr4YTDoI2wDTiI6HSaB926zfua0SZU-Kaw
 onnxtr/models/detection/_utils/__init__.py,sha256=oPkIYbySSbLsOk02wVPNO9bUuywC47YjaenfyTwfOsw,20
 onnxtr/models/detection/_utils/base.py,sha256=fOWnvBKluWKTNXSBKg3U6ckzYuF7onEKQ4AvheuTJQk,2346
 onnxtr/models/detection/models/__init__.py,sha256=6Ea6knYrVCR2jAmPlsVWmCdHe-c6lSRETSAuZGfhx8I,85
-onnxtr/models/detection/models/differentiable_binarization.py,sha256=5ZeO3RRFMvLLZ4TpK01xUdxTTFhXvywjrNBbjASxgLY,6734
-onnxtr/models/detection/models/fast.py,sha256=2umsWdwPV91q6PyNrlZPbdi9DIk7dbmZWcLOMkD1EUg,6293
-onnxtr/models/detection/models/linknet.py,sha256=Wd4PbKMJlOZ20fXrZcqPYtdGETSKGXYAKEqBVrVWHEE,6771
+onnxtr/models/detection/models/differentiable_binarization.py,sha256=bJ_bkeDBweY_bfyzI681rx2BpE4BcgDZe49M1FPJJig,6736
+onnxtr/models/detection/models/fast.py,sha256=VkwboSA7IHCXCnxUDwMTEbxXWdrpCM477PY8nO2tPOI,6294
+onnxtr/models/detection/models/linknet.py,sha256=aVRkCVvMDO74izdCFZRPtub7AJkxZntpsqqFrxMr8ts,6772
 onnxtr/models/detection/postprocessor/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 onnxtr/models/detection/postprocessor/base.py,sha256=FIhSNktNLQjGWup3xEMaOCjKQmRvtt0h8M9IFQk_5jM,5823
 onnxtr/models/detection/predictor/__init__.py,sha256=ERmmOxz_9mUkIuccNbzUa5Y6gVLLVDdyc4cCxbCCUbY,20
 onnxtr/models/detection/predictor/base.py,sha256=bt8M6I14tWC9DYjrFrqg-AU5u670_uPpuC7LmcegcCQ,2328
+onnxtr/models/factory/__init__.py,sha256=cKPoH2V2157lLMTR2zsljG3_IQHziodqR-XK_LG0D_I,19
+onnxtr/models/factory/hub.py,sha256=Fk6pX9VJD422rnVgLh37o136T_0YAsQFzY2dQplDfa4,7176
 onnxtr/models/predictor/__init__.py,sha256=XL25XkRkgyK7mldF-CWhg2MMakSdP5vLpDLwL59hphk,25
-onnxtr/models/predictor/base.py,sha256=VUs1OIsb8FW91U1ehB1sBaxG4Suz8iS-Ut50Zt6_SHo,8860
-onnxtr/models/predictor/predictor.py,sha256=etxgAvT8cYhboPyHiDRO0BL1rBoTw5lL1vhZP4dHWqw,6247
+onnxtr/models/predictor/base.py,sha256=ZutI4iNUWk5I5wFfzip89JEDl0SmN7W7hCWRmVec38w,8813
+onnxtr/models/predictor/predictor.py,sha256=pfyTu2qidlPOpXyNKkh20cZefWYUZlF3VEmzrsQr2K8,6368
 onnxtr/models/preprocessor/__init__.py,sha256=ERmmOxz_9mUkIuccNbzUa5Y6gVLLVDdyc4cCxbCCUbY,20
 onnxtr/models/preprocessor/base.py,sha256=8ZCKsB-o9uRaUm0x4x9FYpYxLXpwHyq2nVv_TlRgaMw,3990
 onnxtr/models/recognition/__init__.py,sha256=h1bZs55iLJBMATtzS4ntTKwfD6OGXBiiqGv_hEnOFnE,41
@@ -45,11 +47,11 @@ onnxtr/models/recognition/core.py,sha256=0Q1dVXqRcDUr_ycT5tpoSH9-zuDF58GtnmxWpUS
 onnxtr/models/recognition/utils.py,sha256=04abbjx-_OuF5iEANWIAOK3tQQl1tExPmBQx4IG04Lc,3569
 onnxtr/models/recognition/zoo.py,sha256=144aDgOpieatiVB0FO-otCNOAKS13AedLk7PWt4Z02M,2521
 onnxtr/models/recognition/models/__init__.py,sha256=IXfiuzzkft8O1CpBZWYTpFw19y49mt5rJ_iGSdaWiU0,105
-onnxtr/models/recognition/models/crnn.py,sha256=JyQ43NEiWj2Vzd8z1oVv_G66xn59ClZ63njowQaAs0g,8963
-onnxtr/models/recognition/models/master.py,sha256=-xnNM-5DPnbOH9b9mXPwU2Nknq7h1H0GXsdd2NWHFnM,4777
-onnxtr/models/recognition/models/parseq.py,sha256=1n3Qvif2763h7H7B2BKovHiFpgan4-bXMntc1O8XuPE,4577
-onnxtr/models/recognition/models/sar.py,sha256=Mc8axoyJaAlbdindvLLeOQCLp_p_m5kMZ9XHKzupo_E,4588
-onnxtr/models/recognition/models/vitstr.py,sha256=mrLpGUS2mrsjCfWdwbMkWgZagTURKSr0qS8JrwFTJzs,6054
+onnxtr/models/recognition/models/crnn.py,sha256=rTMh_stR_4oKJKHKDCTEssQsXW56meYhWHahkaDPYpc,8965
+onnxtr/models/recognition/models/master.py,sha256=UTsd2hSLrnTeafisVgdumAiJrpAeBm-WwYFI2ZEYERw,4778
+onnxtr/models/recognition/models/parseq.py,sha256=nn-LsqQ_n1bmyE_QmVMgciillIkHlcpr8OFOunOQthQ,4579
+onnxtr/models/recognition/models/sar.py,sha256=yEQ9_bH2kcjPr8iI-9Doq_Bm2SKhBCOeiRMv3IXp6mY,4590
+onnxtr/models/recognition/models/vitstr.py,sha256=D9PR2N7IjhIh_YdPCSzlGRW91c3hrn2tCE_UTd89nxg,6055
 onnxtr/models/recognition/predictor/__init__.py,sha256=ERmmOxz_9mUkIuccNbzUa5Y6gVLLVDdyc4cCxbCCUbY,20
 onnxtr/models/recognition/predictor/_utils.py,sha256=ZNm5I7ibiWfTlz302uiifCkUOu65YWa-oUBUMPrrUuQ,3406
 onnxtr/models/recognition/predictor/base.py,sha256=YvqSNEM3rCEttxl6hsC9zl1R97N9zO2WZfD5_-nfkR0,2483
@@ -64,10 +66,10 @@ onnxtr/utils/multithreading.py,sha256=30T7AylM3rb52ZEI3Pk1pfB0VYraTbc7yO2vNODVVF
 onnxtr/utils/reconstitution.py,sha256=Hx1_ddLevKLzuxXc19UelPdsGlAwqi4f6vRSYKHDUB4,2617
 onnxtr/utils/repr.py,sha256=kfbjGL6KymGT8spo2UL4FJXZ0XRwa7CO7Y1dTVR8dIk,2129
 onnxtr/utils/visualization.py,sha256=CX09qvDnNIw3BFW5F3jM4R9OcpLWAeZyoDyTAOGRvls,9925
-onnxtr/utils/vocabs.py,sha256=SCQ4XQjbHSxunj1tg2iHRiPfE8OaTAMhcJbKq5BNvFs,3138
-onnxtr-0.3.2.dist-info/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
-onnxtr-0.3.2.dist-info/METADATA,sha256=I9n5apYunvpxpSy36h-UtfNYl8eW3WOLpnPujaKUzgo,29802
-onnxtr-0.3.2.dist-info/WHEEL,sha256=y4mX-SOX4fYIkonsAGA5N0Oy-8_gI4FXw5HNI1xqvWg,91
-onnxtr-0.3.2.dist-info/top_level.txt,sha256=r_MSUTpspp4pWEEWvly-s7ZkfCg1KwrK6-kBlXkWKU8,7
-onnxtr-0.3.2.dist-info/zip-safe,sha256=AbpHGcgLb-kRsJGnwFEktk7uzpZOCcBY74-YBdrKVGs,1
-onnxtr-0.3.2.dist-info/RECORD,,
+onnxtr/utils/vocabs.py,sha256=9Ufmjf7OczWb0931NjWTL7owXLYOKn5x0ulaoVeJGn8,3855
+onnxtr-0.4.1.dist-info/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
+onnxtr-0.4.1.dist-info/METADATA,sha256=ghYrvvMe49613vZHcXr8qw6e8o7aoVD4uocdcKDaRYU,31723
+onnxtr-0.4.1.dist-info/WHEEL,sha256=Mdi9PDNwEZptOjTlUcAth7XJDFtKrHYaQMPulZeBCiQ,91
+onnxtr-0.4.1.dist-info/top_level.txt,sha256=r_MSUTpspp4pWEEWvly-s7ZkfCg1KwrK6-kBlXkWKU8,7
+onnxtr-0.4.1.dist-info/zip-safe,sha256=AbpHGcgLb-kRsJGnwFEktk7uzpZOCcBY74-YBdrKVGs,1
+onnxtr-0.4.1.dist-info/RECORD,,

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/WHEEL RENAMED Viewed

@@ -1,5 +1,5 @@
 Wheel-Version: 1.0
-Generator: setuptools (70.2.0)
+Generator: setuptools (73.0.1)
 Root-Is-Purelib: true
 Tag: py3-none-any

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/LICENSE RENAMED Viewed

File without changes

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/top_level.txt RENAMED Viewed

File without changes

{onnxtr-0.3.2.dist-info → onnxtr-0.4.1.dist-info}/zip-safe RENAMED Viewed

File without changes

onnxtr 0.3.2__py3-none-any.whl → 0.4.1__py3-none-any.whl

onnxtr 0.3.2py3-none-any.whl → 0.4.1py3-none-any.whl