PyPI - openocr-python - Versions diffs - 0.0.9__py3-none-any.whl → 0.1.0.dev0__py3-none-any.whl - Mend

openocr-python 0.0.9py3-none-any.whl → 0.1.0.dev0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (90) hide show

openocr/__init__.py +35 -1
openocr/configs/dataset/rec/evaluation.yaml +41 -0
openocr/configs/dataset/rec/ltb.yaml +9 -0
openocr/configs/dataset/rec/mjsynth.yaml +11 -0
openocr/configs/dataset/rec/openvino.yaml +25 -0
openocr/configs/dataset/rec/ost.yaml +17 -0
openocr/configs/dataset/rec/synthtext.yaml +7 -0
openocr/configs/dataset/rec/test.yaml +77 -0
openocr/configs/dataset/rec/textocr.yaml +13 -0
openocr/configs/dataset/rec/textocr_horizontal.yaml +13 -0
openocr/configs/dataset/rec/union14m_b.yaml +47 -0
openocr/configs/dataset/rec/union14m_l_filtered.yaml +35 -0
openocr/configs/rec/cmer/cmer.yml +127 -0
openocr/configs/rec/mdiff4str/svtrv2_mdiffdecoder_base.yml +152 -0
openocr/configs/rec/mdiff4str/svtrv2_mdiffdecoder_small.yml +152 -0
openocr/configs/rec/unirec/focalsvtr_ardecoder_unirec.yml +114 -0
openocr/configs/rec/unirec/opendoc_pipeline.yml +105 -0
openocr/demo_gradio.py +28 -8
openocr/demo_opendoc.py +572 -0
openocr/demo_unirec.py +392 -0
openocr/opendet/losses/__init__.py +5 -7
openocr/opendet/preprocess/crop_resize.py +2 -1
openocr/openocr.py +685 -0
openocr/openrec/losses/__init__.py +8 -3
openocr/openrec/losses/cmer_loss.py +12 -0
openocr/openrec/losses/mdiff_loss.py +11 -0
openocr/openrec/losses/unirec_loss.py +12 -0
openocr/openrec/metrics/__init__.py +4 -1
openocr/openrec/metrics/rec_metric_cmer.py +328 -0
openocr/openrec/modeling/cmer_modeling/modeling_cmer.py +643 -0
openocr/openrec/modeling/decoders/__init__.py +1 -0
openocr/openrec/modeling/decoders/ctc_decoder.py +1 -1
openocr/openrec/modeling/decoders/dan_decoder.py +4 -4
openocr/openrec/modeling/decoders/dptr_parseq_clip_b_decoder.py +1563 -1398
openocr/openrec/modeling/decoders/mdiff_decoder.py +587 -0
openocr/openrec/modeling/decoders/smtr_decoder.py +99 -48
openocr/openrec/modeling/unirec_modeling/configuration_unirec.py +166 -0
openocr/openrec/modeling/unirec_modeling/modeling_unirec.py +433 -0
openocr/openrec/optimizer/__init__.py +4 -3
openocr/openrec/optimizer/lr.py +49 -0
openocr/openrec/postprocess/__init__.py +2 -0
openocr/openrec/postprocess/abinet_postprocess.py +1 -1
openocr/openrec/postprocess/ar_postprocess.py +1 -1
openocr/openrec/postprocess/cmer_postprocess.py +86 -0
openocr/openrec/postprocess/cppd_postprocess.py +1 -1
openocr/openrec/postprocess/igtr_postprocess.py +1 -1
openocr/openrec/postprocess/lister_postprocess.py +1 -1
openocr/openrec/postprocess/mgp_postprocess.py +1 -1
openocr/openrec/postprocess/nrtr_postprocess.py +2 -2
openocr/openrec/postprocess/smtr_postprocess.py +1 -1
openocr/openrec/postprocess/srn_postprocess.py +1 -1
openocr/openrec/postprocess/unirec_postprocess.py +58 -0
openocr/openrec/postprocess/visionlan_postprocess.py +1 -1
openocr/openrec/preprocess/__init__.py +5 -0
openocr/openrec/preprocess/ce_label_encode.py +1 -1
openocr/openrec/preprocess/cmer_label_encode.py +1025 -0
openocr/openrec/preprocess/ctc_label_encode.py +1 -1
openocr/openrec/preprocess/dptr_label_encode.py +177 -157
openocr/openrec/preprocess/igtr_label_encode.py +4 -2
openocr/openrec/preprocess/mdiff_label_encode.py +312 -0
openocr/openrec/preprocess/rec_aug.py +128 -2
openocr/openrec/preprocess/resize.py +57 -0
openocr/openrec/preprocess/unirec_label_encode.py +62 -0
openocr/tools/data/__init__.py +78 -55
openocr/tools/data/cmer_web_dataset.py +310 -0
openocr/tools/data/native_size_dataset.py +753 -0
openocr/tools/data/native_size_sampler.py +158 -0
openocr/tools/data/ratio_dataset_tvresize.py +2 -0
openocr/tools/data/ratio_sampler.py +2 -1
openocr/tools/download/download_dataset.py +38 -0
openocr/tools/download/utils.py +28 -0
openocr/tools/download_example_images.py +236 -0
openocr/tools/engine/trainer.py +155 -39
openocr/tools/eval_rec_all_ch.py +2 -2
openocr/tools/infer_det.py +20 -2
openocr/tools/infer_doc.py +898 -0
openocr/tools/infer_doc_onnx.py +1172 -0
openocr/tools/infer_e2e.py +27 -10
openocr/tools/infer_rec.py +64 -15
openocr/tools/infer_unirec_onnx.py +730 -0
openocr/tools/to_markdown.py +468 -0
openocr/tools/utils/ckpt.py +17 -5
openocr/tools/utils/opendoc_onnx_utils/utils.py +1052 -0
openocr_python-0.1.0.dev0.dist-info/METADATA +324 -0
{openocr_python-0.0.9.dist-info → openocr_python-0.1.0.dev0.dist-info}/RECORD +89 -45
{openocr_python-0.0.9.dist-info → openocr_python-0.1.0.dev0.dist-info}/WHEEL +1 -1
openocr_python-0.1.0.dev0.dist-info/entry_points.txt +2 -0
openocr_python-0.0.9.dist-info/METADATA +0 -149
/openocr_python-0.0.9.dist-info/LICENCE → /openocr_python-0.1.0.dev0.dist-info/licenses/LICENSE +0 -0
{openocr_python-0.0.9.dist-info → openocr_python-0.1.0.dev0.dist-info}/top_level.txt +0 -0

openocr/openrec/losses/__init__.py CHANGED Viewed

@@ -15,22 +15,27 @@ name_to_module = {
     'MGPLoss': '.mgp_loss',
     'PARSeqLoss': '.parseq_loss',
     'RobustScannerLoss': '.robustscanner_loss',
+    'SEEDLoss': '.seed_loss',
+    'SMTRLoss': '.smtr_loss',
     'SRNLoss': '.srn_loss',
     'VisionLANLoss': '.visionlan_loss',
     'CAMLoss': '.cam_loss',
-    'SEEDLoss': '.seed_loss',
+    'MDiffLoss': '.mdiff_loss',
+    'UniRecLoss': '.unirec_loss',
+    'CMERLoss': '.cmer_loss',
 }
 def build_loss(config):
     config = copy.deepcopy(config)
     module_name = config.pop('name')
-    assert module_name in name_to_module, Exception(
-        'loss only support {}'.format(list(name_to_module.keys())))
     if module_name in globals():
         module_class = globals()[module_name]
     else:
+        assert module_name in name_to_module, Exception(
+            '{} is not supported. The losses in {} are supportes'.format(
+                module_name, list(name_to_module.keys())))
         module_path = name_to_module[module_name]
         module = import_module(module_path, package=__package__)
         module_class = getattr(module, module_name)

openocr/openrec/losses/cmer_loss.py ADDED Viewed

@@ -0,0 +1,12 @@
+from torch import nn
+class CMERLoss(nn.Module):
+    def __init__(self, label_smoothing=0.1, **kwargs):
+        super(CMERLoss, self).__init__()
+    def forward(self, pred, batch):
+        # loss, vision_loss, text_loss = pred.loss
+        loss = {'loss': pred.loss}
+        return loss

openocr/openrec/losses/mdiff_loss.py ADDED Viewed

@@ -0,0 +1,11 @@
+from torch import nn
+class MDiffLoss(nn.Module):
+    def __init__(self, **kwargs):
+        super(MDiffLoss, self).__init__()
+    def forward(self, predicts, batch):
+        return {'loss': predicts}

openocr/openrec/losses/unirec_loss.py ADDED Viewed

@@ -0,0 +1,12 @@
+from torch import nn
+class UniRecLoss(nn.Module):
+    def __init__(self, label_smoothing=0.1, **kwargs):
+        super(UniRecLoss, self).__init__()
+    def forward(self, pred, batch):
+        # loss, vision_loss, text_loss = pred.loss
+        loss = {'loss': pred.loss}
+        return loss

openocr/openrec/metrics/__init__.py CHANGED Viewed

@@ -6,8 +6,11 @@ from .rec_metric import RecMetric
 from .rec_metric_gtc import RecGTCMetric
 from .rec_metric_long import RecMetricLong
 from .rec_metric_mgp import RecMPGMetric
+from .rec_metric_cmer import CMERMetric
-support_dict = ['RecMetric', 'RecMetricLong', 'RecGTCMetric', 'RecMPGMetric']
+support_dict = [
+    'RecMetric', 'RecMetricLong', 'RecGTCMetric', 'RecMPGMetric', 'CMERMetric'
+]
 def build_metric(config):

openocr/openrec/metrics/rec_metric_cmer.py ADDED Viewed

@@ -0,0 +1,328 @@
+import re
+import math
+import collections
+from functools import lru_cache
+import datasets
+import evaluate
+from rouge_score import rouge_scorer, scoring
+from Levenshtein import distance as levenshtein_distance
+def _get_ngrams(segment, max_order):
+    ngram_counts = collections.Counter()
+    for order in range(1, max_order + 1):
+        for i in range(0, len(segment) - order + 1):
+            ngram = tuple(segment[i:i + order])
+            ngram_counts[ngram] += 1
+    return ngram_counts
+def compute_bleu(reference_corpus,
+                 translation_corpus,
+                 max_order=4,
+                 smooth=False):
+    matches_by_order = [0] * max_order
+    possible_matches_by_order = [0] * max_order
+    reference_length = 0
+    translation_length = 0
+    for (references, translation) in zip(reference_corpus, translation_corpus):
+        reference_length += min(len(r) for r in references)
+        translation_length += len(translation)
+        merged_ref_ngram_counts = collections.Counter()
+        for reference in references:
+            merged_ref_ngram_counts |= _get_ngrams(reference, max_order)
+        translation_ngram_counts = _get_ngrams(translation, max_order)
+        overlap = translation_ngram_counts & merged_ref_ngram_counts
+        for ngram in overlap:
+            matches_by_order[len(ngram) - 1] += overlap[ngram]
+        for order in range(1, max_order + 1):
+            possible_matches = len(translation) - order + 1
+            if possible_matches > 0:
+                possible_matches_by_order[order - 1] += possible_matches
+    precisions = [0] * max_order
+    for i in range(0, max_order):
+        if smooth:
+            precisions[i] = ((matches_by_order[i] + 1.) /
+                             (possible_matches_by_order[i] + 1.))
+        else:
+            if possible_matches_by_order[i] > 0:
+                precisions[i] = (float(matches_by_order[i]) /
+                                 possible_matches_by_order[i])
+            else:
+                precisions[i] = 0.0
+    if min(precisions) > 0:
+        p_log_sum = sum((1. / max_order) * math.log(p) for p in precisions)
+        geo_mean = math.exp(p_log_sum)
+    else:
+        geo_mean = 0
+    if reference_length == 0:
+        ratio = 0.0
+    else:
+        ratio = float(translation_length) / reference_length
+    if ratio > 1.0:
+        bp = 1.
+    elif ratio <= 0:
+        bp = 0.0
+    else:
+        bp = math.exp(1 - 1. / ratio)
+    bleu = geo_mean * bp
+    return (bleu, precisions, bp, ratio, translation_length, reference_length)
+class BaseTokenizer:
+    def signature(self):
+        return 'none'
+    def __call__(self, line):
+        return line
+class TokenizerRegexp(BaseTokenizer):
+    def signature(self):
+        return 're'
+    def __init__(self):
+        self._re = [
+            (re.compile(r'([\{-\~[-\` -\&\(-\+\:-\@\/])'), r' \1 '),
+            (re.compile(r'([^0-9])([\.,])'), r'\1 \2 '),
+            (re.compile(r'([\.,])([^0-9])'), r' \1 \2'),
+            (re.compile(r'([0-9])(-)'), r'\1 \2 '),
+        ]
+    @lru_cache(maxsize=2**16)
+    def __call__(self, line):
+        for (_re, repl) in self._re:
+            line = _re.sub(repl, line)
+        return line.split()
+class Tokenizer13a(BaseTokenizer):
+    def signature(self):
+        return '13a'
+    def __init__(self):
+        self._post_tokenizer = TokenizerRegexp()
+    @lru_cache(maxsize=2**16)
+    def __call__(self, line):
+        line = line.replace('<skipped>', '')
+        line = line.replace('-\n', '')
+        line = line.replace('\n', ' ')
+        if '&' in line:
+            line = line.replace('&quot;', '"')
+            line = line.replace('&amp;', '&')
+            line = line.replace('&lt;', '<')
+            line = line.replace('&gt;', '>')
+        return self._post_tokenizer(f' {line} ')
+class CustomBleu(evaluate.Metric):
+    def _info(self):
+        return evaluate.MetricInfo(
+            description='Custom BLEU implementation',
+            citation='',
+            inputs_description='',
+            features=datasets.Features({
+                'predictions':
+                datasets.Value('string', id='sequence'),
+                'references':
+                datasets.Sequence(datasets.Value('string', id='sequence'),
+                                  id='references'),
+            }),
+        )
+    def _compute(self,
+                 predictions,
+                 references,
+                 tokenizer=None,
+                 max_order=4,
+                 smooth=False):
+        if tokenizer is None:
+            tokenizer = Tokenizer13a()
+        if isinstance(references[0], str):
+            references = [[ref] for ref in references]
+        references_tokenized = [[tokenizer(r) for r in ref]
+                                for ref in references]
+        predictions_tokenized = [tokenizer(p) for p in predictions]
+        score = compute_bleu(reference_corpus=references_tokenized,
+                             translation_corpus=predictions_tokenized,
+                             max_order=max_order,
+                             smooth=smooth)
+        (bleu, precisions, bp, ratio, translation_length,
+         reference_length) = score
+        return {
+            'bleu': bleu,
+            'precisions': precisions,
+            'brevity_penalty': bp,
+            'length_ratio': ratio,
+            'translation_length': translation_length,
+            'reference_length': reference_length,
+        }
+class CustomRougeTokenizer:
+    def __init__(self, tokenizer_func):
+        self.tokenizer_func = tokenizer_func
+    def tokenize(self, text):
+        return self.tokenizer_func(text)
+class CustomRouge(evaluate.Metric):
+    def _info(self):
+        return evaluate.MetricInfo(
+            description='Custom ROUGE implementation',
+            citation='',
+            inputs_description='',
+            features=datasets.Features({
+                'predictions':
+                datasets.Value('string', id='sequence'),
+                'references':
+                datasets.Sequence(datasets.Value('string', id='sequence')),
+            }),
+        )
+    def _compute(self,
+                 predictions,
+                 references,
+                 rouge_types=None,
+                 use_aggregator=True,
+                 use_stemmer=False,
+                 tokenizer=None):
+        if rouge_types is None:
+            rouge_types = ['rouge1', 'rouge2', 'rougeL', 'rougeLsum']
+        multi_ref = isinstance(references[0], list)
+        if tokenizer is not None:
+            tokenizer = CustomRougeTokenizer(tokenizer)
+        scorer = rouge_scorer.RougeScorer(rouge_types=rouge_types,
+                                          use_stemmer=use_stemmer,
+                                          tokenizer=tokenizer)
+        if use_aggregator:
+            aggregator = scoring.BootstrapAggregator()
+        else:
+            scores = []
+        for ref, pred in zip(references, predictions):
+            if multi_ref:
+                score = scorer.score_multi(ref, pred)
+            else:
+                score = scorer.score(ref, pred)
+            if use_aggregator:
+                aggregator.add_scores(score)
+            else:
+                scores.append(score)
+        if use_aggregator:
+            result = aggregator.aggregate()
+            for key in result:
+                result[key] = result[key].mid.fmeasure
+        else:
+            result = {}
+            first_score = scores[0]
+            for key in first_score:
+                result[key] = [s[key].fmeasure for s in scores]
+        return result
+class CMERMetric(object):
+    def __init__(self, main_indicator='bleu', **kwargs):
+        self.main_indicator = main_indicator
+        self.tokenizer = Tokenizer13a()
+        self.rouge_metric = CustomRouge()
+        self.bleu_metric = CustomBleu()
+        self.reset()
+    def reset(self):
+        self.preds_list = []
+        self.labels_list = []
+    def _compute_single_pair(self, pred, label):
+        preds = [pred]
+        refs_formatted = [[label]]
+        rouge_results = self.rouge_metric.compute(predictions=preds,
+                                                  references=refs_formatted,
+                                                  use_aggregator=True,
+                                                  tokenizer=self.tokenizer)
+        bleu_results = self.bleu_metric.compute(predictions=preds,
+                                                references=refs_formatted,
+                                                tokenizer=self.tokenizer)
+        dist = levenshtein_distance(pred, label)
+        return {
+            'rouge1': rouge_results['rouge1'],
+            'rouge2': rouge_results['rouge2'],
+            'rougeL': rouge_results['rougeL'],
+            'bleu': bleu_results['bleu'],
+            'edit_distance': float(dist),
+        }
+    def __call__(self, preds, labels, **kwargs):
+        if isinstance(preds, str):
+            preds = [preds]
+        if isinstance(labels, str):
+            labels = [labels]
+        self.preds_list.extend(preds)
+        self.labels_list.extend(labels)
+    def compute_single(self, preds, labels):
+        if len(preds) == 0:
+            return {
+                'rouge1': 0.0,
+                'rouge2': 0.0,
+                'rougeL': 0.0,
+                'bleu': 0.0,
+                'edit_distance': 0.0,
+            }
+        total_metrics = collections.defaultdict(float)
+        count = 0
+        for p, l in zip(preds, labels):
+            single_res = self._compute_single_pair(p, l)
+            for k, v in single_res.items():
+                total_metrics[k] += v
+            count += 1
+        return {k: v / count for k, v in total_metrics.items()}
+    def get_metric(self):
+        if len(self.preds_list) == 0:
+            return {
+                'rouge1': 0.0,
+                'rouge2': 0.0,
+                'rougeL': 0.0,
+                'bleu': 0.0,
+                'edit_distance': 0.0,
+            }
+        total_metrics = collections.defaultdict(float)
+        count = len(self.preds_list)
+        for p, l in zip(self.preds_list, self.labels_list):
+            single_res = self._compute_single_pair(p, l)
+            for k, v in single_res.items():
+                total_metrics[k] += v
+        avg_metrics = {k: v / count for k, v in total_metrics.items()}
+        self.reset()
+        return avg_metrics

openocr-python 0.0.9__py3-none-any.whl → 0.1.0.dev0__py3-none-any.whl

openocr-python 0.0.9py3-none-any.whl → 0.1.0.dev0py3-none-any.whl