PyPI - openocr-python - Versions diffs - 0.0.2__py3-none-any.whl - Mend

openocr-python 0.0.2__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (323) hide show

openocr/__init__.py +11 -0
openocr/configs/det/dbnet/repvit_db.yml +173 -0
openocr/configs/rec/abinet/resnet45_trans_abinet_lang.yml +94 -0
openocr/configs/rec/abinet/resnet45_trans_abinet_wo_lang.yml +93 -0
openocr/configs/rec/abinet/svtrv2_abinet_lang.yml +130 -0
openocr/configs/rec/abinet/svtrv2_abinet_wo_lang.yml +128 -0
openocr/configs/rec/aster/resnet31_lstm_aster_tps_on.yml +93 -0
openocr/configs/rec/aster/svtrv2_aster.yml +127 -0
openocr/configs/rec/aster/svtrv2_aster_tps_on.yml +102 -0
openocr/configs/rec/autostr/autostr_lstm_aster_tps_on.yml +95 -0
openocr/configs/rec/busnet/svtrv2_busnet.yml +135 -0
openocr/configs/rec/busnet/svtrv2_busnet_pretraining.yml +134 -0
openocr/configs/rec/busnet/vit_busnet.yml +104 -0
openocr/configs/rec/busnet/vit_busnet_pretraining.yml +104 -0
openocr/configs/rec/cam/convnextv2_cam_tps_on.yml +118 -0
openocr/configs/rec/cam/convnextv2_tiny_cam_tps_on.yml +118 -0
openocr/configs/rec/cam/svtrv2_cam_tps_on.yml +123 -0
openocr/configs/rec/cdistnet/resnet45_trans_cdistnet.yml +93 -0
openocr/configs/rec/cdistnet/svtrv2_cdistnet.yml +139 -0
openocr/configs/rec/cppd/svtr_base_cppd.yml +123 -0
openocr/configs/rec/cppd/svtr_base_cppd_ch.yml +126 -0
openocr/configs/rec/cppd/svtr_base_cppd_h8.yml +123 -0
openocr/configs/rec/cppd/svtr_base_cppd_syn.yml +124 -0
openocr/configs/rec/cppd/svtrv2_cppd.yml +150 -0
openocr/configs/rec/dan/resnet45_fpn_dan.yml +98 -0
openocr/configs/rec/dan/svtrv2_dan.yml +130 -0
openocr/configs/rec/focalsvtr/focalsvtr_ctc.yml +137 -0
openocr/configs/rec/gtc/svtrv2_lnconv_nrtr_gtc.yml +168 -0
openocr/configs/rec/gtc/svtrv2_lnconv_smtr_gtc_long_infer.yml +151 -0
openocr/configs/rec/gtc/svtrv2_lnconv_smtr_gtc_smtr_long.yml +150 -0
openocr/configs/rec/gtc/svtrv2_lnconv_smtr_gtc_stream.yml +152 -0
openocr/configs/rec/igtr/svtr_base_ds_igtr.yml +157 -0
openocr/configs/rec/lister/focalsvtr_lister_wo_fem_maxratio12.yml +133 -0
openocr/configs/rec/lister/svtrv2_lister_wo_fem_maxratio12.yml +138 -0
openocr/configs/rec/lpv/svtr_base_lpv.yml +124 -0
openocr/configs/rec/lpv/svtr_base_lpv_wo_glrm.yml +123 -0
openocr/configs/rec/lpv/svtrv2_lpv.yml +147 -0
openocr/configs/rec/lpv/svtrv2_lpv_wo_glrm.yml +146 -0
openocr/configs/rec/maerec/vit_nrtr.yml +116 -0
openocr/configs/rec/matrn/resnet45_trans_matrn.yml +95 -0
openocr/configs/rec/matrn/svtrv2_matrn.yml +130 -0
openocr/configs/rec/mgpstr/svtrv2_mgpstr_only_char.yml +140 -0
openocr/configs/rec/mgpstr/vit_base_mgpstr_only_char.yml +111 -0
openocr/configs/rec/mgpstr/vit_large_mgpstr_only_char.yml +110 -0
openocr/configs/rec/mgpstr/vit_mgpstr.yml +110 -0
openocr/configs/rec/mgpstr/vit_mgpstr_only_char.yml +110 -0
openocr/configs/rec/moran/resnet31_lstm_moran.yml +92 -0
openocr/configs/rec/nrtr/focalsvtr_nrtr_maxraio12.yml +145 -0
openocr/configs/rec/nrtr/nrtr.yml +107 -0
openocr/configs/rec/nrtr/svtr_base_nrtr.yml +118 -0
openocr/configs/rec/nrtr/svtr_base_nrtr_syn.yml +119 -0
openocr/configs/rec/nrtr/svtrv2_nrtr.yml +146 -0
openocr/configs/rec/ote/svtr_base_h8_ote.yml +117 -0
openocr/configs/rec/ote/svtr_base_ote.yml +116 -0
openocr/configs/rec/parseq/focalsvtr_parseq_maxratio12.yml +140 -0
openocr/configs/rec/parseq/svrtv2_parseq.yml +136 -0
openocr/configs/rec/parseq/vit_parseq.yml +100 -0
openocr/configs/rec/robustscanner/resnet31_robustscanner.yml +102 -0
openocr/configs/rec/robustscanner/svtrv2_robustscanner.yml +134 -0
openocr/configs/rec/sar/resnet31_lstm_sar.yml +94 -0
openocr/configs/rec/sar/svtrv2_sar.yml +128 -0
openocr/configs/rec/seed/resnet31_lstm_seed_tps_on.yml +96 -0
openocr/configs/rec/smtr/focalsvtr_smtr.yml +150 -0
openocr/configs/rec/smtr/focalsvtr_smtr_long.yml +133 -0
openocr/configs/rec/smtr/svtrv2_smtr.yml +150 -0
openocr/configs/rec/smtr/svtrv2_smtr_bi.yml +136 -0
openocr/configs/rec/srn/resnet50_fpn_srn.yml +97 -0
openocr/configs/rec/srn/svtrv2_srn.yml +131 -0
openocr/configs/rec/svtrs/convnextv2_ctc.yml +105 -0
openocr/configs/rec/svtrs/convnextv2_h8_ctc.yml +105 -0
openocr/configs/rec/svtrs/convnextv2_h8_rctc.yml +106 -0
openocr/configs/rec/svtrs/convnextv2_rctc.yml +106 -0
openocr/configs/rec/svtrs/convnextv2_tiny_h8_ctc.yml +105 -0
openocr/configs/rec/svtrs/convnextv2_tiny_h8_rctc.yml +106 -0
openocr/configs/rec/svtrs/crnn_ctc.yml +99 -0
openocr/configs/rec/svtrs/crnn_ctc_long.yml +116 -0
openocr/configs/rec/svtrs/focalnet_base_ctc.yml +108 -0
openocr/configs/rec/svtrs/focalnet_base_rctc.yml +109 -0
openocr/configs/rec/svtrs/focalsvtr_ctc.yml +106 -0
openocr/configs/rec/svtrs/focalsvtr_rctc.yml +107 -0
openocr/configs/rec/svtrs/resnet45_trans_ctc.yml +103 -0
openocr/configs/rec/svtrs/resnet45_trans_rctc.yml +104 -0
openocr/configs/rec/svtrs/svtr_base_ctc.yml +110 -0
openocr/configs/rec/svtrs/svtr_base_rctc.yml +111 -0
openocr/configs/rec/svtrs/svtrnet_ctc_syn.yml +111 -0
openocr/configs/rec/svtrs/vit_ctc.yml +103 -0
openocr/configs/rec/svtrs/vit_rctc.yml +103 -0
openocr/configs/rec/svtrv2/repsvtr_ch.yml +121 -0
openocr/configs/rec/svtrv2/svtrv2_ch.yml +133 -0
openocr/configs/rec/svtrv2/svtrv2_ctc.yml +136 -0
openocr/configs/rec/svtrv2/svtrv2_rctc.yml +135 -0
openocr/configs/rec/svtrv2/svtrv2_small_rctc.yml +135 -0
openocr/configs/rec/svtrv2/svtrv2_smtr_gtc_rctc.yml +162 -0
openocr/configs/rec/svtrv2/svtrv2_smtr_gtc_rctc_ch.yml +153 -0
openocr/configs/rec/svtrv2/svtrv2_tiny_rctc.yml +135 -0
openocr/configs/rec/visionlan/resnet45_trans_visionlan_LA.yml +103 -0
openocr/configs/rec/visionlan/resnet45_trans_visionlan_LF_1.yml +102 -0
openocr/configs/rec/visionlan/resnet45_trans_visionlan_LF_2.yml +103 -0
openocr/configs/rec/visionlan/svtrv2_visionlan_LA.yml +112 -0
openocr/configs/rec/visionlan/svtrv2_visionlan_LF_1.yml +111 -0
openocr/configs/rec/visionlan/svtrv2_visionlan_LF_2.yml +112 -0
openocr/demo_gradio.py +128 -0
openocr/opendet/modeling/__init__.py +11 -0
openocr/opendet/modeling/backbones/__init__.py +14 -0
openocr/opendet/modeling/backbones/repvit.py +340 -0
openocr/opendet/modeling/base_detector.py +69 -0
openocr/opendet/modeling/heads/__init__.py +14 -0
openocr/opendet/modeling/heads/db_head.py +73 -0
openocr/opendet/modeling/necks/__init__.py +14 -0
openocr/opendet/modeling/necks/db_fpn.py +609 -0
openocr/opendet/postprocess/__init__.py +18 -0
openocr/opendet/postprocess/db_postprocess.py +273 -0
openocr/opendet/preprocess/__init__.py +154 -0
openocr/opendet/preprocess/crop_resize.py +121 -0
openocr/opendet/preprocess/db_resize_for_test.py +135 -0
openocr/openrec/losses/__init__.py +62 -0
openocr/openrec/losses/abinet_loss.py +42 -0
openocr/openrec/losses/ar_loss.py +23 -0
openocr/openrec/losses/cam_loss.py +48 -0
openocr/openrec/losses/cdistnet_loss.py +34 -0
openocr/openrec/losses/ce_loss.py +68 -0
openocr/openrec/losses/cppd_loss.py +77 -0
openocr/openrec/losses/ctc_loss.py +33 -0
openocr/openrec/losses/igtr_loss.py +12 -0
openocr/openrec/losses/lister_loss.py +14 -0
openocr/openrec/losses/lpv_loss.py +30 -0
openocr/openrec/losses/mgp_loss.py +34 -0
openocr/openrec/losses/parseq_loss.py +12 -0
openocr/openrec/losses/robustscanner_loss.py +20 -0
openocr/openrec/losses/seed_loss.py +46 -0
openocr/openrec/losses/smtr_loss.py +12 -0
openocr/openrec/losses/srn_loss.py +40 -0
openocr/openrec/losses/visionlan_loss.py +58 -0
openocr/openrec/metrics/__init__.py +19 -0
openocr/openrec/metrics/rec_metric.py +270 -0
openocr/openrec/metrics/rec_metric_gtc.py +58 -0
openocr/openrec/metrics/rec_metric_long.py +142 -0
openocr/openrec/metrics/rec_metric_mgp.py +93 -0
openocr/openrec/modeling/__init__.py +11 -0
openocr/openrec/modeling/base_recognizer.py +69 -0
openocr/openrec/modeling/common.py +238 -0
openocr/openrec/modeling/decoders/__init__.py +109 -0
openocr/openrec/modeling/decoders/abinet_decoder.py +283 -0
openocr/openrec/modeling/decoders/aster_decoder.py +170 -0
openocr/openrec/modeling/decoders/bus_decoder.py +133 -0
openocr/openrec/modeling/decoders/cam_decoder.py +43 -0
openocr/openrec/modeling/decoders/cdistnet_decoder.py +334 -0
openocr/openrec/modeling/decoders/cppd_decoder.py +393 -0
openocr/openrec/modeling/decoders/ctc_decoder.py +203 -0
openocr/openrec/modeling/decoders/dan_decoder.py +203 -0
openocr/openrec/modeling/decoders/igtr_decoder.py +815 -0
openocr/openrec/modeling/decoders/lister_decoder.py +535 -0
openocr/openrec/modeling/decoders/lpv_decoder.py +119 -0
openocr/openrec/modeling/decoders/matrn_decoder.py +236 -0
openocr/openrec/modeling/decoders/mgp_decoder.py +99 -0
openocr/openrec/modeling/decoders/nrtr_decoder.py +439 -0
openocr/openrec/modeling/decoders/ote_decoder.py +205 -0
openocr/openrec/modeling/decoders/parseq_decoder.py +504 -0
openocr/openrec/modeling/decoders/rctc_decoder.py +70 -0
openocr/openrec/modeling/decoders/robustscanner_decoder.py +749 -0
openocr/openrec/modeling/decoders/sar_decoder.py +236 -0
openocr/openrec/modeling/decoders/smtr_decoder.py +621 -0
openocr/openrec/modeling/decoders/smtr_decoder_nattn.py +521 -0
openocr/openrec/modeling/decoders/srn_decoder.py +283 -0
openocr/openrec/modeling/decoders/visionlan_decoder.py +321 -0
openocr/openrec/modeling/encoders/__init__.py +39 -0
openocr/openrec/modeling/encoders/autostr_encoder.py +327 -0
openocr/openrec/modeling/encoders/cam_encoder.py +760 -0
openocr/openrec/modeling/encoders/convnextv2.py +213 -0
openocr/openrec/modeling/encoders/focalsvtr.py +631 -0
openocr/openrec/modeling/encoders/nrtr_encoder.py +28 -0
openocr/openrec/modeling/encoders/rec_hgnet.py +346 -0
openocr/openrec/modeling/encoders/rec_lcnetv3.py +488 -0
openocr/openrec/modeling/encoders/rec_mobilenet_v3.py +132 -0
openocr/openrec/modeling/encoders/rec_mv1_enhance.py +254 -0
openocr/openrec/modeling/encoders/rec_nrtr_mtb.py +37 -0
openocr/openrec/modeling/encoders/rec_resnet_31.py +213 -0
openocr/openrec/modeling/encoders/rec_resnet_45.py +183 -0
openocr/openrec/modeling/encoders/rec_resnet_fpn.py +216 -0
openocr/openrec/modeling/encoders/rec_resnet_vd.py +252 -0
openocr/openrec/modeling/encoders/repvit.py +338 -0
openocr/openrec/modeling/encoders/resnet31_rnn.py +123 -0
openocr/openrec/modeling/encoders/svtrnet.py +574 -0
openocr/openrec/modeling/encoders/svtrnet2dpos.py +616 -0
openocr/openrec/modeling/encoders/svtrv2.py +470 -0
openocr/openrec/modeling/encoders/svtrv2_lnconv.py +503 -0
openocr/openrec/modeling/encoders/svtrv2_lnconv_two33.py +517 -0
openocr/openrec/modeling/encoders/vit.py +120 -0
openocr/openrec/modeling/transforms/__init__.py +15 -0
openocr/openrec/modeling/transforms/aster_tps.py +262 -0
openocr/openrec/modeling/transforms/moran.py +136 -0
openocr/openrec/modeling/transforms/tps.py +246 -0
openocr/openrec/optimizer/__init__.py +73 -0
openocr/openrec/optimizer/lr.py +227 -0
openocr/openrec/postprocess/__init__.py +72 -0
openocr/openrec/postprocess/abinet_postprocess.py +37 -0
openocr/openrec/postprocess/ar_postprocess.py +63 -0
openocr/openrec/postprocess/ce_postprocess.py +43 -0
openocr/openrec/postprocess/char_postprocess.py +108 -0
openocr/openrec/postprocess/cppd_postprocess.py +42 -0
openocr/openrec/postprocess/ctc_postprocess.py +119 -0
openocr/openrec/postprocess/igtr_postprocess.py +100 -0
openocr/openrec/postprocess/lister_postprocess.py +59 -0
openocr/openrec/postprocess/mgp_postprocess.py +143 -0
openocr/openrec/postprocess/nrtr_postprocess.py +75 -0
openocr/openrec/postprocess/smtr_postprocess.py +73 -0
openocr/openrec/postprocess/srn_postprocess.py +80 -0
openocr/openrec/postprocess/visionlan_postprocess.py +81 -0
openocr/openrec/preprocess/__init__.py +173 -0
openocr/openrec/preprocess/abinet_aug.py +473 -0
openocr/openrec/preprocess/abinet_label_encode.py +36 -0
openocr/openrec/preprocess/ar_label_encode.py +36 -0
openocr/openrec/preprocess/auto_augment.py +1012 -0
openocr/openrec/preprocess/cam_label_encode.py +141 -0
openocr/openrec/preprocess/ce_label_encode.py +116 -0
openocr/openrec/preprocess/char_label_encode.py +36 -0
openocr/openrec/preprocess/cppd_label_encode.py +173 -0
openocr/openrec/preprocess/ctc_label_encode.py +124 -0
openocr/openrec/preprocess/ep_label_encode.py +38 -0
openocr/openrec/preprocess/igtr_label_encode.py +360 -0
openocr/openrec/preprocess/mgp_label_encode.py +95 -0
openocr/openrec/preprocess/parseq_aug.py +150 -0
openocr/openrec/preprocess/rec_aug.py +211 -0
openocr/openrec/preprocess/resize.py +534 -0
openocr/openrec/preprocess/smtr_label_encode.py +125 -0
openocr/openrec/preprocess/srn_label_encode.py +37 -0
openocr/openrec/preprocess/visionlan_label_encode.py +67 -0
openocr/tools/create_lmdb_dataset.py +118 -0
openocr/tools/data/__init__.py +94 -0
openocr/tools/data/collate_fn.py +100 -0
openocr/tools/data/lmdb_dataset.py +142 -0
openocr/tools/data/lmdb_dataset_test.py +166 -0
openocr/tools/data/multi_scale_sampler.py +177 -0
openocr/tools/data/ratio_dataset.py +217 -0
openocr/tools/data/ratio_dataset_test.py +273 -0
openocr/tools/data/ratio_dataset_tvresize.py +213 -0
openocr/tools/data/ratio_dataset_tvresize_test.py +276 -0
openocr/tools/data/ratio_sampler.py +190 -0
openocr/tools/data/simple_dataset.py +263 -0
openocr/tools/data/strlmdb_dataset.py +143 -0
openocr/tools/engine/__init__.py +5 -0
openocr/tools/engine/config.py +158 -0
openocr/tools/engine/trainer.py +621 -0
openocr/tools/eval_rec.py +41 -0
openocr/tools/eval_rec_all_ch.py +184 -0
openocr/tools/eval_rec_all_en.py +206 -0
openocr/tools/eval_rec_all_long.py +119 -0
openocr/tools/eval_rec_all_long_simple.py +122 -0
openocr/tools/export_rec.py +118 -0
openocr/tools/infer/onnx_engine.py +65 -0
openocr/tools/infer/predict_rec.py +140 -0
openocr/tools/infer/utility.py +234 -0
openocr/tools/infer_det.py +449 -0
openocr/tools/infer_e2e.py +462 -0
openocr/tools/infer_e2e_parallel.py +184 -0
openocr/tools/infer_rec.py +371 -0
openocr/tools/train_rec.py +37 -0
openocr/tools/utility.py +45 -0
openocr/tools/utils/EN_symbol_dict.txt +94 -0
openocr/tools/utils/__init__.py +0 -0
openocr/tools/utils/ckpt.py +87 -0
openocr/tools/utils/dict/ar_dict.txt +117 -0
openocr/tools/utils/dict/arabic_dict.txt +161 -0
openocr/tools/utils/dict/be_dict.txt +145 -0
openocr/tools/utils/dict/bg_dict.txt +140 -0
openocr/tools/utils/dict/chinese_cht_dict.txt +8421 -0
openocr/tools/utils/dict/cyrillic_dict.txt +163 -0
openocr/tools/utils/dict/devanagari_dict.txt +167 -0
openocr/tools/utils/dict/en_dict.txt +63 -0
openocr/tools/utils/dict/fa_dict.txt +136 -0
openocr/tools/utils/dict/french_dict.txt +136 -0
openocr/tools/utils/dict/german_dict.txt +143 -0
openocr/tools/utils/dict/hi_dict.txt +162 -0
openocr/tools/utils/dict/it_dict.txt +118 -0
openocr/tools/utils/dict/japan_dict.txt +4399 -0
openocr/tools/utils/dict/ka_dict.txt +153 -0
openocr/tools/utils/dict/kie_dict/xfund_class_list.txt +4 -0
openocr/tools/utils/dict/korean_dict.txt +3688 -0
openocr/tools/utils/dict/latex_symbol_dict.txt +111 -0
openocr/tools/utils/dict/latin_dict.txt +185 -0
openocr/tools/utils/dict/layout_dict/layout_cdla_dict.txt +10 -0
openocr/tools/utils/dict/layout_dict/layout_publaynet_dict.txt +5 -0
openocr/tools/utils/dict/layout_dict/layout_table_dict.txt +1 -0
openocr/tools/utils/dict/mr_dict.txt +153 -0
openocr/tools/utils/dict/ne_dict.txt +153 -0
openocr/tools/utils/dict/oc_dict.txt +96 -0
openocr/tools/utils/dict/pu_dict.txt +130 -0
openocr/tools/utils/dict/rs_dict.txt +91 -0
openocr/tools/utils/dict/rsc_dict.txt +134 -0
openocr/tools/utils/dict/ru_dict.txt +125 -0
openocr/tools/utils/dict/spin_dict.txt +68 -0
openocr/tools/utils/dict/ta_dict.txt +128 -0
openocr/tools/utils/dict/table_dict.txt +277 -0
openocr/tools/utils/dict/table_master_structure_dict.txt +39 -0
openocr/tools/utils/dict/table_structure_dict.txt +28 -0
openocr/tools/utils/dict/table_structure_dict_ch.txt +48 -0
openocr/tools/utils/dict/te_dict.txt +151 -0
openocr/tools/utils/dict/ug_dict.txt +114 -0
openocr/tools/utils/dict/uk_dict.txt +142 -0
openocr/tools/utils/dict/ur_dict.txt +137 -0
openocr/tools/utils/dict/xi_dict.txt +110 -0
openocr/tools/utils/dict90.txt +90 -0
openocr/tools/utils/e2e_metric/Deteval.py +802 -0
openocr/tools/utils/e2e_metric/polygon_fast.py +70 -0
openocr/tools/utils/e2e_utils/extract_batchsize.py +86 -0
openocr/tools/utils/e2e_utils/extract_textpoint_fast.py +479 -0
openocr/tools/utils/e2e_utils/extract_textpoint_slow.py +582 -0
openocr/tools/utils/e2e_utils/pgnet_pp_utils.py +159 -0
openocr/tools/utils/e2e_utils/visual.py +152 -0
openocr/tools/utils/en_dict.txt +95 -0
openocr/tools/utils/gen_label.py +68 -0
openocr/tools/utils/ic15_dict.txt +36 -0
openocr/tools/utils/logging.py +56 -0
openocr/tools/utils/poly_nms.py +132 -0
openocr/tools/utils/ppocr_keys_v1.txt +6623 -0
openocr/tools/utils/stats.py +58 -0
openocr/tools/utils/utility.py +165 -0
openocr/tools/utils/visual.py +117 -0
openocr_python-0.0.2.dist-info/LICENCE +201 -0
openocr_python-0.0.2.dist-info/METADATA +98 -0
openocr_python-0.0.2.dist-info/RECORD +323 -0
openocr_python-0.0.2.dist-info/WHEEL +5 -0
openocr_python-0.0.2.dist-info/top_level.txt +1 -0

openocr/openrec/preprocess/cam_label_encode.py ADDED Viewed

@@ -0,0 +1,141 @@
+import numpy as np
+import cv2
+from .ar_label_encode import ARLabelEncode
+def crop_safe(arr, rect, bbs=[], pad=0):
+    rect = np.array(rect)
+    rect[:2] -= pad
+    rect[2:] += 2 * pad
+    v0 = [max(0, rect[0]), max(0, rect[1])]
+    v1 = [
+        min(arr.shape[0], rect[0] + rect[2]),
+        min(arr.shape[1], rect[1] + rect[3])
+    ]
+    arr = arr[v0[0]:v1[0], v0[1]:v1[1], ...]
+    if len(bbs) > 0:
+        for i in range(len(bbs)):
+            bbs[i, 0] -= v0[0]
+            bbs[i, 1] -= v0[1]
+        return arr, bbs
+    else:
+        return arr
+try:
+    # pygame==2.5.2
+    import pygame
+    from pygame import freetype
+except:
+    pass
+class CAMLabelEncode(ARLabelEncode):
+    """Convert between text-label and text-index."""
+    def __init__(self,
+                 max_text_length,
+                 character_dict_path=None,
+                 use_space_char=False,
+                 font_path=None,
+                 font_size=30,
+                 font_strength=0.1,
+                 image_shape=[32, 128],
+                 **kwargs):
+        super(CAMLabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+        self.image_shape = image_shape
+        if font_path is not None:
+            freetype.init()
+            # init font
+            self.font = freetype.Font(font_path)
+            self.font.antialiased = True
+            self.font.origin = True
+            # choose font style
+            self.font.size = font_size
+            self.font.underline = False
+            self.font.strong = True
+            self.font.strength = font_strength
+            self.font.oblique = False
+    def render_normal(self, font, text):
+        # get the number of lines
+        lines = text.split('\n')
+        lengths = [len(l) for l in lines]
+        # font parameters:
+        line_spacing = font.get_sized_height() + 1
+        # initialize the surface to proper size:
+        line_bounds = font.get_rect(lines[np.argmax(lengths)])
+        fsize = (round(2.0 * line_bounds.width),
+                 round(1.25 * line_spacing * len(lines)))
+        surf = pygame.Surface(fsize, pygame.locals.SRCALPHA, 32)
+        bbs = []
+        space = font.get_rect('O')
+        # space = font.get_rect(' ')
+        x, y = 0, 0
+        for l in lines:
+            x = 2  # carriage-return
+            y += line_spacing  # line-feed
+            for ch in l:  # render each character
+                if ch.isspace():  # just shift
+                    x += space.width
+                else:
+                    # render the character
+                    ch_bounds = font.render_to(surf, (x, y), ch)
+                    # ch_bounds.x = x + ch_bounds.x
+                    # ch_bounds.y = y - ch_bounds.y
+                    x += ch_bounds.width + 5
+                    bbs.append(np.array(ch_bounds))
+        # get the union of characters for cropping:
+        r0 = pygame.Rect(bbs[0])
+        rect_union = r0.unionall(bbs)
+        # get the words:
+        # words = ' '.join(text.split())
+        # crop the surface to fit the text:
+        bbs = np.array(bbs)
+        surf_arr, bbs = crop_safe(pygame.surfarray.pixels_alpha(surf),
+                                  rect_union,
+                                  bbs,
+                                  pad=5)
+        surf_arr = surf_arr.swapaxes(0, 1)
+        # self.visualize_bb(surf_arr,bbs)
+        return surf_arr, bbs
+    def __call__(self, data):
+        data = super().__call__(data=data)
+        if data is None:
+            return None
+        word = []
+        for c in data['label'][1:data['length'] + 1]:
+            word.append(self.character[c])
+        word = ''.join(word)
+        # binary mask
+        binary_mask, bbs = self.render_normal(self.font, word)
+        cate_aware_surf = np.zeros((binary_mask.shape[0], binary_mask.shape[1],
+                                    len(self.character) - 3)).astype(np.uint8)
+        for id, bb in zip(data['label'][1:data['length'] + 1], bbs):
+            char_id = id - 1
+            cate_aware_surf[:, :,
+                            char_id][bb[1]:bb[1] + bb[3], bb[0]:bb[0] +
+                                     bb[2]] = binary_mask[bb[1]:bb[1] + bb[3],
+                                                          bb[0]:bb[0] + bb[2]]
+        binary_mask = cate_aware_surf
+        binary_mask = cv2.resize(
+            binary_mask, (self.image_shape[0] // 2, self.image_shape[1] // 2))
+        if np.max(binary_mask) > 0:
+            binary_mask = binary_mask / np.max(binary_mask)  # [0 ~ 1]
+            binary_mask = binary_mask.astype(np.float32)
+        data['binary_mask'] = binary_mask
+        return data

openocr/openrec/preprocess/ce_label_encode.py ADDED Viewed

@@ -0,0 +1,116 @@
+import re
+import numpy as np
+from tools.utils.logging import get_logger
+class BaseRecLabelEncode(object):
+    """Convert between text-label and text-index."""
+    def __init__(
+        self,
+        max_text_length,
+        character_dict_path=None,
+        use_space_char=False,
+        lower=False,
+    ):
+        self.max_text_len = max_text_length
+        self.beg_str = 'sos'
+        self.end_str = 'eos'
+        self.lower = lower
+        self.reverse = False
+        if character_dict_path is None:
+            logger = get_logger()
+            logger.warning(
+                'The character_dict_path is None, model can only recognize number and lower letters'
+            )
+            self.character_str = '0123456789abcdefghijklmnopqrstuvwxyz'
+            dict_character = list(self.character_str)
+            self.lower = True
+        else:
+            self.character_str = []
+            with open(character_dict_path, 'rb') as fin:
+                lines = fin.readlines()
+                for line in lines:
+                    line = line.decode('utf-8').strip('\n').strip('\r\n')
+                    self.character_str.append(line)
+            if use_space_char:
+                self.character_str.append(' ')
+            dict_character = list(self.character_str)
+            if 'arabic' in character_dict_path:
+                self.reverse = True
+        dict_character = self.add_special_char(dict_character)
+        self.dict = {}
+        for i, char in enumerate(dict_character):
+            self.dict[char] = i
+        self.character = dict_character
+    def label_reverse(self, text):
+        text_re = []
+        c_current = ''
+        for c in text:
+            if not bool(re.search('[a-zA-Z0-9 :*./%+-١٢٣٤٥٦٧٨٩٠]', c)):
+                if c_current != '':
+                    text_re.append(c_current)
+                text_re.append(c)
+                c_current = ''
+            else:
+                c_current += c
+        if c_current != '':
+            text_re.append(c_current)
+        return ''.join(text_re[::-1])
+    def add_special_char(self, dict_character):
+        return dict_character
+    def encode(self, text):
+        """convert text-label into text-index.
+        input:
+            text: text labels of each image. [batch_size]
+        output:
+            text: concatenated text index for CTCLoss.
+                    [sum(text_lengths)] = [text_index_0 + text_index_1 + ... + text_index_(n - 1)]
+            length: length of each text. [batch_size]
+        """
+        if len(text) == 0 or len(text) > self.max_text_len:
+            return None
+        if self.lower:
+            text = text.lower()
+        text_list = []
+        for char in text:
+            if char not in self.dict:
+                # logger = get_logger()
+                # logger.warning('{} is not in dict'.format(char))
+                continue
+            text_list.append(self.dict[char])
+        if len(text_list) == 0:
+            return None
+        return text_list
+class CELabelEncode(BaseRecLabelEncode):
+    """Convert between text-label and text-index."""
+    def __init__(self,
+                 max_text_length,
+                 character_dict_path=None,
+                 use_space_char=False,
+                 **kwargs):
+        super(CELabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+    def __call__(self, data):
+        text = data['label']
+        text = self.encode(text)
+        if text is None:
+            return None
+        data['length'] = np.array(len(text))
+        data['label'] = np.array(text)
+        return data
+    def add_special_char(self, dict_character):
+        return dict_character

openocr/openrec/preprocess/char_label_encode.py ADDED Viewed

@@ -0,0 +1,36 @@
+import numpy as np
+from .ctc_label_encode import BaseRecLabelEncode
+class CharLabelEncode(BaseRecLabelEncode):
+    """Convert between text-label and text-index."""
+    def __init__(self,
+                 max_text_length,
+                 character_dict_path=None,
+                 use_space_char=False,
+                 **kwargs):
+        super(CharLabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+    def __call__(self, data):
+        text = data['label']
+        text = self.encode(text)
+        if text is None:
+            return None
+        if len(text) > self.max_text_len:
+            return None
+        data['length'] = np.array(len(text))
+        text_char = text + [104] * (self.max_text_len + 1 - len(text))
+        text.insert(0, 2)
+        text.append(3)
+        text = text + [0] * (self.max_text_len + 2 - len(text))
+        data['label'] = np.array(text)
+        data['label_char'] = np.array(text_char)
+        return data
+    def add_special_char(self, dict_character):
+        dict_character = ['blank', '<unk>', '<s>', '</s>'] + dict_character
+        return dict_character

openocr/openrec/preprocess/cppd_label_encode.py ADDED Viewed

@@ -0,0 +1,173 @@
+import random
+import numpy as np
+from openrec.preprocess.ctc_label_encode import BaseRecLabelEncode
+class CPPDLabelEncode(BaseRecLabelEncode):
+    """Convert between text-label and text-index."""
+    def __init__(
+            self,
+            max_text_length,
+            character_dict_path=None,
+            use_space_char=False,
+            ch=False,
+            #  ch_7000=7000,
+            ignore_index=100,
+            use_sos=False,
+            pos_len=False,
+            **kwargs):
+        self.use_sos = use_sos
+        super(CPPDLabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+        self.ch = ch
+        self.ignore_index = ignore_index
+        self.pos_len = pos_len
+    def __call__(self, data):
+        text = data['label']
+        if self.ch:
+            text, text_node_index, text_node_num = self.encodech(text)
+            if text is None:
+                return None
+            if len(text) > self.max_text_len:
+                return None
+            data['length'] = np.array(len(text))
+            # text.insert(0, 0)
+            if self.pos_len:
+                text_pos_node = [i_ for i_ in range(len(text), -1, -1)
+                                 ] + [100] * (self.max_text_len - len(text))
+            else:
+                text_pos_node = [1] * (len(text) + 1) + [0] * (
+                    self.max_text_len - len(text))
+            text.append(0)
+            text + [0] * (self.max_text_len - len(text))
+            text = text + [self.ignore_index
+                           ] * (self.max_text_len + 1 - len(text))
+            data['label'] = np.array(text)
+            data['label_node'] = np.array(text_node_num + text_pos_node)
+            data['label_index'] = np.array(text_node_index)
+            # data['label_ctc'] = np.array(ctc_text)
+            return data
+        else:
+            text, text_char_node, ch_order = self.encode(text)
+            if text is None:
+                return None
+            if len(text) > self.max_text_len:
+                return None
+            data['length'] = np.array(len(text))
+            # text.insert(0, 0)
+            if self.pos_len:
+                text_pos_node = [i_ for i_ in range(len(text), -1, -1)
+                                 ] + [100] * (self.max_text_len - len(text))
+            else:
+                text_pos_node = [1] * (len(text) + 1) + [0] * (
+                    self.max_text_len - len(text))
+            text.append(0)
+            text = text + [self.ignore_index
+                           ] * (self.max_text_len + 1 - len(text))
+            data['label'] = np.array(text)
+            data['label_node'] = np.array(text_char_node + text_pos_node)
+            data['label_order'] = np.array(ch_order)
+            return data
+    def add_special_char(self, dict_character):
+        if self.use_sos:
+            dict_character = ['<s>', '</s>'] + dict_character
+        else:
+            dict_character = ['</s>'] + dict_character
+        self.num_character = len(dict_character)
+        return dict_character
+    def encode(self, text):
+        """convert text-label into text-index.
+        input:
+            text: text labels of each image. [batch_size]
+        output:
+            text: concatenated text index for CTCLoss.
+                    [sum(text_lengths)] = [text_index_0 + text_index_1 + ... + text_index_(n - 1)]
+            length: length of each text. [batch_size]
+        """
+        if len(text) == 0:
+            return None, None, None
+        if self.lower:
+            text = text.lower()
+        text_node = [0 for _ in range(self.num_character)]
+        text_node[0] = 1
+        text_list = []
+        ch_order = []
+        order = 1
+        for char in text:
+            if char not in self.dict:
+                continue
+            text_list.append(self.dict[char])
+            text_node[self.dict[char]] += 1
+            ch_order.append(
+                [self.dict[char], text_node[self.dict[char]], order])
+            order += 1
+        no_ch_order = []
+        for char in self.character:
+            if char not in text:
+                no_ch_order.append([self.dict[char], 1, 0])
+        random.shuffle(no_ch_order)
+        ch_order = ch_order + no_ch_order
+        ch_order = ch_order[:self.max_text_len + 1]
+        if len(text_list) == 0 or len(text_list) > self.max_text_len:
+            return None, None, None
+        return text_list, text_node, ch_order.sort()
+    def encodech(self, text):
+        """convert text-label into text-index.
+        input:
+            text: text labels of each image. [batch_size]
+        output:
+            text: concatenated text index for CTCLoss.
+                    [sum(text_lengths)] = [text_index_0 + text_index_1 + ... + text_index_(n - 1)]
+            length: length of each text. [batch_size]
+        """
+        if len(text) == 0:
+            return None, None, None
+        if self.lower:
+            text = text.lower()
+        text_node_dict = {}
+        text_node_dict.update({0: 1})
+        character_index = [_ for _ in range(self.num_character)]
+        text_list = []
+        for char in text:
+            if char not in self.dict:
+                continue
+            i_c = self.dict[char]
+            text_list.append(i_c)
+            if i_c in text_node_dict.keys():
+                text_node_dict[i_c] += 1
+            else:
+                text_node_dict.update({i_c: 1})
+        for ic in list(text_node_dict.keys()):
+            character_index.remove(ic)
+        none_char_index = random.sample(character_index,
+                                        37 - len(list(text_node_dict.keys())))
+        for ic in none_char_index:
+            text_node_dict[ic] = 0
+        text_node_index = sorted(text_node_dict)
+        text_node_num = [text_node_dict[k] for k in text_node_index]
+        if len(text_list) == 0 or len(text_list) > self.max_text_len:
+            return None, None, None
+        return text_list, text_node_index, text_node_num

openocr/openrec/preprocess/ctc_label_encode.py ADDED Viewed

@@ -0,0 +1,124 @@
+import re
+import numpy as np
+from tools.utils.logging import get_logger
+class BaseRecLabelEncode(object):
+    """Convert between text-label and text-index."""
+    def __init__(
+        self,
+        max_text_length,
+        character_dict_path=None,
+        use_space_char=False,
+        lower=False,
+    ):
+        self.max_text_len = max_text_length
+        self.beg_str = 'sos'
+        self.end_str = 'eos'
+        self.lower = lower
+        self.reverse = False
+        if character_dict_path is None:
+            logger = get_logger()
+            logger.warning(
+                'The character_dict_path is None, model can only recognize number and lower letters'
+            )
+            self.character_str = '0123456789abcdefghijklmnopqrstuvwxyz'
+            dict_character = list(self.character_str)
+            self.lower = True
+        else:
+            self.character_str = []
+            with open(character_dict_path, 'rb') as fin:
+                lines = fin.readlines()
+                for line in lines:
+                    line = line.decode('utf-8').strip('\n').strip('\r\n')
+                    self.character_str.append(line)
+            if use_space_char:
+                self.character_str.append(' ')
+            dict_character = list(self.character_str)
+            if 'arabic' in character_dict_path:
+                self.reverse = True
+        dict_character = self.add_special_char(dict_character)
+        self.dict = {}
+        for i, char in enumerate(dict_character):
+            self.dict[char] = i
+        self.character = dict_character
+    def label_reverse(self, text):
+        text_re = []
+        c_current = ''
+        for c in text:
+            if not bool(re.search('[a-zA-Z0-9 :*./%+-١٢٣٤٥٦٧٨٩٠]', c)):
+                if c_current != '':
+                    text_re.append(c_current)
+                text_re.append(c)
+                c_current = ''
+            else:
+                c_current += c
+        if c_current != '':
+            text_re.append(c_current)
+        return ''.join(text_re[::-1])
+    def add_special_char(self, dict_character):
+        return dict_character
+    def encode(self, text):
+        """convert text-label into text-index.
+        input:
+            text: text labels of each image. [batch_size]
+        output:
+            text: concatenated text index for CTCLoss.
+                    [sum(text_lengths)] = [text_index_0 + text_index_1 + ... + text_index_(n - 1)]
+            length: length of each text. [batch_size]
+        """
+        if len(text) == 0:
+            return None
+        if self.lower:
+            text = text.lower()
+        text_list = []
+        for char in text:
+            if char not in self.dict:
+                continue
+            text_list.append(self.dict[char])
+        if len(text_list) == 0 or len(text_list) > self.max_text_len:
+            return None
+        return text_list
+class CTCLabelEncode(BaseRecLabelEncode):
+    """Convert between text-label and text-index."""
+    def __init__(self,
+                 max_text_length,
+                 character_dict_path=None,
+                 use_space_char=False,
+                 **kwargs):
+        super(CTCLabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+        self.is_reverse = kwargs.get('is_reverse', False)
+    def __call__(self, data):
+        text = data['label']
+        if self.reverse and self.is_reverse:  # for arabic rec
+            text = self.label_reverse(text)
+        text = self.encode(text)
+        if text is None:
+            return None
+        data['length'] = np.array(len(text))
+        text = text + [0] * (self.max_text_len - len(text))
+        data['label'] = np.array(text)
+        label = [0] * len(self.character)
+        for x in text:
+            label[x] += 1
+        data['label_ace'] = np.array(label)
+        return data
+    def add_special_char(self, dict_character):
+        dict_character = ['blank'] + dict_character
+        return dict_character

openocr/openrec/preprocess/ep_label_encode.py ADDED Viewed

@@ -0,0 +1,38 @@
+import numpy as np
+from openrec.preprocess.ctc_label_encode import BaseRecLabelEncode
+class EPLabelEncode(BaseRecLabelEncode):
+    """Convert between text-label and text-index."""
+    EOS = '</s>'
+    PAD = '<pad>'
+    def __init__(self,
+                 max_text_length,
+                 character_dict_path=None,
+                 use_space_char=False,
+                 **kwargs):
+        super(EPLabelEncode,
+              self).__init__(max_text_length, character_dict_path,
+                             use_space_char)
+    def __call__(self, data):
+        text = data['label']
+        text = self.encode(text)
+        if text is None:
+            return None
+        if len(text) > self.max_text_len:
+            return None
+        data['length'] = np.array(len(text))
+        text = text + [self.dict[self.EOS]]
+        text = text + [self.dict[self.PAD]
+                       ] * (self.max_text_len + 1 - len(text))
+        data['label'] = np.array(text)
+        return data
+    def add_special_char(self, dict_character):
+        dict_character = [self.EOS] + dict_character + [self.PAD]
+        return dict_character