PyPI - pyxllib - Versions diffs - 0.3.96__py3-none-any.whl → 0.3.197__py3-none-any.whl - Mend

pyxllib 0.3.96py3-none-any.whl → 0.3.197py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (306) hide show

pyxllib/algo/geo.py +12 -0
pyxllib/algo/intervals.py +1 -1
pyxllib/algo/matcher.py +78 -0
pyxllib/algo/pupil.py +187 -19
pyxllib/algo/specialist.py +2 -1
pyxllib/algo/stat.py +38 -2
{pyxlpr → pyxllib/autogui}/__init__.py +1 -1
pyxllib/autogui/activewin.py +246 -0
pyxllib/autogui/all.py +9 -0
pyxllib/{ext/autogui → autogui}/autogui.py +40 -11
pyxllib/autogui/uiautolib.py +362 -0
pyxllib/autogui/wechat.py +827 -0
pyxllib/autogui/wechat_msg.py +421 -0
pyxllib/autogui/wxautolib.py +84 -0
pyxllib/cv/slidercaptcha.py +137 -0
pyxllib/data/echarts.py +123 -12
pyxllib/data/jsonlib.py +89 -0
pyxllib/data/pglib.py +514 -30
pyxllib/data/sqlite.py +231 -4
pyxllib/ext/JLineViewer.py +14 -1
pyxllib/ext/drissionlib.py +277 -0
pyxllib/ext/kq5034lib.py +0 -1594
pyxllib/ext/robustprocfile.py +497 -0
pyxllib/ext/unixlib.py +6 -5
pyxllib/ext/utools.py +108 -95
pyxllib/ext/webhook.py +32 -14
pyxllib/ext/wjxlib.py +88 -0
pyxllib/ext/wpsapi.py +124 -0
pyxllib/ext/xlwork.py +9 -0
pyxllib/ext/yuquelib.py +1003 -71
pyxllib/file/docxlib.py +1 -1
pyxllib/file/libreoffice.py +165 -0
pyxllib/file/movielib.py +9 -0
pyxllib/file/packlib/__init__.py +112 -75
pyxllib/file/pdflib.py +1 -1
pyxllib/file/pupil.py +1 -1
pyxllib/file/specialist/dirlib.py +1 -1
pyxllib/file/specialist/download.py +10 -3
pyxllib/file/specialist/filelib.py +266 -55
pyxllib/file/xlsxlib.py +205 -50
pyxllib/file/xlsyncfile.py +341 -0
pyxllib/prog/cachetools.py +64 -0
pyxllib/prog/filelock.py +42 -0
pyxllib/prog/multiprogs.py +940 -0
pyxllib/prog/newbie.py +9 -2
pyxllib/prog/pupil.py +129 -60
pyxllib/prog/specialist/__init__.py +176 -2
pyxllib/prog/specialist/bc.py +5 -2
pyxllib/prog/specialist/browser.py +11 -2
pyxllib/prog/specialist/datetime.py +68 -0
pyxllib/prog/specialist/tictoc.py +12 -13
pyxllib/prog/specialist/xllog.py +5 -5
pyxllib/prog/xlosenv.py +7 -0
pyxllib/text/airscript.js +744 -0
pyxllib/text/charclasslib.py +17 -5
pyxllib/text/jiebalib.py +6 -3
pyxllib/text/jinjalib.py +32 -0
pyxllib/text/jsa_ai_prompt.md +271 -0
pyxllib/text/jscode.py +159 -4
pyxllib/text/nestenv.py +1 -1
pyxllib/text/newbie.py +12 -0
pyxllib/text/pupil/common.py +26 -0
pyxllib/text/specialist/ptag.py +2 -2
pyxllib/text/templates/echart_base.html +11 -0
pyxllib/text/templates/highlight_code.html +17 -0
pyxllib/text/templates/latex_editor.html +103 -0
pyxllib/text/xmllib.py +76 -14
pyxllib/xl.py +2 -1
pyxllib-0.3.197.dist-info/METADATA +48 -0
pyxllib-0.3.197.dist-info/RECORD +126 -0
{pyxllib-0.3.96.dist-info → pyxllib-0.3.197.dist-info}/WHEEL +1 -2
pyxllib/ext/autogui/__init__.py +0 -8
pyxllib-0.3.96.dist-info/METADATA +0 -51
pyxllib-0.3.96.dist-info/RECORD +0 -333
pyxllib-0.3.96.dist-info/top_level.txt +0 -2
pyxlpr/ai/__init__.py +0 -5
pyxlpr/ai/clientlib.py +0 -1281
pyxlpr/ai/specialist.py +0 -286
pyxlpr/ai/torch_app.py +0 -172
pyxlpr/ai/xlpaddle.py +0 -655
pyxlpr/ai/xltorch.py +0 -705
pyxlpr/data/__init__.py +0 -11
pyxlpr/data/coco.py +0 -1325
pyxlpr/data/datacls.py +0 -365
pyxlpr/data/datasets.py +0 -200
pyxlpr/data/gptlib.py +0 -1291
pyxlpr/data/icdar/__init__.py +0 -96
pyxlpr/data/icdar/deteval.py +0 -377
pyxlpr/data/icdar/icdar2013.py +0 -341
pyxlpr/data/icdar/iou.py +0 -340
pyxlpr/data/icdar/rrc_evaluation_funcs_1_1.py +0 -463
pyxlpr/data/imtextline.py +0 -473
pyxlpr/data/labelme.py +0 -866
pyxlpr/data/removeline.py +0 -179
pyxlpr/data/specialist.py +0 -57
pyxlpr/eval/__init__.py +0 -85
pyxlpr/paddleocr.py +0 -776
pyxlpr/ppocr/__init__.py +0 -15
pyxlpr/ppocr/configs/rec/multi_language/generate_multi_language_configs.py +0 -226
pyxlpr/ppocr/data/__init__.py +0 -135
pyxlpr/ppocr/data/imaug/ColorJitter.py +0 -26
pyxlpr/ppocr/data/imaug/__init__.py +0 -67
pyxlpr/ppocr/data/imaug/copy_paste.py +0 -170
pyxlpr/ppocr/data/imaug/east_process.py +0 -437
pyxlpr/ppocr/data/imaug/gen_table_mask.py +0 -244
pyxlpr/ppocr/data/imaug/iaa_augment.py +0 -114
pyxlpr/ppocr/data/imaug/label_ops.py +0 -789
pyxlpr/ppocr/data/imaug/make_border_map.py +0 -184
pyxlpr/ppocr/data/imaug/make_pse_gt.py +0 -106
pyxlpr/ppocr/data/imaug/make_shrink_map.py +0 -126
pyxlpr/ppocr/data/imaug/operators.py +0 -433
pyxlpr/ppocr/data/imaug/pg_process.py +0 -906
pyxlpr/ppocr/data/imaug/randaugment.py +0 -143
pyxlpr/ppocr/data/imaug/random_crop_data.py +0 -239
pyxlpr/ppocr/data/imaug/rec_img_aug.py +0 -533
pyxlpr/ppocr/data/imaug/sast_process.py +0 -777
pyxlpr/ppocr/data/imaug/text_image_aug/__init__.py +0 -17
pyxlpr/ppocr/data/imaug/text_image_aug/augment.py +0 -120
pyxlpr/ppocr/data/imaug/text_image_aug/warp_mls.py +0 -168
pyxlpr/ppocr/data/lmdb_dataset.py +0 -115
pyxlpr/ppocr/data/pgnet_dataset.py +0 -104
pyxlpr/ppocr/data/pubtab_dataset.py +0 -107
pyxlpr/ppocr/data/simple_dataset.py +0 -372
pyxlpr/ppocr/losses/__init__.py +0 -61
pyxlpr/ppocr/losses/ace_loss.py +0 -52
pyxlpr/ppocr/losses/basic_loss.py +0 -135
pyxlpr/ppocr/losses/center_loss.py +0 -88
pyxlpr/ppocr/losses/cls_loss.py +0 -30
pyxlpr/ppocr/losses/combined_loss.py +0 -67
pyxlpr/ppocr/losses/det_basic_loss.py +0 -208
pyxlpr/ppocr/losses/det_db_loss.py +0 -80
pyxlpr/ppocr/losses/det_east_loss.py +0 -63
pyxlpr/ppocr/losses/det_pse_loss.py +0 -149
pyxlpr/ppocr/losses/det_sast_loss.py +0 -121
pyxlpr/ppocr/losses/distillation_loss.py +0 -272
pyxlpr/ppocr/losses/e2e_pg_loss.py +0 -140
pyxlpr/ppocr/losses/kie_sdmgr_loss.py +0 -113
pyxlpr/ppocr/losses/rec_aster_loss.py +0 -99
pyxlpr/ppocr/losses/rec_att_loss.py +0 -39
pyxlpr/ppocr/losses/rec_ctc_loss.py +0 -44
pyxlpr/ppocr/losses/rec_enhanced_ctc_loss.py +0 -70
pyxlpr/ppocr/losses/rec_nrtr_loss.py +0 -30
pyxlpr/ppocr/losses/rec_sar_loss.py +0 -28
pyxlpr/ppocr/losses/rec_srn_loss.py +0 -47
pyxlpr/ppocr/losses/table_att_loss.py +0 -109
pyxlpr/ppocr/metrics/__init__.py +0 -44
pyxlpr/ppocr/metrics/cls_metric.py +0 -45
pyxlpr/ppocr/metrics/det_metric.py +0 -82
pyxlpr/ppocr/metrics/distillation_metric.py +0 -73
pyxlpr/ppocr/metrics/e2e_metric.py +0 -86
pyxlpr/ppocr/metrics/eval_det_iou.py +0 -274
pyxlpr/ppocr/metrics/kie_metric.py +0 -70
pyxlpr/ppocr/metrics/rec_metric.py +0 -75
pyxlpr/ppocr/metrics/table_metric.py +0 -50
pyxlpr/ppocr/modeling/architectures/__init__.py +0 -32
pyxlpr/ppocr/modeling/architectures/base_model.py +0 -88
pyxlpr/ppocr/modeling/architectures/distillation_model.py +0 -60
pyxlpr/ppocr/modeling/backbones/__init__.py +0 -54
pyxlpr/ppocr/modeling/backbones/det_mobilenet_v3.py +0 -268
pyxlpr/ppocr/modeling/backbones/det_resnet_vd.py +0 -246
pyxlpr/ppocr/modeling/backbones/det_resnet_vd_sast.py +0 -285
pyxlpr/ppocr/modeling/backbones/e2e_resnet_vd_pg.py +0 -265
pyxlpr/ppocr/modeling/backbones/kie_unet_sdmgr.py +0 -186
pyxlpr/ppocr/modeling/backbones/rec_mobilenet_v3.py +0 -138
pyxlpr/ppocr/modeling/backbones/rec_mv1_enhance.py +0 -258
pyxlpr/ppocr/modeling/backbones/rec_nrtr_mtb.py +0 -48
pyxlpr/ppocr/modeling/backbones/rec_resnet_31.py +0 -210
pyxlpr/ppocr/modeling/backbones/rec_resnet_aster.py +0 -143
pyxlpr/ppocr/modeling/backbones/rec_resnet_fpn.py +0 -307
pyxlpr/ppocr/modeling/backbones/rec_resnet_vd.py +0 -286
pyxlpr/ppocr/modeling/heads/__init__.py +0 -54
pyxlpr/ppocr/modeling/heads/cls_head.py +0 -52
pyxlpr/ppocr/modeling/heads/det_db_head.py +0 -118
pyxlpr/ppocr/modeling/heads/det_east_head.py +0 -121
pyxlpr/ppocr/modeling/heads/det_pse_head.py +0 -37
pyxlpr/ppocr/modeling/heads/det_sast_head.py +0 -128
pyxlpr/ppocr/modeling/heads/e2e_pg_head.py +0 -253
pyxlpr/ppocr/modeling/heads/kie_sdmgr_head.py +0 -206
pyxlpr/ppocr/modeling/heads/multiheadAttention.py +0 -163
pyxlpr/ppocr/modeling/heads/rec_aster_head.py +0 -393
pyxlpr/ppocr/modeling/heads/rec_att_head.py +0 -202
pyxlpr/ppocr/modeling/heads/rec_ctc_head.py +0 -88
pyxlpr/ppocr/modeling/heads/rec_nrtr_head.py +0 -826
pyxlpr/ppocr/modeling/heads/rec_sar_head.py +0 -402
pyxlpr/ppocr/modeling/heads/rec_srn_head.py +0 -280
pyxlpr/ppocr/modeling/heads/self_attention.py +0 -406
pyxlpr/ppocr/modeling/heads/table_att_head.py +0 -246
pyxlpr/ppocr/modeling/necks/__init__.py +0 -32
pyxlpr/ppocr/modeling/necks/db_fpn.py +0 -111
pyxlpr/ppocr/modeling/necks/east_fpn.py +0 -188
pyxlpr/ppocr/modeling/necks/fpn.py +0 -138
pyxlpr/ppocr/modeling/necks/pg_fpn.py +0 -314
pyxlpr/ppocr/modeling/necks/rnn.py +0 -92
pyxlpr/ppocr/modeling/necks/sast_fpn.py +0 -284
pyxlpr/ppocr/modeling/necks/table_fpn.py +0 -110
pyxlpr/ppocr/modeling/transforms/__init__.py +0 -28
pyxlpr/ppocr/modeling/transforms/stn.py +0 -135
pyxlpr/ppocr/modeling/transforms/tps.py +0 -308
pyxlpr/ppocr/modeling/transforms/tps_spatial_transformer.py +0 -156
pyxlpr/ppocr/optimizer/__init__.py +0 -61
pyxlpr/ppocr/optimizer/learning_rate.py +0 -228
pyxlpr/ppocr/optimizer/lr_scheduler.py +0 -49
pyxlpr/ppocr/optimizer/optimizer.py +0 -160
pyxlpr/ppocr/optimizer/regularizer.py +0 -52
pyxlpr/ppocr/postprocess/__init__.py +0 -55
pyxlpr/ppocr/postprocess/cls_postprocess.py +0 -33
pyxlpr/ppocr/postprocess/db_postprocess.py +0 -234
pyxlpr/ppocr/postprocess/east_postprocess.py +0 -143
pyxlpr/ppocr/postprocess/locality_aware_nms.py +0 -200
pyxlpr/ppocr/postprocess/pg_postprocess.py +0 -52
pyxlpr/ppocr/postprocess/pse_postprocess/__init__.py +0 -15
pyxlpr/ppocr/postprocess/pse_postprocess/pse/__init__.py +0 -29
pyxlpr/ppocr/postprocess/pse_postprocess/pse/setup.py +0 -14
pyxlpr/ppocr/postprocess/pse_postprocess/pse_postprocess.py +0 -118
pyxlpr/ppocr/postprocess/rec_postprocess.py +0 -654
pyxlpr/ppocr/postprocess/sast_postprocess.py +0 -355
pyxlpr/ppocr/tools/__init__.py +0 -14
pyxlpr/ppocr/tools/eval.py +0 -83
pyxlpr/ppocr/tools/export_center.py +0 -77
pyxlpr/ppocr/tools/export_model.py +0 -129
pyxlpr/ppocr/tools/infer/predict_cls.py +0 -151
pyxlpr/ppocr/tools/infer/predict_det.py +0 -300
pyxlpr/ppocr/tools/infer/predict_e2e.py +0 -169
pyxlpr/ppocr/tools/infer/predict_rec.py +0 -414
pyxlpr/ppocr/tools/infer/predict_system.py +0 -204
pyxlpr/ppocr/tools/infer/utility.py +0 -629
pyxlpr/ppocr/tools/infer_cls.py +0 -83
pyxlpr/ppocr/tools/infer_det.py +0 -134
pyxlpr/ppocr/tools/infer_e2e.py +0 -122
pyxlpr/ppocr/tools/infer_kie.py +0 -153
pyxlpr/ppocr/tools/infer_rec.py +0 -146
pyxlpr/ppocr/tools/infer_table.py +0 -107
pyxlpr/ppocr/tools/program.py +0 -596
pyxlpr/ppocr/tools/test_hubserving.py +0 -117
pyxlpr/ppocr/tools/train.py +0 -163
pyxlpr/ppocr/tools/xlprog.py +0 -748
pyxlpr/ppocr/utils/EN_symbol_dict.txt +0 -94
pyxlpr/ppocr/utils/__init__.py +0 -24
pyxlpr/ppocr/utils/dict/ar_dict.txt +0 -117
pyxlpr/ppocr/utils/dict/arabic_dict.txt +0 -162
pyxlpr/ppocr/utils/dict/be_dict.txt +0 -145
pyxlpr/ppocr/utils/dict/bg_dict.txt +0 -140
pyxlpr/ppocr/utils/dict/chinese_cht_dict.txt +0 -8421
pyxlpr/ppocr/utils/dict/cyrillic_dict.txt +0 -163
pyxlpr/ppocr/utils/dict/devanagari_dict.txt +0 -167
pyxlpr/ppocr/utils/dict/en_dict.txt +0 -63
pyxlpr/ppocr/utils/dict/fa_dict.txt +0 -136
pyxlpr/ppocr/utils/dict/french_dict.txt +0 -136
pyxlpr/ppocr/utils/dict/german_dict.txt +0 -143
pyxlpr/ppocr/utils/dict/hi_dict.txt +0 -162
pyxlpr/ppocr/utils/dict/it_dict.txt +0 -118
pyxlpr/ppocr/utils/dict/japan_dict.txt +0 -4399
pyxlpr/ppocr/utils/dict/ka_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/korean_dict.txt +0 -3688
pyxlpr/ppocr/utils/dict/latin_dict.txt +0 -185
pyxlpr/ppocr/utils/dict/mr_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/ne_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/oc_dict.txt +0 -96
pyxlpr/ppocr/utils/dict/pu_dict.txt +0 -130
pyxlpr/ppocr/utils/dict/rs_dict.txt +0 -91
pyxlpr/ppocr/utils/dict/rsc_dict.txt +0 -134
pyxlpr/ppocr/utils/dict/ru_dict.txt +0 -125
pyxlpr/ppocr/utils/dict/ta_dict.txt +0 -128
pyxlpr/ppocr/utils/dict/table_dict.txt +0 -277
pyxlpr/ppocr/utils/dict/table_structure_dict.txt +0 -2759
pyxlpr/ppocr/utils/dict/te_dict.txt +0 -151
pyxlpr/ppocr/utils/dict/ug_dict.txt +0 -114
pyxlpr/ppocr/utils/dict/uk_dict.txt +0 -142
pyxlpr/ppocr/utils/dict/ur_dict.txt +0 -137
pyxlpr/ppocr/utils/dict/xi_dict.txt +0 -110
pyxlpr/ppocr/utils/dict90.txt +0 -90
pyxlpr/ppocr/utils/e2e_metric/Deteval.py +0 -574
pyxlpr/ppocr/utils/e2e_metric/polygon_fast.py +0 -83
pyxlpr/ppocr/utils/e2e_utils/extract_batchsize.py +0 -87
pyxlpr/ppocr/utils/e2e_utils/extract_textpoint_fast.py +0 -457
pyxlpr/ppocr/utils/e2e_utils/extract_textpoint_slow.py +0 -592
pyxlpr/ppocr/utils/e2e_utils/pgnet_pp_utils.py +0 -162
pyxlpr/ppocr/utils/e2e_utils/visual.py +0 -162
pyxlpr/ppocr/utils/en_dict.txt +0 -95
pyxlpr/ppocr/utils/gen_label.py +0 -81
pyxlpr/ppocr/utils/ic15_dict.txt +0 -36
pyxlpr/ppocr/utils/iou.py +0 -54
pyxlpr/ppocr/utils/logging.py +0 -69
pyxlpr/ppocr/utils/network.py +0 -84
pyxlpr/ppocr/utils/ppocr_keys_v1.txt +0 -6623
pyxlpr/ppocr/utils/profiler.py +0 -110
pyxlpr/ppocr/utils/save_load.py +0 -150
pyxlpr/ppocr/utils/stats.py +0 -72
pyxlpr/ppocr/utils/utility.py +0 -80
pyxlpr/ppstructure/__init__.py +0 -13
pyxlpr/ppstructure/predict_system.py +0 -187
pyxlpr/ppstructure/table/__init__.py +0 -13
pyxlpr/ppstructure/table/eval_table.py +0 -72
pyxlpr/ppstructure/table/matcher.py +0 -192
pyxlpr/ppstructure/table/predict_structure.py +0 -136
pyxlpr/ppstructure/table/predict_table.py +0 -221
pyxlpr/ppstructure/table/table_metric/__init__.py +0 -16
pyxlpr/ppstructure/table/table_metric/parallel.py +0 -51
pyxlpr/ppstructure/table/table_metric/table_metric.py +0 -247
pyxlpr/ppstructure/table/tablepyxl/__init__.py +0 -13
pyxlpr/ppstructure/table/tablepyxl/style.py +0 -283
pyxlpr/ppstructure/table/tablepyxl/tablepyxl.py +0 -118
pyxlpr/ppstructure/utility.py +0 -71
pyxlpr/xlai.py +0 -10
/pyxllib/{ext/autogui → autogui}/virtualkey.py +0 -0
{pyxllib-0.3.96.dist-info → pyxllib-0.3.197.dist-info/licenses}/LICENSE +0 -0

pyxlpr/ai/xlpaddle.py DELETED Viewed

@@ -1,655 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-# @Author : 陈坤泽
-# @Email  : 877362867@qq.com
-# @Date   : 2021/11/05 09:01
-"""
-pp是paddlepaddle的缩写
-"""
-import os
-import sys
-import logging
-import random
-import shutil
-import re
-from tqdm import tqdm
-import numpy as np
-import pandas as pd
-import humanfriendly
-import paddle
-import paddle.inference as paddle_infer
-from pyxllib.algo.pupil import natural_sort
-from pyxllib.xl import XlPath, browser
-from pyxllib.xlcv import xlcv
-from pyxlpr.ai.specialist import ClasEvaluater, show_feature_map
-def __1_数据集():
-    pass
-class SequenceDataset(paddle.io.Dataset):
-    def __init__(self, samples, labels=None, transform=None):
-        super().__init__()
-        self.samples = samples
-        self.labels = labels
-        # if self.labels is not None:  # 对np.array类型无法直接使用len，从通用角度看，这个参数可以不设
-        #     assert len(self.samples) == len(self.labels)
-        self.transform = transform
-    def __len__(self):
-        return len(self.samples)
-    def __getitem__(self, index):
-        x = self.samples[index]
-        if self.transform:
-            x = self.transform(x)
-        if self.labels is not None:
-            return x, self.labels[index]
-        else:
-            return x
-def build_testdata_loader(samples, *, labels=None, transform=None, **kwargs):
-    """ 简化的一个创建paddle的DataLoader的函数。主要用于简化部署阶段的推理。
-    :param samples: list类型的输入格式
-    """
-    import paddle.fluid.dataloader.fetcher
-    # 暂时不知道怎么关闭这个警告，先用暴力方法
-    paddle.fluid.dataloader.fetcher._WARNING_TO_LOG = False
-    if isinstance(samples, paddle.io.DataLoader):
-        return samples
-    elif isinstance(samples, paddle.io.Dataset):
-        dataset = samples
-    else:
-        dataset = SequenceDataset(samples, labels, transform)
-    return paddle.io.DataLoader(dataset, **kwargs)
-class ImageClasDataset(paddle.io.Dataset):
-    """ 常用的分类数据集格式 """
-    def __init__(self, num_classes, samples, ratio=None, *,
-                 use_img_augment=False, seed=4101, class_names=None):
-        """ 直接按root下的目录数进行分类，注意如果train和val是分开的，目录结构要一直，否则自带的类别id编号会不匹配
-        :param num_classes: 类别数
-        :param list samples: 样本清单，每个条目有[图片路径, 类别id]
-        :param int|float|list|tuple ratio: 取数据的比例，默认全取，可以输入一个区间，指定取哪个部分
-            这个操作会设置seed，确保每次随机打乱后选取的结果相同
-        :param list class_names: 表示id从0开始依次取，对应的类别昵称
-        """
-        super().__init__()
-        if ratio is not None:
-            if isinstance(ratio, (int, float)):
-                # 每个类别取得样本区间
-                if ratio > 0:
-                    left, right = 0, ratio
-                else:
-                    left, right = (1 + ratio), 1
-            else:
-                left, right = ratio
-            # 初始化，按类别分好组
-            random.seed(seed)
-            groups = [[] for i in range(num_classes)]
-            for file, label in samples:
-                groups[label].append(file)
-            # 每个类别选取部分数据
-            samples = []
-            for label, files in enumerate(groups):
-                n = len(files)
-                random.shuffle(files)
-                files2 = files[int(left * n):int(right * n)]
-                samples += [[f, label] for f in files2]
-        self.samples = samples
-        self.num_classes = num_classes
-        self.class_names = class_names
-        self.use_img_augment = use_img_augment
-    @classmethod
-    def from_folder(cls, root, ratio=None, *, class_mode=1, **kwargs):
-        """ 从类别目录式的数据，构造图像分类数据集
-        :param root: 数据根目录
-        :param ratio: 每个类别取多少样本量
-        :param class_mode: 类别限定方法。注意空目录也会标记为1个类。
-            0，一般是读取没有label标签的测试集，所有的类别，统一用0占位
-            1，root下每个直接子目录是一个类别，每个类别目录里如果有嵌套目录，都会归为可用图片
-            2，root下每个目录均被视为一个类别，这些类别在目录结构上虽然有嵌套结构，但在模型上先用线性类别模式处理
-        注：空目录相当于没有该类别数据，会跳过，不会进入分类清单。比如8个类别的目录，但是有2个空的，那么实际只会生成6分类模型。
-        """
-        def run_mode0():
-            samples = list(XlPath(root).glob_images('**/*'))
-            return samples, []
-        def run_mode1():
-            samples, class_names = [], []
-            dirs = sorted(XlPath(root).glob_dirs())
-            for i, d in enumerate(dirs):
-                class_names.append(d.name)
-                for f in d.glob_images('**/*'):
-                    samples.append([f, i])
-            return samples, class_names
-        def run_mode2():
-            samples, class_names = [], []
-            dirs = sorted(XlPath(root).rglob_dirs())
-            for i, d in enumerate(dirs):
-                class_names.append(d.name)
-                for f in d.glob_images():
-                    samples.append([f, i])
-            return samples, class_names
-        func = {0: run_mode0, 1: run_mode1, 2: run_mode2}[class_mode]
-        samples, class_names = func()
-        return cls(len(class_names), samples, ratio, class_names=class_names, **kwargs)
-    @classmethod
-    def from_label(cls, label_file, root=None, ratio=None, **kwargs):
-        """ 从标注文件初始化 """
-        label_file = XlPath(label_file)
-        lines = label_file.read_text().splitlines()
-        if root is None:
-            root = label_file.parent
-        else:
-            root = XlPath(root)
-        samples, class_names = [], set()
-        for line in lines:
-            if not line:
-                continue
-            path, label = line.split('\t')
-            class_names.add(label)
-            samples.append([root / path, int(label)])
-        class_names = natural_sort(list(class_names))
-        return cls(len(class_names), samples, ratio=ratio, class_names=class_names, **kwargs)
-    def __len__(self):
-        return len(self.samples)
-    def save_class_names(self, outfile):
-        """ 保存类别文件 """
-        class_names = self.class_names
-        if not class_names:
-            class_names = list(map(str, range(self.num_classes)))
-        outfile = XlPath(outfile)
-        if not outfile.parent.is_dir():
-            os.makedirs(outfile.parent)
-        outfile.write_text('\n'.join(class_names))
-    @classmethod
-    def img_augment(cls, img):
-        """ 自带的一套默认的增广、数据处理方案。实际应用建议根据不同任务做扩展调整。
-        """
-        import albumentations as A
-        h, w, c = img.shape
-        # 如果进行随机裁剪，则h, w的尺寸变化
-        h = random.randint(int(h * 0.7), h)
-        w = random.randint(int(w * 0.7), w)
-        transform = A.Compose([
-            A.RandomCrop(width=w, height=h, p=0.8),
-            A.CoarseDropout(),  # 随机噪声遮挡
-            A.RandomSunFlare(p=0.1),  # 随机强光
-            A.RandomShadow(p=0.1),  # 随机阴影
-            A.RGBShift(p=0.1),  # RGB波动
-            A.Blur(p=0.1),  # 模糊
-            A.RandomBrightnessContrast(p=0.2),  # 随机调整图片明暗
-        ])
-        return transform(image=img)['image']
-    @classmethod
-    def transform(cls, x):
-        """ 自带的一种默认的图片预处理方案，实际应用建议根据不同任务做扩展调整。
-        """
-        import paddle.vision.transforms.functional as F
-        img = xlcv.read(x)
-        img = F.resize(img, (256, 256))  # 将图片尺寸统一，方便按batch训练。但resnet并不强制输入图片尺寸大小。
-        img = np.array(img, dtype='float32') / 255.
-        img = img.transpose([2, 0, 1])
-        return img
-    def __getitem__(self, index):
-        file, label = self.samples[index]
-        img = xlcv.read(file)
-        if self.use_img_augment:
-            img = self.img_augment(img)
-        img = self.transform(img)
-        return img, np.array(label, dtype='int64')
-def __2_模型结构():
-    pass
-def check_network(x):
-    """ 检查输入的模型x的相关信息 """
-    msg = '总参数量：'
-    msg += str(sum([p.size for p in x.parameters()]))
-    msg += ' | ' + ', '.join([f'{p.name}={p.size}' for p in x.parameters()])
-    print(msg)
-def model_state_dict_df(model, *, browser=False):
-    """ 统计模型中所有的参数
-    :param browser: 不单纯返回统计表，而是用浏览器打开，展示更详细的分析报告
-    详细见 w211206周报
-    """
-    ls = []
-    # 摘选ParamBase中部分成员属性进行展示
-    columns = ['var_name', 'name', 'shape', 'size', 'dtype', 'trainable', 'stop_gradient']
-    state_dict = model.state_dict()  # 可能会有冗余重复
-    used = set()
-    for k, v in state_dict.items():
-        # a 由于state_dict的机制，self.b=self.a，a、b都是会重复获取的，这时候不应该重复计算参数量
-        # 但是后面计算存储文件大小的时候，遵循原始机制冗余存储计算空间消耗
-        param_id = id(v)
-        if param_id in used:
-            continue
-        else:
-            used.add(param_id)
-        # b msg
-        msg = [k]
-        for col_name in columns[1:]:
-            msg.append(getattr(v, col_name, None))
-        ls.append(msg)
-    df = pd.DataFrame.from_records(ls, columns=columns)
-    def html_content(df):
-        import io
-        content = f'<pre>{model}' + '</pre><br/>'
-        content += df.to_html()
-        total_params = sum(df['size'])
-        content += f'<br/>总参数量：{total_params}'
-        f = io.BytesIO()
-        paddle.save(state_dict, f)
-        content += f'<br/>文件大小：{humanfriendly.format_size(len(f.getvalue()))}'
-        return content
-    if browser:
-        browser.html(html_content(df))
-    return df
-def __3_损失():
-    pass
-def __4_优化器():
-    pass
-def __5_评价指标():
-    pass
-class ClasAccuracy(paddle.metric.Metric):
-    """ 分类问题的精度 """
-    def __init__(self, num_classes=None, *, print_mode=0):
-        """
-        :param num_classes: 其实这个参数不输也没事~~
-        :param print_mode:
-            0，静默
-            1，reset的时候，输出f1指标
-            2，reset的时候，还会输出crosstab
-        """
-        super(ClasAccuracy, self).__init__()
-        self.num_classes = num_classes
-        self.total = 0
-        self.count = 0
-        self.gt = []
-        self.pred = []
-        self.print_mode = print_mode
-    def name(self):
-        return 'acc'
-    def update(self, x, y):
-        x = x.argmax(axis=1)
-        y = y.reshape(-1)
-        cmp = (x == y)
-        self.count += cmp.sum()
-        self.total += len(cmp)
-        self.gt += y.tolist()
-        self.pred += x.tolist()
-    def accumulate(self):
-        return self.count / self.total
-    def reset(self):
-        if self.print_mode:
-            a = ClasEvaluater(self.gt, self.pred)
-            print(a.f1_score('all'))
-            if self.print_mode > 1:
-                print(a.crosstab())
-        self.count = 0
-        self.total = 0
-        self.gt = []
-        self.pred = []
-class VisualAcc(paddle.callbacks.Callback):
-    def __init__(self, logdir, experimental_name, *, reset=False, save_model_with_input=None):
-        """
-        :param logdir: log所在根目录
-        :param experimental_name: 实验名子目录
-        :param reset: 是否重置目录
-        :param save_model_with_input: 默认不存储模型结构
-        """
-        from pyxllib.prog.pupil import check_install_package
-        check_install_package('visualdl')
-        from visualdl import LogWriter
-        super().__init__()
-        # 这样奇怪地加后缀，是为了字典序后，每个实验的train显示在eval之前
-        d = XlPath(logdir) / (experimental_name + '_train')
-        if reset and d.exists(): shutil.rmtree(d)
-        self.write = LogWriter(logdir=str(d))
-        d = XlPath(logdir) / (experimental_name + '_val')
-        if reset and d.exists(): shutil.rmtree(d)
-        self.eval_writer = LogWriter(logdir=str(d))
-        self.eval_times = 0
-        self.save_model_with_input = save_model_with_input
-    def on_epoch_end(self, epoch, logs=None):
-        self.write.add_scalar('acc', step=epoch, value=logs['acc'])
-        self.write.flush()
-    def on_eval_end(self, logs=None):
-        self.eval_writer.add_scalar('acc', step=self.eval_times, value=logs['acc'])
-        self.eval_writer.flush()
-        self.eval_times += 1
-def __6_集成():
-    pass
-class XlModel(paddle.Model):
-    def __init__(self, network, **kwargs):
-        """
-        """
-        super(XlModel, self).__init__(network, **kwargs)
-        self.save_dir = None
-        self.train_data = None
-        self.eval_data = None
-        self.test_data = None
-        self.callbacks = []
-    def get_save_dir(self):
-        """
-        注意 self.save_dir、self.get_save_dir()各有用途
-            self.save_dir获取原始配置，可能是None，表示未设置，则在某些场合默认不输出文件
-            self.get_save_dir()，有些场合显示指定要输出文件了，则需要用这个接口获得一个明确的目录
-        """
-        if self.save_dir is None:
-            return XlPath('.')
-        else:
-            return self.save_dir
-    def set_save_dir(self, save_dir):
-        """
-        :param save_dir: 模型等保存的目录，有时候并不想保存模型，则可以不设
-            如果在未设置save_dir情况下，仍使用相关读写文件功能，默认在当前目录下处理
-        """
-        # 相关数据的保存路径
-        self.save_dir = XlPath(save_dir)
-        os.makedirs(self.save_dir, exist_ok=True)
-    def set_dataset(self, train_data=None, eval_data=None, test_data=None):
-        if train_data:
-            self.train_data = train_data
-            if isinstance(train_data, ImageClasDataset):
-                self.train_data.save_class_names(self.get_save_dir() / 'class_names.txt')  # 保存类别昵称文件
-        if eval_data:
-            self.eval_data = eval_data
-        if test_data:
-            self.test_data = test_data
-            # TODO 可以扩展一些能自动处理测试集的功能
-            #   不过考虑不同性质的任务，这个不太好封装，可能要分图像分类，目标检测的分类处理
-            #   但这样一来就等于重做一遍PaddleDet等框架了，不太必要
-    def try_load_params(self, relpath='final.pdparams'):
-        # TODO 怎么更好地resume训练？回复学习率等信息？虽然目前直接加载权重重新训练也没大碍。
-        pretrained_model = self.get_save_dir() / relpath
-        if pretrained_model.is_file():
-            self.network.load_dict(paddle.load(str(pretrained_model)))
-    def prepare_clas_task(self, optimizer=None, loss=None, metrics=None, amp_configs=None,
-                          use_visualdl=None):
-        """ 分类模型的一套默认的优化器、损失、测评配置
-        TODO 这套配置不一定是最泛用的，需要进行更多研究
-        :param use_visualdl: 是否使用visualdl
-            支持输入str类型，作为自定义路径名
-            否则每次实验，会自增一个编号，生成 e0001、e0002、e0003、...
-        """
-        from paddle.optimizer import Momentum
-        from paddle.regularizer import L2Decay
-        if optimizer is None:
-            optimizer = Momentum(learning_rate=0.01,
-                                 momentum=0.9,
-                                 weight_decay=L2Decay(1e-4),
-                                 parameters=self.network.parameters())
-        if loss is None:
-            loss = paddle.nn.CrossEntropyLoss()
-        if metrics is None:
-            metrics = ClasAccuracy(print_mode=2)  # 自定义可以用crosstab检查的精度类
-        self.prepare(optimizer, loss, metrics, amp_configs)
-        # 但有设置save_dir的时候，默认开启可视化
-        if use_visualdl is None and self.save_dir is not None:
-            use_visualdl = True
-        if use_visualdl:
-            p = self.save_dir or XlPath('.')
-            if not isinstance(use_visualdl, str):
-                num = max([int(re.search(r'\d+', x.stem).group())
-                           for x in p.glob_dirs()
-                           if re.match(r'e\d+_', x.stem)], default=0) + 1
-                use_visualdl = f'e{num:04}'
-            self.callbacks.append(VisualAcc(p / 'visualdl', use_visualdl))
-    def train(self,
-              epochs=1,
-              batch_size=1,
-              eval_freq=1000,  # 每多少次epoch进行精度验证，可以调大些，默认就是不验证了。反正目前机制也没有根据metric保存最优模型的操作。
-              log_freq=1000,  # 每轮epoch中，每多少step显示一次日志，可以调大些
-              save_freq=1000,  # 每多少次epoch保存模型。可以调大些，默认就只保存final了。
-              verbose=2,
-              drop_last=False,
-              shuffle=True,
-              num_workers=0,
-              callbacks=None,
-              accumulate_grad_batches=1,
-              num_iters=None,
-              ):
-        """ 对 paddle.Model.fit的封装
-        简化了上下游配置
-        修改了一些参数默认值，以更符合我实际使用中的情况
-        """
-        train_data = self.train_data
-        eval_data = self.eval_data
-        callbacks = callbacks or []
-        if self.callbacks:
-            callbacks += self.callbacks
-        super(XlModel, self).fit(train_data, eval_data, batch_size, epochs, eval_freq, log_freq,
-                                 self.save_dir, save_freq, verbose, drop_last, shuffle, num_workers,
-                                 callbacks, accumulate_grad_batches, num_iters)
-        # 判断最后是否要再做一次eval：有验证集 + 原本不是每次epoch都预测 + 正好最后次epochs结束是eval周期结束
-        # 此时paddle.Model.fit机制是恰好不会做eval的，这里做个补充
-        if eval_data and eval_freq != 1 and (epochs % eval_freq == 0):
-            self.evaluate(eval_data)
-        # TODO 要再写个metric测评？这个其实就是evaluate，不用重复写吧。
-    def save_static_network(self, *, data_shape=None):
-        """ 导出静态图部署模型 """
-        if data_shape is None:
-            data_shape = [1, 3, 256, 256]
-            # TODO 可以尝试从train_data、eval_data等获取尺寸
-        data = paddle.zeros(data_shape, dtype='float32')
-        infer_dir = self.get_save_dir() / 'infer/inference'
-        infer_dir.mkdir(parents=True, exist_ok=True)
-        paddle.jit.save(paddle.jit.to_static(self.network), infer_dir.as_posix(), [data])
-def __7_部署():
-    pass
-class ImageClasPredictor:
-    """ 图像分类框架的预测器 """
-    def __init__(self, model, *, transform=None, class_names=None):
-        self.model = model
-        self.transform = transform
-        # 如果输入该字段，会把下标id自动转为明文类名
-        self.class_names = class_names
-    @classmethod
-    def from_dynamic(cls, model, params_file=None, **kwargs):
-        """ 从动态图初始化 """
-        if params_file:
-            model.load_dict(paddle.load(params_file))
-        model.eval()
-        return cls(model, **kwargs)
-    @classmethod
-    def from_static(cls, pdmodel, pdiparams, **kwargs):
-        """ 从静态图初始化 """
-        # 创建配置对象，并根据需求配置
-        config = paddle_infer.Config(pdmodel, pdiparams)
-        device = paddle.get_device()
-        if device.startswith('gpu'):
-            config.enable_use_gpu(0, int(device.split(':')[1]))
-        # 根据Config创建预测对象
-        predictor = paddle_infer.create_predictor(config)
-        def model(x):
-            """ 静态图的使用流程会略麻烦一点
-            以及为了跟动态图的上下游衔接，需要统一格式
-                输入的tensor x 需要改成 np.array
-                输出的np.array 需要改成 tensor
-            TODO 关于这里动静态图部署的代码，可能有更好的组织形式，这个以后继续研究吧~~
-            """
-            # 获取输入的名称
-            input_names = predictor.get_input_names()
-            # 获取输入handle
-            x_handle = predictor.get_input_handle(input_names[0])
-            x_handle.copy_from_cpu(x.numpy())
-            # 运行预测引擎
-            predictor.run()
-            # 获得输出名称
-            output_names = predictor.get_output_names()
-            # 获得输出handle
-            output_handle = predictor.get_output_handle(output_names[0])
-            output_data = output_handle.copy_to_cpu()  # return numpy.ndarray
-            return paddle.Tensor(output_data)
-        return cls(model, **kwargs)
-    @classmethod
-    def from_modeldir(cls, root, *, dynamic_net=None, **kwargs):
-        """ 从特定的目录结构中初始化部署模型
-        使用固定的配置范式，我自己常用的训练目录结构
-        :param dynamic_net: 输入动态图模型类型，初始化动态图
-        注：使用这个接口初始化，在目录里必须要有个class_names.txt文件来确定类别数
-            否则请用更底层的from_dynamic、from_static精细配置
-        """
-        root = XlPath(root)
-        class_names_file = root / 'class_names.txt'
-        assert class_names_file.is_file(), f'{class_names_file} 必须要有类别昵称配置文件，才知道类别数'
-        class_names = class_names_file.read_text().splitlines()
-        if dynamic_net:
-            clas = ImageClasPredictor.from_dynamic(dynamic_net(num_classes=len(class_names)),
-                                                   str(root / 'final.pdparams'),
-                                                   class_names=class_names,
-                                                   **kwargs)
-        else:
-            clas = cls.from_static(str(root / 'infer/inference.pdmodel'),
-                                   str(root / 'infer/inference.pdiparams'),
-                                   class_names=class_names,
-                                   **kwargs)
-        return clas
-    def pred_batch(self, samples, batch_size=None, *, return_mode=0, print_mode=0):
-        """ 默认是进行批量识别，如果只识别单个，可以用pred
-        :param samples: 要识别的数据，支持类list的列表，或Dataset、DataLoader
-        :param return_mode: 返回值细粒度，0表示直接预测类别，1则是返回每个预测在各个类别的概率
-        :param print_mode: 0 静默运行，1 显示进度条
-        :param batch_size: 默认按把imgs整个作为一个批次前传，如果数据量很大，可以使用该参数切分batch
-        :return:
-        """
-        import paddle.nn.functional as F
-        if not batch_size: batch_size = len(samples)
-        data_loader = build_testdata_loader(samples, transform=self.transform, batch_size=batch_size)
-        logits = []
-        for inputs in tqdm(data_loader, desc='预测：', disable=not print_mode):
-            logits.append(self.model(inputs))
-            # if sys.version_info.minor >= 8:  # v0.1.62.2 paddlelib bug，w211202
-            #     break
-        logits = paddle.concat(logits, axis=0)
-        if return_mode == 0:
-            idx = logits.argmax(1).tolist()
-            if self.class_names:
-                idx = [self.class_names[x] for x in idx]
-            return idx
-        elif return_mode == 1:
-            prob = F.softmax(logits, axis=1).tolist()
-            for i, item in enumerate(prob):
-                prob[i] = [round(x, 4) for x in item]  # 保留4位小数就够了
-            return prob
-        else:
-            raise ValueError
-    def __call__(self, *args, **kwargs):
-        return self.pred_batch(*args, **kwargs)
-    def pred(self, img, *args, **kwargs):
-        return self.pred_batch([img], *args, **kwargs)[0]

pyxllib 0.3.96__py3-none-any.whl → 0.3.197__py3-none-any.whl

pyxllib 0.3.96py3-none-any.whl → 0.3.197py3-none-any.whl