PyPI - pyxllib - Versions diffs - 0.3.96__py3-none-any.whl → 0.3.200__py3-none-any.whl - Mend

pyxllib 0.3.96py3-none-any.whl → 0.3.200py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (358) hide show

pyxllib/__init__.py +21 -21
pyxllib/algo/__init__.py +8 -8
pyxllib/algo/disjoint.py +54 -54
pyxllib/algo/geo.py +541 -529
pyxllib/algo/intervals.py +964 -964
pyxllib/algo/matcher.py +389 -311
pyxllib/algo/newbie.py +166 -166
pyxllib/algo/pupil.py +629 -461
pyxllib/algo/shapelylib.py +67 -67
pyxllib/algo/specialist.py +241 -240
pyxllib/algo/stat.py +494 -458
pyxllib/algo/treelib.py +149 -149
pyxllib/algo/unitlib.py +66 -66
{pyxlpr → pyxllib/autogui}/__init__.py +5 -5
pyxllib/autogui/activewin.py +246 -0
pyxllib/autogui/all.py +9 -0
pyxllib/{ext/autogui → autogui}/autogui.py +852 -823
pyxllib/autogui/uiautolib.py +362 -0
pyxllib/{ext/autogui → autogui}/virtualkey.py +102 -102
pyxllib/autogui/wechat.py +827 -0
pyxllib/autogui/wechat_msg.py +421 -0
pyxllib/autogui/wxautolib.py +84 -0
pyxllib/cv/__init__.py +5 -5
pyxllib/cv/expert.py +267 -267
pyxllib/cv/imfile.py +159 -159
pyxllib/cv/imhash.py +39 -39
pyxllib/cv/pupil.py +9 -9
pyxllib/cv/rgbfmt.py +1525 -1525
pyxllib/cv/slidercaptcha.py +137 -0
pyxllib/cv/trackbartools.py +251 -251
pyxllib/cv/xlcvlib.py +1040 -1040
pyxllib/cv/xlpillib.py +423 -423
pyxllib/data/echarts.py +240 -129
pyxllib/data/jsonlib.py +89 -0
pyxllib/data/oss.py +72 -72
pyxllib/data/pglib.py +1127 -643
pyxllib/data/sqlite.py +568 -341
pyxllib/data/sqllib.py +297 -297
pyxllib/ext/JLineViewer.py +505 -492
pyxllib/ext/__init__.py +6 -6
pyxllib/ext/demolib.py +246 -246
pyxllib/ext/drissionlib.py +277 -0
pyxllib/ext/kq5034lib.py +12 -1606
pyxllib/ext/old.py +663 -663
pyxllib/ext/qt.py +449 -449
pyxllib/ext/robustprocfile.py +497 -0
pyxllib/ext/seleniumlib.py +76 -76
pyxllib/ext/tk.py +173 -173
pyxllib/ext/unixlib.py +827 -826
pyxllib/ext/utools.py +351 -338
pyxllib/ext/webhook.py +124 -101
pyxllib/ext/win32lib.py +40 -40
pyxllib/ext/wjxlib.py +88 -0
pyxllib/ext/wpsapi.py +124 -0
pyxllib/ext/xlwork.py +9 -0
pyxllib/ext/yuquelib.py +1105 -173
pyxllib/file/__init__.py +17 -17
pyxllib/file/docxlib.py +761 -761
pyxllib/file/gitlib.py +309 -309
pyxllib/file/libreoffice.py +165 -0
pyxllib/file/movielib.py +148 -139
pyxllib/file/newbie.py +10 -10
pyxllib/file/onenotelib.py +1469 -1469
pyxllib/file/packlib/__init__.py +330 -293
pyxllib/file/packlib/zipfile.py +2441 -2441
pyxllib/file/pdflib.py +426 -426
pyxllib/file/pupil.py +185 -185
pyxllib/file/specialist/__init__.py +685 -685
pyxllib/file/specialist/dirlib.py +799 -799
pyxllib/file/specialist/download.py +193 -186
pyxllib/file/specialist/filelib.py +2829 -2618
pyxllib/file/xlsxlib.py +3131 -2976
pyxllib/file/xlsyncfile.py +341 -0
pyxllib/prog/__init__.py +5 -5
pyxllib/prog/cachetools.py +64 -0
pyxllib/prog/deprecatedlib.py +233 -233
pyxllib/prog/filelock.py +42 -0
pyxllib/prog/ipyexec.py +253 -253
pyxllib/prog/multiprogs.py +940 -0
pyxllib/prog/newbie.py +451 -444
pyxllib/prog/pupil.py +1197 -1128
pyxllib/prog/sitepackages.py +33 -33
pyxllib/prog/specialist/__init__.py +391 -217
pyxllib/prog/specialist/bc.py +203 -200
pyxllib/prog/specialist/browser.py +497 -488
pyxllib/prog/specialist/common.py +347 -347
pyxllib/prog/specialist/datetime.py +199 -131
pyxllib/prog/specialist/tictoc.py +240 -241
pyxllib/prog/specialist/xllog.py +180 -180
pyxllib/prog/xlosenv.py +108 -101
pyxllib/stdlib/__init__.py +17 -17
pyxllib/stdlib/tablepyxl/__init__.py +10 -10
pyxllib/stdlib/tablepyxl/style.py +303 -303
pyxllib/stdlib/tablepyxl/tablepyxl.py +130 -130
pyxllib/text/__init__.py +8 -8
pyxllib/text/ahocorasick.py +39 -39
pyxllib/text/airscript.js +744 -0
pyxllib/text/charclasslib.py +121 -109
pyxllib/text/jiebalib.py +267 -264
pyxllib/text/jinjalib.py +32 -0
pyxllib/text/jsa_ai_prompt.md +271 -0
pyxllib/text/jscode.py +922 -767
pyxllib/text/latex/__init__.py +158 -158
pyxllib/text/levenshtein.py +303 -303
pyxllib/text/nestenv.py +1215 -1215
pyxllib/text/newbie.py +300 -288
pyxllib/text/pupil/__init__.py +8 -8
pyxllib/text/pupil/common.py +1121 -1095
pyxllib/text/pupil/xlalign.py +326 -326
pyxllib/text/pycode.py +47 -47
pyxllib/text/specialist/__init__.py +8 -8
pyxllib/text/specialist/common.py +112 -112
pyxllib/text/specialist/ptag.py +186 -186
pyxllib/text/spellchecker.py +172 -172
pyxllib/text/templates/echart_base.html +11 -0
pyxllib/text/templates/highlight_code.html +17 -0
pyxllib/text/templates/latex_editor.html +103 -0
pyxllib/text/vbacode.py +17 -17
pyxllib/text/xmllib.py +747 -685
pyxllib/xl.py +42 -38
pyxllib/xlcv.py +17 -17
pyxllib-0.3.200.dist-info/METADATA +48 -0
pyxllib-0.3.200.dist-info/RECORD +126 -0
{pyxllib-0.3.96.dist-info → pyxllib-0.3.200.dist-info}/WHEEL +1 -2
{pyxllib-0.3.96.dist-info → pyxllib-0.3.200.dist-info/licenses}/LICENSE +190 -190
pyxllib/ext/autogui/__init__.py +0 -8
pyxllib-0.3.96.dist-info/METADATA +0 -51
pyxllib-0.3.96.dist-info/RECORD +0 -333
pyxllib-0.3.96.dist-info/top_level.txt +0 -2
pyxlpr/ai/__init__.py +0 -5
pyxlpr/ai/clientlib.py +0 -1281
pyxlpr/ai/specialist.py +0 -286
pyxlpr/ai/torch_app.py +0 -172
pyxlpr/ai/xlpaddle.py +0 -655
pyxlpr/ai/xltorch.py +0 -705
pyxlpr/data/__init__.py +0 -11
pyxlpr/data/coco.py +0 -1325
pyxlpr/data/datacls.py +0 -365
pyxlpr/data/datasets.py +0 -200
pyxlpr/data/gptlib.py +0 -1291
pyxlpr/data/icdar/__init__.py +0 -96
pyxlpr/data/icdar/deteval.py +0 -377
pyxlpr/data/icdar/icdar2013.py +0 -341
pyxlpr/data/icdar/iou.py +0 -340
pyxlpr/data/icdar/rrc_evaluation_funcs_1_1.py +0 -463
pyxlpr/data/imtextline.py +0 -473
pyxlpr/data/labelme.py +0 -866
pyxlpr/data/removeline.py +0 -179
pyxlpr/data/specialist.py +0 -57
pyxlpr/eval/__init__.py +0 -85
pyxlpr/paddleocr.py +0 -776
pyxlpr/ppocr/__init__.py +0 -15
pyxlpr/ppocr/configs/rec/multi_language/generate_multi_language_configs.py +0 -226
pyxlpr/ppocr/data/__init__.py +0 -135
pyxlpr/ppocr/data/imaug/ColorJitter.py +0 -26
pyxlpr/ppocr/data/imaug/__init__.py +0 -67
pyxlpr/ppocr/data/imaug/copy_paste.py +0 -170
pyxlpr/ppocr/data/imaug/east_process.py +0 -437
pyxlpr/ppocr/data/imaug/gen_table_mask.py +0 -244
pyxlpr/ppocr/data/imaug/iaa_augment.py +0 -114
pyxlpr/ppocr/data/imaug/label_ops.py +0 -789
pyxlpr/ppocr/data/imaug/make_border_map.py +0 -184
pyxlpr/ppocr/data/imaug/make_pse_gt.py +0 -106
pyxlpr/ppocr/data/imaug/make_shrink_map.py +0 -126
pyxlpr/ppocr/data/imaug/operators.py +0 -433
pyxlpr/ppocr/data/imaug/pg_process.py +0 -906
pyxlpr/ppocr/data/imaug/randaugment.py +0 -143
pyxlpr/ppocr/data/imaug/random_crop_data.py +0 -239
pyxlpr/ppocr/data/imaug/rec_img_aug.py +0 -533
pyxlpr/ppocr/data/imaug/sast_process.py +0 -777
pyxlpr/ppocr/data/imaug/text_image_aug/__init__.py +0 -17
pyxlpr/ppocr/data/imaug/text_image_aug/augment.py +0 -120
pyxlpr/ppocr/data/imaug/text_image_aug/warp_mls.py +0 -168
pyxlpr/ppocr/data/lmdb_dataset.py +0 -115
pyxlpr/ppocr/data/pgnet_dataset.py +0 -104
pyxlpr/ppocr/data/pubtab_dataset.py +0 -107
pyxlpr/ppocr/data/simple_dataset.py +0 -372
pyxlpr/ppocr/losses/__init__.py +0 -61
pyxlpr/ppocr/losses/ace_loss.py +0 -52
pyxlpr/ppocr/losses/basic_loss.py +0 -135
pyxlpr/ppocr/losses/center_loss.py +0 -88
pyxlpr/ppocr/losses/cls_loss.py +0 -30
pyxlpr/ppocr/losses/combined_loss.py +0 -67
pyxlpr/ppocr/losses/det_basic_loss.py +0 -208
pyxlpr/ppocr/losses/det_db_loss.py +0 -80
pyxlpr/ppocr/losses/det_east_loss.py +0 -63
pyxlpr/ppocr/losses/det_pse_loss.py +0 -149
pyxlpr/ppocr/losses/det_sast_loss.py +0 -121
pyxlpr/ppocr/losses/distillation_loss.py +0 -272
pyxlpr/ppocr/losses/e2e_pg_loss.py +0 -140
pyxlpr/ppocr/losses/kie_sdmgr_loss.py +0 -113
pyxlpr/ppocr/losses/rec_aster_loss.py +0 -99
pyxlpr/ppocr/losses/rec_att_loss.py +0 -39
pyxlpr/ppocr/losses/rec_ctc_loss.py +0 -44
pyxlpr/ppocr/losses/rec_enhanced_ctc_loss.py +0 -70
pyxlpr/ppocr/losses/rec_nrtr_loss.py +0 -30
pyxlpr/ppocr/losses/rec_sar_loss.py +0 -28
pyxlpr/ppocr/losses/rec_srn_loss.py +0 -47
pyxlpr/ppocr/losses/table_att_loss.py +0 -109
pyxlpr/ppocr/metrics/__init__.py +0 -44
pyxlpr/ppocr/metrics/cls_metric.py +0 -45
pyxlpr/ppocr/metrics/det_metric.py +0 -82
pyxlpr/ppocr/metrics/distillation_metric.py +0 -73
pyxlpr/ppocr/metrics/e2e_metric.py +0 -86
pyxlpr/ppocr/metrics/eval_det_iou.py +0 -274
pyxlpr/ppocr/metrics/kie_metric.py +0 -70
pyxlpr/ppocr/metrics/rec_metric.py +0 -75
pyxlpr/ppocr/metrics/table_metric.py +0 -50
pyxlpr/ppocr/modeling/architectures/__init__.py +0 -32
pyxlpr/ppocr/modeling/architectures/base_model.py +0 -88
pyxlpr/ppocr/modeling/architectures/distillation_model.py +0 -60
pyxlpr/ppocr/modeling/backbones/__init__.py +0 -54
pyxlpr/ppocr/modeling/backbones/det_mobilenet_v3.py +0 -268
pyxlpr/ppocr/modeling/backbones/det_resnet_vd.py +0 -246
pyxlpr/ppocr/modeling/backbones/det_resnet_vd_sast.py +0 -285
pyxlpr/ppocr/modeling/backbones/e2e_resnet_vd_pg.py +0 -265
pyxlpr/ppocr/modeling/backbones/kie_unet_sdmgr.py +0 -186
pyxlpr/ppocr/modeling/backbones/rec_mobilenet_v3.py +0 -138
pyxlpr/ppocr/modeling/backbones/rec_mv1_enhance.py +0 -258
pyxlpr/ppocr/modeling/backbones/rec_nrtr_mtb.py +0 -48
pyxlpr/ppocr/modeling/backbones/rec_resnet_31.py +0 -210
pyxlpr/ppocr/modeling/backbones/rec_resnet_aster.py +0 -143
pyxlpr/ppocr/modeling/backbones/rec_resnet_fpn.py +0 -307
pyxlpr/ppocr/modeling/backbones/rec_resnet_vd.py +0 -286
pyxlpr/ppocr/modeling/heads/__init__.py +0 -54
pyxlpr/ppocr/modeling/heads/cls_head.py +0 -52
pyxlpr/ppocr/modeling/heads/det_db_head.py +0 -118
pyxlpr/ppocr/modeling/heads/det_east_head.py +0 -121
pyxlpr/ppocr/modeling/heads/det_pse_head.py +0 -37
pyxlpr/ppocr/modeling/heads/det_sast_head.py +0 -128
pyxlpr/ppocr/modeling/heads/e2e_pg_head.py +0 -253
pyxlpr/ppocr/modeling/heads/kie_sdmgr_head.py +0 -206
pyxlpr/ppocr/modeling/heads/multiheadAttention.py +0 -163
pyxlpr/ppocr/modeling/heads/rec_aster_head.py +0 -393
pyxlpr/ppocr/modeling/heads/rec_att_head.py +0 -202
pyxlpr/ppocr/modeling/heads/rec_ctc_head.py +0 -88
pyxlpr/ppocr/modeling/heads/rec_nrtr_head.py +0 -826
pyxlpr/ppocr/modeling/heads/rec_sar_head.py +0 -402
pyxlpr/ppocr/modeling/heads/rec_srn_head.py +0 -280
pyxlpr/ppocr/modeling/heads/self_attention.py +0 -406
pyxlpr/ppocr/modeling/heads/table_att_head.py +0 -246
pyxlpr/ppocr/modeling/necks/__init__.py +0 -32
pyxlpr/ppocr/modeling/necks/db_fpn.py +0 -111
pyxlpr/ppocr/modeling/necks/east_fpn.py +0 -188
pyxlpr/ppocr/modeling/necks/fpn.py +0 -138
pyxlpr/ppocr/modeling/necks/pg_fpn.py +0 -314
pyxlpr/ppocr/modeling/necks/rnn.py +0 -92
pyxlpr/ppocr/modeling/necks/sast_fpn.py +0 -284
pyxlpr/ppocr/modeling/necks/table_fpn.py +0 -110
pyxlpr/ppocr/modeling/transforms/__init__.py +0 -28
pyxlpr/ppocr/modeling/transforms/stn.py +0 -135
pyxlpr/ppocr/modeling/transforms/tps.py +0 -308
pyxlpr/ppocr/modeling/transforms/tps_spatial_transformer.py +0 -156
pyxlpr/ppocr/optimizer/__init__.py +0 -61
pyxlpr/ppocr/optimizer/learning_rate.py +0 -228
pyxlpr/ppocr/optimizer/lr_scheduler.py +0 -49
pyxlpr/ppocr/optimizer/optimizer.py +0 -160
pyxlpr/ppocr/optimizer/regularizer.py +0 -52
pyxlpr/ppocr/postprocess/__init__.py +0 -55
pyxlpr/ppocr/postprocess/cls_postprocess.py +0 -33
pyxlpr/ppocr/postprocess/db_postprocess.py +0 -234
pyxlpr/ppocr/postprocess/east_postprocess.py +0 -143
pyxlpr/ppocr/postprocess/locality_aware_nms.py +0 -200
pyxlpr/ppocr/postprocess/pg_postprocess.py +0 -52
pyxlpr/ppocr/postprocess/pse_postprocess/__init__.py +0 -15
pyxlpr/ppocr/postprocess/pse_postprocess/pse/__init__.py +0 -29
pyxlpr/ppocr/postprocess/pse_postprocess/pse/setup.py +0 -14
pyxlpr/ppocr/postprocess/pse_postprocess/pse_postprocess.py +0 -118
pyxlpr/ppocr/postprocess/rec_postprocess.py +0 -654
pyxlpr/ppocr/postprocess/sast_postprocess.py +0 -355
pyxlpr/ppocr/tools/__init__.py +0 -14
pyxlpr/ppocr/tools/eval.py +0 -83
pyxlpr/ppocr/tools/export_center.py +0 -77
pyxlpr/ppocr/tools/export_model.py +0 -129
pyxlpr/ppocr/tools/infer/predict_cls.py +0 -151
pyxlpr/ppocr/tools/infer/predict_det.py +0 -300
pyxlpr/ppocr/tools/infer/predict_e2e.py +0 -169
pyxlpr/ppocr/tools/infer/predict_rec.py +0 -414
pyxlpr/ppocr/tools/infer/predict_system.py +0 -204
pyxlpr/ppocr/tools/infer/utility.py +0 -629
pyxlpr/ppocr/tools/infer_cls.py +0 -83
pyxlpr/ppocr/tools/infer_det.py +0 -134
pyxlpr/ppocr/tools/infer_e2e.py +0 -122
pyxlpr/ppocr/tools/infer_kie.py +0 -153
pyxlpr/ppocr/tools/infer_rec.py +0 -146
pyxlpr/ppocr/tools/infer_table.py +0 -107
pyxlpr/ppocr/tools/program.py +0 -596
pyxlpr/ppocr/tools/test_hubserving.py +0 -117
pyxlpr/ppocr/tools/train.py +0 -163
pyxlpr/ppocr/tools/xlprog.py +0 -748
pyxlpr/ppocr/utils/EN_symbol_dict.txt +0 -94
pyxlpr/ppocr/utils/__init__.py +0 -24
pyxlpr/ppocr/utils/dict/ar_dict.txt +0 -117
pyxlpr/ppocr/utils/dict/arabic_dict.txt +0 -162
pyxlpr/ppocr/utils/dict/be_dict.txt +0 -145
pyxlpr/ppocr/utils/dict/bg_dict.txt +0 -140
pyxlpr/ppocr/utils/dict/chinese_cht_dict.txt +0 -8421
pyxlpr/ppocr/utils/dict/cyrillic_dict.txt +0 -163
pyxlpr/ppocr/utils/dict/devanagari_dict.txt +0 -167
pyxlpr/ppocr/utils/dict/en_dict.txt +0 -63
pyxlpr/ppocr/utils/dict/fa_dict.txt +0 -136
pyxlpr/ppocr/utils/dict/french_dict.txt +0 -136
pyxlpr/ppocr/utils/dict/german_dict.txt +0 -143
pyxlpr/ppocr/utils/dict/hi_dict.txt +0 -162
pyxlpr/ppocr/utils/dict/it_dict.txt +0 -118
pyxlpr/ppocr/utils/dict/japan_dict.txt +0 -4399
pyxlpr/ppocr/utils/dict/ka_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/korean_dict.txt +0 -3688
pyxlpr/ppocr/utils/dict/latin_dict.txt +0 -185
pyxlpr/ppocr/utils/dict/mr_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/ne_dict.txt +0 -153
pyxlpr/ppocr/utils/dict/oc_dict.txt +0 -96
pyxlpr/ppocr/utils/dict/pu_dict.txt +0 -130
pyxlpr/ppocr/utils/dict/rs_dict.txt +0 -91
pyxlpr/ppocr/utils/dict/rsc_dict.txt +0 -134
pyxlpr/ppocr/utils/dict/ru_dict.txt +0 -125
pyxlpr/ppocr/utils/dict/ta_dict.txt +0 -128
pyxlpr/ppocr/utils/dict/table_dict.txt +0 -277
pyxlpr/ppocr/utils/dict/table_structure_dict.txt +0 -2759
pyxlpr/ppocr/utils/dict/te_dict.txt +0 -151
pyxlpr/ppocr/utils/dict/ug_dict.txt +0 -114
pyxlpr/ppocr/utils/dict/uk_dict.txt +0 -142
pyxlpr/ppocr/utils/dict/ur_dict.txt +0 -137
pyxlpr/ppocr/utils/dict/xi_dict.txt +0 -110
pyxlpr/ppocr/utils/dict90.txt +0 -90
pyxlpr/ppocr/utils/e2e_metric/Deteval.py +0 -574
pyxlpr/ppocr/utils/e2e_metric/polygon_fast.py +0 -83
pyxlpr/ppocr/utils/e2e_utils/extract_batchsize.py +0 -87
pyxlpr/ppocr/utils/e2e_utils/extract_textpoint_fast.py +0 -457
pyxlpr/ppocr/utils/e2e_utils/extract_textpoint_slow.py +0 -592
pyxlpr/ppocr/utils/e2e_utils/pgnet_pp_utils.py +0 -162
pyxlpr/ppocr/utils/e2e_utils/visual.py +0 -162
pyxlpr/ppocr/utils/en_dict.txt +0 -95
pyxlpr/ppocr/utils/gen_label.py +0 -81
pyxlpr/ppocr/utils/ic15_dict.txt +0 -36
pyxlpr/ppocr/utils/iou.py +0 -54
pyxlpr/ppocr/utils/logging.py +0 -69
pyxlpr/ppocr/utils/network.py +0 -84
pyxlpr/ppocr/utils/ppocr_keys_v1.txt +0 -6623
pyxlpr/ppocr/utils/profiler.py +0 -110
pyxlpr/ppocr/utils/save_load.py +0 -150
pyxlpr/ppocr/utils/stats.py +0 -72
pyxlpr/ppocr/utils/utility.py +0 -80
pyxlpr/ppstructure/__init__.py +0 -13
pyxlpr/ppstructure/predict_system.py +0 -187
pyxlpr/ppstructure/table/__init__.py +0 -13
pyxlpr/ppstructure/table/eval_table.py +0 -72
pyxlpr/ppstructure/table/matcher.py +0 -192
pyxlpr/ppstructure/table/predict_structure.py +0 -136
pyxlpr/ppstructure/table/predict_table.py +0 -221
pyxlpr/ppstructure/table/table_metric/__init__.py +0 -16
pyxlpr/ppstructure/table/table_metric/parallel.py +0 -51
pyxlpr/ppstructure/table/table_metric/table_metric.py +0 -247
pyxlpr/ppstructure/table/tablepyxl/__init__.py +0 -13
pyxlpr/ppstructure/table/tablepyxl/style.py +0 -283
pyxlpr/ppstructure/table/tablepyxl/tablepyxl.py +0 -118
pyxlpr/ppstructure/utility.py +0 -71
pyxlpr/xlai.py +0 -10

pyxllib/algo/pupil.py CHANGED Viewed

@@ -1,461 +1,629 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-# @Author : 陈坤泽
-# @Email  : 877362867@qq.com
-# @Date   : 2021/06/03 14:22
-import textwrap
-from collections import defaultdict, Counter
-import math
-import re
-import sys
-from pyxllib.prog.newbie import typename, human_readable_number
-from pyxllib.text.pupil import listalign, int2myalphaenum
-def natural_sort_key(key):
-    """
-    >>> natural_sort_key('0.0.43') < natural_sort_key('0.0.43.1')
-    True
-    >>> natural_sort_key('0.0.2') < natural_sort_key('0.0.12')
-    True
-    """
-    def convert(text):
-        return int(text) if text.isdigit() else text.lower()
-    return [convert(c) for c in re.split('([0-9]+)', str(key))]
-def natural_sort(ls, only_use_digits=False):
-    """ 自然排序
-    :param only_use_digits: 正常会用数字作为分隔，切割每一部分进行比较
-        如果只想比较数值部分，可以only_use_digits=True
-    >>> natural_sort(['0.1.12', '0.0.10', '0.0.23'])
-    ['0.0.10', '0.0.23', '0.1.12']
-    """
-    if only_use_digits:
-        def func(key):
-            return [int(c) for c in re.split('([0-9]+)', str(key)) if c.isdigit()]
-    else:
-        func = natural_sort_key
-    return sorted(ls, key=func)
-def argsort(seq):
-    # http://stackoverflow.com/questions/3071415/efficient-method-to-calculate-the-rank-vector-of-a-list-in-python
-    return sorted(range(len(seq)), key=seq.__getitem__)
-def make_index_function(li, *, start=0, nan=None):
-    """ 返回一个函数，输入值，返回对应下标，找不到时返回 not_found
-    :param li: 列表数据
-    :param start: 起始下标
-    :param nan: 找不到对应元素时的返回值
-        注意这里找不到默认不是-1，而是li的长度，这样用于排序时，找不到的默认会排在尾巴
-    >>> func = make_index_function(['少儿', '小学', '初中', '高中'])
-    >>> sorted(['初中', '小学', '高中'], key=func)
-    ['小学', '初中', '高中']
-    # 不在枚举项目里的，会统一列在最后面
-    >>> sorted(['初中', '小学', '高中', '幼儿'], key=func)
-    ['小学', '初中', '高中', '幼儿']
-    """
-    data = {x: i for i, x in enumerate(li, start=start)}
-    if nan is None:
-        nan = len(li)
-    def warpper(x, default=None):
-        if default is None:
-            default = nan
-        return data.get(x, default)
-    return warpper
-class ValuesStat:
-    """ 一串数值的相关统计分析 """
-    def __init__(self, values):
-        from statistics import pstdev, mean
-        self.values = values
-        self.n = len(values)
-        self.sum = sum(values)
-        if self.n:
-            self.mean = mean(self.values)
-            self.std = pstdev(self.values)
-            self.min, self.max = min(values), max(values)
-        else:
-            self.mean = self.std = self.min = self.max = float('nan')
-    def __len__(self):
-        return self.n
-    def summary(self, valfmt=lambda x: human_readable_number(x, '万', 4)):
-        """ 输出性能分析报告，data是每次运行得到的时间数组
-        :param valfmt: 数值显示的格式
-            g是比较智能的一种模式
-            也可以用 '.3f'表示保留3位小数
-            可以是一个函数，该函数接收一个数值作为输入，返回格式化后的字符串
-            注意可以写None表示删除特定位的显示
-            也可以传入长度5的格式清单，表示 [和、均值、标准差、最小值、最大值] 一次展示的格式
-        """
-        if isinstance(valfmt, str) or callable(valfmt):
-            valfmt = [valfmt] * 6
-        if len(valfmt) == 5:  # 兼容旧版格式化，默认是不填充"总数"的格式化的
-            valfmt = [lambda x: x] + valfmt
-        assert len(valfmt) == 6, f'valfmt长度必须是6，现在是{len(valfmt)}'
-        ls = []
-        def format_value(value, fmt_id):
-            """ 根据指定的格式来格式化值 """
-            format_spec = valfmt[fmt_id]
-            if format_spec is None:
-                return ''
-            if callable(format_spec):
-                return format_spec(value)
-            else:
-                return f"{value:{format_spec}}"
-        if self.n > 1:
-            ls.append(f'总数: {format_value(self.n, 0)}')  # 注意输出其实完整是6个值，还有个总数不用控制格式
-            if valfmt[1]:
-                ls.append(f'总和: {format_value(self.sum, 1)}')
-            if valfmt[2] or valfmt[3]:
-                mean_str = format_value(self.mean, 2)
-                std_str = format_value(self.std, 3)
-                if mean_str and std_str:
-                    ls.append(f'均值标准差: {mean_str}±{std_str}')
-                elif mean_str:
-                    ls.append(f'均值: {mean_str}')
-                elif std_str:
-                    ls.append(f'标准差: {std_str}')
-            if valfmt[4]:
-                ls.append(f'最小值: {format_value(self.min, 4)}')
-            if valfmt[5]:
-                ls.append(f'最大值: {format_value(self.max, 5)}')
-            return '\t'.join(ls)
-        elif self.n == 1:
-            return format_value(self.sum, 1)
-        else:
-            raise ValueError("无效的数据数量")
-class Groups:
-    def __init__(self, data):
-        """ 分组
-        :param data: 输入字典结构直接赋值
-            或者其他结构，会自动按相同项聚合
-        TODO 显示一些数值统计信息，甚至图表
-        TODO 转文本表达，方便bc比较
-        """
-        if not isinstance(data, dict):
-            new_data = dict()
-            # 否要要转字典类型，自动从1~n编组
-            for k, v in enumerate(data, start=1):
-                new_data[k] = v
-            data = new_data
-        self.data = data  # 字典存原数据
-        self.ctr = Counter({k: len(x) for k, x in self.data.items()})  # 计数
-        self.stat = ValuesStat(self.ctr.values())  # 综合统计数据
-    def __repr__(self):
-        ls = []
-        for i, (k, v) in enumerate(self.data.items(), start=1):
-            ls.append(f'{i}, {k}：{v}')
-        return '\n'.join(ls)
-    @classmethod
-    def groupby(cls, ls, key, ykey=None):
-        """
-        :param ls: 可迭代等数组类型
-        :param key: 映射规则，ls中每个元素都会被归到映射的key组上
-            Callable[Any, 不可变类型]
-            None，未输入时，默认输入的ls已经是分好组的数据
-        :param ykey: 是否对分组后存储的内容y，也做一个函数映射
-        :return: dict
-        """
-        data = defaultdict(list)
-        for x in ls:
-            k = key(x)
-            if ykey:
-                x = ykey(x)
-            data[k].append(x)
-        return cls(data)
-def intersection_split(a, b):
-    """ 输入两个对象a,b，可以是dict或set类型，list等
-    会分析出二者共有的元素值关系
-    返回值是 ls1, ls2, ls3, ls4，大部分是list类型，但也有可能遵循原始情况是set类型
-        ls1：a中，与b共有key的元素值
-        ls2：a中，独有key的元素值
-        ls3：b中，与a共有key的元素值
-        ls4：b中，独有key的元素值
-    """
-    # 1 获得集合的key关系
-    keys1 = set(a)
-    keys2 = set(b)
-    keys0 = keys1 & keys2  # 两个集合共有的元素
-    # TODO 如果是字典，希望能保序
-    # 2 组合出ls1、ls2、ls3、ls4
-    def split(t, s, ks):
-        """原始元素为t，集合化的值为s，共有key是ks"""
-        if isinstance(t, (set, list, tuple)):
-            return ks, s - ks
-        elif isinstance(t, dict):
-            ls1 = sorted(map(lambda x: (x, t[x]), ks), key=lambda x: natural_sort_key(x[0]))
-            ls2 = sorted(map(lambda x: (x, t[x]), s - ks), key=lambda x: natural_sort_key(x[0]))
-            return ls1, ls2
-        else:
-            # dprint(type(s))  # s不是可以用来进行集合规律分析的类型
-            raise ValueError(f'{type(s)}不是可以用来进行集合规律分析的类型')
-    ls1, ls2 = split(a, keys1, keys0)
-    ls3, ls4 = split(b, keys2, keys0)
-    return ls1, ls2, ls3, ls4
-def matchpairs(xs, ys, cmp_func, least_score=sys.float_info.epsilon, *,
-               key=None, index=False):
-    r""" 匹配两组数据
-    :param xs: 第一组数据
-    :param ys: 第二组数据
-    :param cmp_func: 所用的比较函数，值越大表示两个对象相似度越高
-    :param least_score: 允许匹配的最低分，默认必须要大于0
-    :param key: 是否需要对xs, ys进行映射后再传入 cmp_func 操作
-    :param index: 返回的不是原值，而是下标
-    :return: 返回结构[(x1, y1, score1), (x2, y2, score2), ...]，注意长度肯定不会超过min(len(xs), len(ys))
-    注意：这里的功能①不支持重复匹配，②任何一个x,y都有可能没有匹配到
-        如果每个x必须都要有一个匹配，或者支持重复配对，请到隔壁使用 MatchPairs
-    TODO 这里很多中间步骤结果都是很有分析价值的，能改成类，然后支持分析中间结果？
-    TODO 这样全量两两比较是很耗性能的，可以加个参数草算，不用精确计算的功能？
-    >>> xs, ys = [4, 6, 1, 2, 9, 4, 5], [1, 5, 8, 9, 2]
-    >>> cmp_func = lambda x,y: 1-abs(x-y)/max(x,y)
-    >>> matchpairs(xs, ys, cmp_func)
-    [(1, 1, 1.0), (2, 2, 1.0), (9, 9, 1.0), (5, 5, 1.0), (6, 8, 0.75)]
-    >>> matchpairs(ys, xs, cmp_func)
-    [(1, 1, 1.0), (5, 5, 1.0), (9, 9, 1.0), (2, 2, 1.0), (8, 6, 0.75)]
-    >>> matchpairs(xs, ys, cmp_func, 0.9)
-    [(1, 1, 1.0), (2, 2, 1.0), (9, 9, 1.0), (5, 5, 1.0)]
-    >>> matchpairs(xs, ys, cmp_func, 0.9, index=True)
-    [(2, 0, 1.0), (3, 4, 1.0), (4, 3, 1.0), (6, 1, 1.0)]
-    """
-    # 0 实际计算使用的是 xs_, ys_
-    if key:
-        xs_ = [key(x) for x in xs]
-        ys_ = [key(y) for y in ys]
-    else:
-        xs_, ys_ = xs, ys
-    # 1 计算所有两两相似度
-    n, m = len(xs), len(ys)
-    all_pairs = []
-    for i in range(n):
-        for j in range(m):
-            score = cmp_func(xs_[i], ys_[j])
-            if score >= least_score:
-                all_pairs.append([i, j, score])
-    # 按分数权重排序，如果分数有很多相似并列，就只能按先来后到排序啦
-    all_pairs = sorted(all_pairs, key=lambda v: (-v[2], v[0], v[1]))
-    # 2 过滤出最终结果
-    pairs = []
-    x_used, y_used = set(), set()
-    for p in all_pairs:
-        i, j, score = p
-        if i not in x_used and j not in y_used:
-            if index:
-                pairs.append((i, j, score))
-            else:
-                pairs.append((xs[i], ys[j], score))
-            x_used.add(i)
-            y_used.add(j)
-    return pairs
-def get_number_width(n):
-    """ 判断数值n的长度
-    >>> get_number_width(0)
-    Traceback (most recent call last):
-    AssertionError
-    >>> get_number_width(9)
-    1
-    >>> get_number_width(10)
-    2
-    >>> get_number_width(97)
-    2
-    """
-    assert n > 0
-    return math.ceil(math.log10(n + 1))
-class SearchBase:
-    """ 一个dfs、bfs模板类 """
-    def __init__(self, root):
-        """
-        Args:
-            root: 根节点
-        """
-        self.root = root
-    def get_neighbors(self, node):
-        """ 获得邻接节点，必须要用yield实现，方便同时支持dfs、bfs的使用
-        对于树结构而言，相当于获取直接子结点
-        这里默认是bs4中Tag规则；不同业务需求，可以重定义该函数
-        例如对图结构、board类型，可以在self存储图访问状态，在这里实现遍历四周的功能
-        """
-        try:
-            for node in node.children:
-                yield node
-        except AttributeError:
-            pass
-    def dfs_nodes(self, node=None, depth=0):
-        """ 返回深度优先搜索得到的结点清单
-        :param node: 起始结点，默认是root根节点
-        :param depth: 当前node深度
-        :return: list，[(node1, depth1), (node2, depth2), ...]
-        """
-        if not node:
-            node = self.root
-        ls = [(node, depth)]
-        for t in self.get_neighbors(node):
-            ls += self.dfs_nodes(t, depth + 1)
-        return ls
-    def bfs_nodes(self, node=None, depth=0):
-        if not node:
-            node = self.root
-        ls = [(node, depth)]
-        i = 0
-        while i < len(ls):
-            x, d = ls[i]
-            nodes = self.get_neighbors(x)
-            ls += [(t, d + 1) for t in nodes]
-            i += 1
-        return ls
-    def fmt_node(self, node, depth, *, prefix='    ', show_node_type=False):
-        """ node格式化显示 """
-        s1 = prefix * depth
-        s2 = typename(node) + '，' if show_node_type else ''
-        s3 = textwrap.shorten(str(node), 200)
-        return s1 + s2 + s3
-    def fmt_nodes(self, *, nodes=None, select_depth=None, linenum=False,
-                  msghead=True, show_node_type=False, prefix='    '):
-        """ 结点清单格式化输出
-        :param nodes: 默认用dfs获得结点，也可以手动指定结点
-        :param prefix: 缩进格式，默认用4个空格
-        :param select_depth: 要显示的深度
-            单个数字：获得指定层
-            Sequences： 两个整数，取出这个闭区间内的层级内容
-        :param linenum：节点从1开始编号
-            行号后面，默认会跟一个类似Excel列名的字母，表示层级深度
-        :param msghead: 第1行输出一些统计信息
-        :param show_node_type:
-        Requires
-            textwrap：用到shorten
-            align.listalign：生成列编号时对齐
-        """
-        # 1 生成结点清单
-        ls = nodes if nodes else self.dfs_nodes()
-        total_node = len(ls)
-        total_depth = max(map(lambda x: x[1], ls))
-        head = f'总节点数：1~{total_node}，总深度：0~{total_depth}'
-        # 2 过滤与重新整理ls（select_depth）
-        logo = True
-        cnt = 0
-        tree_num = 0
-        if isinstance(select_depth, int):
-            for i in range(total_node):
-                if ls[i][1] == select_depth:
-                    ls[i][1] = 0
-                    cnt += 1
-                    logo = True
-                elif ls[i][1] < select_depth and logo:  # 遇到第1个父节点添加一个空行
-                    ls[i] = ''
-                    tree_num += 1
-                    logo = False
-                else:  # 删除该节点，不做任何显示
-                    ls[i] = None
-            head += f'；挑选出的节点数：{cnt}，所选深度：{select_depth}，树数量：{tree_num}'
-        elif hasattr(select_depth, '__getitem__'):
-            for i in range(total_node):
-                if select_depth[0] <= ls[i][1] <= select_depth[1]:
-                    ls[i][1] -= select_depth[0]
-                    cnt += 1
-                    logo = True
-                elif ls[i][1] < select_depth[0] and logo:  # 遇到第1个父节点添加一个空行
-                    ls[i] = ''
-                    tree_num += 1
-                    logo = False
-                else:  # 删除该节点，不做任何显示
-                    ls[i] = None
-            head += f'；挑选出的节点数：{cnt}，所选深度：{select_depth[0]}~{select_depth[1]}，树数量：{tree_num}'
-        """注意此时ls[i]的状态，有3种类型
-            (node, depth)：tuple类型，第0个元素是node对象，第1个元素是该元素所处层级
-            None：已删除元素，但为了后续编号方便，没有真正的移出，而是用None作为标记
-            ''：已删除元素，但这里涉及父节点的删除，建议此处留一个空行
-        """
-        # 3 格式处理
-        def mystr(item):
-            return self.fmt_node(item[0], item[1], prefix=prefix, show_node_type=show_node_type)
-        line_num = listalign(range(1, total_node + 1))
-        res = []
-        for i in range(total_node):
-            if ls[i] is not None:
-                if isinstance(ls[i], str):  # 已经指定该行要显示什么
-                    res.append(ls[i])
-                else:
-                    if linenum:  # 增加了一个能显示层级的int2excel_col_name
-                        res.append(line_num[i] + int2myalphaenum(ls[i][1]) + ' ' + mystr(ls[i]))
-                    else:
-                        res.append(mystr(ls[i]))
-        s = '\n'.join(res)
-        # 是否要添加信息头
-        if msghead:
-            s = head + '\n' + s
-        return s
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+# @Author : 陈坤泽
+# @Email  : 877362867@qq.com
+# @Date   : 2021/06/03 14:22
+from bisect import bisect_right
+from collections import defaultdict, Counter
+import datetime
+import re
+from statistics import quantiles
+import sys
+import textwrap
+from pyxllib.prog.newbie import typename, human_readable_number
+from pyxllib.text.pupil import listalign, int2myalphaenum
+def natural_sort_key(key):
+    """
+    >>> natural_sort_key('0.0.43') < natural_sort_key('0.0.43.1')
+    True
+    >>> natural_sort_key('0.0.2') < natural_sort_key('0.0.12')
+    True
+    """
+    def convert(text):
+        return int(text) if text.isdigit() else text.lower()
+    return [convert(c) for c in re.split('([0-9]+)', str(key))]
+def natural_sort(ls, only_use_digits=False):
+    """ 自然排序
+    :param only_use_digits: 正常会用数字作为分隔，切割每一部分进行比较
+        如果只想比较数值部分，可以only_use_digits=True
+    >>> natural_sort(['0.1.12', '0.0.10', '0.0.23'])
+    ['0.0.10', '0.0.23', '0.1.12']
+    """
+    if only_use_digits:
+        def func(key):
+            return [int(c) for c in re.split('([0-9]+)', str(key)) if c.isdigit()]
+    else:
+        func = natural_sort_key
+    return sorted(ls, key=func)
+def argsort(seq):
+    # http://stackoverflow.com/questions/3071415/efficient-method-to-calculate-the-rank-vector-of-a-list-in-python
+    return sorted(range(len(seq)), key=seq.__getitem__)
+def make_index_function(li, *, start=0, nan=None):
+    """ 返回一个函数，输入值，返回对应下标，找不到时返回 not_found
+    :param li: 列表数据
+    :param start: 起始下标
+    :param nan: 找不到对应元素时的返回值
+        注意这里找不到默认不是-1，而是li的长度，这样用于排序时，找不到的默认会排在尾巴
+    >>> func = make_index_function(['少儿', '小学', '初中', '高中'])
+    >>> sorted(['初中', '小学', '高中'], key=func)
+    ['小学', '初中', '高中']
+    # 不在枚举项目里的，会统一列在最后面
+    >>> sorted(['初中', '小学', '高中', '幼儿'], key=func)
+    ['小学', '初中', '高中', '幼儿']
+    """
+    data = {x: i for i, x in enumerate(li, start=start)}
+    if nan is None:
+        nan = len(li)
+    def warpper(x, default=None):
+        if default is None:
+            default = nan
+        return data.get(x, default)
+    return warpper
+class ValuesStat:
+    """ 一串数值的相关统计分析 """
+    def __init__(self, values):
+        from statistics import pstdev, mean
+        self.values = values
+        self.n = len(values)
+        self.sum = sum(values)
+        if self.n:
+            self.mean = mean(self.values)
+            self.std = pstdev(self.values)
+            self.min, self.max = min(values), max(values)
+        else:
+            self.mean = self.std = self.min = self.max = float('nan')
+    def __len__(self):
+        return self.n
+    def summary(self, valfmt=lambda x: human_readable_number(x, '万', 4)):
+        """ 输出性能分析报告，data是每次运行得到的时间数组
+        :param valfmt: 数值显示的格式
+            g是比较智能的一种模式
+            也可以用 '.3f'表示保留3位小数
+            可以是一个函数，该函数接收一个数值作为输入，返回格式化后的字符串
+            注意可以写None表示删除特定位的显示
+            也可以传入长度5的格式清单，表示 [和、均值、标准差、最小值、最大值] 一次展示的格式
+        """
+        if isinstance(valfmt, str) or callable(valfmt):
+            valfmt = [valfmt] * 6
+        if len(valfmt) == 5:  # 兼容旧版格式化，默认是不填充"总数"的格式化的
+            valfmt = [lambda x: x] + valfmt
+        assert len(valfmt) == 6, f'valfmt长度必须是6，现在是{len(valfmt)}'
+        ls = []
+        def format_value(value, fmt_id):
+            """ 根据指定的格式来格式化值 """
+            format_spec = valfmt[fmt_id]
+            if format_spec is None:
+                return ''
+            if callable(format_spec):
+                return format_spec(value)
+            else:
+                return f"{value:{format_spec}}"
+        if self.n > 1:
+            ls.append(f'总数: {format_value(self.n, 0)}')  # 注意输出其实完整是6个值，还有个总数不用控制格式
+            if valfmt[1]:
+                ls.append(f'总和: {format_value(self.sum, 1)}')
+            if valfmt[2] or valfmt[3]:
+                mean_str = format_value(self.mean, 2)
+                std_str = format_value(self.std, 3)
+                if mean_str and std_str:
+                    ls.append(f'均值标准差: {mean_str}±{std_str}')
+                elif mean_str:
+                    ls.append(f'均值: {mean_str}')
+                elif std_str:
+                    ls.append(f'标准差: {std_str}')
+            if valfmt[4]:
+                ls.append(f'最小值: {format_value(self.min, 4)}')
+            if valfmt[5]:
+                ls.append(f'最大值: {format_value(self.max, 5)}')
+            return '\t'.join(ls)
+        elif self.n == 1:
+            return format_value(self.sum, 1)
+        else:
+            raise ValueError("无效的数据数量")
+class ValuesStat2:
+    """ 240509周四17:33，第2代统计器
+    240628周五14:05 todo 关于各种特殊格式数据，怎么计算是个问题
+        这问题可能有些复杂，近期估计没空折腾，留以后有空折腾的一个大坑了
+    """
+    def __init__(self, values=None, raw_values=None, data_type=None):
+        from statistics import pstdev, mean
+        # 支持输入可能带有非数值类型的raw_values
+        data_type = data_type or ''
+        if raw_values:
+            if 'timestamp' in data_type:
+                values = [x.timestamp() for x in raw_values if hasattr(x, 'timestamp')]
+            else:
+                values = [x for x in raw_values if isinstance(x, (int, float))]  # todo 可能需要更泛用的判断数值的方法
+        self.date_type = data_type
+        self.raw_values = raw_values
+        values = values or []
+        self.values = sorted(values)
+        if self.raw_values:
+            self.raw_n = len(self.raw_values)
+        else:
+            self.raw_n = 0
+        self.n = len(values)
+        if 'timestamp' in data_type:
+            self.sum = None
+        else:
+            self.sum = sum(values)
+        if self.n:
+            self.mean = mean(self.values)
+            self.std = pstdev(self.values)
+            self.min, self.max = self.values[0], self.values[-1]
+        else:
+            self.mean = self.std = self.min = self.max = None
+        self.dist = None
+    def __len__(self):
+        return self.n
+    def _summary(self, unit=None, precision=4, percentile_count=5):
+        """ 返回字典结构的总结 """
+        """ 文本汇总性的报告
+        :param percentile_count: 包括两个极值端点的切分点数，
+            设置2，就是不设置分位数，就是只展示最小、最大值
+            如果设置了3，就表示"中位数、二分位数"，在展示的时候，会显示50%位置的分位数值
+            如果设置了5，就相当于"四分位数"，会显示25%、50%、75%位置的分位数值
+        :param unit: 展示数值时使用的单位
+        :param precision: 展示数值时的精度
+        """
+        # 1 各种细分的格式化方法
+        def fmt0(v):
+            # 数量类整数的格式
+            return human_readable_number(v, '万')
+        def fmt1(v):
+            if isinstance(v, str):
+                return v
+            return human_readable_number(v, unit or 'K', precision)
+        def fmt2(v):
+            # 日期类数据的格式化
+            # todo 这个应该数据的具体格式来设置的，但是这个现在有点难写，先写死
+            if isinstance(v, str):
+                return v
+            elif isinstance(v, (int, float)):
+                v = datetime.datetime.fromtimestamp(v)
+            return v.strftime(unit or '%Y-%m-%d %H:%M:%S')
+        def fmt2b(v):
+            # 时间长度类数据的格式化
+            return human_readable_number(v, '秒')
+        if 'timestamp' in self.date_type:
+            fmt = fmt2
+            fmtb = fmt2b
+        else:
+            fmt = fmtb = fmt1
+        # 2 生成统计报告
+        desc = {}
+        if self.raw_n and self.raw_n > self.n:
+            desc["总数"] = f"{fmt0(self.n)}/{fmt0(self.raw_n)}≈{self.n / self.raw_n:.2%}"
+        else:
+            desc["总数"] = f"{fmt0(self.n)}"
+        if self.sum is not None:
+            desc["总和"] = f"{fmt(self.sum)}"
+        if self.mean is not None and self.std is not None:
+            desc["均值±标准差"] = f"{fmt(self.mean)}±{fmtb(self.std)}"
+        elif self.mean is not None:
+            desc["均值"] = f"{fmt(self.mean)}"
+        elif self.std is not None:
+            desc["标准差"] = f"{fmtb(self.std)}"
+        if self.values:
+            dist = [self.values[0]]
+            if percentile_count > 2:
+                quartiles = quantiles(self.values, n=percentile_count - 1)
+                dist += quartiles
+            dist.append(self.values[-1])
+            desc["分布"] = '/'.join([fmt(v) for v in dist])
+        elif self.dist:
+            desc["分布"] = '/'.join([fmt(v) for v in self.dist])
+        return desc
+    def summary(self, unit=None, precision=4, percentile_count=5):
+        """ 文本汇总性的报告
+        :param unit: 展示数值时使用的单位
+        :param precision: 展示数值时的精度
+        :param percentile_count: 包括两个极值端点的切分点数，
+            设置2，就是不设置分位数，就是只展示最小、最大值
+            如果设置了3，就表示"中位数、二分位数"，在展示的时候，会显示50%位置的分位数值
+            如果设置了5，就相当于"四分位数"，会显示25%、50%、75%位置的分位数值
+        """
+        desc = self._summary(unit, precision, percentile_count)
+        return '\t'.join([f"{key}: {value}" for key, value in desc.items()])
+    def calculate_ratios(self, x_values, fmt=False, unit=False):
+        """ 计算并返回一个字典，其中包含每个 x_values 中的值与其小于等于该值的元素的比例
+        :param x_values: 一个数值列表，用来计算每个数值小于等于它的元素的比例
+        :param fmt: 直接将值格式化好
+        :return: 一个字典，键为输入的数值，值为对应的比例（百分比）
+        """
+        ratio_dict = {}
+        for x in x_values:
+            position = bisect_right(self.values, x)
+            if self.n > 0:
+                ratio = (position / self.n)
+            else:
+                ratio = 0
+            ratio_dict[x] = ratio
+        def unit_func(x):
+            if unit:
+                return human_readable_number(x, unit, 4)
+            return x
+        if fmt:
+            ratio_dict = {unit_func(x): f'{ratio:.2%}' for x, ratio in ratio_dict.items()}
+        return ratio_dict
+    def group_count(self, max_entries=None, min_count=None):
+        """ 统计每种取值出现的次数，并根据条件过滤结果
+        :param max_entries: 最多显示的条目数
+        :param min_count: 显示的条目至少出现的次数
+        """
+        from collections import Counter
+        # 使用Counter来计数每个值出现的次数
+        counts = Counter(self.values or self.raw_values)
+        # 根据min_count过滤计数结果
+        if min_count is not None:
+            counts = {k: v for k, v in counts.items() if v >= min_count}
+        # 根据max_entries限制结果数量
+        if max_entries is not None:
+            # 按出现次数降序排列，然后选取前max_entries项
+            most_common = counts.most_common(max_entries)
+            # 转换回字典形式
+            counts = dict(most_common)
+        else:
+            # 如果没有指定max_entries，则保持所有满足min_count的结果
+            counts = dict(sorted(counts.items(), key=lambda item: item[1], reverse=True))
+        return counts
+class Groups:
+    def __init__(self, data):
+        """ 分组
+        :param data: 输入字典结构直接赋值
+            或者其他结构，会自动按相同项聚合
+        TODO 显示一些数值统计信息，甚至图表
+        TODO 转文本表达，方便bc比较
+        """
+        if not isinstance(data, dict):
+            new_data = dict()
+            # 否要要转字典类型，自动从1~n编组
+            for k, v in enumerate(data, start=1):
+                new_data[k] = v
+            data = new_data
+        self.data = data  # 字典存原数据
+        self.ctr = Counter({k: len(x) for k, x in self.data.items()})  # 计数
+        self.stat = ValuesStat(self.ctr.values())  # 综合统计数据
+    def __repr__(self):
+        ls = []
+        for i, (k, v) in enumerate(self.data.items(), start=1):
+            ls.append(f'{i}, {k}：{v}')
+        return '\n'.join(ls)
+    @classmethod
+    def groupby(cls, ls, key, ykey=None):
+        """
+        :param ls: 可迭代等数组类型
+        :param key: 映射规则，ls中每个元素都会被归到映射的key组上
+            Callable[Any, 不可变类型]
+            None，未输入时，默认输入的ls已经是分好组的数据
+        :param ykey: 是否对分组后存储的内容y，也做一个函数映射
+        :return: dict
+        """
+        data = defaultdict(list)
+        for x in ls:
+            k = key(x)
+            if ykey:
+                x = ykey(x)
+            data[k].append(x)
+        return cls(data)
+def intersection_split(a, b):
+    """ 输入两个对象a,b，可以是dict或set类型，list等
+    会分析出二者共有的元素值关系
+    返回值是 ls1, ls2, ls3, ls4，大部分是list类型，但也有可能遵循原始情况是set类型
+        ls1：a中，与b共有key的元素值
+        ls2：a中，独有key的元素值
+        ls3：b中，与a共有key的元素值
+        ls4：b中，独有key的元素值
+    """
+    # 1 获得集合的key关系
+    keys1 = set(a)
+    keys2 = set(b)
+    keys0 = keys1 & keys2  # 两个集合共有的元素
+    # TODO 如果是字典，希望能保序
+    # 2 组合出ls1、ls2、ls3、ls4
+    def split(t, s, ks):
+        """原始元素为t，集合化的值为s，共有key是ks"""
+        if isinstance(t, (set, list, tuple)):
+            return ks, s - ks
+        elif isinstance(t, dict):
+            ls1 = sorted(map(lambda x: (x, t[x]), ks), key=lambda x: natural_sort_key(x[0]))
+            ls2 = sorted(map(lambda x: (x, t[x]), s - ks), key=lambda x: natural_sort_key(x[0]))
+            return ls1, ls2
+        else:
+            # dprint(type(s))  # s不是可以用来进行集合规律分析的类型
+            raise ValueError(f'{type(s)}不是可以用来进行集合规律分析的类型')
+    ls1, ls2 = split(a, keys1, keys0)
+    ls3, ls4 = split(b, keys2, keys0)
+    return ls1, ls2, ls3, ls4
+def matchpairs(xs, ys, cmp_func, least_score=sys.float_info.epsilon, *,
+               key=None, index=False):
+    r""" 匹配两组数据
+    :param xs: 第一组数据
+    :param ys: 第二组数据
+    :param cmp_func: 所用的比较函数，值越大表示两个对象相似度越高
+    :param least_score: 允许匹配的最低分，默认必须要大于0
+    :param key: 是否需要对xs, ys进行映射后再传入 cmp_func 操作
+    :param index: 返回的不是原值，而是下标
+    :return: 返回结构[(x1, y1, score1), (x2, y2, score2), ...]，注意长度肯定不会超过min(len(xs), len(ys))
+    注意：这里的功能①不支持重复匹配，②任何一个x,y都有可能没有匹配到
+        如果每个x必须都要有一个匹配，或者支持重复配对，请到隔壁使用 MatchPairs
+    TODO 这里很多中间步骤结果都是很有分析价值的，能改成类，然后支持分析中间结果？
+    TODO 这样全量两两比较是很耗性能的，可以加个参数草算，不用精确计算的功能？
+    >>> xs, ys = [4, 6, 1, 2, 9, 4, 5], [1, 5, 8, 9, 2]
+    >>> cmp_func = lambda x,y: 1-abs(x-y)/max(x,y)
+    >>> matchpairs(xs, ys, cmp_func)
+    [(1, 1, 1.0), (2, 2, 1.0), (9, 9, 1.0), (5, 5, 1.0), (6, 8, 0.75)]
+    >>> matchpairs(ys, xs, cmp_func)
+    [(1, 1, 1.0), (5, 5, 1.0), (9, 9, 1.0), (2, 2, 1.0), (8, 6, 0.75)]
+    >>> matchpairs(xs, ys, cmp_func, 0.9)
+    [(1, 1, 1.0), (2, 2, 1.0), (9, 9, 1.0), (5, 5, 1.0)]
+    >>> matchpairs(xs, ys, cmp_func, 0.9, index=True)
+    [(2, 0, 1.0), (3, 4, 1.0), (4, 3, 1.0), (6, 1, 1.0)]
+    """
+    # 0 实际计算使用的是 xs_, ys_
+    if key:
+        xs_ = [key(x) for x in xs]
+        ys_ = [key(y) for y in ys]
+    else:
+        xs_, ys_ = xs, ys
+    # 1 计算所有两两相似度
+    n, m = len(xs), len(ys)
+    all_pairs = []
+    for i in range(n):
+        for j in range(m):
+            score = cmp_func(xs_[i], ys_[j])
+            if score >= least_score:
+                all_pairs.append([i, j, score])
+    # 按分数权重排序，如果分数有很多相似并列，就只能按先来后到排序啦
+    all_pairs = sorted(all_pairs, key=lambda v: (-v[2], v[0], v[1]))
+    # 2 过滤出最终结果
+    pairs = []
+    x_used, y_used = set(), set()
+    for p in all_pairs:
+        i, j, score = p
+        if i not in x_used and j not in y_used:
+            if index:
+                pairs.append((i, j, score))
+            else:
+                pairs.append((xs[i], ys[j], score))
+            x_used.add(i)
+            y_used.add(j)
+    return pairs
+class SearchBase:
+    """ 一个dfs、bfs模板类 """
+    def __init__(self, root):
+        """
+        Args:
+            root: 根节点
+        """
+        self.root = root
+    def get_neighbors(self, node):
+        """ 获得邻接节点，必须要用yield实现，方便同时支持dfs、bfs的使用
+        对于树结构而言，相当于获取直接子结点
+        这里默认是bs4中Tag规则；不同业务需求，可以重定义该函数
+        例如对图结构、board类型，可以在self存储图访问状态，在这里实现遍历四周的功能
+        """
+        try:
+            for node in node.children:
+                yield node
+        except AttributeError:
+            pass
+    def dfs_nodes(self, node=None, depth=0):
+        """ 返回深度优先搜索得到的结点清单
+        :param node: 起始结点，默认是root根节点
+        :param depth: 当前node深度
+        :return: list，[(node1, depth1), (node2, depth2), ...]
+        """
+        if not node:
+            node = self.root
+        ls = [(node, depth)]
+        for t in self.get_neighbors(node):
+            ls += self.dfs_nodes(t, depth + 1)
+        return ls
+    def bfs_nodes(self, node=None, depth=0):
+        if not node:
+            node = self.root
+        ls = [(node, depth)]
+        i = 0
+        while i < len(ls):
+            x, d = ls[i]
+            nodes = self.get_neighbors(x)
+            ls += [(t, d + 1) for t in nodes]
+            i += 1
+        return ls
+    def fmt_node(self, node, depth, *, prefix='    ', show_node_type=False):
+        """ node格式化显示 """
+        s1 = prefix * depth
+        s2 = typename(node) + '，' if show_node_type else ''
+        s3 = textwrap.shorten(str(node), 200)
+        return s1 + s2 + s3
+    def fmt_nodes(self, *, nodes=None, select_depth=None, linenum=False,
+                  msghead=True, show_node_type=False, prefix='    '):
+        """ 结点清单格式化输出
+        :param nodes: 默认用dfs获得结点，也可以手动指定结点
+        :param prefix: 缩进格式，默认用4个空格
+        :param select_depth: 要显示的深度
+            单个数字：获得指定层
+            Sequences： 两个整数，取出这个闭区间内的层级内容
+        :param linenum：节点从1开始编号
+            行号后面，默认会跟一个类似Excel列名的字母，表示层级深度
+        :param msghead: 第1行输出一些统计信息
+        :param show_node_type:
+        Requires
+            textwrap：用到shorten
+            align.listalign：生成列编号时对齐
+        """
+        # 1 生成结点清单
+        ls = nodes if nodes else self.dfs_nodes()
+        total_node = len(ls)
+        total_depth = max(map(lambda x: x[1], ls))
+        head = f'总节点数：1~{total_node}，总深度：0~{total_depth}'
+        # 2 过滤与重新整理ls（select_depth）
+        logo = True
+        cnt = 0
+        tree_num = 0
+        if isinstance(select_depth, int):
+            for i in range(total_node):
+                if ls[i][1] == select_depth:
+                    ls[i][1] = 0
+                    cnt += 1
+                    logo = True
+                elif ls[i][1] < select_depth and logo:  # 遇到第1个父节点添加一个空行
+                    ls[i] = ''
+                    tree_num += 1
+                    logo = False
+                else:  # 删除该节点，不做任何显示
+                    ls[i] = None
+            head += f'；挑选出的节点数：{cnt}，所选深度：{select_depth}，树数量：{tree_num}'
+        elif hasattr(select_depth, '__getitem__'):
+            for i in range(total_node):
+                if select_depth[0] <= ls[i][1] <= select_depth[1]:
+                    ls[i][1] -= select_depth[0]
+                    cnt += 1
+                    logo = True
+                elif ls[i][1] < select_depth[0] and logo:  # 遇到第1个父节点添加一个空行
+                    ls[i] = ''
+                    tree_num += 1
+                    logo = False
+                else:  # 删除该节点，不做任何显示
+                    ls[i] = None
+            head += f'；挑选出的节点数：{cnt}，所选深度：{select_depth[0]}~{select_depth[1]}，树数量：{tree_num}'
+        """注意此时ls[i]的状态，有3种类型
+            (node, depth)：tuple类型，第0个元素是node对象，第1个元素是该元素所处层级
+            None：已删除元素，但为了后续编号方便，没有真正的移出，而是用None作为标记
+            ''：已删除元素，但这里涉及父节点的删除，建议此处留一个空行
+        """
+        # 3 格式处理
+        def mystr(item):
+            return self.fmt_node(item[0], item[1], prefix=prefix, show_node_type=show_node_type)
+        line_num = listalign(range(1, total_node + 1))
+        res = []
+        for i in range(total_node):
+            if ls[i] is not None:
+                if isinstance(ls[i], str):  # 已经指定该行要显示什么
+                    res.append(ls[i])
+                else:
+                    if linenum:  # 增加了一个能显示层级的int2excel_col_name
+                        res.append(line_num[i] + int2myalphaenum(ls[i][1]) + ' ' + mystr(ls[i]))
+                    else:
+                        res.append(mystr(ls[i]))
+        s = '\n'.join(res)
+        # 是否要添加信息头
+        if msghead:
+            s = head + '\n' + s
+        return s

pyxllib 0.3.96__py3-none-any.whl → 0.3.200__py3-none-any.whl

pyxllib 0.3.96py3-none-any.whl → 0.3.200py3-none-any.whl