PyPI - mdbq - Versions diffs - 2.7.1__py3-none-any.whl → 2.7.3__py3-none-any.whl - Mend

mdbq 2.7.1py3-none-any.whl → 2.7.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

mdbq/aggregation/aggregation.py +31 -30
mdbq/aggregation/mysql_types.py +83 -90
mdbq/aggregation/optimize_data.py +31 -52
mdbq/aggregation/query_data.py +256 -295
mdbq/clean/clean_upload.py +106 -194
mdbq/config/myconfig.py +30 -0
mdbq/config/products.py +32 -34
mdbq/mysql/mysql.py +12 -42
mdbq/mysql/s_query.py +4 -3
{mdbq-2.7.1.dist-info → mdbq-2.7.3.dist-info}/METADATA +1 -1
{mdbq-2.7.1.dist-info → mdbq-2.7.3.dist-info}/RECORD +13 -12
{mdbq-2.7.1.dist-info → mdbq-2.7.3.dist-info}/WHEEL +1 -1
{mdbq-2.7.1.dist-info → mdbq-2.7.3.dist-info}/top_level.txt +0 -0

mdbq/clean/clean_upload.py CHANGED Viewed

@@ -4,13 +4,14 @@ import pandas as pd
 from functools import wraps
 import chardet
 import zipfile
+import socket
 from pyzipper import PyZipFile
 import os
 import platform
 import json
 from mdbq.mongo import mongo
 from mdbq.mysql import mysql
-from mdbq.config import get_myconf
+from mdbq.config import myconfig
 from mdbq.aggregation import df_types
 from mdbq.config import products
 from mdbq.aggregation import optimize_data
@@ -41,18 +42,32 @@ else:
     Share_Path = os.path.join('/Volumes/时尚事业部/01.运营部/天猫报表')  # 共享文件根目录
 upload_path = os.path.join(D_PATH, '数据上传中心')  # 此目录位于下载文件夹
-source_path = os.path.join(Data_Path, '原始文件2')  # 此目录保存下载并清洗过的文件，作为数据库备份
+# source_path = os.path.join(Data_Path, '原始文件2')  # 此目录保存下载并清洗过的文件，作为数据库备份
 source_path3 = os.path.join(Data_Path, '原始文件3')  # 此目录保存下载并清洗过的文件，作为数据库备份
+username, password, host, port, service_database = None, None, None, None, None,
+if socket.gethostname().lower() in ['xigua_lx', 'xigua1', 'macbook pro']:
+    conf = myconfig.main()
+    conf_data = conf['Windows']['xigua_lx']['mysql']['local']
+    username, password, host, port = conf_data['username'], conf_data['password'], conf_data['host'], conf_data['port']
+    service_database = {'xigua_lx': 'mysql'}
+elif socket.gethostname().lower() in ['company', 'mac2.local']:
+    conf = myconfig.main()
+    conf_data = conf['Windows']['company']['mysql']['local']
+    username, password, host, port = conf_data['username'], conf_data['password'], conf_data['host'], conf_data['port']
+    service_database = {'company': 'mysql'}
+if not username:
+    print(f'找不到主机：')
 class DataClean:
     """ 数据分类 """
-    def __init__(self, path, source_path, service_databases):
+    def __init__(self, path, source_path):
         self.path = path  # 数据源位置，下载文件夹
         self.source_path = source_path  # 原始文件保存目录
         self.datas = []
-        self.service_databases = service_databases
     @staticmethod
     def try_except(func):  # 在类内部定义一个异常处理方法
@@ -264,6 +279,7 @@ class DataClean:
                     os.remove(os.path.join(root, name))
                 elif name.endswith('.csv') and 'dmp人群报表_' in name:
                     df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
+                    df = df[df['日期'] != '']
                     if len(df) == 0:
                         print(f'{name} 报表数据为空')
                         os.remove(os.path.join(root, name))
@@ -917,7 +933,7 @@ class DataClean:
                 if name.endswith('.xlsx') and '商品素材_' in name:
                     shop_name = re.findall(r'_([\u4e00-\u9fffA-Za-z]+店)_', name)[0]
-                    df = pd.read_excel(os.path.join(root, name), header=0, engine='xlrd')
+                    df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
                     if '日期' not in df.columns.tolist():
                         df.insert(loc=0, column='日期', value=datetime.datetime.today().strftime('%Y-%m-%d'))
                     if '店铺名称' not in df.columns.tolist():
@@ -1007,7 +1023,7 @@ class DataClean:
                     t_path = os.path.join(self.source_path, '生意参谋', '商品属性')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.csv') and '爱库存_商品榜单_' in name:
-                    t_path = os.path.join(self.source_path, '爱库存', 'spu商品榜单')
+                    t_path = os.path.join(self.source_path, '爱库存', '商品spu榜单')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.csv') and '手淘搜索_本店引流词_' in name:
                     t_path = os.path.join(self.source_path, '生意参谋', '手淘搜索_本店引流词')
@@ -1049,7 +1065,6 @@ class DataClean:
                     t_path = os.path.join(self.source_path, '达摩盘', 'dmp人群报表')
                     bib(t_path, _as_month=True)
     # @try_except
     def move_sjy(self, path=None, is_except=[]):
         if not path:
@@ -1127,22 +1142,22 @@ class DataClean:
                 if 'py_xg' not in name:  # 排除非目标文件
                     continue
-                if name.endswith('.xlsx') and '京东商智_spu_商品明细' in name:
+                if name.endswith('.csv') and '京东商智_spu_商品明细' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '京东商智_spu_商品明细')
                     bib(t_path, _as_month=True)
-                elif name.endswith('.xlsx') and '京东商智_sku_商品明细' in name:
+                elif name.endswith('.csv') and '京东商智_sku_商品明细' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '京东商智_sku_商品明细')
                     bib(t_path, _as_month=True)
-                elif name.endswith('.xlsx') and '京东推广_搜索词' in name:
+                elif name.endswith('.csv') and '京东推广_搜索词' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '搜索词报表')
                     bib(t_path, _as_month=True)
-                elif name.endswith('.xlsx') and '京东推广_点击成交' in name:
+                elif name.endswith('.csv') and '京东推广_点击成交' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '推广报表')
                     bib(t_path, _as_month=True)
-                elif name.endswith('.xlsx') and '京东推广_关键词点击' in name:
+                elif name.endswith('.csv') and '京东推广_关键词点击' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '关键词报表')
                     bib(t_path, _as_month=True)
-                elif name.endswith('.xlsx') and '京东商智_店铺来源_三级来源' in name:
+                elif name.endswith('.csv') and '京东商智_店铺来源_三级来源' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '店铺来源_三级来源')
                     bib(t_path, _as_month=True)
@@ -1411,118 +1426,59 @@ class DataClean:
             if _new_root != _root or '__MACOSX' in _root:
                 shutil.rmtree(_root)
-    def upload_df(self, service_databases=None, path=None):
+    def upload_df(self, path=None):
         """
         将清洗后的 df 上传数据库, copysh.py 调用
         """
-        if not service_databases:
-            service_databases = self.service_databases
         df_to_json = df_types.DataTypes()  # json 文件, 包含数据的 dtypes 信息
-        for service_database in service_databases:
-            for service_name, database in service_database.items():
-                # print(service_name, database)
-                if database == 'mongodb':
-                    username, password, host, port = get_myconf.select_config_values(
-                        target_service=service_name,
-                        database=database,
-                    )
-                    d = mongo.UploadMongo(
-                        username=username,
-                        password=password,
-                        host=host,
-                        port=port,
-                        drop_duplicates=False,
-                    )
-                    for data in self.datas:
-                        db_name, collection_name, df = data['数据库名'], data['集合名称'], data['数据主体']
-                        df_to_json.get_df_types(
-                            df=df,
-                            db_name=db_name,
-                            collection_name=collection_name,
-                            is_file_dtype=True,  # 默认本地文件优先: True
-                        )
-                        d.df_to_mongo(df=df, db_name=db_name, collection_name=collection_name)
-                    if d.client:
-                        d.client.close()
-                elif database == 'mysql':
-                    username, password, host, port = get_myconf.select_config_values(
-                        target_service=service_name,
-                        database=database,
-                    )
-                    m = mysql.MysqlUpload(
-                        username=username,
-                        password=password,
-                        host=host,
-                        port=port,
-                    )
-                    for data in self.datas:
-                        df, db_name, collection_name, rt_filename = data['数据主体'], data['数据库名'], data['集合名称'], data['文件名']
-                        df_to_json.get_df_types(
-                            df=df,
-                            db_name=db_name,
-                            collection_name=collection_name,
-                            is_file_dtype=True,  # 默认本地文件优先: True
-                        )
-                        m.df_to_mysql(
-                            df=df,
-                            db_name=db_name,
-                            table_name=collection_name,
-                            move_insert=True,  # 先删除，再插入
-                            df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                            drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                            filename=rt_filename,  # 用来追踪处理进度
-                            service_database=service_database,  # 字典
-                        )
-                df_to_json.as_json_file()  # 写入 json 文件, 包含数据的 dtypes 信息
-def test():
-    # main_key = '单元报表'
-    path = f'/Users/xigua/数据中心/原始文件3/天猫推广报表/主体报表'
-    for root, dirs, files in os.walk(path, topdown=False):
-        for name in files:
-            if '~$' in name or '.DS' in name or '.localized' in name or '.jpg' in name or '.png' in name:
-                continue
-            # if 'py_xg' in name:
-            #     continue
-            # if 'TM_旧表_字段' in root:
-            #     continue
-            if name.endswith('.csv'):
-                print(name)
-                df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
-                # if '店铺名称' not in df.columns.tolist():
-                #     df.insert(loc=1, column='店铺名称', value='万里马官方旗舰店')
-                # df.replace(to_replace=['-'], value=0, regex=False, inplace=True)
-                # df.replace(to_replace=[','], value='', regex=True, inplace=True)
-                # if '统计日期' in df.columns.tolist() and '日期' not in df.columns.tolist():
-                #     df.rename(columns={'统计日期': '日期', '商品ID': '商品id'}, inplace=True)
-                # shop_name = re.findall(r'_([\u4e00-\u9fffA-Za-z]+店)', name)[0]
-                # df.insert(loc=1, column='店铺名称', value=shop_name)
-                date_all = re.findall(r'_(\d{4}-\d{2}-\d{2})_', name)[0]
-                date = re.findall(r'_(\d{4}-\d{2})-\d{2}', name)[0]
-                new_path = f'/Users/xigua/数据中心/原始文件3/天猫_生意参谋/商品排行/{date}'
-                # new_path = os.path.join(new_path, date)  # 添加 年月分类
-                if not os.path.exists(new_path):
-                    os.makedirs(new_path, exist_ok=True)
-                # print(date_all)
-                new_name = f'py_xg_商品排行_万里马官方旗舰店_{date_all}.csv'
-                # print(os.path.join(new_path, new_name))
-                # breakpoint()
-                df.to_csv(os.path.join(new_path, new_name), encoding='utf-8_sig', index=False, header=True)
-                # try:
-                #     df.to_excel(os.path.join(new_path, new_name),
-                #                 index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
-                # except Exception as e:
-                #     print(e)
-def date_table(service_databases=[{}]):
+        # d = mongo.UploadMongo(
+        #     username=username,
+        #     password=password,
+        #     host=host,
+        #     port=port,
+        #     drop_duplicates=False,
+        # )
+        # for data in self.datas:
+        #     db_name, collection_name, df = data['数据库名'], data['集合名称'], data['数据主体']
+        #     df_to_json.get_df_types(
+        #         df=df,
+        #         db_name=db_name,
+        #         collection_name=collection_name,
+        #         is_file_dtype=True,  # 默认本地文件优先: True
+        #     )
+        #     d.df_to_mongo(df=df, db_name=db_name, collection_name=collection_name)
+        # if d.client:
+        #     d.client.close()
+        m = mysql.MysqlUpload(
+            username=username,
+            password=password,
+            host=host,
+            port=port,
+        )
+        for data in self.datas:
+            df, db_name, collection_name, rt_filename = data['数据主体'], data['数据库名'], data['集合名称'], data['文件名']
+            df_to_json.get_df_types(
+                df=df,
+                db_name=db_name,
+                collection_name=collection_name,
+                is_file_dtype=True,  # 默认本地文件优先: True
+            )
+            m.df_to_mysql(
+                df=df,
+                db_name=db_name,
+                table_name=collection_name,
+                move_insert=True,  # 先删除，再插入
+                df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+                drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+                filename=rt_filename,  # 用来追踪处理进度
+                service_database=service_database,  # 字典
+            )
+            df_to_json.as_json_file()  # 写入 json 文件, 包含数据的 dtypes 信息
+def date_table():
     """
     生成 pbix 使用的日期表
     """
@@ -1549,47 +1505,32 @@ def date_table(service_databases=[{}]):
     df['月索引'] = mon
     df.sort_values('日期', ascending=False, ignore_index=True, inplace=True)
-    for service_database in service_databases:
-        for service_name, database in service_database.items():
-            username, password, host, port = get_myconf.select_config_values(
-                target_service=service_name,
-                database=database,
-            )
-            m = mysql.MysqlUpload(
-                username=username,
-                password=password,
-                host=host,
-                port=port,
-            )
-            m.df_to_mysql(
-                df=df,
-                db_name='聚合数据',
-                table_name='日期表',
-                move_insert=True,  # 先删除，再插入
-                df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                filename=None,  # 用来追踪处理进度
-                service_database=service_database,  # 用来追踪处理进度
-            )
+    m = mysql.MysqlUpload(
+        username=username,
+        password=password,
+        host=host,
+        port=port,
+    )
+    m.df_to_mysql(
+        df=df,
+        db_name='聚合数据',
+        table_name='日期表',
+        move_insert=True,  # 先删除，再插入
+        df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+        drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+        filename=None,  # 用来追踪处理进度
+        service_database=service_database,  # 用来追踪处理进度
+    )
-def main(service_databases=None, is_mysql=False):
+def main(is_mysql=False):
     """
     is_mysql: 调试时加，False: 是否后续的聚合数据
     """
-    if not service_databases:
-        service_databases = [
-            # {'home_lx': 'mongodb'},
-            {'home_lx': 'mysql'},
-            # {'company': 'mysql'},
-            # {'nas': 'mysql'},
-        ]
     cn = DataClean(
         path=upload_path,  # 源文件目录，下载文件夹
         source_path=source_path3,  # 原始文件保存目录
-        service_databases=service_databases
     )
     cn.new_unzip(is_move=True)  # 解压文件， is_move 解压后是否删除原 zip 压缩文件
     cn.sycm_tm(is_except=['except'])  # 天猫生意参谋
@@ -1600,7 +1541,7 @@ def main(service_databases=None, is_mysql=False):
     # cn.syj_reports_tb(is_except=['except'])  # 淘宝生意经，不可以和天猫同时运行
     cn.jd_reports(is_except=['except'])  # 清洗京东报表
     cn.sp_scene_clean(is_except=['except'])  # 商品素材
-    cn.upload_df(service_databases=service_databases)  # 上传数据库
+    cn.upload_df()  # 上传数据库
     cn.move_sycm(is_except=['临时文件', ])  # 生意参谋，移到文件到原始文件夹
     cn.move_dmp(is_except=['临时文件', ])  # 达摩盘
@@ -1613,64 +1554,35 @@ def main(service_databases=None, is_mysql=False):
         return
     # 更新日期表
-    date_table(service_databases=service_databases)
-    # 更新货品年份基准表， 属性设置 2 - 货品年份基准
+    date_table()
+    # 更新货品年份基准表， 属性设置 3 - 货品年份基准
     p = products.Products()
-    p.to_mysql(service_databases=service_databases)
+    p.to_mysql()
+    conf = myconfig.main()
+    data = conf['Windows']['xigua_lx']['mysql']['local']
+    db_list = conf['Windows']['xigua_lx']['mysql']['数据库集']
+    db_list = [item for item in db_list if item != '聚合数据']
     # 清理所有非聚合数据的库
     optimize_data.op_data(
-        db_name_lists=[
-            '京东数据3',
-            '属性设置3',
-            '推广数据2',
-            '生意参谋3',
-            '推广数据_淘宝店',
-            '爱库存2'
-            '生意参谋3',
-            '生意经2',
-            # '聚合数据',  # 不在这里清理聚合数据, 还未开始聚合呢
-            '达摩盘3',
-        ],
-        days=100,
+        db_name_lists=db_list,
+        days=5,
         is_mongo=True,
         is_mysql=True,
-        service_databases=service_databases
     )
     # 数据聚合
-    query_data.data_aggregation(service_databases=service_databases, months=3)
+    query_data.data_aggregation(months=3)
     time.sleep(60)
     # 清理聚合数据, mongodb 中没有聚合数据，所以只需要清理 mysql 即可
     optimize_data.op_data(
         db_name_lists=['聚合数据'],
         days=3650,
-        service_databases=service_databases,
         is_mongo=False,
         is_mysql=True,
     )
 if __name__ == '__main__':
-    main(
-        service_databases = [
-            # {'company': 'mysql'},
-            {'home_lx': 'mysql'},
-            # {'home_lx': 'mongodb'},
-            # {'nas': 'mysql'},
-        ],
-        is_mysql = False,  # 清理聚合数据
-    )
-    # date_table(service_databases=[{'company': 'mysql'}])
-    # c = DataClean(
-    #     path=upload_path,  # 源文件目录，下载文件夹
-    #     source_path=source_path3,  # 原始文件保存目录
-    #     service_databases=[{'home_lx': 'mysql'},]
-    # )
-    # c.sp_scene_clean(is_except=['except'])  # 商品素材
-    # c.move_tg_tm(is_except=['临时文件', ])  # 天猫，移到文件到原始文件夹
-    # test()
+    main(is_mysql=False)

mdbq/config/myconfig.py ADDED Viewed

@@ -0,0 +1,30 @@
+# -*- coding: UTF-8 –*-
+import os
+import json
+from mdbq.config import set_support
+def main():
+    support_path = set_support.SetSupport(dirname='support').dirname
+    file = os.path.join(support_path, 'my_config.txt')
+    if not os.path.isfile(file):
+        print(f'缺少配置文件，无法读取配置文件： {file}')
+        return
+    with open(file, 'r', encoding='utf-8') as f:
+        config_datas = json.load(f)
+        return config_datas
+def write_back(datas):
+    """ 将数据写回本地 """
+    support_path = set_support.SetSupport(dirname='support').dirname
+    file = os.path.join(support_path, 'my_config.txt')
+    with open(file, 'w+', encoding='utf-8') as f:
+        json.dump(datas, f, ensure_ascii=False, sort_keys=False, indent=4)
+if __name__ == '__main__':
+    d = main()
+    print(d)

mdbq/config/products.py CHANGED Viewed

@@ -3,15 +3,29 @@ import json
 import os
 import platform
 import getpass
+import socket
 import pandas as pd
 from mdbq.mysql import mysql
-from mdbq.config import get_myconf
+from mdbq.config import myconfig
 from numpy.ma.core import product
 """
 天猫货品年份基准对照
 用于聚合数据，通过此数据表进一步可确定商品上架年月
 """
+username, password, host, port, service_database = None, None, None, None, None,
+if socket.gethostname().lower() in ['xigua_lx', 'xigua1', 'macbook pro']:
+    conf = myconfig.main()
+    data = conf['Windows']['xigua_lx']['mysql']['local']
+    username, password, host, port = data['username'], data['password'], data['host'], data['port']
+    service_database = {'xigua_lx': 'mysql'}
+elif socket.gethostname().lower() in ['company', 'mac2.local']:
+    conf = myconfig.main()
+    data = conf['Windows']['company']['mysql']['local']
+    username, password, host, port = data['username'], data['password'], data['host'], data['port']
+    service_database = {'company': 'mysql'}
+if not username:
+    print(f'找不到主机：')
 class Products:
@@ -107,31 +121,25 @@ class Products:
         ]
         self.datas += my_datas
-    def to_mysql(self, service_databases=[{'home_lx': 'mysql'}]):
+    def to_mysql(self):
         self.update_my_datas()
         df = pd.DataFrame(self.datas)
-        for service_database in service_databases:
-            for service_name, database in service_database.items():
-                username, password, host, port = get_myconf.select_config_values(
-                    target_service=service_name,
-                    database=database,
-                )
-                m = mysql.MysqlUpload(
-                    username=username,
-                    password=password,
-                    host=host,
-                    port=port,
-                )
-                m.df_to_mysql(
-                    df=df,
-                    db_name='属性设置2',
-                    table_name='货品年份基准',
-                    move_insert = False,
-                    df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                    drop_duplicates=True,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                    icm_update=[],
-                    service_database=service_database,  # 用来追踪处理进度
-                )
+        m = mysql.MysqlUpload(
+            username=username,
+            password=password,
+            host=host,
+            port=port,
+        )
+        m.df_to_mysql(
+            df=df,
+            db_name='属性设置3',
+            table_name='货品年份基准',
+            move_insert = False,
+            df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+            drop_duplicates=True,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+            icm_update=[],
+            service_database=service_database,  # 用来追踪处理进度
+        )
     def market_date(self, product_id: int):
         try:
@@ -153,13 +161,3 @@ if __name__ == '__main__':
     p = Products()
     year = p.market_date(product_id=product_id)
     print(f'{product_id}:  {year}')
-    p.to_mysql(service_databases=[
-        {
-            'home_lx': 'mysql'
-        },
-        {
-            'company': 'mysql'
-        }
-    ]
-    )

mdbq/mysql/mysql.py CHANGED Viewed

@@ -12,7 +12,7 @@ import pandas as pd
 from sqlalchemy import create_engine
 import os
 import calendar
-from mdbq.config import get_myconf
+from mdbq.config import myconfig
 from mdbq.config import set_support
 from mdbq.dataframe import converter
 from mdbq.aggregation import mysql_types
@@ -49,7 +49,7 @@ class MysqlUpload:
         self.port = port
         self.config = {
             'host': self.host,
-            'port': self.port,
+            'port': int(self.port),
             'user': self.username,
             'password': self.password,
             'charset': charset,  # utf8mb4 支持存储四字节的UTF-8字符集
@@ -69,7 +69,7 @@ class MysqlUpload:
         return wrapper
     @try_except
-    def df_to_mysql(self, df, table_name, db_name='远程数据源', icm_update=[], service_database={'home_lx': 'mysql'}, move_insert=False, df_sql=False, drop_duplicates=False, filename=None, count=None, json_path=None, reset_id=False):
+    def df_to_mysql(self, df, table_name, db_name='远程数据源', icm_update=[], service_database={'xigua_lx': 'mysql'}, move_insert=False, df_sql=False, drop_duplicates=False, filename=None, count=None, json_path=None, reset_id=False):
         """
         将 df 写入数据库
         db_name: 数据库名称
@@ -185,13 +185,13 @@ class MysqlUpload:
             # print(cl, db_n, tb_n)
             # 返回这些结果的目的是等添加完列再写 json 文件才能读到 types 信息
-            # ⚠️ mysql_all_dtypes 函数默认只读取 home_lx 的数据库信息，不会读取其他系统
+            # ⚠️ mysql_all_dtypes 函数默认只读取 xigua_lx 的数据库信息，不会读取其他系统
             if cl and db_n and tb_n:
-                mysql_types.mysql_all_dtypes(service_database=service_database, db_name=db_name, table_name=table_name)  # 更新一个表的 dtypes
+                mysql_types.mysql_all_dtypes(db_name=db_name, table_name=table_name)  # 更新一个表的 dtypes
             elif cl and db_n:
-                mysql_types.mysql_all_dtypes(service_database=service_database, db_name=db_name)  # 更新一个数据库的 dtypes
+                mysql_types.mysql_all_dtypes(db_name=db_name)  # 更新一个数据库的 dtypes
             elif cl:
-                mysql_types.mysql_all_dtypes(service_database=service_database)  # 更新所有数据库所有数据表的 dtypes 信息到本地 json
+                mysql_types.mysql_all_dtypes()  # 更新所有数据库所有数据表的 dtypes 信息到本地 json
             # 4. 更新插入数据
             now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S ")
@@ -555,7 +555,7 @@ class OptimizeDatas:
         self.charset = charset
         self.config = {
             'host': self.host,
-            'port': self.port,
+            'port': int(self.port),
             'user': self.username,
             'password': self.password,
             'charset': self.charset,  # utf8mb4 支持存储四字节的UTF-8字符集
@@ -864,38 +864,8 @@ def year_month_day_bak(start_date, end_date):
     return results  # start_date至end_date之间的所有年月日
-def download_datas_bak(table_name, save_path, start_date):
-    username, password, host, port = get_myconf.select_config_values(target_service='home_lx', database='mysql')
-    print(username, password, host, port)
-    m = MysqlUpload(username=username, password=password, host=host, port=port)
-    m.port = port
-    results = year_month_day(start_date=start_date, end_date='today')
-    # print(results)
-    for result in results:
-        start_date = result['起始日期']
-        end_date = result['结束日期']
-        # print(start_date, end_date)
-        df = m.read_mysql(db_name='天猫数据1', table_name=table_name, start_date=start_date, end_date=end_date)
-        if len(df) == 0:
-            continue
-        path = os.path.join(save_path, f'{table_name}_{str(start_date)}_{str(end_date)}.csv')
-        df['日期'] = df['日期'].apply(lambda x: re.sub(' .*', '', str(x)))
-        df.to_csv(path, index=False, encoding='utf-8_sig', header=True)
 if __name__ == '__main__':
-    username, password, host, port = get_myconf.select_config_values(target_service='home_lx', database='mysql')
-    # print(username, password, host, port)
-    path = '/Users/xigua/Downloads/人群洞察.csv'
-    df = pd.read_csv(path, encoding='utf-8_sig', header=0, na_filter=False)
-    # print(df)
-    m = MysqlUpload(username=username, password=password, host=host, port=port)
-    m.df_to_mysql(
-        df=df,
-        db_name='test',
-        table_name='测试数据',
-        drop_duplicates=True,
-        # service_name=service_name,
-        # service_databases=service_databases,
-    )
+    conf = myconfig.main()
+    data = conf['Windows']['xigua_lx']['mysql']['local']
+    username, password, host, port = data['username'], data['password'], data['host'], data['port']
+    print(username, password, host, port)

mdbq 2.7.1__py3-none-any.whl → 2.7.3__py3-none-any.whl

mdbq 2.7.1py3-none-any.whl → 2.7.3py3-none-any.whl