PyPI - mdbq - Versions diffs - 2.7.0__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mdbq 2.7.0py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

mdbq/aggregation/aggregation.py +27 -33
mdbq/aggregation/mysql_types.py +83 -90
mdbq/aggregation/optimize_data.py +30 -52
mdbq/aggregation/query_data.py +257 -296
mdbq/clean/clean_upload.py +126 -201
mdbq/company/copysh.py +1 -2
mdbq/config/myconfig.py +30 -0
mdbq/config/products.py +31 -34
mdbq/mysql/mysql.py +12 -42
mdbq/mysql/s_query.py +4 -3
{mdbq-2.7.0.dist-info → mdbq-2.7.2.dist-info}/METADATA +2 -2
{mdbq-2.7.0.dist-info → mdbq-2.7.2.dist-info}/RECORD +14 -13
{mdbq-2.7.0.dist-info → mdbq-2.7.2.dist-info}/WHEEL +1 -1
{mdbq-2.7.0.dist-info → mdbq-2.7.2.dist-info}/top_level.txt +0 -0

mdbq/clean/clean_upload.py CHANGED Viewed

@@ -4,13 +4,14 @@ import pandas as pd
 from functools import wraps
 import chardet
 import zipfile
+import socket
 from pyzipper import PyZipFile
 import os
 import platform
 import json
 from mdbq.mongo import mongo
 from mdbq.mysql import mysql
-from mdbq.config import get_myconf
+from mdbq.config import myconfig
 from mdbq.aggregation import df_types
 from mdbq.config import products
 from mdbq.aggregation import optimize_data
@@ -41,18 +42,31 @@ else:
     Share_Path = os.path.join('/Volumes/时尚事业部/01.运营部/天猫报表')  # 共享文件根目录
 upload_path = os.path.join(D_PATH, '数据上传中心')  # 此目录位于下载文件夹
-source_path = os.path.join(Data_Path, '原始文件2')  # 此目录保存下载并清洗过的文件，作为数据库备份
+# source_path = os.path.join(Data_Path, '原始文件2')  # 此目录保存下载并清洗过的文件，作为数据库备份
 source_path3 = os.path.join(Data_Path, '原始文件3')  # 此目录保存下载并清洗过的文件，作为数据库备份
+if socket.gethostname().lower() in ['xigua_lx', 'xigua1', 'macbook pro']:
+    conf = myconfig.main()
+    conf_data = conf['Windows']['xigua_lx']['mysql']['local']
+    username, password, host, port = conf_data['username'], conf_data['password'], conf_data['host'], conf_data['port']
+    service_database = {'xigua_lx': 'mysql'}
+elif socket.gethostname().lower() in ['company', 'Mac2.local']:
+    conf = myconfig.main()
+    conf_data = conf['Windows']['company']['mysql']['local']
+    username, password, host, port = conf_data['username'], conf_data['password'], conf_data['host'], conf_data['port']
+    service_database = {'company': 'mysql'}
+if not username:
+    print(f'找不到主机：')
 class DataClean:
     """ 数据分类 """
-    def __init__(self, path, source_path, service_databases):
+    def __init__(self, path, source_path):
         self.path = path  # 数据源位置，下载文件夹
         self.source_path = source_path  # 原始文件保存目录
         self.datas = []
-        self.service_databases = service_databases
     @staticmethod
     def try_except(func):  # 在类内部定义一个异常处理方法
@@ -145,6 +159,7 @@ class DataClean:
                     df = pd.read_excel(os.path.join(root, name), header=4)
                     if len(df) == 0:
                         print(f'{name} 报表数据不能为空')
+                        os.remove(os.path.join(root, name))
                         continue
                     df.replace(to_replace=['-'], value=0, regex=False, inplace=True)
                     df.replace(to_replace=[','], value='', regex=True, inplace=True)
@@ -159,6 +174,7 @@ class DataClean:
                     df = pd.read_excel(os.path.join(root, name), header=5, engine='xlrd')
                     if len(df) == 0:
                         print(f'{name} 报表数据不能为空')
+                        os.remove(os.path.join(root, name))
                         continue
                     df.replace(to_replace=['-'], value=0, regex=False, inplace=True)
                     df.replace(to_replace=[','], value='', regex=True, inplace=True)
@@ -255,6 +271,7 @@ class DataClean:
                     df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
                     if len(df) == 0:
                         print(f'{name} 报表数据为空')
+                        os.remove(os.path.join(root, name))
                         continue
                     new_name = f'py_xg_{os.path.splitext(name)[0]}.csv'
                     self.save_to_csv(df, root, new_name, encoding='utf-8_sig')
@@ -263,6 +280,7 @@ class DataClean:
                     df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
                     if len(df) == 0:
                         print(f'{name} 报表数据为空')
+                        os.remove(os.path.join(root, name))
                         continue
                     for col in df.columns.tolist():
                         if '(' in col or ')' in col:
@@ -563,6 +581,7 @@ class DataClean:
                     name_st = re.findall(r'([\u4e00-\u9fa5]+)\(分日', name)
                     if not name_st:
                         print(f'{name}  正则提取文件名失败')
+                        os.remove(os.path.join(root, name))
                         continue
                     encoding = self.get_encoding(file_path=os.path.join(root, name))
                     df = pd.read_csv(os.path.join(root, name), encoding=encoding, header=0, na_filter=False)
@@ -802,8 +821,9 @@ class DataClean:
                 if not is_continue:
                     continue
-                if name.endswith('.xlsx') and '京东推广_' in name:
-                    df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
+                if name.endswith('.csv') and '京东推广_' in name:
+                    # df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
+                    df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
                     new_name = f'py_xg_{name}'
                     os.rename(os.path.join(root, name), os.path.join(root, new_name))
                 elif name.endswith('.xlsx') and '京东商智_sku_商品明细' in name:
@@ -813,9 +833,10 @@ class DataClean:
                     df.insert(loc=0, column='日期', value=pattern)
                     df.insert(loc=1, column='店铺名称', value='京东箱包旗舰店')
                     df.fillna(0, inplace=True)
-                    new_name = f'py_xg_{name}'
-                    df.to_excel(os.path.join(upload_path, new_name),
-                                index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
+                    new_name = f'py_xg_{os.path.splitext(name)[0]}.csv'
+                    df.to_csv(os.path.join(root, new_name), encoding='utf-8_sig', index=False, header=True)
+                    # df.to_excel(os.path.join(upload_path, new_name),
+                    #             index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
                     os.remove(os.path.join(root, name))
                 elif name.endswith('.xlsx') and '京东商智_spu_商品明细' in name:
                     df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
@@ -824,9 +845,10 @@ class DataClean:
                     df.insert(loc=0, column='日期', value=pattern)
                     df.insert(loc=1, column='店铺名称', value='京东箱包旗舰店')
                     df.fillna(0, inplace=True)
-                    new_name = f'py_xg_{name}'
-                    df.to_excel(os.path.join(upload_path, new_name),
-                                index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
+                    new_name = f'py_xg_{os.path.splitext(name)[0]}.csv'
+                    df.to_csv(os.path.join(root, new_name), encoding='utf-8_sig', index=False, header=True)
+                    # df.to_excel(os.path.join(upload_path, new_name),
+                    #             index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
                     os.remove(os.path.join(root, name))
                 elif name.endswith('.xlsx') and '京东商智_店铺来源_三级来源' in name:
                     df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
@@ -836,9 +858,10 @@ class DataClean:
                         if '环比' in col or '同比' in col:
                             df.drop(col, axis=1, inplace=True)
                     df.fillna(0, inplace=True)
-                    new_name = f'py_xg_{name}'
-                    df.to_excel(os.path.join(upload_path, new_name),
-                                index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
+                    new_name = f'py_xg_{os.path.splitext(name)[0]}.csv'
+                    df.to_csv(os.path.join(root, new_name), encoding='utf-8_sig', index=False, header=True)
+                    # df.to_excel(os.path.join(upload_path, new_name),
+                    #             index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
                     os.remove(os.path.join(root, name))
                 # 将数据传入 self.datas 等待更新进数据库
@@ -908,7 +931,7 @@ class DataClean:
                 if name.endswith('.xlsx') and '商品素材_' in name:
                     shop_name = re.findall(r'_([\u4e00-\u9fffA-Za-z]+店)_', name)[0]
-                    df = pd.read_excel(os.path.join(root, name), header=0, engine='xlrd')
+                    df = pd.read_excel(os.path.join(root, name), header=0, engine='openpyxl')
                     if '日期' not in df.columns.tolist():
                         df.insert(loc=0, column='日期', value=datetime.datetime.today().strftime('%Y-%m-%d'))
                     if '店铺名称' not in df.columns.tolist():
@@ -998,7 +1021,7 @@ class DataClean:
                     t_path = os.path.join(self.source_path, '生意参谋', '商品属性')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.csv') and '爱库存_商品榜单_' in name:
-                    t_path = os.path.join(self.source_path, '爱库存', 'spu商品榜单')
+                    t_path = os.path.join(self.source_path, '爱库存', '商品spu榜单')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.csv') and '手淘搜索_本店引流词_' in name:
                     t_path = os.path.join(self.source_path, '生意参谋', '手淘搜索_本店引流词')
@@ -1040,7 +1063,6 @@ class DataClean:
                     t_path = os.path.join(self.source_path, '达摩盘', 'dmp人群报表')
                     bib(t_path, _as_month=True)
     # @try_except
     def move_sjy(self, path=None, is_except=[]):
         if not path:
@@ -1119,10 +1141,10 @@ class DataClean:
                     continue
                 if name.endswith('.xlsx') and '京东商智_spu_商品明细' in name:
-                    t_path = os.path.join(self.source_path, '京东报表', 'spu_商品明细')
+                    t_path = os.path.join(self.source_path, '京东报表', '京东商智_spu_商品明细')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.xlsx') and '京东商智_sku_商品明细' in name:
-                    t_path = os.path.join(self.source_path, '京东报表', 'sku_商品明细')
+                    t_path = os.path.join(self.source_path, '京东报表', '京东商智_sku_商品明细')
                     bib(t_path, _as_month=True)
                 elif name.endswith('.xlsx') and '京东推广_搜索词' in name:
                     t_path = os.path.join(self.source_path, '京东报表', '搜索词报表')
@@ -1402,118 +1424,59 @@ class DataClean:
             if _new_root != _root or '__MACOSX' in _root:
                 shutil.rmtree(_root)
-    def upload_df(self, service_databases=None, path=None):
+    def upload_df(self, path=None):
         """
         将清洗后的 df 上传数据库, copysh.py 调用
         """
-        if not service_databases:
-            service_databases = self.service_databases
         df_to_json = df_types.DataTypes()  # json 文件, 包含数据的 dtypes 信息
-        for service_database in service_databases:
-            for service_name, database in service_database.items():
-                # print(service_name, database)
-                if database == 'mongodb':
-                    username, password, host, port = get_myconf.select_config_values(
-                        target_service=service_name,
-                        database=database,
-                    )
-                    d = mongo.UploadMongo(
-                        username=username,
-                        password=password,
-                        host=host,
-                        port=port,
-                        drop_duplicates=False,
-                    )
-                    for data in self.datas:
-                        db_name, collection_name, df = data['数据库名'], data['集合名称'], data['数据主体']
-                        df_to_json.get_df_types(
-                            df=df,
-                            db_name=db_name,
-                            collection_name=collection_name,
-                            is_file_dtype=True,  # 默认本地文件优先: True
-                        )
-                        d.df_to_mongo(df=df, db_name=db_name, collection_name=collection_name)
-                    if d.client:
-                        d.client.close()
-                elif database == 'mysql':
-                    username, password, host, port = get_myconf.select_config_values(
-                        target_service=service_name,
-                        database=database,
-                    )
-                    m = mysql.MysqlUpload(
-                        username=username,
-                        password=password,
-                        host=host,
-                        port=port,
-                    )
-                    for data in self.datas:
-                        df, db_name, collection_name, rt_filename = data['数据主体'], data['数据库名'], data['集合名称'], data['文件名']
-                        df_to_json.get_df_types(
-                            df=df,
-                            db_name=db_name,
-                            collection_name=collection_name,
-                            is_file_dtype=True,  # 默认本地文件优先: True
-                        )
-                        m.df_to_mysql(
-                            df=df,
-                            db_name=db_name,
-                            table_name=collection_name,
-                            move_insert=True,  # 先删除，再插入
-                            df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                            drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                            filename=rt_filename,  # 用来追踪处理进度
-                            service_database=service_database,  # 字典
-                        )
-                df_to_json.as_json_file()  # 写入 json 文件, 包含数据的 dtypes 信息
-def test():
-    # main_key = '单元报表'
-    path = f'/Users/xigua/数据中心/原始文件3/天猫推广报表/主体报表'
-    for root, dirs, files in os.walk(path, topdown=False):
-        for name in files:
-            if '~$' in name or '.DS' in name or '.localized' in name or '.jpg' in name or '.png' in name:
-                continue
-            # if 'py_xg' in name:
-            #     continue
-            # if 'TM_旧表_字段' in root:
-            #     continue
-            if name.endswith('.csv'):
-                print(name)
-                df = pd.read_csv(os.path.join(root, name), encoding='utf-8_sig', header=0, na_filter=False)
-                # if '店铺名称' not in df.columns.tolist():
-                #     df.insert(loc=1, column='店铺名称', value='万里马官方旗舰店')
-                # df.replace(to_replace=['-'], value=0, regex=False, inplace=True)
-                # df.replace(to_replace=[','], value='', regex=True, inplace=True)
-                # if '统计日期' in df.columns.tolist() and '日期' not in df.columns.tolist():
-                #     df.rename(columns={'统计日期': '日期', '商品ID': '商品id'}, inplace=True)
-                # shop_name = re.findall(r'_([\u4e00-\u9fffA-Za-z]+店)', name)[0]
-                # df.insert(loc=1, column='店铺名称', value=shop_name)
-                date_all = re.findall(r'_(\d{4}-\d{2}-\d{2})_', name)[0]
-                date = re.findall(r'_(\d{4}-\d{2})-\d{2}', name)[0]
-                new_path = f'/Users/xigua/数据中心/原始文件3/天猫_生意参谋/商品排行/{date}'
-                # new_path = os.path.join(new_path, date)  # 添加 年月分类
-                if not os.path.exists(new_path):
-                    os.makedirs(new_path, exist_ok=True)
-                # print(date_all)
-                new_name = f'py_xg_商品排行_万里马官方旗舰店_{date_all}.csv'
-                # print(os.path.join(new_path, new_name))
-                # breakpoint()
-                df.to_csv(os.path.join(new_path, new_name), encoding='utf-8_sig', index=False, header=True)
-                # try:
-                #     df.to_excel(os.path.join(new_path, new_name),
-                #                 index=False, header=True, engine='openpyxl', freeze_panes=(1, 0))
-                # except Exception as e:
-                #     print(e)
-def date_table(service_databases=[{}]):
+        # d = mongo.UploadMongo(
+        #     username=username,
+        #     password=password,
+        #     host=host,
+        #     port=port,
+        #     drop_duplicates=False,
+        # )
+        # for data in self.datas:
+        #     db_name, collection_name, df = data['数据库名'], data['集合名称'], data['数据主体']
+        #     df_to_json.get_df_types(
+        #         df=df,
+        #         db_name=db_name,
+        #         collection_name=collection_name,
+        #         is_file_dtype=True,  # 默认本地文件优先: True
+        #     )
+        #     d.df_to_mongo(df=df, db_name=db_name, collection_name=collection_name)
+        # if d.client:
+        #     d.client.close()
+        m = mysql.MysqlUpload(
+            username=username,
+            password=password,
+            host=host,
+            port=port,
+        )
+        for data in self.datas:
+            df, db_name, collection_name, rt_filename = data['数据主体'], data['数据库名'], data['集合名称'], data['文件名']
+            df_to_json.get_df_types(
+                df=df,
+                db_name=db_name,
+                collection_name=collection_name,
+                is_file_dtype=True,  # 默认本地文件优先: True
+            )
+            m.df_to_mysql(
+                df=df,
+                db_name=db_name,
+                table_name=collection_name,
+                move_insert=True,  # 先删除，再插入
+                df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+                drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+                filename=rt_filename,  # 用来追踪处理进度
+                service_database=service_database,  # 字典
+            )
+            df_to_json.as_json_file()  # 写入 json 文件, 包含数据的 dtypes 信息
+def date_table():
     """
     生成 pbix 使用的日期表
     """
@@ -1540,58 +1503,43 @@ def date_table(service_databases=[{}]):
     df['月索引'] = mon
     df.sort_values('日期', ascending=False, ignore_index=True, inplace=True)
-    for service_database in service_databases:
-        for service_name, database in service_database.items():
-            username, password, host, port = get_myconf.select_config_values(
-                target_service=service_name,
-                database=database,
-            )
-            m = mysql.MysqlUpload(
-                username=username,
-                password=password,
-                host=host,
-                port=port,
-            )
-            m.df_to_mysql(
-                df=df,
-                db_name='聚合数据',
-                table_name='日期表',
-                move_insert=True,  # 先删除，再插入
-                df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                filename=None,  # 用来追踪处理进度
-                service_database=service_database,  # 用来追踪处理进度
-            )
+    m = mysql.MysqlUpload(
+        username=username,
+        password=password,
+        host=host,
+        port=port,
+    )
+    m.df_to_mysql(
+        df=df,
+        db_name='聚合数据',
+        table_name='日期表',
+        move_insert=True,  # 先删除，再插入
+        df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+        drop_duplicates=False,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+        filename=None,  # 用来追踪处理进度
+        service_database=service_database,  # 用来追踪处理进度
+    )
-def main(service_databases=None, is_mysql=False):
+def main(is_mysql=False):
     """
     is_mysql: 调试时加，False: 是否后续的聚合数据
     """
-    if not service_databases:
-        service_databases = [
-            # {'home_lx': 'mongodb'},
-            {'home_lx': 'mysql'},
-            # {'company': 'mysql'},
-            # {'nas': 'mysql'},
-        ]
     cn = DataClean(
         path=upload_path,  # 源文件目录，下载文件夹
         source_path=source_path3,  # 原始文件保存目录
-        service_databases=service_databases
     )
     cn.new_unzip(is_move=True)  # 解压文件， is_move 解压后是否删除原 zip 压缩文件
     cn.sycm_tm(is_except=['except'])  # 天猫生意参谋
     cn.dmp_tm(is_except=['except'])  # 达摩盘
     cn.tg_reports(is_except=['except'])  # 推广报表，天猫淘宝共同清洗
     cn.syj_reports_tm(is_except=['except'])  # 天猫生意经
-    """ 淘宝生意经，不可以和天猫同时运行 """
+    # # 淘宝生意经，不可以和天猫同时运行
     # cn.syj_reports_tb(is_except=['except'])  # 淘宝生意经，不可以和天猫同时运行
     cn.jd_reports(is_except=['except'])  # 清洗京东报表
     cn.sp_scene_clean(is_except=['except'])  # 商品素材
-    cn.upload_df(service_databases=service_databases)  # 上传数据库
+    cn.upload_df()  # 上传数据库
     cn.move_sycm(is_except=['临时文件', ])  # 生意参谋，移到文件到原始文件夹
     cn.move_dmp(is_except=['临时文件', ])  # 达摩盘
@@ -1604,64 +1552,41 @@ def main(service_databases=None, is_mysql=False):
         return
     # 更新日期表
-    date_table(service_databases=service_databases)
-    # 更新货品年份基准表， 属性设置 2 - 货品年份基准
+    date_table()
+    # 更新货品年份基准表， 属性设置 3 - 货品年份基准
     p = products.Products()
-    p.to_mysql(service_databases=service_databases)
+    p.to_mysql()
+    conf = myconfig.main()
+    data = conf['Windows']['xigua_lx']['mysql']['local']
+    db_list = conf['Windows']['xigua_lx']['mysql']['数据库集']
+    db_list = [item for item in db_list if item != '聚合数据']
     # 清理所有非聚合数据的库
     optimize_data.op_data(
-        db_name_lists=[
-            '京东数据3',
-            '属性设置3',
-            '推广数据2',
-            '生意参谋3',
-            '推广数据_淘宝店',
-            '爱库存2'
-            '生意参谋3',
-            '生意经2',
-            # '聚合数据',  # 不在这里清理聚合数据, 还未开始聚合呢
-            '达摩盘3',
-        ],
-        days=100,
+        db_name_lists=db_list,
+        days=5,
         is_mongo=True,
         is_mysql=True,
-        service_databases=service_databases
     )
     # 数据聚合
-    query_data.data_aggregation(service_databases=service_databases, months=3)
+    query_data.data_aggregation(months=3)
     time.sleep(60)
     # 清理聚合数据, mongodb 中没有聚合数据，所以只需要清理 mysql 即可
     optimize_data.op_data(
         db_name_lists=['聚合数据'],
         days=3650,
-        service_databases=service_databases,
         is_mongo=False,
         is_mysql=True,
     )
 if __name__ == '__main__':
-    main(
-        service_databases = [
-            {'company': 'mysql'},
-            # {'home_lx': 'mysql'},
-            # {'home_lx': 'mongodb'},
-            # {'nas': 'mysql'},
-        ],
-        is_mysql = False,  # 清理聚合数据
-    )
-    # date_table(service_databases=[{'company': 'mysql'}])
-    # c = DataClean(
-    #     path=upload_path,  # 源文件目录，下载文件夹
-    #     source_path=source_path3,  # 原始文件保存目录
-    #     service_databases=[{'home_lx': 'mysql'},]
-    # )
-    # c.sp_scene_clean(is_except=['except'])  # 商品素材
-    # c.move_tg_tm(is_except=['临时文件', ])  # 天猫，移到文件到原始文件夹
-    # test()
+    main(is_mysql=True)
+    # conf = myconfig.main()
+    # data = conf['Windows']['xigua_lx']['mysql']['local']
+    # db_list = conf['Windows']['xigua_lx']['mysql']['数据库集']
+    # db_list = [item for item in db_list if item != '聚合数据']
+    # print(db_list)

mdbq/company/copysh.py CHANGED Viewed

@@ -321,7 +321,7 @@ def op_data(days: int =100):
         # 清理所有非聚合数据的库
         optimize_data.op_data(
             db_name_lists=[
-                '京东数据3',
+                '京东数据2',
                 '属性设置3',
                 '推广数据2',
                 '推广数据_淘宝店',
@@ -367,7 +367,6 @@ def main():
             op_data(days=100)
         t.sleep_minutes = 5  # 同步前休眠时间
-        # 4. 同步共享文件
         t.tb_file()
         time.sleep(600)  # 检测间隔

mdbq/config/myconfig.py ADDED Viewed

@@ -0,0 +1,30 @@
+# -*- coding: UTF-8 –*-
+import os
+import json
+from mdbq.config import set_support
+def main():
+    support_path = set_support.SetSupport(dirname='support').dirname
+    file = os.path.join(support_path, 'my_config.txt')
+    if not os.path.isfile(file):
+        print(f'缺少配置文件，无法读取配置文件： {file}')
+        return
+    with open(file, 'r', encoding='utf-8') as f:
+        config_datas = json.load(f)
+        return config_datas
+def write_back(datas):
+    """ 将数据写回本地 """
+    support_path = set_support.SetSupport(dirname='support').dirname
+    file = os.path.join(support_path, 'my_config.txt')
+    with open(file, 'w+', encoding='utf-8') as f:
+        json.dump(datas, f, ensure_ascii=False, sort_keys=False, indent=4)
+if __name__ == '__main__':
+    d = main()
+    print(d)

mdbq/config/products.py CHANGED Viewed

@@ -3,15 +3,28 @@ import json
 import os
 import platform
 import getpass
+import socket
 import pandas as pd
 from mdbq.mysql import mysql
-from mdbq.config import get_myconf
+from mdbq.config import myconfig
 from numpy.ma.core import product
 """
 天猫货品年份基准对照
 用于聚合数据，通过此数据表进一步可确定商品上架年月
 """
+if socket.gethostname().lower() in ['xigua_lx', 'xigua1', 'macbook pro']:
+    conf = myconfig.main()
+    data = conf['Windows']['xigua_lx']['mysql']['local']
+    username, password, host, port = data['username'], data['password'], data['host'], data['port']
+    service_database = {'xigua_lx': 'mysql'}
+elif socket.gethostname().lower() in ['company', 'Mac2.local']:
+    conf = myconfig.main()
+    data = conf['Windows']['company']['mysql']['local']
+    username, password, host, port = data['username'], data['password'], data['host'], data['port']
+    service_database = {'company': 'mysql'}
+if not username:
+    print(f'找不到主机：')
 class Products:
@@ -107,31 +120,25 @@ class Products:
         ]
         self.datas += my_datas
-    def to_mysql(self, service_databases=[{'home_lx': 'mysql'}]):
+    def to_mysql(self):
         self.update_my_datas()
         df = pd.DataFrame(self.datas)
-        for service_database in service_databases:
-            for service_name, database in service_database.items():
-                username, password, host, port = get_myconf.select_config_values(
-                    target_service=service_name,
-                    database=database,
-                )
-                m = mysql.MysqlUpload(
-                    username=username,
-                    password=password,
-                    host=host,
-                    port=port,
-                )
-                m.df_to_mysql(
-                    df=df,
-                    db_name='属性设置2',
-                    table_name='货品年份基准',
-                    move_insert = False,
-                    df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
-                    drop_duplicates=True,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
-                    icm_update=[],
-                    service_database=service_database,  # 用来追踪处理进度
-                )
+        m = mysql.MysqlUpload(
+            username=username,
+            password=password,
+            host=host,
+            port=port,
+        )
+        m.df_to_mysql(
+            df=df,
+            db_name='属性设置3',
+            table_name='货品年份基准',
+            move_insert = False,
+            df_sql=False,  # 值为 True 时使用 df.to_sql 函数上传整个表, 不会排重
+            drop_duplicates=True,  # 值为 True 时检查重复数据再插入，反之直接上传，会比较慢
+            icm_update=[],
+            service_database=service_database,  # 用来追踪处理进度
+        )
     def market_date(self, product_id: int):
         try:
@@ -153,13 +160,3 @@ if __name__ == '__main__':
     p = Products()
     year = p.market_date(product_id=product_id)
     print(f'{product_id}:  {year}')
-    p.to_mysql(service_databases=[
-        {
-            'home_lx': 'mysql'
-        },
-        {
-            'company': 'mysql'
-        }
-    ]
-    )

mdbq 2.7.0__py3-none-any.whl → 2.7.2__py3-none-any.whl

mdbq 2.7.0py3-none-any.whl → 2.7.2py3-none-any.whl