PyPI - mdbq - Versions diffs - 1.6.9__tar.gz → 1.7.1__tar.gz - Mend

mdbq 1.6.9tar.gz → 1.7.1tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (45) hide show

{mdbq-1.6.9 → mdbq-1.7.1}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: mdbq
-Version: 1.6.9
+Version: 1.7.1
 Home-page: https://pypi.org/project/mdbsql
 Author: xigua,
 Author-email: 2587125111@qq.com

{mdbq-1.6.9 → mdbq-1.7.1}/mdbq/aggregation/query_data.py RENAMED Viewed

@@ -415,7 +415,7 @@ class GroupBy:
             print(f'query_data.groupby函数中 {table_name} 传入的 df 不是 dataframe 结构')
             return pd.DataFrame()
         # print(table_name)
-        if '主体报表' in table_name:
+        if '天猫_主体报表' in table_name:
             df.rename(columns={
                 '场景名字': '营销场景',
                 '主体id': '商品id',
@@ -473,6 +473,11 @@ class GroupBy:
                     table_name: df_new,
                 }
             )
+            self.data_tgyj.update(
+                {
+                    '天猫汇总表调用': df,
+                }
+            )
             # df_pic：商品排序索引表, 给 powerbi 中的主推款排序用的,(从上月1号到今天的总花费进行排序)
             today = datetime.date.today()
             last_month = today - datetime.timedelta(days=30)
@@ -577,7 +582,7 @@ class GroupBy:
                 )
             df.insert(loc=1, column='推广渠道', value='万相台无界版')  # df中插入新列
             return df
-        elif '超级直播' in table_name:
+        elif '天猫_超级直播' in table_name:
             df.rename(columns={
                 '观看次数': '观看次数',
                 '总购物车数': '加购量',
@@ -625,6 +630,23 @@ class GroupBy:
             df.insert(loc=1, column='推广渠道', value='万相台无界版')  # df中插入新列
             # df.insert(loc=2, column='营销场景', value='超级直播')  # df中插入新列
             # df = df.loc[df['日期'].between(start_day, today)]
+            df_new = df.groupby(['日期', '推广渠道', '营销场景'], as_index=False).agg(
+                **{
+                    '花费': ('花费', np.sum),
+                    '展现量': ('展现量', np.sum),
+                    '观看次数': ('观看次数', np.sum),
+                    '加购量': ('加购量', np.sum),
+                    '成交笔数': ('成交笔数', np.sum),
+                    '成交金额': ('成交金额', np.sum),
+                    '直接成交笔数': ('直接成交笔数', np.sum),
+                    '直接成交金额': ('直接成交金额', np.sum),
+                }
+            )
+            self.data_tgyj.update(
+                {
+                    table_name: df_new,
+                }
+            )
             return df
         elif '宝贝指标' in table_name:
             """ 聚合时不可以加商家编码，编码有些是空白，有些是 0 """
@@ -818,7 +840,7 @@ class GroupBy:
     def performance(self, bb_tg=True):
          # print(self.data_tgyj)
         tg, syj, idbm, pic, cost = (
-            self.data_tgyj['主体报表'],
+            self.data_tgyj['天猫_主体报表'],
             self.data_tgyj['天猫生意经_宝贝指标'],
             self.data_tgyj['商品id编码表'],
             self.data_tgyj['商品id图片对照表'],
@@ -851,6 +873,44 @@ class GroupBy:
         df['盈亏'] = df.apply(lambda x: x['商品毛利'] - x['花费'], axis=1)
         return df
+    def performance_concat(self, bb_tg=True):
+        tg,  zb = self.data_tgyj['天猫汇总表调用'], self.data_tgyj['天猫_超级直播']
+        zb.rename(columns={
+            '观看次数': '点击量',
+        }, inplace=True)
+        zb.fillna(0, inplace=True)  # astype 之前要填充空值
+        tg.fillna(0, inplace=True)
+        zb = zb.astype({
+            '花费': float,
+            '展现量': int,
+            '点击量': int,
+            '加购量': int,
+            '成交笔数': int,
+            '成交金额': float,
+            '直接成交笔数': int,
+            '直接成交金额': float,
+        }, errors='raise')
+        tg = tg.astype({
+            '商品id': str,
+            '花费': float,
+            '展现量': int,
+            '点击量': int,
+            '加购量': int,
+            '成交笔数': int,
+            '成交金额': float,
+            '直接成交笔数': int,
+            '直接成交金额': float,
+            '自然流量曝光量': int,
+        }, errors='raise')
+        df = pd.concat([tg, zb], axis=0, ignore_index=True)
+        df.fillna(0, inplace=True)  # concat 之后要填充空值
+        df = df.astype(
+            {
+                '自然流量曝光量': int,
+        }
+        )
+        return df
     def performance_jd(self, jd_tg=True):
         jdtg, sku_sales = self.data_jdtg['京东_京准通'], self.data_jdtg['京东_sku_商品明细']
         jdtg = jdtg.groupby(['日期', '跟单sku id'],
@@ -1035,7 +1095,7 @@ def data_aggregation(service_databases=[{}], months=1):
             data_dict = [
                 {
                     '数据库名': '聚合数据',
-                    '集合名': '主体报表',
+                    '集合名': '天猫_主体报表',
                     '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费'],
                     '数据主体': sdq.tg_wxt(),
                 },
@@ -1153,6 +1213,18 @@ def data_aggregation(service_databases=[{}], months=1):
                 icm_update=['日期', '商品id'],  # 设置唯一主键
                 service_database=service_database,
             )
+            res = g.performance_concat(bb_tg=False)  # 推广主体合并直播表，依赖其他表，单独做
+            m.df_to_mysql(
+                df=res,
+                db_name='聚合数据',
+                table_name='天猫_推广汇总',
+                drop_duplicates=False,
+                icm_update=['日期', '商品id'],  # 设置唯一主键
+                service_database=service_database,
+            )
             res = g.performance_jd(jd_tg=False)  # 盈亏表，依赖其他表，单独做
             m.df_to_mysql(
                 df=res,
@@ -1163,6 +1235,7 @@ def data_aggregation(service_databases=[{}], months=1):
                 service_database=service_database,
             )
     # 这里要注释掉，不然 copysh.py 可能有问题，这里主要修改配置文件，后续触发 home_lx 的 optimize_datas.py(有s)程序进行全局清理
     # optimize_data.op_data(service_databases=service_databases, days=3650)  # 立即启动对聚合数据的清理工作
@@ -1172,7 +1245,7 @@ def main():
 if __name__ == '__main__':
-    data_aggregation(service_databases=[{'company': 'mysql'}], months=1)  # 正常的聚合所有数据
-    # data_aggregation_one(service_databases=[{'home_lx': 'mysql'}], months=1)  # 单独聚合某一个数据库，具体库进函数编辑
+    data_aggregation(service_databases=[{'company': 'mysql'}], months=24)  # 正常的聚合所有数据
+    # data_aggregation_one(service_databases=[{'company': 'mysql'}], months=1)  # 单独聚合某一个数据库，具体库进函数编辑
     # optimize_data.op_data(service_databases=[{'company': 'mysql'}], days=3650)  # 立即启动对聚合数据的清理工作

{mdbq-1.6.9 → mdbq-1.7.1}/mdbq.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: mdbq
-Version: 1.6.9
+Version: 1.7.1
 Home-page: https://pypi.org/project/mdbsql
 Author: xigua,
 Author-email: 2587125111@qq.com

{mdbq-1.6.9 → mdbq-1.7.1}/setup.py RENAMED Viewed

@@ -3,7 +3,7 @@
 from setuptools import setup, find_packages
 setup(name='mdbq',
-      version='1.6.9',
+      version='1.7.1',
       author='xigua, ',
       author_email="2587125111@qq.com",
       url='https://pypi.org/project/mdbsql',