PyPI - mdbq - Versions diffs - 3.4.0__py3-none-any.whl → 3.4.1__py3-none-any.whl - Mend

mdbq 3.4.0py3-none-any.whl → 3.4.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

mdbq/aggregation/datashow.py +175 -108
mdbq/spider/aikucun.py +1 -1
{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/METADATA +1 -1
{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/RECORD +6 -6
{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/WHEEL +0 -0
{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/top_level.txt +0 -0

mdbq/aggregation/datashow.py CHANGED Viewed

@@ -91,7 +91,9 @@ else:
 class DataShow:
     def __init__(self):
-        self.path = '/Users/xigua/Downloads'
+        self.path = '/Users/xigua/Downloads/html文件'
+        if not os.path.isdir(self.path):
+            os.makedirs(self.path)
         root = tk.Tk()
         self.screen_width = root.winfo_screenwidth()
         self.screen_height = root.winfo_screenheight()
@@ -119,100 +121,143 @@ class DataShow:
         df = pd.concat(__res, ignore_index=True)
         return df
-    def dpll_bak(self, db_name='聚合数据', table_name='店铺流量来源构成', pro_list=None, filename='店铺流量来源'):
-        if not pro_list:
-            pro_list = ['日期', '三级来源', '访客数']
-        df = self.getdata(db_name=db_name, table_name=table_name, pro_list=pro_list, start_date='2024-11-01', end_date=self.end_date)
-        if len(df) == 0:
-            print(f'数据不能为空: {table_name}')
-            return
-        df = df[df['三级来源'] != '汇总']
-        df['日期'] = pd.to_datetime(df['日期'])
-        today = datetime.date.today()
-        def st_date(num=1):
-            return pd.to_datetime(today - datetime.timedelta(days=num))
-        max_date = df['日期'].max().strftime('%Y-%m-%d')
-        df1 = df[df['日期'] >= st_date(1)]
-        df2 = df[df['日期'] >= st_date(7)]
-        df3 = df[df['日期'] >= st_date(30)]
-        df2 = df2.groupby(
-            ['三级来源'],
-            as_index=False).agg(
-            **{
-                '访客数': ('访客数', np.sum),
-            }
+    def pov_city(self, db_name='生意经3', filename='销售地域分布', start_date=None, end_date=None, percentage=None):
+        """
+        生意经  省份城市销售分析
+        """
+        if not start_date:
+            start_date = self.start_date
+        if not end_date:
+            end_date = self.end_date
+        pov_set = self.getdata(
+            db_name='属性设置3',
+            table_name=f'城市等级',
+            pro_list=[],
+            start_date=start_date,
+            end_date=end_date
         )
-        df3 = df3.groupby(
-            ['三级来源'],
-            as_index=False).agg(
-            **{
-                '访客数': ('访客数', np.sum),
-            }
+        # print(pov_set)
+        # 城市
+        pro_list = ['日期', '店铺名称', '城市', '销售额', '退款额']
+        year = datetime.datetime.today().year
+        df_city = self.getdata(
+            db_name=db_name,
+            table_name=f'地域分析_城市_{year}',
+            pro_list=pro_list,
+            start_date=start_date,
+            end_date=end_date
+        )
+        df_city = df_city[df_city['店铺名称'] == '万里马官方旗舰店']
+        df_city = df_city.groupby(['店铺名称', '城市'], as_index=False).agg(
+            **{'销售额': ('销售额', np.sum), '退款额': ('退款额', np.sum)})
+        df_city = df_city[df_city['销售额'] > 0]
+        # 将城市等级添加到df
+        pov_set = pov_set[['城市等级', '城市']]
+        pov_set.drop_duplicates(subset='城市', keep='last', inplace=True, ignore_index=True)
+        df_city = pd.merge(df_city, pov_set, left_on=['城市'], right_on=['城市'], how='left')
+        df_level = df_city.groupby(['店铺名称', '城市等级'], as_index=False).agg(
+            **{'销售额': ('销售额', np.sum), '退款额': ('退款额', np.sum)})
+        data_list = [('销售  按城市等级', df_level['城市等级'].tolist(), df_level['销售额'].tolist())]
+        if percentage:
+            print(df_city['销售额'].sum())
+            return
+            df_city1 = df_city[df_city['销售额'] > int(percentage)]
+            data_list += ('销售额top城市', df_city1['城市'].tolist(), df_city1['销售额'].tolist())
+            df_city2 = df_city[df_city['退款额'] > int(percentage)]
+            data_list += ('退款额top城市', df_city2['城市'].tolist(), df_city2['退款额'].tolist())
+        # 省份
+        pro_list = ['日期', '店铺名称', '省份', '销售额', '退款额']
+        year = datetime.datetime.today().year
+        df_pov = self.getdata(
+            db_name=db_name,
+            table_name=f'地域分析_省份_{year}',
+            pro_list=pro_list,
+            start_date=start_date,
+            end_date=end_date
         )
-        # print(df)
-        labels1 = df1['三级来源'].tolist()
-        values1 = df1['访客数'].tolist()
-        labels2 = df2['三级来源'].tolist()
-        values2 = df2['访客数'].tolist()
-        labels3 = df3['三级来源'].tolist()
-        values3 = df3['访客数'].tolist()
-        def make_sub(data_list, num):
-            # 创建一个具有1行2列的网格布局
-            t_p = []
-            for i in range(num):
-                t_p.extend([{"type": "pie"}])
-            fig = make_subplots(rows=1, cols=num, specs=[t_p])
-            pie_title = {1: 1, 2: 7, 3: 30}
-            i = 1
-            for item in data_list:
-                # 计算每个扇区的百分比，并找出哪些扇区应该被保留
-                total = sum(item['值'])
-                # 计算每个扇区的百分比，并找出哪些扇区应该被保留
-                threshold_percentage = 0.1  # 阈值百分比
-                filtered_indices = [i for i, value in enumerate(item['值']) if
-                                    (value / total) * 100 >= threshold_percentage]
-                # 提取被保留的扇区的标签和值
-                filtered_labels = [item['键'][i] for i in filtered_indices]
-                filtered_values = [item['值'][i] for i in filtered_indices]
+        df_pov = df_pov[df_pov['店铺名称'] == '万里马官方旗舰店']
+        # print(df_pov[df_pov['省份'] == '广东'])
+        df_pov = df_pov.groupby(['店铺名称', '省份'], as_index=False).agg(
+            **{'销售额': ('销售额', np.sum), '退款额': ('退款额', np.sum)})
+        if percentage:
+            df_pov1 = df_pov[df_pov['销售额'] > int(percentage)]
+            data_list += [('销售  按省份', df_pov1['省份'].tolist(), df_pov1['销售额'].tolist())]  # 添加列表数据
+            df_pov2 = df_pov[df_pov['退款额'] > int(percentage)]
+            data_list += [('退款  按省份', df_pov2['省份'].tolist(), df_pov2['退款额'].tolist())]  # 添加列表数据
-                # 添加饼图
-                fig.add_trace(
-                    go.Pie(labels=filtered_labels, values=filtered_values, name=f'pie {i}', textinfo='label+percent'),
-                    row=1, col=i)
-                # fig.add_trace(go.Pie(labels=item['键'], values=item['值'], name=f'最近{pie_title[i]}天', textinfo='label+percent'), row=1, col=i)
-                fig.add_annotation(
-                    text=f'最近{pie_title[i]}天',
-                    x=0.15 + 0.35 * (i - 1),
-                    y=0.98,
-                    xref='paper',  # # 相对于整个图表区域
-                    yref='paper',
-                    showarrow=True,   # 显示箭头
-                    align="left",  # 文本对齐方式
-                    font=dict(size=16),
-                )
-                i += 1
-                fig.update_layout(
-                    title_text=f'店铺流量来源   最近一天: {max_date}',
-                    xaxis_title='X Axis',
-                    yaxis_title='Y Axis',
-                    # width=self.screen_width // 1.4,
-                    # height=self.screen_width // 2,
-                    margin=dict(
-                        l=100,   # 左边距
-                        r=300,
-                        t=100,  # 上边距
-                        b=400,
-                    ),
+        t_p1 = []
+        for i in range(3):
+            t_p1.extend([{"type": "pie"}])  # 折线图类型
+        t_p2 = []
+        for i in range(3):
+            t_p2.extend([{"type": "pie"}])  # 饼图类型
+        specs = [t_p1, t_p2]
+        fig = make_subplots(rows=2, cols=3, specs=specs)
+        row = 0
+        col = 0
+        for item in data_list:
+            title, labels, values = item
+            # 计算每个扇区的百分比，并找出哪些扇区应该被保留
+            total = sum(values)
+            # 计算每个扇区的百分比，并找出哪些扇区应该被保留
+            percentage = 1.2  # 阈值百分比
+            filtered_indices = [i for i, value in enumerate(values) if
+                                (value / total) * 100 >= percentage]
+            # 提取被保留的扇区的标签和值
+            filtered_labels = [labels[i] for i in filtered_indices]
+            filtered_values = [values[i] for i in filtered_indices]
+            # 添加饼图
+            fig.add_trace(
+                go.Pie(
+                    labels=filtered_labels,
+                    values=filtered_values,
+                    name=title,
+                    textinfo='label+percent'
+                ),
+                row=row // 3 + 1,
+                col=col % 3 + 1,
+            )
+            x = 0.14 + 0.355 * (row % 3)
+            y = 1.04 - 0.59 * (row // 3)
+            fig.add_annotation(
+                text=title,
+                x=x,
+                y=y,
+                xref='paper',  # # 相对于整个图表区域
+                yref='paper',
+                showarrow=True,  # 显示箭头
+                align="left",  # 文本对齐方式
+                font=dict(size=14),
+            )
+            row += 1
+            col += 1
+        fig.update_layout(
+            title_text=f'销售地域分布',
+            # xaxis_title='X Axis',
+            # yaxis_title='Y Axis',
+            # width=self.screen_width // 1.4,
+            # height=self.screen_width // 2,
+            margin=dict(
+                l=100,  # 左边距
+                r=100,
+                t=100,  # 上边距
+                b=100,
+            ),
+            legend=dict(
+                # title='Legend Title',  # 图例标题
+                orientation='v',  # 图例方向（'h' 表示水平，'v' 表示垂直）
+                # x=0.5,  # 图例在图表中的 x 位置（0 到 1 的比例）
+                # y=1.02,  # 图例在图表中的 y 位置（稍微超出顶部以避免遮挡数据）
+                font=dict(
+                    size=12  # 图例字体大小
                 )
-                fig.update_layout(xaxis_showgrid=False, yaxis_showgrid=False, xaxis_visible=False, yaxis_visible=False)
-            return fig
-        data_list = [{'键': labels1, '值': values1}, {'键': labels2, '值': values2}, {'键': labels3, '值': values3}]
-        fig = make_sub(data_list=data_list, num=3)
+            )
+        )
         fig.write_html(os.path.join(self.path, f'{filename}.html'))
     def dpll(self, db_name='聚合数据', table_name='店铺流量来源构成', pro_list=None, filename='店铺流量来源'):
         if not pro_list:
             pro_list = ['日期', '店铺名称', '类别', '来源构成', '二级来源', '三级来源', '访客数']
@@ -600,7 +645,7 @@ class DataShow:
             align="left",  # 文本对齐方式
             font=dict(size=12),
         )
-        fig.write_html(os.path.join(self.path, f'{filename}.html'))
+        fig.write_html(os.path.join(self.path, f'{filename}_{item_id}.html'))
     def crowd(self, db_name='人群画像2', table_list=None, pro_list=None, filename='达摩盘人群画像', crowd_id=None, last_date=None):
         # item_ids = [696017020186, 714066010148, 830890472575]
@@ -739,29 +784,51 @@ class DataShow:
             align="left",  # 文本对齐方式
             font=dict(size=12),
         )
-        fig.write_html(os.path.join(self.path, f'{filename}.html'))
+        fig.write_html(os.path.join(self.path, f'{filename}_{crowd_name[:15]}.html'))
 def main():
     ds = DataShow()
-    ds.dpll()
-    ds.tg(
-        days=15,
-        # start_date='2024-11-01',
-        # end_date='2024-11-30',
-    )
-    ds.item_crowd(
-        item_id=839148235697,
-        lab='全部渠道',
-        option='商详浏览',
-        last_date=None,
-        d_str='近30天',
-    )
-    ds.crowd(
-        crowd_id=40457166,
-        last_date=None,
-    )
+    # # 店铺流量来源
+    # ds.dpll()
+    # # 多店聚合推广数据
+    # ds.tg(
+    #     days=15,
+    #     # start_date='2024-11-01',
+    #     # end_date='2024-11-30',
+    # )
+    #
+    # # 商品人群画像
+    # item_id_list = [
+    #     839148235697,
+    # ]
+    # for item_id in item_id_list:
+    #     ds.item_crowd(
+    #         item_id=item_id,
+    #         lab='全部渠道',
+    #         option='商详浏览',
+    #         last_date=None,
+    #         d_str='近30天',
+    #     )
+    #
+    # # 达摩盘人群画像
+    # crowid_list = [
+    #     40457166,
+    # ]
+    # for crowid in crowid_list:
+    #     ds.crowd(
+    #         crowd_id=crowid,
+    #         last_date=None,
+    #     )
+    ds.pov_city(
+        db_name='生意经3',
+        filename='销售地域分布',
+        start_date='2024-06-01',
+        end_date='2024-12-11',
+        percentage=1,
+    )
 if __name__ == '__main__':
     main()

mdbq/spider/aikucun.py CHANGED Viewed

@@ -483,7 +483,7 @@ class AikuCunNew:
 if __name__ == '__main__':
     get_cookie_aikucun()  # 登录并获取 cookies
-    akucun(date_num=3, headless=True)  # 下载数据
+    akucun(date_num=10, headless=True)  # 下载数据
     # a = AikuCunNew(shop_name='aikucun')
     # a.akc()

{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: mdbq
-Version: 3.4.0
+Version: 3.4.1
 Home-page: https://pypi.org/project/mdbq
 Author: xigua,
 Author-email: 2587125111@qq.com

{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/RECORD RENAMED Viewed

@@ -2,7 +2,7 @@ mdbq/__init__.py,sha256=Il5Q9ATdX8yXqVxtP_nYqUhExzxPC_qk_WXQ_4h0exg,16
 mdbq/__version__.py,sha256=y9Mp_8x0BCZSHsdLT_q5tX9wZwd5QgqrSIENLrb6vXA,62
 mdbq/aggregation/__init__.py,sha256=EeDqX2Aml6SPx8363J-v1lz0EcZtgwIBYyCJV6CcEDU,40
 mdbq/aggregation/aggregation.py,sha256=-yzApnlqSN2L0E1YMu5ml-W827qpKQvWPCOI7jj2kzY,80264
-mdbq/aggregation/datashow.py,sha256=2NzHGjGoUy2WG-MxmbilCj6KBAmVah3jqFuEd2zv9XU,32379
+mdbq/aggregation/datashow.py,sha256=Hwpt9REb7Iep_ptdVw0TqebYaJNNyvNs6dyOB_LqozM,34893
 mdbq/aggregation/optimize_data.py,sha256=RXIv7cACCgYyehAxMjUYi_S7rVyjIwXKWMaM3nduGtA,3068
 mdbq/aggregation/query_data.py,sha256=FiNZhL5_El2B5ADfCPGUZXsE2iZd3UmGml9Te9qJIpU,175364
 mdbq/bdup/__init__.py,sha256=AkhsGk81SkG1c8FqDH5tRq-8MZmFobVbN60DTyukYTY,28
@@ -33,8 +33,8 @@ mdbq/pbix/pbix_refresh.py,sha256=JUjKW3bNEyoMVfVfo77UhguvS5AWkixvVhDbw4_MHco,239
 mdbq/pbix/refresh_all.py,sha256=OBT9EewSZ0aRS9vL_FflVn74d4l2G00wzHiikCC4TC0,5926
 mdbq/pbix/refresh_all_old.py,sha256=_pq3WSQ728GPtEG5pfsZI2uTJhU8D6ra-htIk1JXYzw,7192
 mdbq/spider/__init__.py,sha256=RBMFXGy_jd1HXZhngB2T2XTvJqki8P_Fr-pBcwijnew,18
-mdbq/spider/aikucun.py,sha256=eAIITxnbbxsR_EoohJ78CRw2dEdfSHOltfpxBrh0cvc,22207
-mdbq-3.4.0.dist-info/METADATA,sha256=5yMS8KxK8EkUCkrPLlPexLMSb2JYk3pVTL5b2S39uME,243
-mdbq-3.4.0.dist-info/WHEEL,sha256=eOLhNAGa2EW3wWl_TU484h7q1UNgy0JXjjoqKoxAAQc,92
-mdbq-3.4.0.dist-info/top_level.txt,sha256=2FQ-uLnCSB-OwFiWntzmwosW3X2Xqsg0ewh1axsaylA,5
-mdbq-3.4.0.dist-info/RECORD,,
+mdbq/spider/aikucun.py,sha256=v7VO5gtEXR6_4Q6ujbTyu1FHu7TXHcwSQ6hIO249YH0,22208
+mdbq-3.4.1.dist-info/METADATA,sha256=n1MFzq9VZzCy63dJOU-fcJSZ0lZTXawBaIW5vXngzCE,243
+mdbq-3.4.1.dist-info/WHEEL,sha256=eOLhNAGa2EW3wWl_TU484h7q1UNgy0JXjjoqKoxAAQc,92
+mdbq-3.4.1.dist-info/top_level.txt,sha256=2FQ-uLnCSB-OwFiWntzmwosW3X2Xqsg0ewh1axsaylA,5
+mdbq-3.4.1.dist-info/RECORD,,

{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/WHEEL RENAMED Viewed

File without changes

{mdbq-3.4.0.dist-info → mdbq-3.4.1.dist-info}/top_level.txt RENAMED Viewed

File without changes

mdbq 3.4.0__py3-none-any.whl → 3.4.1__py3-none-any.whl

mdbq 3.4.0py3-none-any.whl → 3.4.1py3-none-any.whl