mdbq 2.4.8__py3-none-any.whl → 2.4.9__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -770,7 +770,11 @@ class MysqlDatasQuery:
770
770
  df_dmp.sort_values('日期', ascending=True, ignore_index=True, inplace=True)
771
771
  df_dmp.drop_duplicates(subset=['日期', '人群id', '消耗(元)'], keep='last', inplace=True, ignore_index=True)
772
772
  df = pd.merge(df_dmp, df_crowd, left_on=['人群id'], right_on=['人群id'], how='left')
773
+ # 清除一些不必要的字符
774
+ df['用户年龄'] = df['用户年龄'].apply(lambda x: '~'.join(re.findall(r'^(\d+).*-(\d+)岁$', str(x))[0]) if '岁' in str(x) else x)
775
+ df['消费能力等级'] = df['消费能力等级'].apply(lambda x: f'L{''.join(re.findall(r'(\d)', str(x)))}' if '购买力' in str(x) else x)
773
776
  # df.to_csv('/Users/xigua/Downloads/test3.csv', index=False, header=True, encoding='utf-8_sig')
777
+ # breakpoint()
774
778
  return df
775
779
 
776
780
 
@@ -920,6 +924,7 @@ class GroupBy:
920
924
  ], keep='last', inplace=True, ignore_index=True)
921
925
  return df
922
926
  elif '天猫_人群报表' in table_name and '达摩盘' not in table_name:
927
+ """ 天猫推广人群报表独立生成消费力、年龄层、分类等特征,不依赖于达摩盘数据表 """
923
928
  df.rename(columns={
924
929
  '场景名字': '营销场景',
925
930
  '主体id': '商品id',
@@ -1746,7 +1751,7 @@ class GroupBy:
1746
1751
  '店铺优惠券',
1747
1752
  '高转化',
1748
1753
  '认知',
1749
- '喜欢我', # 系统推荐的宝贝相关人群
1754
+ '喜欢我', # 系统推荐宝贝/店铺访问相关人群
1750
1755
  '未购买',
1751
1756
  '种草',
1752
1757
  '兴趣',
@@ -2059,126 +2064,126 @@ def data_aggregation(service_databases=[{}], months=1, is_juhe=True):
2059
2064
 
2060
2065
  # 从数据库中获取数据, 返回包含 df 数据的字典
2061
2066
  data_dict = [
2062
- {
2063
- '数据库名': '聚合数据', # 清洗完回传的目的地数据库
2064
- '集合名': '天猫_主体报表', # 清洗完回传的数据表名
2065
- '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费'],
2066
- '数据主体': sdq.tg_wxt(),
2067
- },
2068
- {
2069
- '数据库名': '聚合数据',
2070
- '集合名': '天猫生意经_宝贝指标',
2071
- '唯一主键': ['日期', '宝贝id'], # 不能加其他字段做主键,比如销售额,是变动的,不是唯一的
2072
- '数据主体': sdq.syj(),
2073
- },
2074
- {
2075
- '数据库名': '聚合数据',
2076
- '集合名': '天猫_店铺来源_日数据',
2077
- '唯一主键': ['日期', '一级来源', '二级来源', '三级来源', '访客数'],
2078
- '数据主体': sdq.dplyd(),
2079
- },
2080
- {
2081
- '数据库名': '聚合数据',
2082
- '集合名': '天猫_店铺来源_日数据_旧版',
2083
- '唯一主键': ['日期', '一级来源', '二级来源', '三级来源'],
2084
- '数据主体': sdq.dplyd_old(),
2085
- },
2086
- {
2087
- '数据库名': '聚合数据',
2088
- '集合名': '商品id编码表',
2089
- '唯一主键': ['宝贝id'],
2090
- '数据主体': sdq.idbm(),
2091
- },
2092
- {
2093
- '数据库名': '聚合数据',
2094
- '集合名': '商品id图片对照表',
2095
- '唯一主键': ['商品id'],
2096
- '数据主体': sdq.sp_picture(),
2097
- },
2098
- {
2099
- '数据库名': '聚合数据',
2100
- '集合名': '商品成本',
2101
- '唯一主键': ['款号'],
2102
- '数据主体': sdq.sp_cost(),
2103
- },
2104
- {
2105
- '数据库名': '聚合数据',
2106
- '集合名': '京东_京准通',
2107
- '唯一主键': ['日期', '产品线', '触发sku id', '跟单sku id', '花费', ],
2108
- '数据主体': sdq.jdjzt(),
2109
- },
2110
- {
2111
- '数据库名': '聚合数据',
2112
- '集合名': '京东_京准通_全站营销',
2113
- '唯一主键': ['日期', '产品线', '花费'],
2114
- '数据主体': sdq.jdqzyx(),
2115
- },
2116
- {
2117
- '数据库名': '聚合数据',
2118
- '集合名': '京东_sku_商品明细',
2119
- '唯一主键': ['日期', '商品id', '成交单量'],
2120
- '数据主体': sdq.sku_sales(),
2121
- },
2122
- {
2123
- '数据库名': '聚合数据',
2124
- '集合名': '京东_spu_商品明细',
2125
- '唯一主键': ['日期', '商品id', '成交单量'],
2126
- '数据主体': sdq.spu_sales(),
2127
- },
2128
- {
2129
- '数据库名': '聚合数据',
2130
- '集合名': '天猫_人群报表',
2131
- '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费', '人群名字'],
2132
- '数据主体': sdq.tg_rqbb(),
2133
- },
2134
- {
2135
- '数据库名': '聚合数据',
2136
- '集合名': '天猫_关键词报表',
2137
- '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费', '词类型', '词名字/词包名字',],
2138
- '数据主体': sdq.tg_gjc(),
2139
- },
2140
- {
2141
- '数据库名': '聚合数据',
2142
- '集合名': '天猫_超级直播',
2143
- '唯一主键': ['日期', '推广渠道', '营销场景', '花费'],
2144
- '数据主体': sdq.tg_cjzb(),
2145
- },
2146
- {
2147
- '数据库名': '聚合数据',
2148
- '集合名': '京东_关键词报表',
2149
- '唯一主键': ['日期', '产品线', '搜索词', '关键词', '展现数', '花费'],
2150
- '数据主体': sdq.jd_gjc(),
2151
- },
2152
- {
2153
- '数据库名': '聚合数据',
2154
- '集合名': '天猫_品销宝账户报表',
2155
- '唯一主键': ['日期', '报表类型', '推广渠道', '营销场景', '花费'],
2156
- '数据主体': sdq.pxb_zh(),
2157
- },
2158
- {
2159
- '数据库名': '聚合数据',
2160
- '集合名': '天猫店铺来源_手淘搜索',
2161
- '唯一主键': ['日期', '关键词', '访客数'],
2162
- '数据主体': sdq.tm_search(),
2163
- },
2164
- {
2165
- '数据库名': '聚合数据',
2166
- '集合名': '生意参谋_直播场次分析',
2167
- '唯一主键': ['场次id'],
2168
- '数据主体': sdq.zb_ccfx(),
2169
- },
2170
- {
2171
- '数据库名': '聚合数据',
2172
- '集合名': '多店推广场景_按日聚合',
2173
- '唯一主键': [],
2174
- '数据主体': sdq.tg_by_day(),
2175
- },
2176
- {
2177
- '数据库名': '聚合数据',
2178
- '集合名': '爱库存_商品spu榜单',
2179
- '唯一主键': [],
2180
- '数据主体': sdq.aikucun_bd_spu(),
2181
- },
2067
+ # {
2068
+ # '数据库名': '聚合数据', # 清洗完回传的目的地数据库
2069
+ # '集合名': '天猫_主体报表', # 清洗完回传的数据表名
2070
+ # '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费'],
2071
+ # '数据主体': sdq.tg_wxt(),
2072
+ # },
2073
+ # {
2074
+ # '数据库名': '聚合数据',
2075
+ # '集合名': '天猫生意经_宝贝指标',
2076
+ # '唯一主键': ['日期', '宝贝id'], # 不能加其他字段做主键,比如销售额,是变动的,不是唯一的
2077
+ # '数据主体': sdq.syj(),
2078
+ # },
2079
+ # {
2080
+ # '数据库名': '聚合数据',
2081
+ # '集合名': '天猫_店铺来源_日数据',
2082
+ # '唯一主键': ['日期', '一级来源', '二级来源', '三级来源', '访客数'],
2083
+ # '数据主体': sdq.dplyd(),
2084
+ # },
2085
+ # {
2086
+ # '数据库名': '聚合数据',
2087
+ # '集合名': '天猫_店铺来源_日数据_旧版',
2088
+ # '唯一主键': ['日期', '一级来源', '二级来源', '三级来源'],
2089
+ # '数据主体': sdq.dplyd_old(),
2090
+ # },
2091
+ # {
2092
+ # '数据库名': '聚合数据',
2093
+ # '集合名': '商品id编码表',
2094
+ # '唯一主键': ['宝贝id'],
2095
+ # '数据主体': sdq.idbm(),
2096
+ # },
2097
+ # {
2098
+ # '数据库名': '聚合数据',
2099
+ # '集合名': '商品id图片对照表',
2100
+ # '唯一主键': ['商品id'],
2101
+ # '数据主体': sdq.sp_picture(),
2102
+ # },
2103
+ # {
2104
+ # '数据库名': '聚合数据',
2105
+ # '集合名': '商品成本',
2106
+ # '唯一主键': ['款号'],
2107
+ # '数据主体': sdq.sp_cost(),
2108
+ # },
2109
+ # {
2110
+ # '数据库名': '聚合数据',
2111
+ # '集合名': '京东_京准通',
2112
+ # '唯一主键': ['日期', '产品线', '触发sku id', '跟单sku id', '花费', ],
2113
+ # '数据主体': sdq.jdjzt(),
2114
+ # },
2115
+ # {
2116
+ # '数据库名': '聚合数据',
2117
+ # '集合名': '京东_京准通_全站营销',
2118
+ # '唯一主键': ['日期', '产品线', '花费'],
2119
+ # '数据主体': sdq.jdqzyx(),
2120
+ # },
2121
+ # {
2122
+ # '数据库名': '聚合数据',
2123
+ # '集合名': '京东_sku_商品明细',
2124
+ # '唯一主键': ['日期', '商品id', '成交单量'],
2125
+ # '数据主体': sdq.sku_sales(),
2126
+ # },
2127
+ # {
2128
+ # '数据库名': '聚合数据',
2129
+ # '集合名': '京东_spu_商品明细',
2130
+ # '唯一主键': ['日期', '商品id', '成交单量'],
2131
+ # '数据主体': sdq.spu_sales(),
2132
+ # },
2133
+ # {
2134
+ # '数据库名': '聚合数据',
2135
+ # '集合名': '天猫_人群报表',
2136
+ # '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费', '人群名字'],
2137
+ # '数据主体': sdq.tg_rqbb(),
2138
+ # },
2139
+ # {
2140
+ # '数据库名': '聚合数据',
2141
+ # '集合名': '天猫_关键词报表',
2142
+ # '唯一主键': ['日期', '推广渠道', '营销场景', '商品id', '花费', '词类型', '词名字/词包名字',],
2143
+ # '数据主体': sdq.tg_gjc(),
2144
+ # },
2145
+ # {
2146
+ # '数据库名': '聚合数据',
2147
+ # '集合名': '天猫_超级直播',
2148
+ # '唯一主键': ['日期', '推广渠道', '营销场景', '花费'],
2149
+ # '数据主体': sdq.tg_cjzb(),
2150
+ # },
2151
+ # {
2152
+ # '数据库名': '聚合数据',
2153
+ # '集合名': '京东_关键词报表',
2154
+ # '唯一主键': ['日期', '产品线', '搜索词', '关键词', '展现数', '花费'],
2155
+ # '数据主体': sdq.jd_gjc(),
2156
+ # },
2157
+ # {
2158
+ # '数据库名': '聚合数据',
2159
+ # '集合名': '天猫_品销宝账户报表',
2160
+ # '唯一主键': ['日期', '报表类型', '推广渠道', '营销场景', '花费'],
2161
+ # '数据主体': sdq.pxb_zh(),
2162
+ # },
2163
+ # {
2164
+ # '数据库名': '聚合数据',
2165
+ # '集合名': '天猫店铺来源_手淘搜索',
2166
+ # '唯一主键': ['日期', '关键词', '访客数'],
2167
+ # '数据主体': sdq.tm_search(),
2168
+ # },
2169
+ # {
2170
+ # '数据库名': '聚合数据',
2171
+ # '集合名': '生意参谋_直播场次分析',
2172
+ # '唯一主键': ['场次id'],
2173
+ # '数据主体': sdq.zb_ccfx(),
2174
+ # },
2175
+ # {
2176
+ # '数据库名': '聚合数据',
2177
+ # '集合名': '多店推广场景_按日聚合',
2178
+ # '唯一主键': [],
2179
+ # '数据主体': sdq.tg_by_day(),
2180
+ # },
2181
+ # {
2182
+ # '数据库名': '聚合数据',
2183
+ # '集合名': '爱库存_商品spu榜单',
2184
+ # '唯一主键': [],
2185
+ # '数据主体': sdq.aikucun_bd_spu(),
2186
+ # },
2182
2187
  {
2183
2188
  '数据库名': '聚合数据',
2184
2189
  '集合名': '达摩盘_人群报表',
@@ -2280,6 +2285,6 @@ def main():
2280
2285
 
2281
2286
 
2282
2287
  if __name__ == '__main__':
2283
- data_aggregation(service_databases=[{'company': 'mysql'}], months=0, is_juhe=False) # 正常的聚合所有数据
2288
+ data_aggregation(service_databases=[{'company': 'mysql'}], months=24, is_juhe=False) # 正常的聚合所有数据
2284
2289
  # data_aggregation_one(service_databases=[{'company': 'mysql'}], months=1) # 单独聚合某一个数据库,具体库进函数编辑
2285
2290
  # optimize_data.op_data(service_databases=[{'company': 'mysql'}], days=3650) # 立即启动对聚合数据的清理工作
mdbq/company/copysh.py CHANGED
@@ -269,7 +269,7 @@ class TbFiles:
269
269
  dir_files = f'\\\\192.168.1.198\\时尚事业部\\01.运营部\\0-电商周报-每周五更新'
270
270
  files = os.listdir(dir_files)
271
271
  for file in files:
272
- if file.endswith('.xlsx') and '0-WLM_运营周报' in file and '~' not in file and 'baidu' not in file:
272
+ if file.endswith('.xlsx') and file.startswith('0-WLM_运营周报') and '~' not in file and 'baidu' not in file:
273
273
  excel_file = os.path.join(dir_files, file)
274
274
  r.refresh_excel(file=excel_file)
275
275
 
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: mdbq
3
- Version: 2.4.8
3
+ Version: 2.4.9
4
4
  Home-page: https://pypi.org/project/mdbsql
5
5
  Author: xigua,
6
6
  Author-email: 2587125111@qq.com
@@ -5,13 +5,13 @@ mdbq/aggregation/aggregation.py,sha256=nPp5fOLktxejNEak3SyTnKLjwzK1l2xjbV45X-I4L
5
5
  mdbq/aggregation/df_types.py,sha256=U9i3q2eRPTDY8qAPTw7irzu-Tlg4CIySW9uYro81wdk,8125
6
6
  mdbq/aggregation/mysql_types.py,sha256=DQYROALDiwjJzjhaJfIIdnsrNs11i5BORlj_v6bp67Y,11062
7
7
  mdbq/aggregation/optimize_data.py,sha256=Wis40oL04M7E1pkvgNPjyVFAUe-zgjimjIVAikxYY8Y,4418
8
- mdbq/aggregation/query_data.py,sha256=mL9kGu1sZf0bIRI_s2PwF12tPR0z7jGkC_qWAz_5wG8,103128
8
+ mdbq/aggregation/query_data.py,sha256=65ulg_i5bNb4RXjtBCDKgRSKXLJJd9bb16j0EbdFVXo,103875
9
9
  mdbq/bdup/__init__.py,sha256=AkhsGk81SkG1c8FqDH5tRq-8MZmFobVbN60DTyukYTY,28
10
10
  mdbq/bdup/bdup.py,sha256=LAV0TgnQpc-LB-YuJthxb0U42_VkPidzQzAagan46lU,4234
11
11
  mdbq/clean/__init__.py,sha256=A1d6x3L27j4NtLgiFV5TANwEkLuaDfPHDQNrPBbNWtU,41
12
12
  mdbq/clean/data_clean.py,sha256=ucfslhqXVZoH2QaXHSAWDky0GhIvH9f4GeNaHg4SrFE,104790
13
13
  mdbq/company/__init__.py,sha256=qz8F_GsP_pMB5PblgJAUAMjasuZbOEp3qQOCB39E8f0,21
14
- mdbq/company/copysh.py,sha256=8LL9uPkY0L3XGxTM8G7tROaQX3YzDq5vaE8U1FLe_n0,19714
14
+ mdbq/company/copysh.py,sha256=NvlXCBZBcO2GIT5nLRYYqhOyHWM1-1RE7DHvgbj6jmQ,19723
15
15
  mdbq/company/home_sh.py,sha256=42CZ2tZIXHLl2mOl2gk2fZnjH2IHh1VJ1s3qHABjonY,18021
16
16
  mdbq/config/__init__.py,sha256=jso1oHcy6cJEfa7udS_9uO5X6kZLoPBF8l3wCYmr5dM,18
17
17
  mdbq/config/get_myconf.py,sha256=cmNvsyoNa0RbZ9FOTjSd3jyyGwkxjUo0phvdHbGlrms,6010
@@ -41,7 +41,7 @@ mdbq/req_post/__init__.py,sha256=jso1oHcy6cJEfa7udS_9uO5X6kZLoPBF8l3wCYmr5dM,18
41
41
  mdbq/req_post/req_tb.py,sha256=PexWSCPJNM6Tv0ol4lAWIhlOwsAr_frnjtcdSHCFiek,36179
42
42
  mdbq/spider/__init__.py,sha256=RBMFXGy_jd1HXZhngB2T2XTvJqki8P_Fr-pBcwijnew,18
43
43
  mdbq/spider/aikucun.py,sha256=Olq7IJP9itM4wuNxZeHOG-Q3i8wWyB4hY8TUGGwCvQ0,14104
44
- mdbq-2.4.8.dist-info/METADATA,sha256=1PkjCLlpg0ipzA5WgllXzHDYkMUb10_sMB0RU2xIIww,245
45
- mdbq-2.4.8.dist-info/WHEEL,sha256=eOLhNAGa2EW3wWl_TU484h7q1UNgy0JXjjoqKoxAAQc,92
46
- mdbq-2.4.8.dist-info/top_level.txt,sha256=2FQ-uLnCSB-OwFiWntzmwosW3X2Xqsg0ewh1axsaylA,5
47
- mdbq-2.4.8.dist-info/RECORD,,
44
+ mdbq-2.4.9.dist-info/METADATA,sha256=3T_hJJlZ-85YZuX4DRP1CNLotuJkISvL4TbTuPJA6BE,245
45
+ mdbq-2.4.9.dist-info/WHEEL,sha256=eOLhNAGa2EW3wWl_TU484h7q1UNgy0JXjjoqKoxAAQc,92
46
+ mdbq-2.4.9.dist-info/top_level.txt,sha256=2FQ-uLnCSB-OwFiWntzmwosW3X2Xqsg0ewh1axsaylA,5
47
+ mdbq-2.4.9.dist-info/RECORD,,
File without changes