@tapdb/tapdb-data-analysis 0.1.27 → 0.1.28

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "@tapdb/tapdb-data-analysis",
3
- "version": "0.1.27",
3
+ "version": "0.1.28",
4
4
  "description": "TapDB 游戏数据分析 AI Agent Skill - 查询和分析 TapDB 中的游戏运营数据(活跃/留存/付费/来源/LTV 等)",
5
5
  "keywords": [
6
6
  "tapdb",
@@ -11,7 +11,7 @@ description: >
11
11
 
12
12
  # TapDB 数据分析
13
13
 
14
- > Skill 版本:v0.1.27
14
+ > Skill 版本:v0.1.28
15
15
 
16
16
  通过 Python 脚本调用 TapDB 运营数据查询接口,获取游戏指标数据并分析。
17
17
 
@@ -64,10 +64,11 @@ npm view @tapdb/tapdb-data-analysis version --registry https://registry.npmjs.or
64
64
 
65
65
  **触发**:"分析趋势/有没有异常/为什么下降/波动大"
66
66
 
67
- 1. 60 天数据(当前30天 + 上一周期30天):DAU→`active -g time --quota dau`,收入→`income -g time`,留存→`retention -g activation_time`,新增→`source -g activation_time`
68
- 2. 按 `analysis_guide.md` 异常检测方法判断,先检查节假日效应
69
- 3. 有异常→按诊断漏斗做维度分组分析(`-g` 改为维度字段如 `activation_channel`)
70
- 4. 输出执行摘要式报告
67
+ 1. 先查 60 天**汇总趋势**(当前30天 + 上一周期30天,优先周粒度):DAU→`active -g time --quota dau --group-unit week`,收入→`income -g time --group-unit week`,留存→`retention -g activation_time --group-unit week`,新增→`source -g activation_time --group-unit week`
68
+ 2. 按 `analysis_guide.md` 异常检测方法判断,先检查节假日效应(周粒度无法定位时再按日)
69
+ 3. 需要定位异常日期/用户要求按日 对异常区间切到按日(`--group-unit day`),并缩小时间窗定位异常日期
70
+ 4. 需要解释原因 → 做维度下钻:`-g <维度> --limit 10`(一次只查一个维度;默认 Top10)
71
+ 5. 输出执行摘要式报告
71
72
 
72
73
  ### C: 版本/卡池/活动分析
73
74
 
@@ -116,6 +117,7 @@ python3 <SKILL_DIR>/scripts/tapdb_query.py describe active # 查看接口
116
117
  | `--language` | 语言(国家分组时) | `--language cn` |
117
118
  | `--group-dim` | 分组维度 cy/scon | `--group-dim cy` |
118
119
  | `--de-water` | 去水 | |
120
+ | `--limit` | 结果数量上限(默认5000) | `--limit 10` |
119
121
  | `--no-truncate` | 不截断输出 | |
120
122
  | `-r` | 区域 cn/sg | `-r sg` |
121
123
 
@@ -157,6 +159,17 @@ python3 <SKILL_DIR>/scripts/tapdb_query.py raw /op/active '{"project_id":2588,"s
157
159
  | `life_cycle` | 生命周期 | `--quota payment_amount\|payment_cvs_rate\|payment_cvs\|acc_payment` | `activation_time` |
158
160
  | `ad_monet` | 广告变现 | 通用参数 | 可能返回 404(未开通或路径不同) |
159
161
 
162
+ ## 数据量控制策略(先小后大,必须遵守)
163
+
164
+ 目标:用**最省 token** 的查询顺序先定位问题,再逐步下钻;避免一上来拉按日/全量/多维明细。
165
+
166
+ - 第一次查询:只返回**汇总 + Top10**
167
+ - 汇总:优先用更粗时间粒度(`--group-unit week/month`)或更窄时间窗,而不是直接按日拉满大范围
168
+ - Top10:需要维度分布时,加 `--limit 10`(如 `-g activation_channel --limit 10`)
169
+ - 维度分组:一次只下钻一个维度,只看 **Top10**(`--limit 10`);需要更多再迭代
170
+ - 按日明细:只在需要定位**异常日期**/用户明确要求**按日趋势**时使用;先用周/月趋势锁定区间,再切到 `day` 并缩小时间窗
171
+ - 需要完整明细:只在必须时才用 `--no-truncate`,并同时缩小时间范围/limit,避免上下文爆炸
172
+
160
173
  ## 数据截断规则
161
174
 
162
175
  脚本**默认自动截断**,`_truncation` 字段含总行数、省略行数和关键列 min/max/avg。