npm - @gracker/smartperfetto - Versions diffs - 1.0.21 → 1.0.22 - Mend

@gracker/smartperfetto 1.0.21 → 1.0.22

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

package/dist/agentv3/claudeMcpServer.d.ts.map +1 -1
package/dist/agentv3/claudeMcpServer.js +3 -2
package/dist/agentv3/claudeMcpServer.js.map +1 -1
package/dist/agentv3/claudeSystemPrompt.d.ts.map +1 -1
package/dist/agentv3/claudeSystemPrompt.js +8 -0
package/dist/agentv3/claudeSystemPrompt.js.map +1 -1
package/dist/agentv3/queryComplexityClassifier.d.ts +1 -1
package/dist/agentv3/queryComplexityClassifier.d.ts.map +1 -1
package/dist/agentv3/queryComplexityClassifier.js +20 -7
package/dist/agentv3/queryComplexityClassifier.js.map +1 -1
package/dist/agentv3/types.d.ts +5 -1
package/dist/agentv3/types.d.ts.map +1 -1
package/dist/agentv3/types.js.map +1 -1
package/package.json +1 -1
package/skills/composite/selection_range_cpu_sched_summary.skill.yaml +428 -0
package/strategies/selection-area.template.md +24 -9

package/skills/composite/selection_range_cpu_sched_summary.skill.yaml ADDED Viewed

@@ -0,0 +1,428 @@
+# SPDX-License-Identifier: AGPL-3.0-or-later
+# Copyright (C) 2024-2026 Gracker (Chris)
+# This file is part of SmartPerfetto. See LICENSE for details.
+name: selection_range_cpu_sched_summary
+version: "1.0"
+type: composite
+category: kernel
+tier: B
+meta:
+  display_name: "选区 CPU 调度与频率摘要"
+  description: "面向用户选区/可见窗口的快速 CPU 摆核、Running 排名、四象限和频率分布分析"
+  icon: "speed"
+  tags: [selection, range, cpu, sched, frequency, quadrant, migration, quick]
+triggers:
+  keywords:
+    zh: [选区, 这一段, 这段, 摆核, 核心摆放, 平均频率, 频率分布, Running 排名, 四象限]
+    en: [selection range, current window, cpu placement, core placement, average frequency, frequency distribution, running ranking, quadrant]
+  patterns:
+    - ".*(选区|这段|这一段).*(CPU|摆核|核心|频率|Running|四象限).*"
+    - ".*(selected|current).*(range|window).*(cpu|core|frequency|running|quadrant).*"
+prerequisites:
+  required_tables:
+    - thread_state
+    - thread
+    - process
+  modules:
+    - sched
+    - linux.cpu.frequency
+inputs:
+  - name: start_ts
+    type: timestamp
+    required: true
+    description: "选区起始时间戳(ns)"
+  - name: end_ts
+    type: timestamp
+    required: true
+    description: "选区结束时间戳(ns)"
+  - name: package
+    type: string
+    required: false
+    description: "可选进程名过滤，支持 GLOB 前缀匹配"
+  - name: thread_name
+    type: string
+    required: false
+    description: "可选线程名包含匹配"
+  - name: top_k
+    type: number
+    required: false
+    description: "线程/进程排名返回数量"
+  - name: freq_bucket_mhz
+    type: number
+    required: false
+    description: "频率分布桶大小，单位 MHz"
+steps:
+  - id: init_cpu_topology
+    type: skill
+    name: "初始化 CPU 拓扑"
+    skill: cpu_topology_view
+    params:
+      start_ts: "${start_ts}"
+      end_ts: "${end_ts}"
+    display:
+      level: hidden
+    optional: true
+  - id: running_thread_quadrants
+    type: atomic
+    name: "Running 线程四象限与摆核"
+    optional: true
+    display:
+      level: key
+      layer: overview
+      title: "选区 Running 线程四象限"
+      columns:
+        - name: thread_name
+          label: "线程"
+          type: string
+        - name: process_name
+          label: "进程"
+          type: string
+        - name: tid
+          label: "TID"
+          type: number
+        - name: total_cpu_ms
+          label: "CPU 时间"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: q1_perf_running_ms
+          label: "Q1 性能核运行"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: q2_little_running_ms
+          label: "Q2 小核运行"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: q3_runnable_ms
+          label: "Q3 等待调度"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: q4a_io_blocked_ms
+          label: "Q4a IO 阻塞"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: q4b_sleeping_ms
+          label: "Q4b 睡眠等待"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: perf_core_pct
+          label: "性能核占比"
+          type: percentage
+          format: percentage
+        - name: running_cpus
+          label: "运行 CPU"
+          type: string
+        - name: running_core_types
+          label: "核心类型"
+          type: string
+        - name: migrations
+          label: "核迁移"
+          type: number
+        - name: cross_cluster_migrations
+          label: "跨簇迁移"
+          type: number
+    sql: |
+      WITH
+      target_threads AS (
+        SELECT
+          t.utid,
+          t.tid,
+          COALESCE(t.name, '<unknown>') AS thread_name,
+          p.upid,
+          p.pid,
+          COALESCE(p.name, '<unknown>') AS process_name
+        FROM thread t
+        LEFT JOIN process p ON t.upid = p.upid
+        WHERE ('${package|}' = '' OR COALESCE(p.name, '') GLOB '${package|}*')
+          AND ('${thread_name|}' = '' OR COALESCE(t.name, '') GLOB '*${thread_name|}*')
+      ),
+      states AS (
+        SELECT
+          tt.utid,
+          tt.tid,
+          tt.thread_name,
+          tt.process_name,
+          ts.ts,
+          ts.state,
+          ts.cpu,
+          COALESCE(ct.core_type, 'unknown') AS core_type,
+          MIN(ts.ts + ts.dur, ${end_ts}) - MAX(ts.ts, ${start_ts}) AS clipped_dur
+        FROM thread_state ts
+        JOIN target_threads tt ON ts.utid = tt.utid
+        LEFT JOIN _cpu_topology ct ON ts.cpu = ct.cpu_id
+        WHERE ts.ts < ${end_ts}
+          AND ts.ts + ts.dur > ${start_ts}
+          AND ts.dur > 0
+      ),
+      running_events AS (
+        SELECT
+          utid,
+          ts,
+          cpu,
+          core_type,
+          LAG(cpu) OVER (PARTITION BY utid ORDER BY ts) AS prev_cpu,
+          LAG(core_type) OVER (PARTITION BY utid ORDER BY ts) AS prev_core_type
+        FROM states
+        WHERE state = 'Running' AND clipped_dur > 0
+      ),
+      migrations AS (
+        SELECT
+          utid,
+          SUM(CASE WHEN prev_cpu IS NOT NULL AND cpu != prev_cpu THEN 1 ELSE 0 END) AS migrations,
+          SUM(CASE WHEN prev_cpu IS NOT NULL AND cpu != prev_cpu AND core_type != prev_core_type THEN 1 ELSE 0 END) AS cross_cluster_migrations
+        FROM running_events
+        GROUP BY utid
+      )
+      SELECT
+        s.thread_name,
+        s.process_name,
+        s.tid,
+        ROUND(SUM(CASE WHEN s.state = 'Running' THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS total_cpu_ms,
+        ROUND(SUM(CASE WHEN s.state = 'Running' AND s.core_type IN ('prime', 'big', 'medium') THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS q1_perf_running_ms,
+        ROUND(SUM(CASE WHEN s.state = 'Running' AND s.core_type = 'little' THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS q2_little_running_ms,
+        ROUND(SUM(CASE WHEN s.state IN ('R', 'R+') THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS q3_runnable_ms,
+        ROUND(SUM(CASE WHEN s.state IN ('D', 'DK') THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS q4a_io_blocked_ms,
+        ROUND(SUM(CASE WHEN s.state IN ('S', 'I') THEN s.clipped_dur ELSE 0 END) / 1e6, 2) AS q4b_sleeping_ms,
+        ROUND(100.0 * SUM(CASE WHEN s.state = 'Running' AND s.core_type IN ('prime', 'big', 'medium') THEN s.clipped_dur ELSE 0 END)
+          / NULLIF(SUM(CASE WHEN s.state = 'Running' THEN s.clipped_dur ELSE 0 END), 0), 1) AS perf_core_pct,
+        GROUP_CONCAT(DISTINCT CASE WHEN s.state = 'Running' THEN s.cpu END) AS running_cpus,
+        GROUP_CONCAT(DISTINCT CASE WHEN s.state = 'Running' THEN s.core_type END) AS running_core_types,
+        COALESCE(m.migrations, 0) AS migrations,
+        COALESCE(m.cross_cluster_migrations, 0) AS cross_cluster_migrations
+      FROM states s
+      LEFT JOIN migrations m ON s.utid = m.utid
+      WHERE s.clipped_dur > 0
+      GROUP BY s.utid
+      HAVING total_cpu_ms > 0
+      ORDER BY total_cpu_ms DESC
+      LIMIT ${top_k|20}
+    save_as: running_thread_quadrants
+  - id: running_process_ranking
+    type: atomic
+    name: "Running 进程排名"
+    optional: true
+    display:
+      level: summary
+      layer: list
+      title: "选区 Running 进程排名"
+      columns:
+        - name: process_name
+          label: "进程"
+          type: string
+        - name: pid
+          label: "PID"
+          type: number
+        - name: running_ms
+          label: "Running 时间"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: thread_count
+          label: "线程数"
+          type: number
+    sql: |
+      SELECT
+        COALESCE(p.name, '<unknown>') AS process_name,
+        p.pid,
+        ROUND(SUM(MIN(ts.ts + ts.dur, ${end_ts}) - MAX(ts.ts, ${start_ts})) / 1e6, 2) AS running_ms,
+        COUNT(DISTINCT ts.utid) AS thread_count
+      FROM thread_state ts
+      JOIN thread t ON ts.utid = t.utid
+      LEFT JOIN process p ON t.upid = p.upid
+      WHERE ts.ts < ${end_ts}
+        AND ts.ts + ts.dur > ${start_ts}
+        AND ts.dur > 0
+        AND ts.state = 'Running'
+        AND ('${package|}' = '' OR COALESCE(p.name, '') GLOB '${package|}*')
+        AND ('${thread_name|}' = '' OR COALESCE(t.name, '') GLOB '*${thread_name|}*')
+      GROUP BY p.upid
+      ORDER BY running_ms DESC
+      LIMIT ${top_k|20}
+    save_as: running_process_ranking
+  - id: cpu_freq_by_core
+    type: atomic
+    name: "各核 duration-weighted 频率"
+    optional: true
+    display:
+      level: summary
+      layer: list
+      title: "选区各核平均频率"
+      columns:
+        - name: cpu
+          label: "CPU"
+          type: number
+        - name: core_type
+          label: "核心类型"
+          type: string
+        - name: avg_freq_mhz
+          label: "平均频率"
+          type: number
+        - name: min_freq_mhz
+          label: "最低频率"
+          type: number
+        - name: max_freq_mhz
+          label: "最高频率"
+          type: number
+        - name: covered_ms
+          label: "覆盖时长"
+          type: duration
+          format: duration_ms
+          unit: ms
+    sql: |
+      WITH
+      cpu_tracks AS (
+        SELECT id, cpu
+        FROM cpu_counter_track
+        WHERE name = 'cpufreq' AND cpu IS NOT NULL
+      ),
+      freq_points AS (
+        SELECT
+          t.cpu,
+          ${start_ts} AS ts,
+          (
+            SELECT c2.value
+            FROM counter c2
+            WHERE c2.track_id = t.id AND c2.ts <= ${start_ts}
+            ORDER BY c2.ts DESC
+            LIMIT 1
+          ) AS freq_khz,
+          0 AS source_order
+        FROM cpu_tracks t
+        UNION ALL
+        SELECT t.cpu, c.ts, c.value AS freq_khz, 1 AS source_order
+        FROM counter c
+        JOIN cpu_tracks t ON c.track_id = t.id
+        WHERE c.ts >= ${start_ts} AND c.ts < ${end_ts}
+      ),
+      freq_spans AS (
+        SELECT
+          cpu,
+          freq_khz,
+          ts,
+          LEAD(ts, 1, ${end_ts}) OVER (PARTITION BY cpu ORDER BY ts, source_order) AS next_ts
+        FROM freq_points
+        WHERE freq_khz IS NOT NULL AND freq_khz > 0
+      ),
+      clipped AS (
+        SELECT
+          cpu,
+          freq_khz,
+          MIN(next_ts, ${end_ts}) - MAX(ts, ${start_ts}) AS dur_ns
+        FROM freq_spans
+        WHERE ts < ${end_ts} AND next_ts > ${start_ts}
+      )
+      SELECT
+        c.cpu,
+        COALESCE(ct.core_type, 'unknown') AS core_type,
+        ROUND(SUM(c.freq_khz * c.dur_ns) / NULLIF(SUM(c.dur_ns), 0) / 1000, 0) AS avg_freq_mhz,
+        ROUND(MIN(c.freq_khz) / 1000, 0) AS min_freq_mhz,
+        ROUND(MAX(c.freq_khz) / 1000, 0) AS max_freq_mhz,
+        ROUND(SUM(c.dur_ns) / 1e6, 2) AS covered_ms
+      FROM clipped c
+      LEFT JOIN _cpu_topology ct ON c.cpu = ct.cpu_id
+      WHERE c.dur_ns > 0
+      GROUP BY c.cpu
+      ORDER BY c.cpu
+    save_as: cpu_freq_by_core
+  - id: cpu_freq_distribution
+    type: atomic
+    name: "各核频率分布"
+    optional: true
+    display:
+      level: detail
+      layer: deep
+      title: "选区各核频率分布"
+      columns:
+        - name: cpu
+          label: "CPU"
+          type: number
+        - name: core_type
+          label: "核心类型"
+          type: string
+        - name: freq_mhz_bucket
+          label: "频率桶"
+          type: number
+        - name: duration_ms
+          label: "时长"
+          type: duration
+          format: duration_ms
+          unit: ms
+        - name: pct_of_range
+          label: "区间占比"
+          type: percentage
+          format: percentage
+    sql: |
+      WITH
+      cpu_tracks AS (
+        SELECT id, cpu
+        FROM cpu_counter_track
+        WHERE name = 'cpufreq' AND cpu IS NOT NULL
+      ),
+      freq_points AS (
+        SELECT
+          t.cpu,
+          ${start_ts} AS ts,
+          (
+            SELECT c2.value
+            FROM counter c2
+            WHERE c2.track_id = t.id AND c2.ts <= ${start_ts}
+            ORDER BY c2.ts DESC
+            LIMIT 1
+          ) AS freq_khz,
+          0 AS source_order
+        FROM cpu_tracks t
+        UNION ALL
+        SELECT t.cpu, c.ts, c.value AS freq_khz, 1 AS source_order
+        FROM counter c
+        JOIN cpu_tracks t ON c.track_id = t.id
+        WHERE c.ts >= ${start_ts} AND c.ts < ${end_ts}
+      ),
+      freq_spans AS (
+        SELECT
+          cpu,
+          freq_khz,
+          ts,
+          LEAD(ts, 1, ${end_ts}) OVER (PARTITION BY cpu ORDER BY ts, source_order) AS next_ts
+        FROM freq_points
+        WHERE freq_khz IS NOT NULL AND freq_khz > 0
+      ),
+      clipped AS (
+        SELECT
+          cpu,
+          CAST(ROUND(freq_khz / (${freq_bucket_mhz|100} * 1000.0)) * ${freq_bucket_mhz|100} AS INTEGER) AS freq_mhz_bucket,
+          MIN(next_ts, ${end_ts}) - MAX(ts, ${start_ts}) AS dur_ns
+        FROM freq_spans
+        WHERE ts < ${end_ts} AND next_ts > ${start_ts}
+      )
+      SELECT
+        c.cpu,
+        COALESCE(ct.core_type, 'unknown') AS core_type,
+        c.freq_mhz_bucket,
+        ROUND(SUM(c.dur_ns) / 1e6, 2) AS duration_ms,
+        ROUND(100.0 * SUM(c.dur_ns) / NULLIF(${end_ts} - ${start_ts}, 0), 1) AS pct_of_range
+      FROM clipped c
+      LEFT JOIN _cpu_topology ct ON c.cpu = ct.cpu_id
+      WHERE c.dur_ns > 0
+      GROUP BY c.cpu, c.freq_mhz_bucket
+      ORDER BY c.cpu, duration_ms DESC
+      LIMIT 100
+    save_as: cpu_freq_distribution
+output:
+  format: structured

package/strategies/selection-area.template.md CHANGED Viewed

@@ -7,28 +7,40 @@
   {{durationMs}}  - Duration in ms, e.g. "19.30"
   {{trackCount}}  - Number of selected tracks (number or "未知")
   {{trackSummary}} - Pre-formatted track list grouped by process (string, may be empty)
+  {{sourceLabel}} - Selection source label, e.g. Perfetto area/time-range selection or current visible timeline window
 -->
 ## 用户选区上下文
-用户在 Perfetto UI 中选择了一段时间区间（按 M 键标记）：
+用户当前问题带有一个明确的时间范围 scope（来源: {{sourceLabel}}）：
 - **起始时间:** {{startNs}} ns
 - **结束时间:** {{endNs}} ns
 - **持续时间:** {{durationMs}} ms
 - **选中 Track 数:** {{trackCount}}{{trackSummary}}
 **分析约束:**
-- 你的 SQL 查询必须使用 `WHERE ts >= {{startNs}} AND ts <= {{endNs}}` 来限制时间范围
+- 选区/窗口只定义时间和可选 track scope；用户真正要看的指标由用户问题决定，不要用固定 pattern 代替意图判断
+- SQL 查询必须限制在上述时间范围。对 `slice` / `thread_state` / `sched_slice` 这类带持续时间的表，优先使用 overlap clipping：`ts < {{endNs}} AND ts + dur > {{startNs}}`，并用 `MIN(ts + dur, {{endNs}}) - MAX(ts, {{startNs}})` 计算区间内贡献
 - 上述时间戳是 trace_processor 原始时间戳（ns），可直接用于 slice/thread_state/sched 等所有表的 ts 列
 - 分析结论应聚焦于用户选择的这段区间
 - 如果需要全局上下文（如整体 VSync 周期）来做对比，可以额外查询，但核心分析范围是选区内
-- 当用户提到"选中的区间"/"这一段"/"选择的范围"/"marked area"等，指的就是上述时间窗口
+- 当用户提到"选中的区间"/"这一段"/"选择的范围"/"marked area"/"current window"等，指的就是上述时间窗口
+- 如果前端请求附带了 `traceContext` datasets，优先复用其中已经预取的选区数据；缺少用户所问的指标时，再调用工具补齐
-**选区内常用 SQL 查询模板:**
+**快速路径建议:**
+- 对 CPU 摆核、task/core placement、各核平均频率、频率分布、Running task/process 排名、Running 四象限这类选区问题，优先调用：
+  `invoke_skill(skillId="selection_range_cpu_sched_summary", params={start_ts: {{startNs}}, end_ts: {{endNs}}})`
+- 如果用户限定某个进程或线程，把它作为 `package` 或 `thread_name` 参数传给该 Skill；没有限定时保持未过滤，让结果按数据排序
+- 如果用户只问一个 Skill 未覆盖的小指标，可以直接 `execute_sql`，但仍必须使用上述时间范围和 overlap clipping
+**选区内常用 SQL 查询模板（需要自定义 SQL 时使用）:**
 ```sql
 -- 1) 选区内某线程的调度状态分布（大小核、Running/Sleeping/Runnable）
-SELECT cpu, state, SUM(dur)/1e6 AS total_ms, COUNT(*) AS count
+SELECT cpu, state,
+       SUM(MIN(ts + dur, {{endNs}}) - MAX(ts, {{startNs}}))/1e6 AS total_ms,
+       COUNT(*) AS count
 FROM thread_state
-WHERE utid = <UTID> AND ts >= {{startNs}} AND ts <= {{endNs}}
+WHERE utid = <UTID>
+  AND ts < {{endNs}} AND ts + dur > {{startNs}}
 GROUP BY cpu, state ORDER BY total_ms DESC;
 -- 2) 选区内 CPU 频率变化（使用 counter + cpu_counter_track，不要用 cpu_frequency_counters）
@@ -38,9 +50,12 @@ WHERE ct.name = 'cpufreq' AND c.ts >= {{startNs}} AND c.ts <= {{endNs}}
 ORDER BY ct.cpu, c.ts;
 -- 3) 选区内某线程的 Slice 热点（通过 thread_track 关联）
-SELECT s.name, s.dur/1e6 AS dur_ms, s.ts, s.depth
+SELECT s.name,
+       (MIN(s.ts + s.dur, {{endNs}}) - MAX(s.ts, {{startNs}}))/1e6 AS dur_ms,
+       s.ts, s.depth
 FROM slice s JOIN thread_track tt ON s.track_id = tt.id
-WHERE tt.utid = <UTID> AND s.ts >= {{startNs}} AND s.ts <= {{endNs}}
+WHERE tt.utid = <UTID>
+  AND s.ts < {{endNs}} AND s.ts + s.dur > {{startNs}}
 ORDER BY s.dur DESC LIMIT 20;
 ```
-> 注意: 不要猜测表名。如果不确定表是否存在，先用 `lookup_sql_schema` 工具查询。
+> 注意: 不要猜测表名。如果不确定表是否存在，先用 `lookup_sql_schema` 工具查询。