npm - @noobdemon/noob-cli - Versions diffs - 1.5.5 → 1.7.0 - Mend

@noobdemon/noob-cli 1.5.5 → 1.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@noobdemon/noob-cli",
-  "version": "1.5.5",
+  "version": "1.7.0",
   "publishConfig": {
     "access": "public"
   },
@@ -16,7 +16,8 @@
     "LICENSE"
   ],
   "scripts": {
-    "start": "node bin/noob.js"
+    "start": "node bin/noob.js",
+    "postpublish": "node scripts/notify-discord.js"
   },
   "engines": {
     "node": ">=18"
@@ -38,6 +39,7 @@
     "boxen": "^8.0.1",
     "chalk": "^5.4.1",
     "cli-highlight": "^2.1.11",
+    "gpt-tokenizer": "^3.4.0",
     "gradient-string": "^3.0.0",
     "marked": "^15.0.12",
     "marked-terminal": "^7.3.0",

package/src/agent.js CHANGED Viewed

@@ -2,6 +2,7 @@ import os from "node:os";
 import { stream } from "./api.js";
 import { loadMemory } from "./memory.js";
 import { t } from "./i18n.js";
+import { countTokens } from "./tokens.js";
 export const SYSTEM = `You are noob, an agentic coding assistant in the spirit of Claude Code. You help with software engineering tasks by reading and editing files and running commands in the user's current working directory.
@@ -71,8 +72,13 @@ Có — cả 12 test đều pass.
 Follow this pattern exactly. Your very first response to a task that needs the filesystem MUST be a tool block — do not refuse or explain limitations.`;
-const MAX_STEPS = 300;
+// Số bước tool tối đa cho một lượt. Đặt rất cao theo yêu cầu người dùng: task
+// dài cứ chạy, đừng tự dừng. Người dùng vẫn có thể Ctrl+C bất cứ lúc nào.
+const MAX_STEPS = 10000;
 const MAX_PROMPT_CHARS = 80000; // ngân sách ký tự cho phần hội thoại gửi lên model
+// Khi history vượt ngưỡng này, gọi model phụ tóm tắt các lượt cũ thay vì cắt cụt
+// → giữ được "trí nhớ dài hạn" trong phiên mà không nổ context.
+const SUMMARIZE_THRESHOLD_CHARS = 60000;
 // Môi trường chạy thực: model cần biết OS + shell để emit lệnh ĐÚNG. Không có
 // khối này, trên Windows model hay emit lệnh Unix (wc/ls/cat/grep) → run_command
@@ -101,6 +107,7 @@ function runtimeContext() {
 // Lược ngữ cảnh để không vượt context khi phiên dài. KHÔNG đụng vào history thật
 // (vẫn lưu/đầy đủ để resume) — chỉ thu gọn BẢN SAO dùng cho prompt.
+// Nếu history đã có summary (do summarizeHistory ghi vào _summary), dùng làm head.
 function compact(history, budget) {
   const len = (m) => (m.content || "").length + 24;
   let total = history.reduce((s, m) => s + len(m), 0);
@@ -125,6 +132,68 @@ function compact(history, budget) {
   return [...head, elided, ...out.slice(tailStart)];
 }
+// Bộ nhớ dài hạn cho phiên: khi history phình to, gọi model phụ TÓM TẮT các
+// lượt cũ thành một message system gọn (giữ quyết định, file đã sửa, lý do,
+// việc dở) rồi thay phần đầu history bằng tóm tắt đó. Mutates `history` in place.
+// Trả về true nếu có tóm tắt (để caller persist phiên ngay).
+export async function maybeSummarize(history, { model, signal }) {
+  if (!history?.length) return false;
+  const totalChars = history.reduce((s, m) => s + (m.content?.length || 0), 0);
+  if (totalChars < SUMMARIZE_THRESHOLD_CHARS) return false;
+  // Giữ 8 message cuối nguyên vẹn; tóm tắt phần trước.
+  const keepTail = 8;
+  if (history.length <= keepTail + 2) return false;
+  // Nếu lượt đầu đã là summary (role=system, name=summary) → tóm tắt thêm.
+  const head = history.slice(0, history.length - keepTail);
+  const tail = history.slice(history.length - keepTail);
+  const transcript = head.map((m) => {
+    const role = m.role === "tool" ? `TOOL(${m.name || "?"})` : m.role.toUpperCase();
+    return `## ${role}\n${(m.content || "").slice(0, 2000)}`;
+  }).join("\n\n");
+  const ask = `Tóm tắt phần hội thoại sau thành BẢN GHI NGẮN GỌN (~25-40 dòng, tiếng Việt) để bạn — chính bạn — đọc lại sau và tiếp tục công việc mà không quên ngữ cảnh quan trọng.
+BẮT BUỘC giữ lại:
+- Mục tiêu/nhiệm vụ tổng người dùng giao (nguyên văn nếu ngắn).
+- Các quyết định thiết kế đã chốt và LÝ DO.
+- Danh sách file đã tạo/sửa kèm mô tả NGẮN (1 dòng/file) — vai trò của file.
+- Các phát hiện quan trọng từ tool (cấu trúc dự án, lệnh build/test, lỗi đã gặp & cách fix).
+- Việc CÒN DANG DỞ và bước kế tiếp đã dự định.
+- Sở thích/yêu cầu đặc biệt của người dùng.
+LOẠI BỎ: chi tiết nội dung file đọc được, output dài của tool, các lượt khảo sát lặp lại.
+Định dạng:
+# Tóm tắt phiên (đến lượt thứ ${head.length})
+## Mục tiêu
+- ...
+## Quyết định & lý do
+- ...
+## File đã đụng
+- path — vai trò
+## Phát hiện & lệnh quan trọng
+- ...
+## Đang làm dở / bước tiếp
+- ...
+--- HỘI THOẠI CẦN TÓM TẮT ---
+${transcript}`;
+  try {
+    const { text } = await stream({ mode: "chat", model, message: ask, signal });
+    const summary = (text || "").trim();
+    if (!summary || summary.length < 50) return false;
+    // Thay head bằng MỘT message tool tên "session_summary".
+    const summaryMsg = {
+      role: "tool",
+      name: "session_summary",
+      content: `[BỘ NHỚ DÀI HẠN — tóm tắt ${head.length} lượt đầu để không quên ngữ cảnh]\n\n${summary}`,
+    };
+    history.splice(0, history.length, summaryMsg, ...tail);
+    return true;
+  } catch {
+    return false; // tóm tắt lỗi → cứ để compact() cắt cụt như cũ
+  }
+}
 // GROUND TRUTH: liệt kê những file ĐÃ THỰC SỰ được ghi/sửa, suy ra từ KẾT QUẢ
 // tool có thật (không phải từ lời model tự kể). Chống lỗi model "tưởng đã tạo
 // file" (chỉ kể trong văn xuôi, quên gọi write_file) rồi khăng khăng "file bị
@@ -148,21 +217,31 @@ function filesLedger(history) {
 // Chèn bộ nhớ noob.md (nếu có) vào prompt — đây là phần "tự học" mà noob đọc
 // lại mỗi lượt. Không có file → nhắc model tự tạo khi rút ra điều đáng nhớ.
+// Framing MẠNH: phần `## Rules` là binding (luật dự án), `## Notes` mới là
+// tham khảo. Đặt ngay sau SYSTEM trong buildPrompt() để không bị lost-in-the-middle.
 function memoryBlock() {
   const mem = loadMemory();
   if (!mem)
-    return "# PROJECT MEMORY (noob.md)\n(Chưa có noob.md trong thư mục này. Khi rút ra điều đáng nhớ lâu dài — lệnh build/test/run, quy ước, kiến trúc, sở thích người dùng, tiến độ — hãy TẠO noob.md bằng write_file và ghi vào đó.)";
+    return "# PROJECT RULES & MEMORY (noob.md)\n(Chưa có noob.md trong thư mục này. Khi rút ra điều đáng nhớ lâu dài — lệnh build/test/run, quy ước, kiến trúc, sở thích người dùng, tiến độ — hãy TẠO noob.md bằng write_file và ghi vào đó.)";
   return (
-    "# PROJECT MEMORY (noob.md — điều bạn đã tự học trước đó; xác minh với filesystem trước khi tin tuyệt đối)\n" +
+    "# PROJECT RULES & MEMORY (noob.md) — BINDING\n" +
+    "Phần `## Rules` dưới đây là LUẬT DỰ ÁN bạn PHẢI tuân theo trong mọi hành động ở lượt này — coi như mở rộng của SYSTEM, không phải gợi ý. Phần `## Notes` là quan sát tham khảo, có thể xác minh lại với filesystem nếu nghi ngờ.\n\n" +
     mem +
-    "\n(Học thêm điều đáng nhớ → cập nhật noob.md bằng edit_file/write_file.)"
+    "\n\nTrước khi emit hành động, đối chiếu với `## Rules` ở trên. Học thêm điều đáng nhớ → cập nhật noob.md bằng edit_file/write_file (Notes mới, promote lên Rules khi đã chứng minh)."
   );
 }
 // The proxy is stateless, so we serialize the whole transcript into one prompt.
-function buildPrompt(history) {
+// extraToolsDoc: chuỗi mô tả thêm tool (vd spawn_agent khi agent mode bật) được
+// chèn ngay sau SYSTEM để model biết và dùng được.
+function buildPrompt(history, extraToolsDoc) {
   const msgs = compact(history, MAX_PROMPT_CHARS);
-  const parts = [SYSTEM, "", runtimeContext(), "", memoryBlock(), "", filesLedger(history), "", "=".repeat(60), "# CONVERSATION", ""];
+  // Thứ tự CÓ CHỦ ĐÍCH: SYSTEM → memoryBlock (Rules dự án, vị trí mạnh thứ 2,
+  // tránh lost-in-the-middle) → extraToolsDoc → runtimeContext → filesLedger →
+  // CONVERSATION. noob.md (đặc biệt phần `## Rules`) phải nằm sát SYSTEM để model coi là luật.
+  const parts = [SYSTEM, "", memoryBlock()];
+  if (extraToolsDoc) parts.push("", extraToolsDoc);
+  parts.push("", runtimeContext(), "", filesLedger(history), "", "=".repeat(60), "# CONVERSATION", "");
   for (const m of msgs) {
     if (m.role === "user") parts.push(`## USER\n${m.content}`);
     else if (m.role === "assistant") parts.push(`## ASSISTANT\n${m.content}`);
@@ -230,14 +309,21 @@ function extractJsonObject(s, from) {
  * @param {(msg:string)=>void} opts.onStatus      thinking/streaming status
  * @returns {Promise<string>} the final assistant answer (no tool block)
  */
-export async function runAgent({ history, model, signal, onTool, onStatus, onDelta, onSteer }) {
+export async function runAgent({ history, model, signal, onTool, onStatus, onDelta, onSteer, tokenMeter, extraToolsDoc }) {
   for (let step = 0; step < MAX_STEPS; step++) {
+    // Mỗi 100 bước log một mốc để người dùng biết noob vẫn đang chạy (task dài).
+    if (step > 0 && step % 100 === 0) onStatus?.(`đã chạy ${step} bước…`);
     // Steering: tin nhắn người dùng gõ GIỮA CHỪNG được chèn vào hội thoại TRƯỚC
     // lần gọi model kế tiếp → model thấy và điều chỉnh ngay trong cùng task.
     const steer = onSteer?.() || [];
     for (const msg of steer) history.push({ role: "user", content: msg });
-    const prompt = buildPrompt(history);
+    // Bộ nhớ dài hạn: thử tóm tắt nếu history đã phình. Im lặng nếu không cần.
+    try { await maybeSummarize(history, { model, signal }); } catch {}
+    const prompt = buildPrompt(history, extraToolsDoc);
+    tokenMeter?.addInput(countTokens(prompt));
     onStatus?.("thinking");
     onDelta?.({ type: "step-start" });
     const { text } = await stream({
@@ -245,8 +331,12 @@ export async function runAgent({ history, model, signal, onTool, onStatus, onDel
       model,
       message: prompt,
       signal,
-      onDelta: (d) => onDelta?.({ type: "delta", text: d }),
+      onDelta: (d) => {
+        tokenMeter?.pushOutputDelta(d);
+        onDelta?.({ type: "delta", text: d });
+      },
     });
+    tokenMeter?.endOutput();
     onDelta?.({ type: "step-end" });
     history.push({ role: "assistant", content: text });

package/src/i18n.js CHANGED Viewed

@@ -57,6 +57,8 @@ export const t = {
   cmdSearch: "/search        bật/tắt chế độ tìm web",
   cmdChat: "/chat          quay lại chế độ chat thường",
   cmdYolo: "/yolo          bật/tắt tự duyệt (hoặc nhấn Shift+Tab)",
+  cmdAgent: "/agent on|off  bật/tắt agent mode (model đẻ sub-agent song song/tuần tự/phân cấp)",
+  cmdTokens: "/tokens        xem số token đã dùng trong phiên",
   cmdAutoYolo: "/auto-yolo     lưu/bỏ yolo làm mặc định mỗi lần chạy (cần xác nhận)",
   cmdInit: "/init           quét dự án & tạo noob.md (tổng quan + quy ước, như Claude Code)",
   cmdKarpathy: "/karpathy [path]  rà soát code theo 4 nguyên tắc Karpathy (/kc)",

package/src/repl.js CHANGED Viewed

@@ -4,6 +4,8 @@ import path from "node:path";
 import chalk from "chalk";
 import { createTui } from "./tui.js";
 import { runAgent } from "./agent.js";
+import { runSubAgent, spawnAgentToolsDoc, MAX_SUBAGENT_DEPTH } from "./subagent.js";
+import { TokenMeter } from "./tokens.js";
 import { stream, usage, ApiError } from "./api.js";
 import { runTool, describe, DESTRUCTIVE } from "./tools.js";
 import { MODELS, PROVIDERS, findModel, providerColor, DEFAULT_MODEL } from "./models.js";
@@ -28,6 +30,8 @@ const SLASH = [
   { name: "/init", desc: "quét dự án & tạo noob.md" },
   { name: "/karpathy", desc: "rà soát code (Karpathy)" },
   { name: "/ultra", desc: "tự hành: tự nghĩ & làm nhiệm vụ" },
+  { name: "/agent", desc: "bật/tắt agent mode (spawn sub-agent)" },
+  { name: "/tokens", desc: "xem số token đã dùng phiên này" },
   { name: "/learn", desc: "chưng cất bài học vào noob.md" },
   { name: "/memory", desc: "xem bộ nhớ noob.md" },
   { name: "/login", desc: "đăng nhập bằng API key" },
@@ -127,7 +131,9 @@ export async function startRepl(opts = {}) {
     autoApprove: new Set(),
     yolo: !!opts.yolo || config.yoloDefault, // cờ --yolo HOẶC mặc định đã lưu (/auto-yolo)
     ultra: false, // chế độ tự hành (self-quest) đang chạy?
+    agentMode: false, // /agent on → cho phép spawn_agent / spawn_agents
   };
+  const tokenMeter = new TokenMeter();
   // Prompt = dòng trạng thái sống. Luôn phản ánh yolo + version theo thời gian
   // thực (vẽ lại mỗi lượt và ngay khi Shift+Tab), nên không cần gõ /status.
@@ -632,10 +638,49 @@ NGUYÊN TẮC:
       startSpin(t.thinking);
       let printer = null;
+      const dispatchTool = async (name, input, depth = 0) => {
+        // spawn_agent / spawn_agents chỉ được phép khi agentMode bật; depth giới hạn
+        // bởi MAX_SUBAGENT_DEPTH để tránh đệ quy nổ.
+        if (name === "spawn_agent" || name === "spawn_agents") {
+          if (!state.agentMode)
+            return { allow: true, result: "ERROR: agent mode đang TẮT — gõ /agent on để bật trước khi spawn." };
+          if (depth >= MAX_SUBAGENT_DEPTH)
+            return { allow: true, result: `ERROR: đã đạt depth tối đa (${MAX_SUBAGENT_DEPTH}) — không spawn thêm.` };
+          const tasks = name === "spawn_agent" ? [input] : (Array.isArray(input?.agents) ? input.agents : []);
+          if (!tasks.length) return { allow: true, result: "ERROR: thiếu task cho sub-agent." };
+          stopSpin();
+          console.log(chalk.hex("#8b5cf6")(`  ⊕ spawn ${tasks.length} sub-agent (depth ${depth + 1}/${MAX_SUBAGENT_DEPTH})`));
+          startSpin(t.thinking);
+          try {
+            const results = await Promise.all(tasks.map((task, i) =>
+              runSubAgent({
+                task: task?.task || task?.prompt || "",
+                context: task?.context || "",
+                depth: depth + 1,
+                model: state.model.id,
+                signal: abort.signal,
+                tokenMeter,
+                dispatchTool: (n, inp) => dispatchTool(n, inp, depth + 1),
+                onLog: (msg) => { stopSpin(); console.log(chalk.hex("#8b5cf6")("  " + msg)); startSpin(t.thinking); },
+              }).then((r) => `── sub-agent #${i + 1} ──\n${r}`).catch((e) => `── sub-agent #${i + 1} (LỖI) ──\n${e?.message || String(e)}`)
+            ));
+            return { allow: true, result: results.join("\n\n") };
+          } catch (err) {
+            return { allow: true, result: "ERROR sub-agent: " + (err?.message || String(err)) };
+          }
+        }
+        stopSpin();
+        const res = await execTool(name, input);
+        startSpin(t.thinking);
+        return res;
+      };
       const answer = await runAgent({
         history: state.history,
         model: state.model.id,
         signal: abort.signal,
+        tokenMeter,
+        extraToolsDoc: state.agentMode ? spawnAgentToolsDoc(0) : "",
         onStatus: () => tick(t.thinking),
         onSteer: () => {
           if (!pending.length) return [];
@@ -657,12 +702,7 @@ NGUYÊN TẮC:
             printer?.flush();
           }
         },
-        onTool: async (name, input) => {
-          stopSpin();
-          const res = await execTool(name, input);
-          startSpin(t.thinking);
-          return res;
-        },
+        onTool: (name, input) => dispatchTool(name, input, 0),
       });
       stopSpin();
@@ -771,6 +811,18 @@ NGUYÊN TẮC:
         state.yolo = !state.yolo;
         console.log((state.yolo ? c.err : c.ok)("  " + (state.yolo ? t.yoloOn : t.yoloOff)));
         break;
+      case "agent": {
+        const v = arg.toLowerCase();
+        if (v === "on" || v === "bật" || v === "bat") state.agentMode = true;
+        else if (v === "off" || v === "tắt" || v === "tat") state.agentMode = false;
+        else state.agentMode = !state.agentMode;
+        console.log((state.agentMode ? c.accent : c.dim)("  agent mode: " + (state.agentMode ? "BẬT (spawn_agent / spawn_agents khả dụng, depth tối đa " + MAX_SUBAGENT_DEPTH + ")" : "tắt")));
+        break;
+      }
+      case "tokens": {
+        console.log(c.dim(`  tokens — input: ${tokenMeter.input.toLocaleString("vi-VN")} · output: ${tokenMeter.output.toLocaleString("vi-VN")} · tổng: ${tokenMeter.total.toLocaleString("vi-VN")} · ${tokenMeter.format()}`));
+        break;
+      }
       case "auto-yolo":
       case "autoyolo":
         await toggleAutoYolo();
@@ -1016,6 +1068,8 @@ function printHelp() {
         "  " + t.cmdSearch,
         "  " + t.cmdChat,
         "  " + t.cmdYolo,
+        "  " + t.cmdAgent,
+        "  " + t.cmdTokens,
         "  " + t.cmdAutoYolo,
         "  " + t.cmdInit,
         "  " + t.cmdKarpathy,

package/src/subagent.js ADDED Viewed

@@ -0,0 +1,61 @@
+// Sub-agent: chạy một runAgent() con với history độc lập, dùng chung tool
+// runtime của cha. Hỗ trợ phân cấp (sub-agent có thể đẻ sub-agent tiếp) nhưng
+// giới hạn độ sâu để không nổ. Hỗ trợ song song qua spawn_agents (mảng).
+import { runAgent } from "./agent.js";
+import { TokenMeter } from "./tokens.js";
+export const MAX_SUBAGENT_DEPTH = 3;
+// Tài liệu tool spawn_agent — chèn vào prompt khi agent mode bật. Mô tả cho
+// model biết WHEN dùng (task lớn, chia được) và HOW (song song vs tuần tự).
+export function spawnAgentToolsDoc(depth = 0) {
+  const canSpawn = depth < MAX_SUBAGENT_DEPTH;
+  return `# AGENT MODE — multi-agent
+Bạn đang ở chế độ AGENT. Khi gặp task LỚN có thể chia nhỏ, hãy ủy thác cho sub-agent thay vì tự làm hết một mình:
+- spawn_agent  {"task": str, "context"?: str}  — đẻ MỘT sub-agent làm "task". "context" là phần ngữ cảnh cần truyền (file paths, quyết định đã chốt, ràng buộc). Sub-agent có TOÀN BỘ tool (read/write/edit/run/grep/glob…) và history RIÊNG (không thấy hội thoại của bạn). Nó trả về một chuỗi tóm tắt kết quả.
+- spawn_agents {"tasks": [{"task": str, "context"?: str}, …]} — đẻ NHIỀU sub-agent CHẠY SONG SONG. Chỉ dùng khi các task ĐỘC LẬP (không phụ thuộc kết quả của nhau). Trả về mảng tóm tắt theo đúng thứ tự tasks.
+Quy tắc dùng:
+1. TUẦN TỰ (task B cần kết quả task A): gọi spawn_agent cho A, đọc kết quả, rồi spawn_agent cho B. KHÔNG dùng spawn_agents.
+2. SONG SONG (các task không liên quan): dùng MỘT lần spawn_agents với mảng tasks. Tiết kiệm thời gian.
+3. PHÂN CẤP (task phức tạp): sub-agent của bạn cũng có spawn_agent, nó tự chia tiếp. Độ sâu tối đa hiện tại: ${MAX_SUBAGENT_DEPTH} (bạn đang ở depth=${depth}${canSpawn ? "" : " — đã chạm trần, KHÔNG được spawn nữa, tự làm"}).
+4. Việc NHỎ/đơn giản: cứ tự làm, đừng spawn cho có. Spawn có overhead (mỗi sub-agent là 1 phiên model riêng → tốn token).
+5. Sau khi gom kết quả từ sub-agent, BẠN là người tổng hợp + trả lời cuối cho user. Sub-agent không nói chuyện trực tiếp với user.
+Ví dụ song song: "viết test cho 3 module độc lập" → spawn_agents với 3 tasks.
+Ví dụ tuần tự: "thiết kế schema rồi viết migration" → spawn_agent(thiết kế) → đọc → spawn_agent(viết migration với schema đó).
+Ví dụ phân cấp: cha giao "build full app" → đẻ 1 sub-agent "build backend" → sub-agent đó tự đẻ tiếp "viết auth", "viết CRUD" song song.`;
+}
+// Chạy một sub-agent. dispatchTool: hàm để thực thi tool con (chia sẻ với cha).
+// model: dùng chung model của cha. onLog: callback để log tiến độ ra UI cha.
+export async function runSubAgent({ task, context, model, signal, dispatchTool, depth = 1, onLog, tokenMeter }) {
+  const sys = `Bạn là SUB-AGENT (depth=${depth}) được agent cha ủy thác MỘT nhiệm vụ cụ thể. Làm xong → trả lời NGẮN GỌN bằng Markdown tóm tắt KẾT QUẢ (file đã đụng, phát hiện, lỗi nếu có). Không tán gẫu. Không hỏi lại cha — tự quyết với thông tin được cấp.
+# NHIỆM VỤ
+${task}
+${context ? `\n# NGỮ CẢNH TỪ CHA\n${context}` : ""}`;
+  const history = [{ role: "user", content: sys }];
+  // Dùng chung meter của cha nếu được truyền vào → token sub-agent cộng dồn
+  // vào tổng phiên. Nếu không có thì tự tạo cục bộ (giữ tương thích cũ).
+  const meter = tokenMeter || new TokenMeter();
+  const before = { input: meter.input, output: meter.output };
+  onLog?.(`↳ sub-agent (depth=${depth}) bắt đầu: ${task.slice(0, 80)}${task.length > 80 ? "…" : ""}`);
+  const result = await runAgent({
+    history,
+    model,
+    signal,
+    tokenMeter: meter,
+    extraToolsDoc: spawnAgentToolsDoc(depth),
+    onTool: (name, input) => dispatchTool(name, input, depth),
+    onStatus: () => {},
+    onDelta: () => {},
+    onSteer: () => [],
+  });
+  const used = { input: meter.input - before.input, output: meter.output - before.output };
+  onLog?.(`↳ sub-agent (depth=${depth}) xong (↑${used.input} ↓${used.output})`);
+  // Trả về string sạch để cha (model) đọc dễ. Token đã cộng vào meter rồi.
+  return result;
+}

package/src/tokens.js ADDED Viewed

@@ -0,0 +1,70 @@
+// Đếm token cục bộ bằng gpt-tokenizer (cl100k_base - tokenizer của GPT-4).
+// CHÍNH XÁC cho GPT, XẤP XỈ cho Claude/Gemini/khác (sai số ~5-15%) — đủ để
+// hiển thị mang tính tham khảo realtime trong CLI.
+import { encode } from "gpt-tokenizer";
+export function countTokens(text) {
+  if (!text) return 0;
+  try {
+    return encode(String(text)).length;
+  } catch {
+    // Fallback heuristic nếu encoder lỗi: ~4 ký tự / token.
+    return Math.ceil(String(text).length / 4);
+  }
+}
+// Đếm token cho cả mảng messages dạng {role, content}. Cộng overhead nhỏ
+// (~4 token/message cho role + format) để gần đúng cách provider tính prompt.
+export function countMessages(messages = []) {
+  let n = 0;
+  for (const m of messages) {
+    n += countTokens(m?.content || "") + 4;
+  }
+  return n;
+}
+// Bộ đếm cộng dồn cho 1 phiên: input (prompt gửi đi) + output (text stream về).
+// Hỗ trợ cộng dồn theo delta để hiển thị realtime trong lúc stream.
+export class TokenMeter {
+  constructor() {
+    this.input = 0;
+    this.output = 0;
+    this._outBuf = ""; // gom delta để đếm theo batch (đỡ tốn CPU)
+    this._outBufN = 0; // số token đã đếm từ _outBuf (để cộng dồn chính xác)
+  }
+  addInput(n) {
+    this.input += Math.max(0, n | 0);
+  }
+  // Mỗi delta text từ stream: gom vào buffer, định kỳ encode lại để cập nhật
+  // số token. Encode toàn buffer thay vì delta riêng lẻ → chính xác hơn (BPE
+  // gộp các byte qua ranh giới delta).
+  pushOutputDelta(text) {
+    if (!text) return;
+    this._outBuf += text;
+    // Re-encode toàn bộ buffer hiện tại; cập nhật delta vào this.output.
+    const total = countTokens(this._outBuf);
+    if (total > this._outBufN) {
+      this.output += total - this._outBufN;
+      this._outBufN = total;
+    }
+  }
+  // Kết thúc một lượt output → reset buffer (bắt đầu lượt mới).
+  endOutput() {
+    this._outBuf = "";
+    this._outBufN = 0;
+  }
+  get total() {
+    return this.input + this.output;
+  }
+  // Định dạng ngắn để hiển thị ở status bar: "↑1.2k ↓340 (1.5k)".
+  format() {
+    const fmt = (n) => (n >= 1000 ? (n / 1000).toFixed(1) + "k" : String(n));
+    return `↑${fmt(this.input)} ↓${fmt(this.output)} (${fmt(this.total)})`;
+  }
+  reset() {
+    this.input = 0;
+    this.output = 0;
+    this._outBuf = "";
+    this._outBufN = 0;
+  }
+}

package/src/tools.js CHANGED Viewed

@@ -348,6 +348,10 @@ export function describe(name, input) {
       return input.id != null ? `xem tiến trình nền #${input.id}` : "liệt kê tiến trình nền";
     case "kill_bg":
       return `dừng tiến trình nền #${input.id}`;
+    case "spawn_agent":
+      return `↳ sub-agent: ${String(input.task || "").slice(0, 80)}`;
+    case "spawn_agents":
+      return `↳ ${(input.tasks || []).length} sub-agent song song`;
     default:
       return name;
   }