npm - @noobdemon/noob-cli - Versions diffs - 1.12.6 → 1.12.8 - Mend

@noobdemon/noob-cli 1.12.6 → 1.12.8

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

package/CHANGELOG.md CHANGED Viewed

@@ -2,7 +2,21 @@
 Tất cả thay đổi đáng kể của `@noobdemon/noob-cli` được ghi vào file này.
-## [1.12.6] - 2026-06-12
+## [1.12.8] - 2026-06-13
+### Added
+- **Claude Opus 4.8** (`gateway-claude-opus-4-8`, provider `anthropic`, tier `flagship`) — set làm `DEFAULT_MODEL` mới.
+### Removed
+- **Rút catalog xuống 3 flagship** (`src/models.js`): chỉ còn `gateway-claude-opus-4-8`, `gateway-gpt-5-5`, `gateway-deepseek-v4-pro`. Gỡ toàn bộ 32 model cũ: o3/o3-mini/o4-mini/DeepSeek R1/Qwen QwQ (reasoning), GPT-5 Mini/Nano + Gemini Flash + DeepSeek V4 Flash + GPT-4.1 Mini/Nano (fast), Gemini 2.5/3/3.1 Pro, Grok 3/4, Qwen 3 Max, Kimi K2, Llama 3.3 70B, Claude Sonnet 4/4.6, Opus 4.1/4.5/4.6/4.7, GPT-5/5.1/5.3/5.4/4o/5 Online. `PROVIDERS` map còn 3 entry (`openai`/`anthropic`/`deepseek`).
+### Changed
+- **Worker `claude-code-proxy`** (`worker/src/worker.js`): `mapModel` map "opus/claude/sonnet/haiku" → `opus-4-8`, "gpt/o3/o4" → `gpt-5-5`, "deepseek" → `deepseek-v4-pro`; fallback default → `opus-4-8`. `modelsList()` chỉ còn 3 id mới. Đã deploy (version `689b94d1`).
+## [1.12.7] - 2026-06-12
+### Changed
+- **Gỡ auto-compact, chuyển sang MANUAL only** (`src/repl.js` + `src/tokens.js` + `src/agent.js`): trước đây CLI tự gọi `maybeSummarize({force:true})` khi context đạt 75% — gián đoạn workflow giữa chừng và summary có thể mất chi tiết user cần. Giờ user toàn quyền quyết định khi nào tóm tắt bằng `/compact`. Chỉ còn 2 mốc CẢNH BÁO (không auto-action): **60% (120k tokens)** nhắc nhẹ một lần, **80% (160k tokens)** cảnh báo mạnh gợi ý gõ `/compact` trước khi provider reject ở ~200k. Đồng thời sửa bug `CONTEXT_WINDOW=2_000_000` → `200_000` (khớp Claude Opus 4.7 + GPT-4o); ngưỡng cũ 2M khiến 75% = 1.5M token không bao giờ chạm → user báo `/compact không hoạt động`. `SUMMARIZE_THRESHOLD_CHARS` 6M → 600k, `MAX_PROMPT_CHARS` 1.2M → 800k, `keepTail` 16/24 → 12/16 cho khớp window thực.
 ### Added
 - **Tool `write_todos`** (`src/repl/agent-dispatch.js` + `src/tools.js` + `src/agent.js`): tool ẢO để model declare structured todo list thay vì viết markdown `- [ ]`. Shape `{todos: [{text, done}]}` — REPLACE toàn bộ list mỗi lần gọi (no patch). Dispatcher intercept TRƯỚC `execTool`: set `state.todos` + `tui.setTodos` trực tiếp, set flag `state._todosFromTool=true` để `repl.js` skip parse markdown sau turn (tránh overwrite structured state). In compact box lần đầu, diff (chỉ dòng đổi) các lần sau. SYSTEM prompt rule TODO-BASED EXECUTION đã update: model PHẢI dùng `write_todos`, không viết markdown. Lý do: parser markdown cũ (`parseTodosFromHistory`) fragile khi model format sai (sai indent, dùng `*` thay `-`, thiếu space). Structured tool call → CLI render luôn đúng, progress bar trên status line cập nhật ngay. Stub trong `TOOLS.write_todos` làm fail-safe nếu lỡ qua `runTool` trực tiếp. Smoke `scripts/smoke-write-todos.mjs` 27/27 pass + regression `smoke-dispatch.mjs` 23/23 pass.

package/package.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
   "name": "@noobdemon/noob-cli",
-  "version": "1.12.6",
+  "version": "1.12.8",
   "publishConfig": {
     "access": "public"
   },
-  "description": "Trợ lý lập trình agentic trong terminal (kiểu Claude Code), tiếng Việt, dùng sức mạnh Noob Demon — 34 mô hình AI.",
+  "description": "Trợ lý lập trình agentic trong terminal (kiểu Claude Code), tiếng Việt, dùng sức mạnh Noob Demon — 3 mô hình flagship (Claude Opus 4.8, GPT-5.5, DeepSeek V4 Pro).",
   "type": "module",
   "bin": {
     "noob": "bin/noob.js"

package/src/agent.js CHANGED Viewed

@@ -146,10 +146,12 @@ const MAX_STEPS = 10000;
 // loop detection cũ bằng cách xen kẽ 2-3 tool call khác nhau.
 const LOOP_DETECT_WINDOW = 6;
 const LOOP_DETECT_THRESHOLD = 2;
-const MAX_PROMPT_CHARS = 1200000; // ~300k tokens (ngang context window) — compact() KHÔNG chạy trước auto-compact 80% (240k token) của repl.js
+const MAX_PROMPT_CHARS = 800000; // ~200k tokens (ngang CONTEXT_WINDOW) — compact() là safety net cuối, repl.js auto-compact ở 75% (150k token) chạy trước.
 // Khi history vượt ngưỡng này, gọi model phụ tóm tắt các lượt cũ thay vì cắt cụt
 // → giữ được "trí nhớ dài hạn" trong phiên mà không nổ context.
-const SUMMARIZE_THRESHOLD_CHARS = 6000000; // ~1.5M tokens (75% window) — summarize chỉ chạy sau auto-compact 75% với CONTEXT_WINDOW=2M
+// 600k chars ≈ 150k tokens = trùng ngưỡng auto-compact 75% của repl.js. Khi
+// /compact thủ công hoặc auto-compact gọi với force=true thì ngưỡng này bị bypass.
+const SUMMARIZE_THRESHOLD_CHARS = 600000;
 // HARD GOAL block (do /goal <text> set): chèn ngay sau memoryBlock, attention
 // cao. Mục đích — chống 3 failure mode bài "dynamic workflows" của Anthropic
@@ -262,11 +264,11 @@ export async function maybeSummarize(history, { model, signal, force = false } =
   const totalChars = history.reduce((s, m) => s + (m.content?.length || 0), 0);
   if (!force && totalChars < SUMMARIZE_THRESHOLD_CHARS) return false;
   // Giữ tail nguyên vẹn; tóm tắt phần trước.
-  // Với CONTEXT_WINDOW = 2M tokens, tail cần đủ lớn để giữ context tool result
-  // gần nhất (vd 10 lượt cuối có thể là chuỗi edit_file + run_command đang dở).
-  // force (gọi từ /compact hoặc auto-compact 75%): giữ 16 tail.
-  // non-force: giữ 24 tail (rộng tay hơn vì phiên rất dài mới trigger).
-  const keepTail = force ? 16 : 24;
+  // Với CONTEXT_WINDOW = 200k tokens, tail cần đủ để giữ vài lượt tool result
+  // gần nhất (chuỗi edit_file + run_command đang dở).
+  // force (gọi từ /compact hoặc auto-compact 75%): giữ 12 tail.
+  // non-force: giữ 16 tail (rộng tay hơn vì phiên dài mới trigger).
+  const keepTail = force ? 12 : 16;
   if (history.length <= keepTail + 2) return false;
   // Nếu lượt đầu đã là summary (role=system, name=summary) → tóm tắt thêm.
   const head = history.slice(0, history.length - keepTail);

package/src/models.js CHANGED Viewed

@@ -1,98 +1,27 @@
 // Model catalog supported by the Noob Demon gateway.
 export const MODELS = [
-  { id: 'gateway-gpt-5', name: 'GPT-5', provider: 'openai', tier: 'flagship' },
-  { id: 'gateway-gpt-5-1', name: 'GPT-5.1', provider: 'openai', tier: 'flagship' },
-  { id: 'gateway-gpt-5-3', name: 'GPT-5.3', provider: 'openai', tier: 'flagship' },
-  { id: 'gateway-gpt-5-4', name: 'GPT-5.4', provider: 'openai', tier: 'flagship' },
-  { id: 'gateway-gpt-5-5', name: 'GPT-5.5', provider: 'openai', tier: 'flagship' },
-  { id: 'gateway-gpt-o3', name: 'o3', provider: 'openai', tier: 'reasoning' },
-  { id: 'gateway-gpt-o3-mini', name: 'o3 Mini', provider: 'openai', tier: 'reasoning' },
-  { id: 'gateway-gpt-o4-mini', name: 'o4-mini', provider: 'openai', tier: 'reasoning' },
-  { id: 'gateway-gpt-4o', name: 'GPT-4o', provider: 'openai', tier: 'standard' },
-  { id: 'gateway-gpt-4-1-mini', name: 'GPT-4.1 Mini', provider: 'openai', tier: 'fast' },
-  { id: 'gateway-gpt-4-1-nano', name: 'GPT-4.1 Nano', provider: 'openai', tier: 'fast' },
-  { id: 'gateway-gpt-5-mini', name: 'GPT-5 Mini', provider: 'openai', tier: 'fast' },
-  { id: 'gateway-gpt-5-nano', name: 'GPT-5 Nano', provider: 'openai', tier: 'fast' },
-  { id: 'gateway-gpt-5-online', name: 'GPT-5 Online', provider: 'openai', tier: 'standard' },
-  {
-    id: 'gateway-claude-opus-4-7',
-    name: 'Claude Opus 4.7',
-    provider: 'anthropic',
-    tier: 'flagship',
-  },
-  {
-    id: 'gateway-claude-opus-4-6',
-    name: 'Claude Opus 4.6',
-    provider: 'anthropic',
-    tier: 'flagship',
-  },
   {
-    id: 'gateway-claude-opus-4-5',
-    name: 'Claude Opus 4.5',
+    id: 'gateway-claude-opus-4-8',
+    name: 'Claude Opus 4.8',
     provider: 'anthropic',
     tier: 'flagship',
   },
-  {
-    id: 'gateway-claude-opus-4-1',
-    name: 'Claude Opus 4.1',
-    provider: 'anthropic',
-    tier: 'standard',
-  },
-  {
-    id: 'gateway-claude-sonnet-4',
-    name: 'Claude Sonnet 4',
-    provider: 'anthropic',
-    tier: 'standard',
-  },
-  {
-    id: 'gateway-claude-sonnet-4-6',
-    name: 'Claude Sonnet 4.6',
-    provider: 'anthropic',
-    tier: 'standard',
-  },
-  { id: 'gateway-google-2.5-pro', name: 'Gemini 2.5 Pro', provider: 'google', tier: 'flagship' },
-  { id: 'gateway-gemini-3-pro', name: 'Gemini 3 Pro', provider: 'google', tier: 'flagship' },
-  { id: 'gateway-gemini-3-1-pro', name: 'Gemini 3.1 Pro', provider: 'google', tier: 'flagship' },
-  { id: 'gateway-gemini-2.5-flash', name: 'Gemini 2.5 Flash', provider: 'google', tier: 'fast' },
+  { id: 'gateway-gpt-5-5', name: 'GPT-5.5', provider: 'openai', tier: 'flagship' },
   {
     id: 'gateway-deepseek-v4-pro',
     name: 'DeepSeek V4 Pro',
     provider: 'deepseek',
     tier: 'flagship',
   },
-  {
-    id: 'gateway-deepseek-v4-flash',
-    name: 'DeepSeek V4 Flash',
-    provider: 'deepseek',
-    tier: 'fast',
-  },
-  { id: 'gateway-deepseek-r1', name: 'DeepSeek R1', provider: 'deepseek', tier: 'reasoning' },
-  { id: 'gateway-deepseek-v3', name: 'DeepSeek V3', provider: 'deepseek', tier: 'standard' },
-  { id: 'gateway-grok-4', name: 'Grok 4', provider: 'xai', tier: 'flagship' },
-  { id: 'gateway-grok-3', name: 'Grok 3', provider: 'xai', tier: 'standard' },
-  { id: 'gateway-qwen-3-max', name: 'Qwen 3 Max', provider: 'alibaba', tier: 'standard' },
-  { id: 'gateway-qwen-qwq-32b', name: 'Qwen QwQ 32B', provider: 'alibaba', tier: 'reasoning' },
-  { id: 'gateway-deepinfra-kimi-k2', name: 'Kimi K2', provider: 'moonshot', tier: 'standard' },
-  {
-    id: 'gateway-llama-3-3-70b-versatile',
-    name: 'Llama 3.3 70B',
-    provider: 'meta',
-    tier: 'standard',
-  },
 ];
 export const PROVIDERS = {
   openai: { name: 'OpenAI', color: '#10a37f' },
   anthropic: { name: 'Anthropic', color: '#d97706' },
-  google: { name: 'Google', color: '#3b82f6' },
   deepseek: { name: 'DeepSeek', color: '#06b6d4' },
-  xai: { name: 'xAI', color: '#ef4444' },
-  alibaba: { name: 'Alibaba', color: '#8b5cf6' },
-  moonshot: { name: 'Moonshot', color: '#ec4899' },
-  meta: { name: 'Meta', color: '#6366f1' },
 };
-export const DEFAULT_MODEL = 'gateway-claude-opus-4-7';
+export const DEFAULT_MODEL = 'gateway-claude-opus-4-8';
 export function findModel(id) {
   if (!id || typeof id !== 'string') return undefined;

package/src/repl.js CHANGED Viewed

@@ -1481,53 +1481,24 @@ NGUYÊN TẮC:
       // Reset turn-scoped auto-approve — chỉ áp dụng trong runAgent vừa rồi.
       // (autoApprove + autoApproveFile vẫn giữ nguyên cho phiên.)
       state.autoApproveTurn.clear();
-      // Auto-compact dựa trên context tokens thay vì chars.
-      // Với CONTEXT_WINDOW = 2M tokens (xem src/tokens.js):
-      //   75% (1.5M tokens) → auto compact
-      //   60% (1.2M tokens) → cảnh báo mạnh
-      //   40% (800k tokens) → nhắc nhẹ
-      // Ngưỡng kéo xuống vì model context dài hiện tại để 80% mới compact thì
-      // mỗi lượt cuối đã ăn 200k+ tokens — auto-compact sớm hơn giữ phiên mượt.
+      // [2026-06-12] GỠ AUTO-COMPACT — user kiểm soát compact thủ công bằng /compact.
+      // Lý do: auto-compact gián đoạn workflow giữa chừng, summary có thể mất chi
+      // tiết user cần. Giữ 2 mốc CẢNH BÁO (60% / 80%) để user biết khi nào nên
+      // chạy /compact, nhưng KHÔNG tự động chạy nữa.
+      // Với CONTEXT_WINDOW = 200k tokens:
+      //   60% (120k) → nhắc nhẹ một lần
+      //   80% (160k) → cảnh báo mạnh — nên /compact ngay trước khi provider reject
       try {
         const totalTokens = countMessages(state.history);
         const k = Math.round(totalTokens / 1000);
         const pct = Math.round((totalTokens / CONTEXT_WINDOW) * 100);
-        // Mốc 3 (≥75% — 1.5M tokens): TỰ ĐỘNG compact.
-        if (totalTokens >= CONTEXT_WINDOW * 0.75 && !state._autoCompacting) {
-          state._autoCompacting = true;
-          console.log(c.accent(`  ⚡ ${t.autoCompactTrigger(k)} (${pct}% context)`));
-          tui.setBusy(true, t.compactRunning);
-          try {
-            const ok = await maybeSummarize(state.history, { model: state.model, force: true });
-            tui.setBusy(false);
-            if (ok) {
-              const afterTokens = countMessages(state.history);
-              const aK = Math.round(afterTokens / 1000);
-              const saved =
-                totalTokens > 0 ? Math.round(((totalTokens - afterTokens) / totalTokens) * 100) : 0;
-              console.log(
-                c.ok(
-                  `  ${t.autoCompactDone(k, aK, saved)} (${Math.round((afterTokens / CONTEXT_WINDOW) * 100)}% context)`
-                )
-              );
-              state._longSessionWarned = false;
-              persist();
-            } else {
-              console.log(c.err('  ' + t.autoCompactFail));
-            }
-          } catch (e) {
-            tui.setBusy(false);
-            console.log(c.err('  ' + t.autoCompactFail));
-          } finally {
-            state._autoCompacting = false;
-          }
-        } else if (totalTokens >= CONTEXT_WINDOW * 0.6) {
-          // Mốc 2 (≥60% — 1.2M tokens): cảnh báo mạnh.
-          console.log(c.err(`  ⚠ ${t.veryLongSession(k)} (${pct}% context)`));
+        if (totalTokens >= CONTEXT_WINDOW * 0.8) {
+          // Mốc 2 (≥80% — 160k tokens): cảnh báo mạnh, gợi ý /compact ngay.
+          console.log(c.err(`  ⚠ ${t.veryLongSession(k)} (${pct}% context) — gõ /compact để tóm tắt, tránh provider reject ở ~200k.`));
           state._longSessionWarned = true;
-        } else if (totalTokens >= CONTEXT_WINDOW * 0.4 && !state._longSessionWarned) {
-          // Mốc 1 (≥40% — 800k tokens): nhắc nhẹ một lần.
-          console.log(c.dim(`  ⓘ ${t.longSession(k)} (${pct}% context)`));
+        } else if (totalTokens >= CONTEXT_WINDOW * 0.6 && !state._longSessionWarned) {
+          // Mốc 1 (≥60% — 120k tokens): nhắc nhẹ một lần.
+          console.log(c.dim(`  ⓘ ${t.longSession(k)} (${pct}% context) — cân nhắc /compact nếu phiên còn dài.`));
           state._longSessionWarned = true;
         }
       } catch {}

package/src/tokens.js CHANGED Viewed

@@ -57,8 +57,12 @@ export function countMessages(messages = []) {
 // window đủ rộng (256 chars) để qua mọi ranh giới token thực tế của cl100k/o200k
 // (token dài nhất ~ vài chục byte).
 const TAIL_WINDOW = 256;
-// Context window tối đa của model (2M tokens). Dùng để tính % usage realtime.
-export const CONTEXT_WINDOW = 2_000_000;
+// Context window tối đa của model. Đặt 200k tokens — match Claude 3.5/Opus 4,
+// GPT-4o, và an toàn cho mọi model phổ biến qua gateway (Gemini 1M, DeepSeek
+// 128k, Grok 128k...). Đặt cao hơn 200k là vô nghĩa: provider sẽ reject prompt
+// TRƯỚC khi auto-compact của repl.js có cơ hội trigger → user thấy 'compact
+// không hoạt động' dù logic compact vẫn đúng.
+export const CONTEXT_WINDOW = 200_000;
 export class TokenMeter {
   constructor() {