npm - @antaif3ng/til-work - Versions diffs - 0.1.2 → 0.3.0 - Mend

@antaif3ng/til-work 0.1.2 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

package/README.md +265 -297
package/dist/core/config.d.ts +29 -11
package/dist/core/config.d.ts.map +1 -1
package/dist/core/config.js +65 -101
package/dist/core/config.js.map +1 -1
package/dist/core/llm.d.ts.map +1 -1
package/dist/core/llm.js +14 -0
package/dist/core/llm.js.map +1 -1
package/dist/core/pricing.d.ts.map +1 -1
package/dist/core/pricing.js +0 -2
package/dist/core/pricing.js.map +1 -1
package/dist/core/session.d.ts +3 -2
package/dist/core/session.d.ts.map +1 -1
package/dist/core/session.js +4 -3
package/dist/core/session.js.map +1 -1
package/dist/core/skills.d.ts +2 -1
package/dist/core/skills.d.ts.map +1 -1
package/dist/core/skills.js +9 -0
package/dist/core/skills.js.map +1 -1
package/dist/core/system-prompt.d.ts.map +1 -1
package/dist/core/system-prompt.js +6 -2
package/dist/core/system-prompt.js.map +1 -1
package/dist/main.d.ts.map +1 -1
package/dist/main.js +66 -124
package/dist/main.js.map +1 -1
package/dist/modes/interactive.d.ts.map +1 -1
package/dist/modes/interactive.js +514 -273
package/dist/modes/interactive.js.map +1 -1
package/dist/tools/browser.d.ts +10 -0
package/dist/tools/browser.d.ts.map +1 -0
package/dist/tools/browser.js +231 -0
package/dist/tools/browser.js.map +1 -0
package/dist/tools/computer.d.ts +3 -0
package/dist/tools/computer.d.ts.map +1 -0
package/dist/tools/computer.js +251 -0
package/dist/tools/computer.js.map +1 -0
package/dist/tools/index.d.ts +5 -2
package/dist/tools/index.d.ts.map +1 -1
package/dist/tools/index.js +11 -2
package/dist/tools/index.js.map +1 -1
package/dist/tools/read.d.ts.map +1 -1
package/dist/tools/read.js +29 -4
package/dist/tools/read.js.map +1 -1
package/dist/tools/screenshot.d.ts +3 -0
package/dist/tools/screenshot.d.ts.map +1 -0
package/dist/tools/screenshot.js +113 -0
package/dist/tools/screenshot.js.map +1 -0
package/dist/utils/file-processor.d.ts +2 -2
package/dist/utils/file-processor.d.ts.map +1 -1
package/dist/utils/file-processor.js +7 -10
package/dist/utils/file-processor.js.map +1 -1
package/package.json +3 -2
package/skills/find-skills/SKILL.md +66 -0
package/skills/playwright-mcp/SKILL.md +90 -0
package/skills/self-improving-agent/SKILL.md +88 -0
package/skills/skill-creator/SKILL.md +93 -0
package/skills/summarize/SKILL.md +55 -0

package/README.md CHANGED Viewed

@@ -2,45 +2,45 @@
 > 运行在终端里的个人电脑 AI 助手，类似 Codex CLI / Claude Code。
-TIL work 是一个基于大语言模型的命令行 Agent 工具。它可以直接操作你的文件系统、执行命令、编辑代码、搜索网页，并通过对话式交互帮你完成各种电脑任务。
+TIL work 是一个基于大语言模型的命令行 Agent 工具。它可以直接操作你的文件系统、执行命令、编辑代码、搜索网页、截图、控制浏览器，并通过对话式交互帮你完成各种电脑任务。
 ## 核心能力
 | 能力 | 说明 |
 |------|------|
 | **命令执行** | 在你的系统上直接运行 bash 命令 |
-| **文件管理** | 读取、创建、编辑、复制、移动、删除文件 |
+| **文件管理** | 读取、创建、编辑、复制、移动、删除文件（支持读取图片） |
 | **代码编辑** | 精确替换代码片段（类似 sed，但更智能） |
-| **系统信息** | 查看 CPU、内存、磁盘、网络等系统状态 |
+| **截图** | 截取全屏或窗口截图，返回给 LLM 进行视觉分析 |
+| **Computer Use** | 鼠标点击、键盘输入、滚动拖拽 + 自动截图反馈 |
+| **浏览器控制** | 页面导航、点击、输入、截图、JS 执行（Playwright） |
 | **网页搜索** | 实时搜索互联网获取最新信息 |
+| **MCP 扩展** | 通过 MCP 协议接入外部工具服务（stdio / HTTP） |
 | **记忆系统** | 跨对话记住上下文（MEMORY.md + AGENTS.md） |
-| **技能系统** | 通过 SKILL.md 扩展 Agent 的专业能力 |
+| **技能系统** | 内置 5 个技能 + 支持自定义 SKILL.md 扩展 |
 | **会话持久化** | 退出后可恢复上次对话（`--resume` / `--continue`） |
 | **Context 压缩** | 长对话自动摘要压缩，防止 token 溢出 |
-| **用量追踪** | 实时显示 Token 消耗和上下文占用 |
 | **安全拦截** | 自动检测并拦截 `rm -rf`、`sudo` 等危险命令 |
-| **Markdown 渲染** | 终端内代码高亮、标题、列表等富文本显示 |
-| **多模型** | 支持 Anthropic、OpenAI、Google Gemini 及任意兼容接口 |
+| **多模型** | 支持 Anthropic、OpenAI、Google Gemini 及任意 OpenAI 兼容接口 |
+## 交互体验
+- **多行输入**：行尾输入 `\` 再回车、`Ctrl+J` 或 `Alt+Enter` 均可插入换行，`Esc` 取消多行输入
+- **输入框 UI**：带上下边框的输入区域，底部常驻显示当前工作目录和随机操作提示
+- **Placeholder**：空输入时显示换行快捷键提示，输入后自动消失
+- **文件引用**：输入 `@` 后实时搜索文件，方向键选择，文件内容自动注入 LLM 上下文
+- **命令菜单**：输入 `/` 弹出命令列表，方向键循环选择，`Enter` 直接执行，`Tab` 补全
 ## 前置要求
 - **Node.js** >= 20.6.0（推荐 22+）
 - **npm** >= 9
-- **至少一个 LLM API Key**（Anthropic / OpenAI / Google / 智谱等 OpenAI 兼容接口）
-检查 Node.js 版本：
+- **至少一个 LLM API Key**（Anthropic / OpenAI / Google / MiniMax / 智谱等 OpenAI 兼容接口）
 ```bash
 node -v  # 需要 v20.6.0 或更高
 ```
-如果未安装，推荐用 [nvm](https://github.com/nvm-sh/nvm) 安装：
-```bash
-curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.0/install.sh | bash
-nvm install 22
-```
 ## 安装
 ### 方式一：npm 全局安装（推荐）
@@ -49,6 +49,8 @@ nvm install 22
 npm install -g @antaif3ng/til-work
 ```
+安装后使用 `til` 命令启动。
 ### 方式二：从源码安装
 ```bash
@@ -59,6 +61,12 @@ npm run build
 npm link  # 注册 til 命令到全局
 ```
+### 更新版本
+```bash
+npm update -g @antaif3ng/til-work
+```
 ## 快速开始
 ### 1. 首次配置
@@ -67,7 +75,7 @@ npm link  # 注册 til 命令到全局
 til --setup
 ```
-按提示输入 API Key 和选择默认模型。配置保存在 `~/.til/config.json`。
+按提示输入模型 ID、API Key 和 Base URL。配置保存在 `~/.til/config.json`。
 你也可以通过环境变量配置：
@@ -81,9 +89,9 @@ export OPENAI_API_KEY=sk-xxxxx
 # Google Gemini
 export GOOGLE_API_KEY=AIza-xxxxx
-# OpenAI 兼容接口（如智谱、DeepSeek、Ollama 等）
+# OpenAI 兼容接口（如 MiniMax、智谱、DeepSeek、Ollama 等）
 export OPENAI_API_KEY=your-key
-export OPENAI_BASE_URL=https://open.bigmodel.cn/api/paas/v4
+export OPENAI_BASE_URL=https://api.minimaxi.com/v1
 ```
 ### 2. 启动交互模式
@@ -92,28 +100,15 @@ export OPENAI_BASE_URL=https://open.bigmodel.cn/api/paas/v4
 til
 ```
-你会看到：
-```
-┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
-┃ >_ 欢迎使用千岛湖 Agent 工具 TIL v0.1.0         ┃
-┃ model:     gpt-4o         /model 切换            ┃
-┃ directory: ~/dev/my-project                      ┃
-┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛
-```
+输入 `/` 查看所有可用命令（支持方向键循环选择），输入 `@` 引用文件内容（自动注入到上下文）。
-输入 `/` 查看所有可用命令，按 Tab 自动补全。
+支持多行输入：行尾输入 `\` 再回车，或按 `Ctrl+J` / `Alt+Enter` 换行。
 ### 3. 单次执行模式
 ```bash
-# 直接给出提示
 til "列出当前目录的所有 TypeScript 文件"
-# 通过参数传入
 til -p "解释这个错误日志" < error.log
-# 管道输入
 cat README.md | til "总结一下这个文件"
 ```
@@ -126,13 +121,13 @@ til [options] [prompt]
 选项:
   -p, --prompt <text>     单次执行模式
-  -m, --model <model>     指定模型（如 gpt-4o, claude-sonnet-4-20250514, gemini-2.5-pro-preview-06-05）
+  -m, --model <model>     指定模型 ID
   --base-url <url>        覆盖 API 地址
   --tools <list>          指定启用的工具（逗号分隔）
   --skill <path>          加载技能文件或目录（可重复）
   --no-skills             禁用自动技能加载
   --continue              恢复当前目录下的最近一次会话
-  --resume [sessionId]    恢复指定 ID 的会话（不传 ID 等同于 --continue）
+  --resume [sessionId]    恢复指定 ID 的会话
   --setup                 运行配置向导
   -h, --help              显示帮助
   -v, --version           显示版本
@@ -140,63 +135,101 @@ til [options] [prompt]
 ### 交互模式命令
-在交互模式中输入 `/` 即可看到所有命令（支持自动补全）：
+在交互模式中输入 `/` 即可看到所有命令（支持方向键选择和自动补全）：
 | 命令 | 说明 |
 |------|------|
 | `/help` | 显示帮助信息 |
-| `/model <id>` | 切换模型 |
-| `/models` | 查看可用模型列表 |
-| `/skills` | 查看已加载的技能 |
+| `/model` | 查看/切换/管理模型（支持方向键选择） |
+| `/model add <id> [baseUrl] [apiKey]` | 添加模型配置 |
+| `/model default <id>` | 设置默认模型 |
+| `/skills` | 查看已加载的技能（含来源标签） |
 | `/skill:<name>` | 查看某个技能的详细内容 |
+| `/mcp` | 查看已连接的 MCP 服务和工具 |
 | `/memory` | 查看当前记忆内容 |
 | `/usage` | 查看本次会话的 Token 用量 |
 | `/sessions` | 查看会话历史列表 |
 | `/config` | 查看当前配置 |
+| `/config check` | 测试当前 API 连接 |
 | `/clear` | 清空对话历史 |
 | `/exit` | 退出 |
 ## 内置工具
-| 工具 | 说明 |
-|------|------|
-| `bash` | 执行 bash 命令（ls, grep, git, curl 等） |
-| `read` | 读取文件内容（支持偏移和行数限制） |
-| `write` | 创建或覆盖文件 |
-| `edit` | 精确查找替换（修改文件中的特定文本） |
-| `file_manager` | 高级文件操作（复制、移动、删除、列目录、获取信息） |
-| `system_info` | 获取系统信息（OS、CPU、内存、网络、环境变量） |
-| `web_search` | 搜索互联网获取实时信息 |
+| 工具 | 类型 | 默认启用 | 说明 |
+|------|------|----------|------|
+| `bash` | 基础 | 是 | 执行 bash 命令（ls, grep, git, curl 等） |
+| `read` | 基础 | 是 | 读取文件内容（文本 + 图片 base64） |
+| `write` | 基础 | 是 | 创建或覆盖文件 |
+| `edit` | 基础 | 是 | 精确查找替换 |
+| `file_manager` | 文件 | 是 | 复制、移动、删除、列目录、获取信息 |
+| `system_info` | 系统 | 是 | OS、CPU、内存、网络、环境变量 |
+| `web_search` | 网络 | 是 | 搜索互联网获取实时信息 |
+| `web_fetch` | 网络 | 是 | 抓取网页内容转纯文本 |
+| `screenshot` | 视觉 | 是 | 截取全屏或窗口截图 |
+| `computer` | 桌面自动化 | 是 | 鼠标、键盘、滚动 + 自动截图反馈 |
+| `browser` | 浏览器 | 否 | Playwright 页面控制（需安装 Playwright） |
+### screenshot 工具
+截取屏幕或窗口截图，返回 base64 图片供 LLM 视觉分析。
+- macOS 使用 `screencapture`（系统自带）
+- Linux 使用 `gnome-screenshot` / `scrot` / `import`（需安装其中一个）
+### computer 工具
+对标 Anthropic Computer Use API，支持以下操作：
+| Action | 说明 |
+|--------|------|
+| `screenshot` | 截屏 |
+| `mouse_move` | 移动鼠标 |
+| `click` | 点击 |
+| `double_click` | 双击 |
+| `drag` | 拖拽 |
+| `type` | 输入文本 |
+| `key` | 按键组合（如 cmd+c, ctrl+shift+t） |
+| `scroll` | 滚动 |
+每个操作执行后自动截图，形成"操作 → 视觉反馈 → 下一步"循环。
+依赖：
+- macOS: `brew install cliclick`
+- Linux: `sudo apt install xdotool`
+### browser 工具
+基于 Playwright 的浏览器自动化，需单独安装：
+```bash
+npm install playwright
+npx playwright install chromium
+```
+支持 `navigate`、`screenshot`、`click`、`type`、`evaluate`、`get_text`、`scroll`、`wait`、`back`、`forward`、`close` 等操作。
 ## 配置
-配置文件位于 `~/.til/config.json`，结构如下：
+配置文件位于 `~/.til/config.json`：
 ```json
 {
-  "providers": {
-    "anthropic": {
-      "apiKey": "sk-ant-xxxxx"
-    },
-    "openai": {
-      "apiKey": "sk-xxxxx",
-      "baseUrl": "https://open.bigmodel.cn/api/paas/v4"
+  "model": "MiniMax-M2.5",
+  "apiKey": "sk-xxxxx",
+  "baseUrl": "https://api.minimaxi.com/v1",
+  "models": {
+    "MiniMax-M2.5": {
+      "provider": "openai-compatible",
+      "contextWindow": 128000
     },
-    "google": {
-      "apiKey": "AIza-xxxxx"
-    }
-  },
-  "defaultModel": {
-    "provider": "openai",
-    "id": "glm-5"
-  },
-  "customModels": {
-    "glm-5": {
+    "gpt-4o": {
       "provider": "openai",
-      "name": "GLM-5",
-      "contextWindow": 128000
+      "apiKey": "sk-openai-xxxxx"
     }
   },
+  "providers": {},
+  "mcpServers": {},
   "compaction": {
     "thresholdRatio": 0.7,
     "keepRecentTokens": 4000,
@@ -205,302 +238,232 @@ til [options] [prompt]
 }
 ```
-### 支持的模型提供商
-| 提供商 | 说明 | 配置方式 |
-|--------|------|---------|
-| **Anthropic** | Claude 系列 | `ANTHROPIC_API_KEY` |
-| **OpenAI** | GPT 系列 | `OPENAI_API_KEY` |
-| **Google** | Gemini 系列 | `GOOGLE_API_KEY` |
-| **智谱 (GLM)** | GLM 系列 | OpenAI 兼容接口 + 自定义 base_url |
-| **DeepSeek** | DeepSeek 系列 | OpenAI 兼容接口 + 自定义 base_url |
-| **Ollama** | 本地模型 | OpenAI 兼容接口 (`http://localhost:11434/v1`) |
-| **其他** | 任意 OpenAI 兼容接口 | `--base-url` 或配置 |
-### 内置模型及 Context Window
-| 模型 | 提供商 | Context Window |
-|------|--------|----------------|
-| `claude-sonnet-4-20250514` | Anthropic | 200k |
-| `claude-3-5-haiku-20241022` | Anthropic | 200k |
-| `gpt-4o` | OpenAI | 128k |
-| `gpt-4o-mini` | OpenAI | 128k |
-| `o3-mini` | OpenAI | 200k |
-| `gemini-2.0-flash` | Google | 1M |
-| `gemini-2.5-pro-preview-06-05` | Google | 1M |
-## 会话持久化
-TIL 自动保存每次对话为会话文件（JSONL 格式），可随时恢复。
-### 自动保存
+### 配置字段
-每次对话的消息都会实时追加写入 `~/.til/sessions/` 目录。退出时会显示会话 ID 和恢复命令：
-```
-Bye!  session: abc12345
-  恢复此会话: til --resume abc12345
-```
+| 字段 | 说明 |
+|------|------|
+| `model` | 默认模型 ID |
+| `apiKey` | 全局 API Key（所有模型的默认值） |
+| `baseUrl` | 全局 Base URL（所有模型的默认值） |
+| `models` | 各模型的单独配置（provider、apiKey、baseUrl、contextWindow 等） |
+| `providers` | Provider 级别配置（apiKey、baseUrl、headers） |
+| `mcpServers` | MCP 服务器配置 |
+| `defaultTools` | 默认启用的工具列表 |
-### 恢复会话
+### 模型管理
 ```bash
-# 恢复最近的会话
-til --continue
-# 恢复指定的会话
-til --resume abc12345
+# 配置向导
+til --setup
-# 在交互模式中查看会话列表
-/sessions
+# 交互模式中管理
+/model                     # 查看已配置模型
+/model <id>                # 切换模型
+/model add <id> [url] [key]  # 添加模型
+/model default <id>        # 设置默认
+/model rm <id>             # 删除配置
+/config check              # 测试 API 连接
 ```
-恢复后会自动加载之前的完整对话历史，并显示上下文摘要。
+### 支持的模型
-## Context 压缩（Compaction）
+TIL 支持任何 OpenAI 兼容接口。模型 provider 根据 ID 前缀自动检测：
-当长对话接近模型的上下文窗口上限时，TIL 会自动触发压缩：
+| ID 前缀 | Provider | 示例 |
+|----------|----------|------|
+| `claude*` | anthropic | claude-sonnet-4-20250514 |
+| `gpt*` / `o3*` / `o1*` | openai | gpt-4o, o3-mini |
+| `gemini*` | google | gemini-2.5-pro-preview-06-05 |
+| 其他 | openai-compatible | MiniMax-M2.5, deepseek-chat, glm-5 |
-1. **阈值检测** — 当已用 token 超过 `contextWindow * thresholdRatio`（默认 70%）时触发
-2. **溢出兜底** — 如果模型返回上下文溢出错误，自动压缩后重试
-3. **智能切分** — 保留最近的对话（默认 4000 token），将历史部分交给 LLM 生成摘要
-4. **增量更新** — 后续压缩会基于前一次的摘要进行增量更新，不丢失关键信息
+## MCP 扩展
-交互界面会实时显示上下文使用率：
+TIL 支持通过 MCP (Model Context Protocol) 接入外部工具服务。
-```
-  in:12.3k out:1.2k  ctx:35%    # 绿色 < 50%
-  in:45.0k out:8.5k  ctx:72%    # 黄色 50-80%
-  in:98.0k out:15.2k ctx:95%    # 红色 > 80%
-```
+### 配置 MCP 服务器
-### 配置压缩参数
-在 `~/.til/config.json` 中：
+在 `~/.til/config.json` 中添加：
 ```json
 {
-  "compaction": {
-    "thresholdRatio": 0.7,
-    "keepRecentTokens": 4000,
-    "reserveTokens": 8000
+  "mcpServers": {
+    "playwright": {
+      "command": "npx",
+      "args": ["@playwright/mcp", "--headless"]
+    },
+    "web-search": {
+      "type": "http",
+      "url": "https://open.bigmodel.cn/api/mcp/web_search/mcp",
+      "headers": {
+        "Authorization": "Bearer your_api_key"
+      }
+    }
   }
 }
 ```
-| 参数 | 默认值 | 说明 |
-|------|--------|------|
-| `thresholdRatio` | 0.7 | 触发压缩的 token 占比阈值 |
-| `keepRecentTokens` | 4000 | 压缩时保留最近多少 token 不被摘要 |
-| `reserveTokens` | 8000 | 为模型输出预留的 token 空间 |
+支持两种传输方式：
+- **stdio**：本地进程通过 stdin/stdout 通信
+- **streamable_http** / **sse**：远程 HTTP 服务
-## Token 用量追踪
-TIL 实时追踪每次对话的 token 消耗。
-### 实时显示
-每轮对话结束后会显示当前轮的用量：
+### 查看 MCP 状态
 ```
-  in:12.3k out:1.2k cache_r:8.0k  ctx:35%
+/mcp        # 查看已连接的 MCP 服务器和工具列表
+/extensions # 查看所有扩展信息
 ```
-- `in` 输入 token
-- `out` 输出 token
-- `cache_r` 缓存读取 token
-- `cache_w` 缓存写入 token
-- `ctx` 上下文占用率（动态计算：已用 token / 模型上下文窗口）
+## 内置技能
+TIL 内置 5 个实用技能，安装即用：
-### 累计用量
+| 技能 | 说明 |
+|------|------|
+| **summarize** | 使用 summarize CLI 摘要网页、PDF、YouTube 等 |
+| **find-skills** | 从开源社区发现和安装新技能 |
+| **self-improvement** | 自动记录错误、学习和修正，持续改进 |
+| **skill-creator** | 创建新技能的指南和最佳实践 |
+| **playwright-mcp** | Playwright MCP 浏览器自动化配置和用法 |
-使用 `/usage` 命令查看本次会话的累计数据：
+### 查看和使用技能
 ```
-Token 用量统计:
-  输入 tokens:  45.2k
-  输出 tokens:  12.9k
-  缓存读取:     38.1k
-  上下文占用:   29% (窗口: 200k)
+/skills           # 列出所有已加载技能（显示来源：内置/用户/项目）
+/skill:summarize  # 查看 summarize 技能详情
 ```
-## 工具安全拦截
+### 自定义技能
-TIL 内置危险命令检测，在执行前自动拦截以下类型的命令：
+将 `SKILL.md` 放入以下目录即可自动加载：
-| 危险类型 | 示例 |
-|----------|------|
-| 递归删除 | `rm -rf /`, `rm -rf ~` |
-| 提权操作 | `sudo ...`, `su root` |
-| 磁盘格式化 | `mkfs`, `dd if=... of=/dev/...` |
-| 权限修改 | `chmod 777`, `chown root` |
-| 进程操作 | `kill -9`, `killall` |
-| 网络操作 | `iptables`, `curl \| sh` |
-拦截时会显示提示并要求确认：
+| 路径 | 作用 |
+|------|------|
+| `~/.til/skills/<name>/SKILL.md` | 全局技能 |
+| `.til/skills/<name>/SKILL.md` | 项目级技能 |
+| `--skill <path>` | CLI 指定 |
-```
-⚠️  检测到危险命令: rm -rf /tmp/important
-   原因: 包含递归删除操作
-   确认执行? (y/N)
-```
+同名的用户技能会覆盖内置技能。
-在非交互模式下（单次执行），危险命令将直接被阻止。
+技能文件格式：
-## Markdown 终端渲染
+```markdown
+---
+name: my-skill
+description: "简要描述技能的功能和触发条件"
+---
-TIL 的回答会以富文本格式渲染在终端中，包括：
+# 技能标题
-- **标题** — 带颜色和粗体的层级标题
-- **代码块** — 语法高亮（支持 TypeScript、Python、Bash 等多种语言）
-- **行内代码** — 反引号高亮
-- **列表** — 有序/无序列表缩进
-- **引用块** — 带边框的引用
-- **链接** — 下划线 + URL 显示
-- **粗体/斜体/删除线** — 终端 ANSI 样式
+具体的指令内容...
+```
 ## 记忆系统
-TIL 使用双层记忆系统在对话之间保持上下文：
+TIL 使用双层记忆系统：
-### MEMORY.md（工作记忆）
+### 对话历史（短期记忆）
-由 AI 自动写入，跨对话持久化：
+当前会话内的完整消息历史，存储在 `~/.til/sessions/` 目录（JSONL 格式）。
+### MEMORY.md（长期记忆）
+由 AI 自动判断写入，跨会话持久化：
 | 文件 | 作用 |
 |------|------|
 | `~/.til/MEMORY.md` | 全局记忆（偏好、通用模式） |
 | `.til/MEMORY.md` | 项目记忆（架构决策、进行中的工作） |
+AI 会在以下情况主动记录：用户偏好、项目架构、问题修复模式、重要决策等。
 ### AGENTS.md（项目上下文）
-手动维护的项目指令和约定：
+手动维护的项目指令：
 | 文件 | 作用 |
 |------|------|
-| `~/.til/AGENTS.md` | 全局指令（编码风格、通用约定） |
-| `<项目>/AGENTS.md` | 项目指令（技术栈、架构规范） |
+| `~/.til/AGENTS.md` | 全局指令 |
+| `<项目>/AGENTS.md` | 项目指令 |
-也支持 `CLAUDE.md` 文件名（兼容 Claude Code 的约定）。
+也兼容 `CLAUDE.md` 文件名。
-## 技能系统
+## 会话持久化
-技能是 `SKILL.md` 文件，用于扩展 Agent 的专业能力。
+每次对话自动保存，退出时显示恢复命令。
-### 技能存放位置
+```bash
+til --continue          # 恢复最近的会话
+til --resume abc12345   # 恢复指定会话
+/sessions               # 交互模式中查看会话列表
+```
-| 路径 | 作用 |
-|------|------|
-| `~/.til/skills/` | 全局技能 |
-| `.til/skills/` | 项目级技能 |
-| `--skill <path>` | CLI 指定的技能 |
+## Context 压缩
-### 技能文件格式
+当长对话接近模型上下文窗口上限时自动触发：
-```markdown
----
-name: deploy-helper
-description: 帮助部署应用到生产环境
-triggers:
-  - deploy
-  - 部署
----
+1. 当已用 token 超过阈值（默认 70%）时压缩
+2. 保留最近对话，将历史部分生成摘要
+3. 溢出时自动压缩后重试
-# 部署助手
+实时显示使用率：
-当用户需要部署时，按照以下步骤操作：
-1. 检查 git 状态，确保代码已提交
-2. 运行测试
-3. 构建项目
-4. 执行部署命令
+```
+  in:12.3k out:1.2k  ctx:35%
 ```
-### 查看和使用技能
+- `in` 输入 token · `out` 输出 token · `ctx` 上下文占用率
-```
-/skills           # 列出所有已加载技能
-/skill:deploy     # 查看 deploy 技能详情
-```
+## 安全拦截
+内置危险命令检测：递归删除、提权操作、磁盘格式化、权限修改等。执行前会要求确认。
 ## 常见问题
-### 安装后提示 permission denied
+### 提示"未配置模型"
 ```bash
-chmod +x $(which til)
-# 或重新 link
-cd til-cli && npm link
+til --setup   # 运行配置向导
 ```
 ### 提示 No API key found
 ```bash
-# 方法 1：环境变量
-export OPENAI_API_KEY=your-key
-# 方法 2：配置向导
-til --setup
+export OPENAI_API_KEY=your-key   # 环境变量
+til --setup                      # 或配置向导
 ```
-### 如何使用 Google Gemini
+### 如何使用国内 LLM（MiniMax / 智谱 / DeepSeek 等）
 ```bash
-export GOOGLE_API_KEY=AIza-xxxxx
-til -m gemini-2.5-pro-preview-06-05
-```
-或在 `~/.til/config.json` 中配置：
-```json
-{
-  "providers": {
-    "google": { "apiKey": "AIza-xxxxx" }
-  },
-  "defaultModel": { "provider": "google", "id": "gemini-2.5-pro-preview-06-05" }
-}
+til --setup
+# 模型: MiniMax-M2.5（或 deepseek-chat, glm-5 等）
+# API Key: 你的 key
+# Base URL: https://api.minimaxi.com/v1（或对应平台的 URL）
 ```
-### 如何使用国内 LLM（智谱/DeepSeek 等）
-运行 `til --setup`，在 CUSTOM PROVIDER 部分填入：
-- Base URL：如 `https://open.bigmodel.cn/api/paas/v4`
-- API Key：你的 API Key
-- Model ID：如 `glm-5`
-或者直接编辑 `~/.til/config.json`。
 ### 如何使用本地模型（Ollama）
 ```bash
-# 启动 Ollama
 ollama serve
-# 配置 TIL
 til --setup
-# Base URL 填 http://localhost:11434/v1
-# Model ID 填 llama3.1:8b（或其他已 pull 的模型）
+# Base URL: http://localhost:11434/v1
+# Model ID: llama3.1:8b
 ```
-### 对话太长会不会丢信息
+### API 连接失败怎么排查
-不会。TIL 内置 Context 压缩机制，当对话接近上下文窗口上限时，会自动将历史对话摘要化，保留关键信息的同时腾出空间。你也可以通过 `/usage` 查看当前上下文使用率。
+```
+/config check   # 显示当前配置并测试 API 连接
+```
-### 会话断了怎么恢复
+### 如何启用浏览器工具
 ```bash
-# 恢复最近一次会话
-til --continue
-# 恢复指定会话
-til --resume <sessionId>
+npm install playwright
+npx playwright install chromium
 ```
-退出时会自动显示恢复命令。
-### 如何关闭危险命令拦截
-目前不支持全局关闭。TIL 在执行可能破坏性的命令前会要求确认，这是安全设计。在交互模式下可以选择 `y` 确认执行。
+然后在配置中将 `browser` 加入 `defaultTools`，或使用 Playwright MCP。
 ## 开发
@@ -511,52 +474,57 @@ npm install
 npm run dev     # 监听模式编译
 npm run build   # 一次性编译
 npm start       # 运行
+npm test        # 运行测试
 ```
-### 运行测试
-```bash
-npm test          # 运行全部测试
-npm run test:watch  # 监听模式
-```
-测试使用 [Vitest](https://vitest.dev/)，覆盖所有核心模块：
-- `tests/core/` — Agent、Config、LLM、Session、Compaction、Pricing、Memory、Skills、Markdown、Tool Permissions
-- `tests/tools/` — Bash、Read、Write、Edit 工具
 ### 项目结构
 ```
 til-cli/
 ├── src/
-│   ├── main.ts              # CLI 入口
-│   ├── index.ts             # 公共 API 导出
+│   ├── main.ts              # CLI 入口 & 配置向导
+│   ├── version.ts           # 版本号管理
 │   ├── core/
 │   │   ├── agent.ts         # 双层循环 Agent 引擎
 │   │   ├── llm.ts           # LLM 提供商抽象（Anthropic/OpenAI/Google）
-│   │   ├── config.ts        # 配置管理
+│   │   ├── config.ts        # 配置管理 & 模型解析
 │   │   ├── session.ts       # 会话包装（工具 + 系统提示）
 │   │   ├── session-manager.ts  # 会话持久化（JSONL）
-│   │   ├── types.ts         # 核心类型定义
+│   │   ├── types.ts         # 核心类型（含 ImageContent）
 │   │   ├── compaction.ts    # Context 压缩 & 溢出检测
-│   │   ├── pricing.ts       # Token 计费 & 用量格式化
+│   │   ├── pricing.ts       # Token 用量格式化
 │   │   ├── tool-permissions.ts  # 危险命令拦截
 │   │   ├── markdown.ts      # 终端 Markdown 渲染
 │   │   ├── memory.ts        # 记忆系统
-│   │   ├── skills.ts        # 技能系统
+│   │   ├── skills.ts        # 技能系统（内置 + 用户 + 项目）
 │   │   └── system-prompt.ts # 系统提示词组装
 │   ├── modes/
 │   │   ├── interactive.ts   # 交互 REPL 模式
 │   │   └── oneshot.ts       # 单次执行模式
-│   └── tools/               # 内置工具实现
-│       ├── bash.ts
-│       ├── read.ts
-│       ├── write.ts
-│       ├── edit.ts
-│       ├── file-manager.ts
-│       ├── system-info.ts
-│       └── web-search.ts
+│   ├── tools/               # 内置工具
+│   │   ├── bash.ts          # Shell 命令执行
+│   │   ├── read.ts          # 文件读取（含图片 base64）
+│   │   ├── write.ts         # 文件写入
+│   │   ├── edit.ts          # 精确替换
+│   │   ├── file-manager.ts  # 文件操作
+│   │   ├── system-info.ts   # 系统信息
+│   │   ├── web-search.ts    # 网页搜索
+│   │   ├── web-fetch.ts     # 网页抓取
+│   │   ├── screenshot.ts    # 截图
+│   │   ├── computer.ts      # Computer Use（鼠标/键盘/截图）
+│   │   └── browser.ts       # 浏览器控制（Playwright）
+│   ├── extensions/          # 扩展系统
+│   │   ├── types.ts         # 扩展/MCP 类型定义
+│   │   ├── loader.ts        # 扩展加载器
+│   │   ├── runner.ts        # 扩展运行器
+│   │   └── builtin/mcp.ts   # MCP 客户端（stdio + HTTP）
+│   └── utils/               # 工具函数
+├── skills/                  # 内置技能
+│   ├── summarize/
+│   ├── find-skills/
+│   ├── self-improving-agent/
+│   ├── skill-creator/
+│   └── playwright-mcp/
 ├── tests/                   # 单元测试
 ├── package.json
 ├── tsconfig.json