npm - bobo-ai-cli - Versions diffs - 3.0.4 → 3.0.5 - Mend

bobo-ai-cli 3.0.4 → 3.0.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (238) hide show

package/LICENSE +21 -21
package/README.md +259 -259
package/bundled-skills/CORE_SKILLS.txt +18 -18
package/bundled-skills/backend-expert/SKILL.md +97 -97
package/bundled-skills/code-review/SKILL.md +280 -280
package/bundled-skills/code-review-expert/SKILL.md +85 -85
package/bundled-skills/context-budget-analyzer/SKILL.md +76 -76
package/bundled-skills/context-compressor/SKILL.md +75 -75
package/bundled-skills/context-optimization-suite/SKILL.md +162 -162
package/bundled-skills/frontend-expert/SKILL.md +93 -93
package/bundled-skills/github/SKILL.md +12 -12
package/bundled-skills/high-agency/SKILL.md +473 -473
package/bundled-skills/high-agency/references/builder-patterns.md +126 -126
package/bundled-skills/high-agency/references/recovery-playbook.md +298 -298
package/bundled-skills/memory-manager/SKILL.md +214 -214
package/bundled-skills/memory-manager/references/advanced-config.md +65 -65
package/bundled-skills/orchestrator/SKILL.md +681 -681
package/bundled-skills/planning-with-files/SKILL.md +193 -193
package/bundled-skills/skill-creator/SKILL.md +220 -220
package/bundled-skills/testing-expert/SKILL.md +99 -99
package/bundled-skills/verify/SKILL.md +15 -15
package/dist/agent.d.ts +5 -0
package/dist/agent.js +11 -1
package/dist/agent.js.map +1 -1
package/dist/agents/catalog.d.ts +47 -0
package/dist/agents/catalog.js +63 -5
package/dist/agents/catalog.js.map +1 -1
package/dist/agents/router.d.ts +12 -1
package/dist/agents/router.js +43 -3
package/dist/agents/router.js.map +1 -1
package/dist/agents/spawn.js +36 -18
package/dist/agents/spawn.js.map +1 -1
package/dist/autonomous.js +5 -5
package/dist/cli.js +23 -21
package/dist/cli.js.map +1 -1
package/dist/compactor.js +39 -39
package/dist/dream.js +29 -29
package/dist/image-input.d.ts +44 -0
package/dist/image-input.js +161 -0
package/dist/image-input.js.map +1 -0
package/dist/memory.js +13 -13
package/dist/project.js +15 -15
package/dist/repl.js +88 -0
package/dist/repl.js.map +1 -1
package/dist/skills.js +54 -54
package/dist/sub-agents.js +65 -65
package/dist/tools/browser.js +21 -21
package/dist/tools/claude-code.js +10 -10
package/dist/web.js +7 -7
package/dist/wiki-commands.d.ts +2 -0
package/dist/wiki-commands.js +249 -0
package/dist/wiki-commands.js.map +1 -0
package/dist/wiki.d.ts +90 -0
package/dist/wiki.js +614 -0
package/dist/wiki.js.map +1 -0
package/knowledge/advanced-patterns.md +70 -70
package/knowledge/agent-directives.md +74 -74
package/knowledge/api-integration-patterns.md +102 -0
package/knowledge/code-review-protocol.md +69 -0
package/knowledge/dream.md +36 -36
package/knowledge/engineering.md +52 -46
package/knowledge/error-catalog.md +38 -33
package/knowledge/event-driven-architecture.md +43 -0
package/knowledge/external-alignment.md +47 -0
package/knowledge/high-agency.md +73 -0
package/knowledge/image-generation.md +48 -0
package/knowledge/index.json +194 -169
package/knowledge/llm-wiki-pattern.md +71 -0
package/knowledge/long-task-management.md +79 -0
package/knowledge/memory/cache-optimization-and-skill-integration.md +102 -102
package/knowledge/memory/engineering-patterns.md +134 -134
package/knowledge/memory/feedback_root_structure.md +15 -15
package/knowledge/memory/project-contexts.md +69 -69
package/knowledge/memory/tools-and-services.md +85 -85
package/knowledge/memory-management.md +72 -0
package/knowledge/rules/advisor-strategy.md +204 -0
package/knowledge/rules/agents.md +62 -62
package/knowledge/rules/blocking-rules.md +323 -323
package/knowledge/rules/cache-management.md +379 -379
package/knowledge/rules/capability-evolution.md +132 -132
package/knowledge/rules/coding.md +126 -126
package/knowledge/rules/engineering-workflows.md +225 -225
package/knowledge/rules/evomap-content-guidelines.md +354 -354
package/knowledge/rules/evomap-guide.md +224 -224
package/knowledge/rules/external-alignment.md +22 -0
package/knowledge/rules/git.md +31 -31
package/knowledge/rules/hooks.md +106 -106
package/knowledge/rules/performance.md +101 -101
package/knowledge/rules/remotion-auto-production.md +1120 -1120
package/knowledge/rules/security.md +46 -46
package/knowledge/rules/testing.md +32 -32
package/knowledge/rules/work-mode.md +208 -208
package/knowledge/rules.md +62 -62
package/knowledge/self-evolution.md +78 -0
package/knowledge/self-rationalization-guard.md +52 -0
package/knowledge/skills/Skill_Seekers.md +1722 -1722
package/knowledge/skills/ab-test-setup.md +557 -557
package/knowledge/skills/agent-sdk-dev.md +238 -238
package/knowledge/skills/agent-tools.md +136 -136
package/knowledge/skills/analytics-tracking.md +597 -597
package/knowledge/skills/artifacts-builder.md +89 -89
package/knowledge/skills/asana.md +12 -12
package/knowledge/skills/backend-expert.md +97 -97
package/knowledge/skills/brand-voice.md +481 -481
package/knowledge/skills/browser-use.md +419 -419
package/knowledge/skills/cache-optimization-skill.md +179 -179
package/knowledge/skills/canvas-design.md +147 -147
package/knowledge/skills/citation-validator.md +203 -203
package/knowledge/skills/clangd-lsp.md +52 -52
package/knowledge/skills/code-review-expert.md +85 -85
package/knowledge/skills/code-review.md +280 -280
package/knowledge/skills/code-simplifier.md +12 -12
package/knowledge/skills/commit-commands.md +258 -258
package/knowledge/skills/competitor-alternatives.md +795 -795
package/knowledge/skills/content-atomizer.md +910 -910
package/knowledge/skills/content-research-writer.md +605 -605
package/knowledge/skills/context-optimization-suite.md +162 -162
package/knowledge/skills/context7.md +12 -12
package/knowledge/skills/copy-editing.md +494 -494
package/knowledge/skills/copywriting.md +510 -510
package/knowledge/skills/csharp-lsp.md +40 -40
package/knowledge/skills/decision-making-framework.md +154 -154
package/knowledge/skills/developer-growth-analysis.md +335 -335
package/knowledge/skills/direct-response-copy.md +2336 -2336
package/knowledge/skills/docker-expert.md +229 -229
package/knowledge/skills/document-skills.md +12 -12
package/knowledge/skills/documentation-expert.md +126 -126
package/knowledge/skills/email-sequence.md +1061 -1061
package/knowledge/skills/email-sequences.md +910 -910
package/knowledge/skills/example-plugin.md +72 -72
package/knowledge/skills/explanatory-output-style.md +82 -82
package/knowledge/skills/feature-dev.md +458 -458
package/knowledge/skills/file-organizer.md +466 -466
package/knowledge/skills/firebase.disabled.md +12 -12
package/knowledge/skills/form-cro.md +488 -488
package/knowledge/skills/free-tool-strategy.md +636 -636
package/knowledge/skills/frontend-design-offical.md +55 -55
package/knowledge/skills/frontend-design.md +41 -41
package/knowledge/skills/frontend-expert.md +93 -93
package/knowledge/skills/github.md +12 -12
package/knowledge/skills/gitlab.md +12 -12
package/knowledge/skills/gopls-lsp.md +32 -32
package/knowledge/skills/got-controller.md +218 -218
package/knowledge/skills/greptile.md +72 -72
package/knowledge/skills/hookify.md +376 -376
package/knowledge/skills/image-editor.md +189 -189
package/knowledge/skills/image-enhancer.md +109 -109
package/knowledge/skills/jdtls-lsp.md +49 -49
package/knowledge/skills/json-canvas.md +654 -654
package/knowledge/skills/keyword-research.md +559 -559
package/knowledge/skills/kotlin-lsp.md +28 -28
package/knowledge/skills/laravel-boost.md +12 -12
package/knowledge/skills/launch-strategy.md +394 -394
package/knowledge/skills/lead-magnet.md +393 -393
package/knowledge/skills/learning-output-style.md +106 -106
package/knowledge/skills/linear.md +12 -12
package/knowledge/skills/lua-lsp.md +47 -47
package/knowledge/skills/marketing-ideas.md +720 -720
package/knowledge/skills/marketing-psychology.md +534 -534
package/knowledge/skills/mcp-builder.md +369 -369
package/knowledge/skills/meeting-insights-analyzer.md +347 -347
package/knowledge/skills/memory-evolution-system.md +172 -172
package/knowledge/skills/multi-lens-thinking.md +407 -407
package/knowledge/skills/nano-banana-pro.md +116 -116
package/knowledge/skills/newsletter.md +736 -736
package/knowledge/skills/notebooklm.md +296 -296
package/knowledge/skills/obsidian-bases.md +634 -634
package/knowledge/skills/obsidian-markdown.md +651 -651
package/knowledge/skills/onboarding-cro.md +494 -494
package/knowledge/skills/orchestrator.md +681 -681
package/knowledge/skills/page-cro.md +379 -379
package/knowledge/skills/paid-ads.md +624 -624
package/knowledge/skills/paywall-upgrade-cro.md +651 -651
package/knowledge/skills/php-lsp.md +36 -36
package/knowledge/skills/planning-with-files.md +193 -193
package/knowledge/skills/playwright.md +12 -12
package/knowledge/skills/plugin-dev.md +434 -434
package/knowledge/skills/popup-cro.md +520 -520
package/knowledge/skills/positioning-angles.md +330 -330
package/knowledge/skills/pr-review-toolkit.md +359 -359
package/knowledge/skills/pricing-strategy.md +777 -777
package/knowledge/skills/programmatic-seo.md +714 -714
package/knowledge/skills/pyright-lsp.md +43 -43
package/knowledge/skills/quality-assurance-framework.md +168 -168
package/knowledge/skills/question-refiner.md +160 -160
package/knowledge/skills/ralph-loop.md +205 -205
package/knowledge/skills/refactoring-expert.md +103 -103
package/knowledge/skills/referral-program.md +668 -668
package/knowledge/skills/research-executor.md +164 -164
package/knowledge/skills/review-with-security.md +12 -12
package/knowledge/skills/rust-analyzer-lsp.md +50 -50
package/knowledge/skills/schema-markup.md +647 -647
package/knowledge/skills/security-audit-expert.md +124 -124
package/knowledge/skills/security-expert.md +140 -140
package/knowledge/skills/security-guidance.md +12 -12
package/knowledge/skills/seedance-prompt.md +139 -139
package/knowledge/skills/self-evolution.md +1160 -1160
package/knowledge/skills/seo-audit.md +432 -432
package/knowledge/skills/seo-content.md +787 -787
package/knowledge/skills/serena.md +12 -12
package/knowledge/skills/signup-flow-cro.md +409 -409
package/knowledge/skills/skill-creator.md +220 -220
package/knowledge/skills/skill-manager.md +226 -226
package/knowledge/skills/skill-share.md +98 -98
package/knowledge/skills/slack.md +12 -12
package/knowledge/skills/social-content.md +878 -878
package/knowledge/skills/spec-flow-skill.md +124 -124
package/knowledge/skills/stripe.md +12 -12
package/knowledge/skills/supabase.md +12 -12
package/knowledge/skills/swift-lsp.md +40 -40
package/knowledge/skills/synthesizer.md +236 -236
package/knowledge/skills/template-skill.md +16 -16
package/knowledge/skills/testing-expert.md +99 -99
package/knowledge/skills/theme-factory.md +72 -72
package/knowledge/skills/tiktok-research.md +208 -208
package/knowledge/skills/typescript-lsp.md +36 -36
package/knowledge/skills/ui-ux-pro-max.md +247 -247
package/knowledge/skills/verify.md +15 -15
package/knowledge/skills/visual-prompt-engineer.md +102 -102
package/knowledge/skills/webapp-testing.md +111 -111
package/knowledge/skills/wide-research.md +191 -191
package/knowledge/system.md +93 -93
package/knowledge/task-router.md +46 -37
package/knowledge/verification.md +38 -38
package/knowledge/worker-prompt-craft.md +66 -0
package/knowledge/workflows/3d-viz.md +47 -47
package/knowledge/workflows/data-pipeline.md +47 -47
package/knowledge/workflows/db-migration.md +51 -51
package/knowledge/workflows/feature-dev.md +41 -41
package/knowledge/workflows/tdd-flow.md +52 -52
package/knowledge/workflows/ui-verify.md +51 -51
package/package.json +74 -74
package/dist/claude-bridge.d.ts +0 -18
package/dist/claude-bridge.js +0 -91
package/dist/claude-bridge.js.map +0 -1
package/dist/tools/claude-bridge-tool.d.ts +0 -4
package/dist/tools/claude-bridge-tool.js +0 -44
package/dist/tools/claude-bridge-tool.js.map +0 -1

package/knowledge/skills/browser-use.md CHANGED Viewed

@@ -1,419 +1,419 @@
----
-id: "browser-use"
-title: "Browser-Use Skill"
-category: "infrastructure"
-tags: ["browser-use skill", "📚 概述", "🚀 快速开始", "创建环境", "安装 browser-use 和 chromium", "browser use（推荐 - 最快速度 + 最低成本）", "或者使用其他 llm", "🏗️ 核心概念", "🛠️ 开发规则", "🎯 开发命令"]
-triggers: []
-dependencies: []
-source: "E:/Bobo's Coding cache/.claude/skills/browser-use"
----
-# Browser-Use Skill
-> AI 驱动的浏览器自动化库 - 使用 LLM 控制浏览器完成复杂任务
-## 📚 概述
-Browser-Use 是一个 async Python >= 3.11 库，通过 LLM + CDP (Chrome DevTools Protocol) 实现 AI 浏览器驱动能力。核心架构使 AI agents 能够自主导航网页、与元素交互、通过处理 HTML 并做出 LLM 驱动的决策来完成复杂任务。
-## 🚀 快速开始
-### 1. 安装 Browser-Use
-```bash
-# 创建环境
-pip install uv
-uv venv --python 3.12
-source .venv/bin/activate
-# Windows 使用: .venv\Scripts\activate
-# 安装 browser-use 和 chromium
-uv pip install browser-use
-uvx browser-use install
-```
-### 2. 选择你喜欢的 LLM
-创建 `.env` 文件并添加 API key：
-```bash
-# Browser Use（推荐 - 最快速度 + 最低成本）
-BROWSER_USE_API_KEY=your_key_here
-# 在 https://cloud.browser-use.com/new-api-key 获取 $10 免费额度
-# 或者使用其他 LLM
-OPENAI_API_KEY=your_key_here
-ANTHROPIC_API_KEY=your_key_here
-GOOGLE_API_KEY=your_key_here
-```
-### 3. 运行第一个 Agent
-```python
-from browser_use import Agent, ChatBrowserUse
-from dotenv import load_dotenv
-import asyncio
-load_dotenv()
-async def main():
-    llm = ChatBrowserUse()
-    task = "查找 Hacker News 上排名第一的帖子"
-    agent = Agent(task=task, llm=llm)
-    await agent.run()
-if __name__ == "__main__":
-    asyncio.run(main())
-```
-### 4. 生产部署
-使用 `@sandbox` 装饰器部署到生产环境，并扩展到百万级 agents：
-```python
-from browser_use import Browser, sandbox, ChatBrowserUse
-from browser_use.agent.service import Agent
-import asyncio
-@sandbox(cloud_profile_id='your-profile-id')
-async def production_task(browser: Browser):
-    agent = Agent(
-        task="你的认证任务",
-        browser=browser,
-        llm=ChatBrowserUse()
-    )
-    await agent.run()
-asyncio.run(production_task())
-```
-同步本地 cookies 到云端：
-```bash
-export BROWSER_USE_API_KEY=your_key && curl -fsSL https://browser-use.com/profile.sh | sh
-```
-## 🏗️ 核心概念
-### Agent 基础
-```python
-from browser_use import Agent, ChatBrowserUse
-agent = Agent(
-    task="搜索最新 AI 新闻",
-    llm=ChatBrowserUse(),
-)
-async def main():
-    history = await agent.run(max_steps=100)
-    # 访问有用信息
-    history.urls()                    # 访问过的 URL 列表
-    history.action_names()            # 执行的操作名称
-    history.final_result()            # 最终提取的内容
-    history.is_successful()           # 检查是否成功完成
-```
-### Browser 配置
-```python
-from browser_use import Agent, Browser, ChatBrowserUse
-browser = Browser(
-    headless=False,  # 显示浏览器窗口
-    window_size={'width': 1000, 'height': 700},
-    proxy=ProxySettings(server='http://host:8080'),
-    user_data_dir='./profile',  # 保持登录状态
-)
-agent = Agent(
-    task='搜索 Browser Use',
-    browser=browser,
-    llm=ChatBrowserUse(),
-)
-```
-### Tools（工具）
-自定义工具扩展 agent 能力：
-```python
-from browser_use import Tools, ActionResult, Browser
-tools = Tools()
-@tools.action('向人类询问问题')
-def ask_human(question: str, browser: Browser) -> ActionResult:
-    answer = input(f'{question} > ')
-    return f'人类回答: {answer}'
-agent = Agent(
-    task='向人类寻求帮助',
-    llm=llm,
-    tools=tools,
-)
-```
-## 🛠️ 开发规则
-### 核心原则
-1. **始终使用 `uv` 而不是 `pip`**
-   ```bash
-   uv venv --python 3.11
-   source .venv/bin/activate
-   uv sync
-   ```
-2. **类型安全编码**
-   - 使用 Pydantic v2 模型进行所有内部操作
-   - 使用现代 Python 类型提示：`str | None` 而非 `Optional[str]`
-3. **Pre-commit 格式化**
-   - 在提交 PR 前始终运行 pre-commit
-4. **使用描述性名称和文档字符串**
-5. **返回 `ActionResult` 结构化内容**
-   - 帮助 agent 更好地推理
-6. **从不创建随机示例**
-   - 测试功能时使用终端内联代码
-7. **默认推荐 `ChatBrowserUse` 模型**
-   - 最高准确度 + 最快速度 + 最低 token 成本
-## 🎯 开发命令
-```bash
-# 设置
-uv venv --python 3.11
-source .venv/bin/activate
-uv sync
-# 测试
-uv run pytest -vxs tests/ci        # CI 测试
-uv run pytest -vxs tests/          # 所有测试
-# 质量检查
-uv run pyright                      # 类型检查
-uv run ruff check --fix            # Linting
-uv run ruff format                 # 格式化
-uv run pre-commit run --all-files  # Pre-commit hooks
-# MCP 服务器模式
-uvx browser-use[cli] --mcp
-```
-## 📖 可用工具（Actions）
-### 导航和浏览器控制
-- `search` - 搜索查询（DuckDuckGo、Google、Bing）
-- `navigate` - 导航到 URL
-- `go_back` - 返回浏览器历史
-- `wait` - 等待指定秒数
-### 页面交互
-- `click` - 通过索引点击元素
-- `input` - 输入文本到表单字段
-- `upload_file` - 上传文件
-- `scroll` - 滚动页面
-- `find_text` - 滚动到页面上的特定文本
-- `send_keys` - 发送特殊按键（Enter、Escape 等）
-### JavaScript 执行
-- `evaluate` - 在页面上执行自定义 JavaScript 代码
-### 标签页管理
-- `switch` - 在浏览器标签页之间切换
-- `close` - 关闭浏览器标签页
-### 内容提取
-- `extract` - 使用 LLM 从网页提取数据
-### 视觉分析
-- `screenshot` - 请求下一个浏览器状态的截图
-### 表单控件
-- `dropdown_options` - 获取下拉选项值
-- `select_dropdown` - 选择下拉选项
-### 文件操作
-- `write_file` - 写入内容到文件
-- `read_file` - 读取文件内容
-- `replace_file` - 替换文件中的文本
-### 任务完成
-- `done` - 完成任务（始终可用）
-## 💡 提示技巧
-### 1. 具体 vs 开放式
-**✅ 具体（推荐）**
-```python
-task = """
-1. 访问 https://quotes.toscrape.com/
-2. 使用 extract 操作查询 "前 3 条引用及其作者"
-3. 使用 write_file 操作将结果保存到 quotes.csv
-4. 对第一条引用进行 Google 搜索并找到写作时间
-"""
-```
-**❌ 开放式**
-```python
-task = "访问网络并赚钱"
-```
-### 2. 直接命名操作
-当你确切知道 agent 应该做什么时，直接引用操作名称：
-```python
-task = """
-1. 使用 search 操作查找 "Python 教程"
-2. 使用 click 在新标签页中打开第一个结果
-3. 使用 scroll 操作向下滚动 2 页
-4. 使用 extract 提取前 5 项的名称
-5. 如果页面未加载，等待 2 秒，刷新并等待 10 秒
-6. 使用 send_keys 操作输入 "Tab Tab ArrowDown Enter"
-"""
-```
-### 3. 通过键盘导航处理交互问题
-有时按钮无法点击（你发现了库中的 bug - 提交 issue）。好消息 - 通常可以通过键盘导航解决！
-```python
-task = """
-如果提交按钮无法点击：
-1. 使用 send_keys 操作输入 "Tab Tab Enter" 进行导航和激活
-2. 或使用 send_keys 输入 "ArrowDown ArrowDown Enter" 提交表单
-"""
-```
-### 4. 自定义操作集成
-```python
-@controller.action("从认证器应用获取 2FA 代码")
-async def get_2fa_code():
-    # 你的实现
-    pass
-task = """
-使用 2FA 登录：
-1. 输入用户名/密码
-2. 提示输入 2FA 时，使用 get_2fa_code 操作
-3. 永远不要尝试从页面手动提取 2FA 代码
-4. 始终使用 get_2fa_code 操作获取认证代码
-"""
-```
-### 5. 错误恢复
-```python
-task = """
-稳健的数据提取：
-1. 访问 openai.com 查找他们的 CEO
-2. 如果由于反机器人保护导航失败：
-   - 使用 Google 搜索查找 CEO
-3. 如果页面超时，使用 go_back 并尝试替代方法
-"""
-```
-## 🌟 高级功能
-### 结构化输出
-使用 Pydantic 模型获取结构化输出：
-```python
-from pydantic import BaseModel
-class Quote(BaseModel):
-    text: str
-    author: str
-agent = Agent(
-    task="提取前 3 条引用",
-    llm=llm,
-    output_model_schema=Quote,
-)
-history = await agent.run()
-structured_data = history.structured_output
-```
-### 远程浏览器（Browser-Use Cloud）
-```python
-from browser_use import Browser, ChatBrowserUse
-# 简单：使用 Browser-Use 云浏览器服务
-browser = Browser(use_cloud=True)
-# 高级：配置云浏览器参数
-browser = Browser(
-    cloud_profile_id='your-profile-id',  # 特定浏览器配置
-    cloud_proxy_country_code='us',       # 代理位置
-    cloud_timeout=30,                    # 会话超时（分钟）
-)
-```
-### MCP 集成
-Browser-Use 支持两种模式：
-1. **作为 MCP 服务器**：向 MCP 客户端（如 Claude Desktop）公开浏览器自动化工具
-2. **使用 MCP 客户端**：Agent 可以连接到外部 MCP 服务器以扩展能力
-```bash
-# 作为 MCP 服务器运行
-uvx browser-use[cli] --mcp
-```
-## 📂 项目结构
-```
-browser_use/
-├── agent/              # Agent 核心逻辑
-│   ├── service.py     # 主编排器
-│   ├── views.py       # Pydantic 模型
-│   └── system_prompt*.md  # Agent 提示词
-├── browser/           # 浏览器管理
-│   ├── session.py    # BrowserSession + CDP 客户端
-│   └── profile.py    # 浏览器配置和启动参数
-├── dom/              # DOM 处理
-│   └── service.py    # DomService 提取和处理
-├── tools/            # 操作注册表
-│   └── service.py    # 工具定义
-├── llm/              # LLM 集成层
-└── mcp/              # MCP 集成
-    └── client.py     # MCP 客户端连接
-```
-## 🔗 相关资源
-- **GitHub**: https://github.com/browser-use/browser-use
-- **文档**: https://docs.browser-use.com
-- **Discord**: https://link.browser-use.com/discord
-- **Cloud**: https://cloud.browser-use.com
-## 🤝 支持
-- 查看 [GitHub Issues](https://github.com/browser-use/browser-use/issues)
-- 在 [Discord 社区](https://link.browser-use.com/discord) 提问
-- 企业支持：support@browser-use.com
+---
+id: "browser-use"
+title: "Browser-Use Skill"
+category: "infrastructure"
+tags: ["browser-use skill", "📚 概述", "🚀 快速开始", "创建环境", "安装 browser-use 和 chromium", "browser use（推荐 - 最快速度 + 最低成本）", "或者使用其他 llm", "🏗️ 核心概念", "🛠️ 开发规则", "🎯 开发命令"]
+triggers: []
+dependencies: []
+source: "E:/Bobo's Coding cache/.claude/skills/browser-use"
+---
+# Browser-Use Skill
+> AI 驱动的浏览器自动化库 - 使用 LLM 控制浏览器完成复杂任务
+## 📚 概述
+Browser-Use 是一个 async Python >= 3.11 库，通过 LLM + CDP (Chrome DevTools Protocol) 实现 AI 浏览器驱动能力。核心架构使 AI agents 能够自主导航网页、与元素交互、通过处理 HTML 并做出 LLM 驱动的决策来完成复杂任务。
+## 🚀 快速开始
+### 1. 安装 Browser-Use
+```bash
+# 创建环境
+pip install uv
+uv venv --python 3.12
+source .venv/bin/activate
+# Windows 使用: .venv\Scripts\activate
+# 安装 browser-use 和 chromium
+uv pip install browser-use
+uvx browser-use install
+```
+### 2. 选择你喜欢的 LLM
+创建 `.env` 文件并添加 API key：
+```bash
+# Browser Use（推荐 - 最快速度 + 最低成本）
+BROWSER_USE_API_KEY=your_key_here
+# 在 https://cloud.browser-use.com/new-api-key 获取 $10 免费额度
+# 或者使用其他 LLM
+OPENAI_API_KEY=your_key_here
+ANTHROPIC_API_KEY=your_key_here
+GOOGLE_API_KEY=your_key_here
+```
+### 3. 运行第一个 Agent
+```python
+from browser_use import Agent, ChatBrowserUse
+from dotenv import load_dotenv
+import asyncio
+load_dotenv()
+async def main():
+    llm = ChatBrowserUse()
+    task = "查找 Hacker News 上排名第一的帖子"
+    agent = Agent(task=task, llm=llm)
+    await agent.run()
+if __name__ == "__main__":
+    asyncio.run(main())
+```
+### 4. 生产部署
+使用 `@sandbox` 装饰器部署到生产环境，并扩展到百万级 agents：
+```python
+from browser_use import Browser, sandbox, ChatBrowserUse
+from browser_use.agent.service import Agent
+import asyncio
+@sandbox(cloud_profile_id='your-profile-id')
+async def production_task(browser: Browser):
+    agent = Agent(
+        task="你的认证任务",
+        browser=browser,
+        llm=ChatBrowserUse()
+    )
+    await agent.run()
+asyncio.run(production_task())
+```
+同步本地 cookies 到云端：
+```bash
+export BROWSER_USE_API_KEY=your_key && curl -fsSL https://browser-use.com/profile.sh | sh
+```
+## 🏗️ 核心概念
+### Agent 基础
+```python
+from browser_use import Agent, ChatBrowserUse
+agent = Agent(
+    task="搜索最新 AI 新闻",
+    llm=ChatBrowserUse(),
+)
+async def main():
+    history = await agent.run(max_steps=100)
+    # 访问有用信息
+    history.urls()                    # 访问过的 URL 列表
+    history.action_names()            # 执行的操作名称
+    history.final_result()            # 最终提取的内容
+    history.is_successful()           # 检查是否成功完成
+```
+### Browser 配置
+```python
+from browser_use import Agent, Browser, ChatBrowserUse
+browser = Browser(
+    headless=False,  # 显示浏览器窗口
+    window_size={'width': 1000, 'height': 700},
+    proxy=ProxySettings(server='http://host:8080'),
+    user_data_dir='./profile',  # 保持登录状态
+)
+agent = Agent(
+    task='搜索 Browser Use',
+    browser=browser,
+    llm=ChatBrowserUse(),
+)
+```
+### Tools（工具）
+自定义工具扩展 agent 能力：
+```python
+from browser_use import Tools, ActionResult, Browser
+tools = Tools()
+@tools.action('向人类询问问题')
+def ask_human(question: str, browser: Browser) -> ActionResult:
+    answer = input(f'{question} > ')
+    return f'人类回答: {answer}'
+agent = Agent(
+    task='向人类寻求帮助',
+    llm=llm,
+    tools=tools,
+)
+```
+## 🛠️ 开发规则
+### 核心原则
+1. **始终使用 `uv` 而不是 `pip`**
+   ```bash
+   uv venv --python 3.11
+   source .venv/bin/activate
+   uv sync
+   ```
+2. **类型安全编码**
+   - 使用 Pydantic v2 模型进行所有内部操作
+   - 使用现代 Python 类型提示：`str | None` 而非 `Optional[str]`
+3. **Pre-commit 格式化**
+   - 在提交 PR 前始终运行 pre-commit
+4. **使用描述性名称和文档字符串**
+5. **返回 `ActionResult` 结构化内容**
+   - 帮助 agent 更好地推理
+6. **从不创建随机示例**
+   - 测试功能时使用终端内联代码
+7. **默认推荐 `ChatBrowserUse` 模型**
+   - 最高准确度 + 最快速度 + 最低 token 成本
+## 🎯 开发命令
+```bash
+# 设置
+uv venv --python 3.11
+source .venv/bin/activate
+uv sync
+# 测试
+uv run pytest -vxs tests/ci        # CI 测试
+uv run pytest -vxs tests/          # 所有测试
+# 质量检查
+uv run pyright                      # 类型检查
+uv run ruff check --fix            # Linting
+uv run ruff format                 # 格式化
+uv run pre-commit run --all-files  # Pre-commit hooks
+# MCP 服务器模式
+uvx browser-use[cli] --mcp
+```
+## 📖 可用工具（Actions）
+### 导航和浏览器控制
+- `search` - 搜索查询（DuckDuckGo、Google、Bing）
+- `navigate` - 导航到 URL
+- `go_back` - 返回浏览器历史
+- `wait` - 等待指定秒数
+### 页面交互
+- `click` - 通过索引点击元素
+- `input` - 输入文本到表单字段
+- `upload_file` - 上传文件
+- `scroll` - 滚动页面
+- `find_text` - 滚动到页面上的特定文本
+- `send_keys` - 发送特殊按键（Enter、Escape 等）
+### JavaScript 执行
+- `evaluate` - 在页面上执行自定义 JavaScript 代码
+### 标签页管理
+- `switch` - 在浏览器标签页之间切换
+- `close` - 关闭浏览器标签页
+### 内容提取
+- `extract` - 使用 LLM 从网页提取数据
+### 视觉分析
+- `screenshot` - 请求下一个浏览器状态的截图
+### 表单控件
+- `dropdown_options` - 获取下拉选项值
+- `select_dropdown` - 选择下拉选项
+### 文件操作
+- `write_file` - 写入内容到文件
+- `read_file` - 读取文件内容
+- `replace_file` - 替换文件中的文本
+### 任务完成
+- `done` - 完成任务（始终可用）
+## 💡 提示技巧
+### 1. 具体 vs 开放式
+**✅ 具体（推荐）**
+```python
+task = """
+1. 访问 https://quotes.toscrape.com/
+2. 使用 extract 操作查询 "前 3 条引用及其作者"
+3. 使用 write_file 操作将结果保存到 quotes.csv
+4. 对第一条引用进行 Google 搜索并找到写作时间
+"""
+```
+**❌ 开放式**
+```python
+task = "访问网络并赚钱"
+```
+### 2. 直接命名操作
+当你确切知道 agent 应该做什么时，直接引用操作名称：
+```python
+task = """
+1. 使用 search 操作查找 "Python 教程"
+2. 使用 click 在新标签页中打开第一个结果
+3. 使用 scroll 操作向下滚动 2 页
+4. 使用 extract 提取前 5 项的名称
+5. 如果页面未加载，等待 2 秒，刷新并等待 10 秒
+6. 使用 send_keys 操作输入 "Tab Tab ArrowDown Enter"
+"""
+```
+### 3. 通过键盘导航处理交互问题
+有时按钮无法点击（你发现了库中的 bug - 提交 issue）。好消息 - 通常可以通过键盘导航解决！
+```python
+task = """
+如果提交按钮无法点击：
+1. 使用 send_keys 操作输入 "Tab Tab Enter" 进行导航和激活
+2. 或使用 send_keys 输入 "ArrowDown ArrowDown Enter" 提交表单
+"""
+```
+### 4. 自定义操作集成
+```python
+@controller.action("从认证器应用获取 2FA 代码")
+async def get_2fa_code():
+    # 你的实现
+    pass
+task = """
+使用 2FA 登录：
+1. 输入用户名/密码
+2. 提示输入 2FA 时，使用 get_2fa_code 操作
+3. 永远不要尝试从页面手动提取 2FA 代码
+4. 始终使用 get_2fa_code 操作获取认证代码
+"""
+```
+### 5. 错误恢复
+```python
+task = """
+稳健的数据提取：
+1. 访问 openai.com 查找他们的 CEO
+2. 如果由于反机器人保护导航失败：
+   - 使用 Google 搜索查找 CEO
+3. 如果页面超时，使用 go_back 并尝试替代方法
+"""
+```
+## 🌟 高级功能
+### 结构化输出
+使用 Pydantic 模型获取结构化输出：
+```python
+from pydantic import BaseModel
+class Quote(BaseModel):
+    text: str
+    author: str
+agent = Agent(
+    task="提取前 3 条引用",
+    llm=llm,
+    output_model_schema=Quote,
+)
+history = await agent.run()
+structured_data = history.structured_output
+```
+### 远程浏览器（Browser-Use Cloud）
+```python
+from browser_use import Browser, ChatBrowserUse
+# 简单：使用 Browser-Use 云浏览器服务
+browser = Browser(use_cloud=True)
+# 高级：配置云浏览器参数
+browser = Browser(
+    cloud_profile_id='your-profile-id',  # 特定浏览器配置
+    cloud_proxy_country_code='us',       # 代理位置
+    cloud_timeout=30,                    # 会话超时（分钟）
+)
+```
+### MCP 集成
+Browser-Use 支持两种模式：
+1. **作为 MCP 服务器**：向 MCP 客户端（如 Claude Desktop）公开浏览器自动化工具
+2. **使用 MCP 客户端**：Agent 可以连接到外部 MCP 服务器以扩展能力
+```bash
+# 作为 MCP 服务器运行
+uvx browser-use[cli] --mcp
+```
+## 📂 项目结构
+```
+browser_use/
+├── agent/              # Agent 核心逻辑
+│   ├── service.py     # 主编排器
+│   ├── views.py       # Pydantic 模型
+│   └── system_prompt*.md  # Agent 提示词
+├── browser/           # 浏览器管理
+│   ├── session.py    # BrowserSession + CDP 客户端
+│   └── profile.py    # 浏览器配置和启动参数
+├── dom/              # DOM 处理
+│   └── service.py    # DomService 提取和处理
+├── tools/            # 操作注册表
+│   └── service.py    # 工具定义
+├── llm/              # LLM 集成层
+└── mcp/              # MCP 集成
+    └── client.py     # MCP 客户端连接
+```
+## 🔗 相关资源
+- **GitHub**: https://github.com/browser-use/browser-use
+- **文档**: https://docs.browser-use.com
+- **Discord**: https://link.browser-use.com/discord
+- **Cloud**: https://cloud.browser-use.com
+## 🤝 支持
+- 查看 [GitHub Issues](https://github.com/browser-use/browser-use/issues)
+- 在 [Discord 社区](https://link.browser-use.com/discord) 提问
+- 企业支持：support@browser-use.com