npm - superagent-ai-agent - Versions diffs - 0.1.0 - Mend

superagent-ai-agent 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

package/src/web-tool.js ADDED Viewed

@@ -0,0 +1,174 @@
+import { createSdkMcpServer, tool } from '@anthropic-ai/claude-agent-sdk';
+import { z } from 'zod';
+import { chromium } from 'playwright';
+// 复用同一个浏览器实例,避免每次调用都冷启动
+let browserPromise = null;
+async function getBrowser() {
+  if (!browserPromise) {
+    browserPromise = chromium.launch({ headless: true });
+  }
+  return browserPromise;
+}
+// 关闭浏览器(进程退出时清理)
+export async function closeBrowser() {
+  if (browserPromise) {
+    try {
+      const b = await browserPromise;
+      await b.close();
+    } catch { /* 忽略 */ }
+    browserPromise = null;
+  }
+}
+process.on('exit', () => {
+  browserPromise?.then((b) => b.close().catch(() => {})).catch(() => {});
+});
+// HTML 主内容提取:去掉 script/style/nav 等噪声,保留正文文本
+function extractMainText(document) {
+  // 常见噪声标签
+  const noise = document.querySelectorAll(
+    'script, style, noscript, iframe, nav, header, footer, aside, form, button, svg, [role="navigation"], [role="banner"], [role="contentinfo"]'
+  );
+  noise.forEach((n) => n.remove());
+  // 优先取 article / main,否则用 body
+  const root = document.querySelector('article') || document.querySelector('main') || document.body;
+  if (!root) return '';
+  // 把块级元素后面补换行,保留结构
+  const blocks = root.querySelectorAll('h1,h2,h3,h4,h5,h6,p,li,pre,blockquote,td,th,section,div');
+  blocks.forEach((b) => { b.append('\n'); });
+  const text = root.textContent || '';
+  // 折叠多余空白
+  return text.replace(/ /g, ' ').replace(/[ \t]+/g, ' ').replace(/\n{3,}/g, '\n\n').trim();
+}
+// 把页面内容转成给模型看的 markdown-ish 文本
+function pageToMarkdown(url, title, text, maxChars = 20000) {
+  const truncated = text.length > maxChars
+    ? text.slice(0, maxChars) + `\n\n[... 内容已截断,原文共 ${text.length} 字符 ...]`
+    : text;
+  return `URL: ${url}\nTitle: ${title}\n\n${truncated}`;
+}
+async function fetchPage(url, timeout = 30000) {
+  const browser = await getBrowser();
+  const context = await browser.newContext({
+    userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
+    locale: 'zh-CN',
+    javaScriptEnabled: true,
+  });
+  const page = await context.newPage();
+  try {
+    await page.goto(url, { waitUntil: 'domcontentloaded', timeout });
+    // 等动态内容渲染一下
+    await page.waitForTimeout(800).catch(() => {});
+    // 触发懒加载
+    await page.evaluate(() => window.scrollTo(0, document.body.scrollHeight)).catch(() => {});
+    await page.waitForTimeout(500).catch(() => {});
+    const result = await page.evaluate(extractMainText);
+    const title = await page.title();
+    return pageToMarkdown(url, title, result || '');
+  } finally {
+    await context.close().catch(() => {});
+  }
+}
+// 搜索:Brave Search(Bing 在国内 IP 下强制中文结果,Google/DuckDuckGo 挡无头浏览器)
+// Brave 不限地区、不挡无头,返回结构化结果且链接是真实 URL 不需解码
+async function searchWeb(query, maxResults = 8, timeout = 30000) {
+  const browser = await getBrowser();
+  const context = await browser.newContext({
+    userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
+    locale: 'en-US',
+    javaScriptEnabled: true,
+  });
+  // 反无头检测
+  await context.addInitScript(() => {
+    Object.defineProperty(navigator, 'webdriver', { get: () => false });
+  });
+  const page = await context.newPage();
+  try {
+    const url = `https://search.brave.com/search?q=${encodeURIComponent(query)}`;
+    await page.goto(url, { waitUntil: 'domcontentloaded', timeout });
+    await page.waitForTimeout(2000).catch(() => {});
+    const results = await page.evaluate((limit) => {
+      // Brave 结果块是 article 或 div.snippet
+      const items = Array.from(document.querySelectorAll('article, div.snippet'));
+      return items.slice(0, limit).map((it) => {
+        const titleEl = it.querySelector('a.title, .snippet-title, h3, a[href]');
+        const snippetEl = it.querySelector('.snippet-content, .snippet-description, p, .text-gray');
+        return {
+          title: (titleEl?.textContent || '').trim(),
+          url: titleEl?.href || titleEl?.closest('a')?.href || '',
+          snippet: (snippetEl?.textContent || '').trim(),
+        };
+      }).filter((r) => (r.title || r.url) && !r.url.includes('search.brave.com'));
+    }, maxResults);
+    return results;
+  } finally {
+    await context.close().catch(() => {});
+  }
+}
+function formatSearchResults(query, results) {
+  if (!results.length) return `搜索 "${query}" 没有返回结果。`;
+  const lines = results.map((r, i) =>
+    `${i + 1}. ${r.title}\n   ${r.url}\n   ${r.snippet}`
+  );
+  return `搜索 "${query}" 的结果:\n\n${lines.join('\n\n')}`;
+}
+export const webMcpServer = createSdkMcpServer({
+  name: 'web',
+  version: '1.0.0',
+  tools: [
+    tool(
+      'WebFetch',
+      '抓取指定 URL 的网页内容并转成文本。用于:需要读取某个网页、文档、API 文档、博客文章内容时。输入 url(必须 http(s)://)和可选的 prompt(想从页面里提取什么信息)。返回页面正文文本。',
+      {
+        url: z.string().url().describe('要抓取的完整 URL,以 http:// 或 https:// 开头'),
+        prompt: z.string().optional().describe('想从页面里提取什么信息(可选,仅作提示,工具仍返回整页正文)'),
+      },
+      async (args) => {
+        try {
+          const content = await fetchPage(args.url);
+          return {
+            content: [{ type: 'text', text: content }],
+          };
+        } catch (e) {
+          return {
+            content: [{ type: 'text', text: `抓取失败: ${e?.message ?? String(e)}` }],
+            isError: true,
+          };
+        }
+      },
+      { alwaysLoad: true }
+    ),
+    tool(
+      'WebSearch',
+      '用搜索引擎搜索关键词,返回标题+URL+摘要列表。用于:需要查最新资讯、找某网站、查某个事实、不知道具体 URL 时。输入 query(搜索词)。先用这个找到相关链接,再用 WebFetch 抓具体页面看细节。',
+      {
+        query: z.string().describe('搜索关键词'),
+      },
+      async (args) => {
+        try {
+          const results = await searchWeb(args.query);
+          return {
+            content: [{ type: 'text', text: formatSearchResults(args.query, results) }],
+          };
+        } catch (e) {
+          return {
+            content: [{ type: 'text', text: `搜索失败: ${e?.message ?? String(e)}` }],
+            isError: true,
+          };
+        }
+      },
+      { alwaysLoad: true }
+    ),
+  ],
+});