npm - @endday/search-mcp - Versions diffs - 1.0.0 → 1.0.2 - Mend

@endday/search-mcp 1.0.0 → 1.0.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (84) hide show

package/dist/index.js +4724 -0
package/{mcp → dist}/search-mcp.js +1 -2
package/package.json +14 -14
package/data/blocklist.generated.js +0 -2
package/envs.js +0 -129
package/index.js +0 -6
package/src/content/extract.impl.js +0 -228
package/src/content/extract.js +0 -1
package/src/content/fetch.impl.js +0 -400
package/src/content/fetch.js +0 -1
package/src/core/crypto.js +0 -7
package/src/core/errors.impl.js +0 -52
package/src/core/errors.js +0 -1
package/src/core/html.impl.js +0 -69
package/src/core/html.js +0 -1
package/src/mcp/config.js +0 -75
package/src/mcp/format.js +0 -44
package/src/mcp/index.js +0 -10
package/src/mcp/local/content.js +0 -26
package/src/mcp/local/search.js +0 -233
package/src/mcp/schemas.js +0 -132
package/src/mcp/server.js +0 -97
package/src/mcp/tools/content.js +0 -31
package/src/mcp/tools/jinaContent.js +0 -38
package/src/mcp/tools/newsSearch.js +0 -22
package/src/mcp/tools/webSearch.js +0 -57
package/src/platform/auth.impl.js +0 -166
package/src/platform/auth.js +0 -1
package/src/platform/cache.impl.js +0 -166
package/src/platform/cache.js +0 -1
package/src/platform/health.impl.js +0 -133
package/src/platform/health.js +0 -1
package/src/platform/http.impl.js +0 -108
package/src/platform/http.js +0 -1
package/src/platform/logger.impl.js +0 -51
package/src/platform/logger.js +0 -1
package/src/platform/metrics.impl.js +0 -43
package/src/platform/metrics.js +0 -1
package/src/platform/nodeHttpClient.js +0 -104
package/src/platform/rateLimit.impl.js +0 -141
package/src/platform/rateLimit.js +0 -1
package/src/platform/requestContext.impl.js +0 -10
package/src/platform/requestContext.js +0 -1
package/src/platform/session.impl.js +0 -198
package/src/platform/session.js +0 -1
package/src/platform/stateKv.impl.js +0 -18
package/src/platform/stateKv.js +0 -1
package/src/platform/tasks.impl.js +0 -17
package/src/platform/tasks.js +0 -1
package/src/routes/requestParams.impl.js +0 -12
package/src/routes/requestParams.js +0 -1
package/src/search/engineRegistry.impl.js +0 -117
package/src/search/engineRegistry.js +0 -1
package/src/search/engineRequest.impl.js +0 -377
package/src/search/engineRequest.js +0 -1
package/src/search/engineUtils.impl.js +0 -227
package/src/search/engineUtils.js +0 -1
package/src/search/engines/baidu.impl.js +0 -145
package/src/search/engines/baidu.js +0 -2
package/src/search/engines/bing.impl.js +0 -509
package/src/search/engines/bing.js +0 -2
package/src/search/engines/brave.impl.js +0 -223
package/src/search/engines/brave.js +0 -2
package/src/search/engines/duckduckgo.impl.js +0 -164
package/src/search/engines/duckduckgo.js +0 -2
package/src/search/engines/mojeek.impl.js +0 -115
package/src/search/engines/mojeek.js +0 -2
package/src/search/engines/qwant.impl.js +0 -188
package/src/search/engines/qwant.js +0 -2
package/src/search/engines/startpage.impl.js +0 -237
package/src/search/engines/startpage.js +0 -2
package/src/search/engines/toutiao.impl.js +0 -265
package/src/search/engines/toutiao.js +0 -2
package/src/search/engines/yahoo.impl.js +0 -379
package/src/search/engines/yahoo.js +0 -2
package/src/search/gateway.impl.js +0 -423
package/src/search/gateway.js +0 -1
package/src/search/ranking.impl.js +0 -381
package/src/search/ranking.js +0 -1
package/src/search/requestPolicy.impl.js +0 -137
package/src/search/requestPolicy.js +0 -1
package/src/search/upstreamSession.impl.js +0 -148
package/src/search/upstreamSession.js +0 -1
/package/{index.d.ts → dist/index.d.ts} +0 -0

package/envs.js DELETED Viewed

@@ -1,129 +0,0 @@
-const createDefaultEnv = () => ({
-  DEFAULT_TIMEOUT: "4000",
-  SUPPORTED_ENGINES: [
-    "baidu",
-    "startpage",
-    "duckduckgo",
-    "brave",
-    "qwant",
-    "yahoo",
-    "mojeek",
-    "bing",
-    "toutiao",
-  ],
-  DEFAULT_ENGINES: ["bing", "brave", "yahoo", "mojeek"],
-  DEFAULT_ENGINES_ZH: ["baidu", "bing"],
-  DEFAULT_ENGINES_NON_ZH: ["bing", "brave", "yahoo", "mojeek"],
-  DEFAULT_LANGUAGE: "en",
-  FALLBACK_MIN_RESULTS: "6",
-  FALLBACK_MIN_CONTRIBUTING_ENGINES: "2",
-  SEARCH_PRIMARY_TIERS: ["primary"],
-  SEARCH_SECONDARY_TIERS: ["secondary"],
-  SEARCH_EXPERIMENTAL_TIERS: ["experimental"],
-  SEARCH_TIER_HEDGE_DELAY_MS: "250",
-  EDGE_CACHE_TTL_SECONDS: "30",
-  CACHE_TTL_SECONDS: "300",
-  STALE_CACHE_TTL_SECONDS: "1800",
-  RATE_LIMIT_WINDOW_SECONDS: "60",
-  RATE_LIMIT_MAX_REQUESTS: "60",
-  UPSTREAM_RETRY_ATTEMPTS: "1",
-  UPSTREAM_RETRY_DELAY_MS: "200",
-  UPSTREAM_PRIMARY_RETRY_ATTEMPTS: "1",
-  UPSTREAM_SECONDARY_RETRY_ATTEMPTS: "0",
-  UPSTREAM_EXPERIMENTAL_RETRY_ATTEMPTS: "0",
-  UPSTREAM_SESSION_TTL_SECONDS: "3600",
-  UPSTREAM_MIN_REQUEST_INTERVAL_MS: "150",
-  UPSTREAM_PRIMARY_MIN_REQUEST_INTERVAL_MS: "100",
-  UPSTREAM_SECONDARY_MIN_REQUEST_INTERVAL_MS: "250",
-  UPSTREAM_EXPERIMENTAL_MIN_REQUEST_INTERVAL_MS: "500",
-  HEALTH_FAILURE_THRESHOLD: "2",
-  HEALTH_COOLDOWN_SECONDS: "180",
-  HEALTH_STATE_TTL_SECONDS: "3600",
-  CORS_ALLOWED_ORIGINS: ["*"],
-  CORS_ALLOWED_HEADERS: ["Authorization", "Content-Type", "x-api-key"],
-  AUTH_REQUIRED: "false",
-  TOKEN: null,
-  CF_BROWSER_RENDERING_ACCOUNT_ID: null,
-  CF_BROWSER_RENDERING_API_TOKEN: null,
-  SEARCH_KV: null,
-  SEARCH_STATE_KV: null,
-});
-function normalizeStringArray(value, fallback) {
-  if (Array.isArray(value)) {
-    return value.map((item) => String(item).trim()).filter(Boolean);
-  }
-  if (typeof value === "string") {
-    const trimmed = value.trim();
-    if (!trimmed) {
-      return [...fallback];
-    }
-    if (trimmed.startsWith("[")) {
-      try {
-        return normalizeStringArray(JSON.parse(trimmed), fallback);
-      } catch (_) {
-        return [...fallback];
-      }
-    }
-    return trimmed
-      .split(",")
-      .map((item) => item.trim())
-      .filter(Boolean);
-  }
-  return [...fallback];
-}
-function resetEnv(target) {
-  const defaults = createDefaultEnv();
-  Object.keys(target).forEach((key) => {
-    delete target[key];
-  });
-  Object.assign(target, defaults);
-}
-export const env = createDefaultEnv();
-export const setEnv = (newEnv = {}) => {
-  resetEnv(env);
-  Object.assign(env, newEnv);
-  env.SUPPORTED_ENGINES = normalizeStringArray(
-    env.SUPPORTED_ENGINES,
-    createDefaultEnv().SUPPORTED_ENGINES
-  );
-  env.DEFAULT_ENGINES = normalizeStringArray(
-    env.DEFAULT_ENGINES,
-    createDefaultEnv().DEFAULT_ENGINES
-  );
-  env.DEFAULT_ENGINES_ZH = normalizeStringArray(
-    env.DEFAULT_ENGINES_ZH,
-    createDefaultEnv().DEFAULT_ENGINES_ZH
-  );
-  env.DEFAULT_ENGINES_NON_ZH = normalizeStringArray(
-    env.DEFAULT_ENGINES_NON_ZH,
-    createDefaultEnv().DEFAULT_ENGINES_NON_ZH
-  );
-  env.CORS_ALLOWED_ORIGINS = normalizeStringArray(
-    env.CORS_ALLOWED_ORIGINS,
-    createDefaultEnv().CORS_ALLOWED_ORIGINS
-  );
-  env.CORS_ALLOWED_HEADERS = normalizeStringArray(
-    env.CORS_ALLOWED_HEADERS,
-    createDefaultEnv().CORS_ALLOWED_HEADERS
-  );
-  env.SEARCH_PRIMARY_TIERS = normalizeStringArray(
-    env.SEARCH_PRIMARY_TIERS,
-    createDefaultEnv().SEARCH_PRIMARY_TIERS
-  );
-  env.SEARCH_SECONDARY_TIERS = normalizeStringArray(
-    env.SEARCH_SECONDARY_TIERS,
-    createDefaultEnv().SEARCH_SECONDARY_TIERS
-  );
-  env.SEARCH_EXPERIMENTAL_TIERS = normalizeStringArray(
-    env.SEARCH_EXPERIMENTAL_TIERS,
-    createDefaultEnv().SEARCH_EXPERIMENTAL_TIERS
-  );
-};

package/index.js DELETED Viewed

@@ -1,6 +0,0 @@
-export { env, setEnv } from "./envs.js";
-export { loadMcpConfig } from "./src/mcp/config.js";
-export { main } from "./src/mcp/index.js";
-export { searchLocal } from "./src/mcp/local/search.js";
-export { createServer, startServer } from "./src/mcp/server.js";
-export { searchAll, searchAllWithMeta } from "./src/search/gateway.js";

package/src/content/extract.impl.js DELETED Viewed

@@ -1,228 +0,0 @@
-import { Readability } from "@mozilla/readability";
-import { DOMParser } from "linkedom/worker";
-import { cleanText, parseHtml } from "../core/html.js";
-const NOISE_SELECTOR =
-  "script, style, noscript, nav, footer, header, aside, form, iframe, svg, canvas, button, input, select, textarea";
-const CANDIDATE_SELECTOR =
-  "article, main, section, div, [role=main], .article, .post, .content, .entry-content, #content";
-const POSITIVE_RE =
-  /article|body|content|entry|hentry|main|page|post|story|text|正文|内容|文章/i;
-const NEGATIVE_RE =
-  /ad|banner|comment|combx|contact|footer|header|menu|meta|nav|promo|related|remark|rss|share|sidebar|social|tag|tool|widget|广告|评论|导航|分享|推荐|相关阅读/i;
-function getNodeText(node) {
-  return cleanText(node?.text || "");
-}
-function getMeta(root, selector) {
-  return cleanText(root.querySelector(selector)?.getAttribute("content") || "");
-}
-function getNodeSignal(node) {
-  return `${node.getAttribute?.("id") || ""} ${node.getAttribute?.("class") || ""}`;
-}
-function scoreCandidate(node) {
-  const text = getNodeText(node);
-  const textLength = text.length;
-  if (textLength < 80) {
-    return {
-      node,
-      score: 0,
-      textLength,
-      linkDensity: 1,
-      paragraphCount: 0,
-    };
-  }
-  const linkTextLength = node
-    .querySelectorAll("a")
-    .reduce((total, link) => total + getNodeText(link).length, 0);
-  const paragraphCount = node.querySelectorAll("p").filter((p) => {
-    return getNodeText(p).length >= 20;
-  }).length;
-  const commaCount = (text.match(/[，,。.!?！？；;]/g) || []).length;
-  const signal = getNodeSignal(node);
-  const linkDensity = textLength ? linkTextLength / textLength : 1;
-  let score = textLength + paragraphCount * 120 + commaCount * 12;
-  if (POSITIVE_RE.test(signal)) {
-    score += 350;
-  }
-  if (NEGATIVE_RE.test(signal)) {
-    score -= 500;
-  }
-  score *= Math.max(0.05, 1 - linkDensity);
-  return {
-    node,
-    score,
-    textLength,
-    linkDensity,
-    paragraphCount,
-  };
-}
-function cleanTree(root) {
-  root.querySelectorAll(NOISE_SELECTOR).forEach((node) => node.remove());
-  root.querySelectorAll("a").forEach((link) => {
-    const href = String(link.getAttribute("href") || "").trim();
-    if (/^\s*javascript:/i.test(href)) {
-      link.removeAttribute("href");
-    }
-  });
-}
-function stripUnsafeHtml(html) {
-  return String(html || "")
-    .replace(/\s+on[a-z]+\s*=\s*("[^"]*"|'[^']*'|[^\s>]+)/gi, "")
-    .replace(/\s+style\s*=\s*("[^"]*"|'[^']*'|[^\s>]+)/gi, "")
-    .replace(/\s+href\s*=\s*(['"])\s*javascript:[\s\S]*?\1/gi, "");
-}
-function pickBestCandidate(root) {
-  const candidates = root
-    .querySelectorAll(CANDIDATE_SELECTOR)
-    .map(scoreCandidate)
-    .sort((a, b) => b.score - a.score);
-  const best = candidates[0];
-  if (best?.score > 0) {
-    return best;
-  }
-  const body = root.querySelector("body") || root;
-  return scoreCandidate(body);
-}
-function getPageMetadata(html) {
-  const root = parseHtml(html);
-  return {
-    title:
-      getMeta(root, 'meta[property="og:title"]') ||
-      getMeta(root, 'meta[name="twitter:title"]') ||
-      cleanText(root.querySelector("title")?.text || ""),
-    description:
-      getMeta(root, 'meta[property="og:description"]') ||
-      getMeta(root, 'meta[name="twitter:description"]') ||
-      getMeta(root, 'meta[name="description"]'),
-    site_name: getMeta(root, 'meta[property="og:site_name"]'),
-    author: getMeta(root, 'meta[name="author"]'),
-    published_time:
-      getMeta(root, 'meta[property="article:published_time"]') ||
-      getMeta(root, 'meta[name="date"]') ||
-      getMeta(root, 'meta[name="pubdate"]'),
-    image:
-      getMeta(root, 'meta[property="og:image"]') ||
-      getMeta(root, 'meta[name="twitter:image"]'),
-    lang: root.querySelector("html")?.getAttribute("lang") || "",
-  };
-}
-function extractWithReadability(html, url) {
-  const document = new DOMParser().parseFromString(html, "text/html");
-  if (url && document.head) {
-    const base = document.createElement("base");
-    base.setAttribute("href", url);
-    document.head.appendChild(base);
-  }
-  const article = new Readability(document, {
-    keepClasses: true,
-  }).parse();
-  if (!article?.content) {
-    return null;
-  }
-  return article;
-}
-function normalizeReadabilityArticle(article, metadata, url) {
-  const text = cleanText(article.textContent || article.content);
-  const contentHtml = stripUnsafeHtml(article.content);
-  if (text.length < 80) {
-    return null;
-  }
-  return {
-    url: article.url || url,
-    source: "direct-fetch",
-    extractor: "readability",
-    title: cleanText(article.title || metadata.title || ""),
-    description: cleanText(article.excerpt || metadata.description || ""),
-    metadata: {
-      ...metadata,
-      title: cleanText(article.title || metadata.title || ""),
-      description: cleanText(article.excerpt || metadata.description || ""),
-      site_name: cleanText(article.siteName || metadata.site_name || ""),
-      author: cleanText(article.byline || metadata.author || ""),
-      lang: article.lang || metadata.lang || "",
-    },
-    html: contentHtml,
-    text,
-    excerpt: text.slice(0, 500),
-    stats: {
-      text_length: text.length,
-      html_length: contentHtml.length,
-      score: null,
-      link_density: null,
-      paragraph_count: (contentHtml.match(/<p\b/gi) || []).length,
-    },
-  };
-}
-function extractPageContentWithHeuristics(html, url) {
-  const root = parseHtml(html);
-  const metadata = getPageMetadata(html);
-  cleanTree(root);
-  const candidate = pickBestCandidate(root);
-  const text = getNodeText(candidate.node);
-  const contentHtml = stripUnsafeHtml(candidate.node?.toString() || "");
-  return {
-    url,
-    source: "direct-fetch",
-    extractor: "heuristic",
-    title: metadata.title,
-    description: metadata.description,
-    metadata,
-    html: contentHtml,
-    text,
-    excerpt: text.slice(0, 500),
-    stats: {
-      text_length: text.length,
-      html_length: contentHtml.length,
-      score: Math.round(candidate.score),
-      link_density: Number(candidate.linkDensity.toFixed(3)),
-      paragraph_count: candidate.paragraphCount,
-    },
-  };
-}
-export async function extractPageContent(html, url) {
-  try {
-    const metadata = getPageMetadata(html);
-    const article = extractWithReadability(html, url);
-    const extracted = normalizeReadabilityArticle(article, metadata, url);
-    if (extracted) {
-      return extracted;
-    }
-  } catch (_) {
-    // Fall back to the local heuristic extractor when the library cannot parse
-    // a page or when Worker bundling/runtime behavior differs by site.
-  }
-  return extractPageContentWithHeuristics(html, url);
-}

package/src/content/extract.js DELETED Viewed

	@@ -1 +0,0 @@
1	- export * from "./extract.impl.js";