npm - smart-image-scraper-mcp - Versions diffs - 2.8.0 → 2.9.0 - Mend

smart-image-scraper-mcp 2.8.0 → 2.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/README.md +2 -0
package/package.json +1 -1
package/src/index.js +4 -0
package/src/providers/bingScraper.js +23 -4
package/src/providers/googleScraper.js +27 -4

package/README.md CHANGED Viewed

@@ -86,6 +86,8 @@ npm install
 - "下载 20 张高清风景壁纸"
 - "找一些人物头像图片"
+> ⚠️ **重要限制**：同一会话中连续调用不要超过 5 次！需要多种类型图片时，使用批量查询（逗号分隔关键词）。
 ## Tool Schema
 ### smart_scraper

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "smart-image-scraper-mcp",
-  "version": "2.8.0",
+  "version": "2.9.0",
   "description": "全网智能图片抓取 MCP 服务器 - 支持 Bing/Google 图片搜索、验证和下载",
   "main": "src/index.js",
   "type": "module",

package/src/index.js CHANGED Viewed

@@ -65,6 +65,10 @@ const SMART_SCRAPER_TOOL = {
 - 正方形: square_1080(1080x1080), square_512(512x512)
 - 社交媒体: instagram(1080x1080), twitter(1200x675), facebook(1200x630)
+【⚠️ 重要限制】
+- 同一会话中连续调用此工具不要超过5次！超过后可能无响应
+- 当用户需要多种类型图片时，必须使用批量查询（逗号分隔），而不是多次调用
 【调用示例】
 1. 搜索5张猫的图片: {"query":"可爱的猫","mode":"link","count":5}
 2. 下载10张高清风景图: {"query":"风景","mode":"download","count":10,"size":"large"}

package/src/providers/bingScraper.js CHANGED Viewed

@@ -26,12 +26,31 @@ export class BingScraper extends BaseScraper {
     this.options = options;
     const pageSize = 35;
-    // 只获取第一页，避免触发速率限制
-    logger.info(`[Bing] Searching "${keyword}" - single page mode`);
+    // 计算需要获取的页数（最多3页，避免触发速率限制）
+    const pagesNeeded = Math.min(Math.ceil(limit / pageSize), 3);
+    logger.info(`[Bing] Searching "${keyword}" - ${pagesNeeded} page(s) for ${limit} images`);
     try {
-      const urls = await this._fetchPage(keyword, 0);
-      const result = urls.slice(0, limit);
+      let allUrls = [];
+      // 顺序获取多页（避免并发触发限制）
+      for (let page = 0; page < pagesNeeded; page++) {
+        const offset = page * pageSize;
+        const urls = await this._fetchPage(keyword, offset);
+        allUrls = allUrls.concat(urls);
+        // 如果已经够了就停止
+        if (allUrls.length >= limit) {
+          break;
+        }
+        // 页间延迟，避免触发速率限制
+        if (page < pagesNeeded - 1) {
+          await this._delay(200);
+        }
+      }
+      const result = allUrls.slice(0, limit);
       logger.info(`[Bing] Complete: ${result.length} URLs for "${keyword}"`);
       return result;
     } catch (error) {

package/src/providers/googleScraper.js CHANGED Viewed

@@ -24,13 +24,32 @@ export class GoogleScraper extends BaseScraper {
    */
   async search(keyword, limit = 10, options = {}) {
     this.options = options;
+    const pageSize = 20; // Google 每页约20张
-    // 只获取第一页，避免触发速率限制
-    logger.info(`[Google] Searching "${keyword}" - single page mode`);
+    // 计算需要获取的页数（最多3页，避免触发速率限制）
+    const pagesNeeded = Math.min(Math.ceil(limit / pageSize), 3);
+    logger.info(`[Google] Searching "${keyword}" - ${pagesNeeded} page(s) for ${limit} images`);
     try {
-      const urls = await this._fetchPage(keyword, 0);
-      const result = urls.slice(0, limit);
+      let allUrls = [];
+      // 顺序获取多页
+      for (let page = 0; page < pagesNeeded; page++) {
+        const start = page * pageSize;
+        const urls = await this._fetchPage(keyword, start);
+        allUrls = allUrls.concat(urls);
+        if (allUrls.length >= limit) {
+          break;
+        }
+        // 页间延迟
+        if (page < pagesNeeded - 1) {
+          await this._delay(300);
+        }
+      }
+      const result = allUrls.slice(0, limit);
       logger.info(`[Google] Complete: ${result.length} URLs for "${keyword}"`);
       return result;
     } catch (error) {
@@ -38,6 +57,10 @@ export class GoogleScraper extends BaseScraper {
       return [];
     }
   }
+  _delay(ms) {
+    return new Promise(resolve => setTimeout(resolve, ms));
+  }
   /**
    * 获取单页结果