npm - @just-every/mcp-read-website-fast - Versions diffs - 0.1.5 → 0.1.7 - Mend

@just-every/mcp-read-website-fast 0.1.5 → 0.1.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/dist/cache/disk.js +1 -1
package/dist/crawler/fetch.js +8 -7
package/dist/crawler/queue.js +16 -10
package/dist/crawler/robots.js +3 -3
package/dist/index.js +14 -11
package/dist/internal/fetchMarkdown.js +4 -4
package/dist/parser/article.js +25 -15
package/dist/parser/dom.js +11 -10
package/dist/parser/markdown.js +27 -14
package/dist/serve.js +104 -56
package/dist/utils/chunker.js +15 -13
package/package.json +4 -1

package/dist/cache/disk.js CHANGED Viewed

@@ -40,7 +40,7 @@ export class DiskCache {
             url,
             markdown,
             timestamp: Date.now(),
-            title
+            title,
         };
         const path = this.getCachePath(url);
         await writeFile(path, JSON.stringify(entry, null, 2));

package/dist/crawler/fetch.js CHANGED Viewed

@@ -1,24 +1,25 @@
 import { fetch } from 'undici';
 export async function fetchStream(url, options = {}) {
-    const { userAgent = 'MCP/0.1 (+https://github.com/just-every/mcp-read-website-fast)', timeout = 30000, maxRedirections = 5 } = options;
+    const { userAgent = 'MCP/0.1 (+https://github.com/just-every/mcp-read-website-fast)', timeout = 30000, maxRedirections = 5, } = options;
     try {
         const response = await fetch(url, {
             headers: {
                 'User-Agent': userAgent,
-                'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+                Accept: 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
                 'Accept-Language': 'en-US,en;q=0.5',
-                'DNT': '1',
-                'Connection': 'keep-alive',
-                'Upgrade-Insecure-Requests': '1'
+                DNT: '1',
+                Connection: 'keep-alive',
+                'Upgrade-Insecure-Requests': '1',
             },
             redirect: maxRedirections > 0 ? 'follow' : 'manual',
-            signal: AbortSignal.timeout(timeout)
+            signal: AbortSignal.timeout(timeout),
         });
         if (!response.ok) {
             throw new Error(`HTTP ${response.status} for ${url}`);
         }
         const contentType = response.headers.get('content-type');
-        if (contentType && !contentType.includes('text/html') &&
+        if (contentType &&
+            !contentType.includes('text/html') &&
             !contentType.includes('application/xhtml+xml')) {
             throw new Error(`Non-HTML content type: ${contentType} for ${url}`);
         }

package/dist/crawler/queue.js CHANGED Viewed

@@ -21,7 +21,7 @@ export class CrawlQueue {
             sameOriginOnly: options.sameOriginOnly ?? true,
             userAgent: options.userAgent ?? 'MCP/0.1',
             cacheDir: options.cacheDir ?? '.cache',
-            timeout: options.timeout ?? 30000
+            timeout: options.timeout ?? 30000,
         };
         this.limit = pLimit(this.options.maxConcurrency);
         this.cache = new DiskCache(this.options.cacheDir);
@@ -60,7 +60,7 @@ export class CrawlQueue {
                 this.results.push({
                     url: normalizedUrl,
                     markdown: cached.markdown,
-                    title: cached.title
+                    title: cached.title,
                 });
                 return;
             }
@@ -70,7 +70,7 @@ export class CrawlQueue {
                     this.results.push({
                         url: normalizedUrl,
                         markdown: '',
-                        error: 'Blocked by robots.txt'
+                        error: 'Blocked by robots.txt',
                     });
                     return;
                 }
@@ -81,13 +81,13 @@ export class CrawlQueue {
             }
             const html = await fetchStream(normalizedUrl, {
                 userAgent: this.options.userAgent,
-                timeout: this.options.timeout
+                timeout: this.options.timeout,
             });
             if (!html || html.trim().length === 0) {
                 this.results.push({
                     url: normalizedUrl,
                     markdown: '',
-                    error: 'Empty response from server'
+                    error: 'Empty response from server',
                 });
                 return;
             }
@@ -97,15 +97,21 @@ export class CrawlQueue {
                 this.results.push({
                     url: normalizedUrl,
                     markdown: '',
-                    error: 'Failed to extract article content'
+                    error: 'Failed to extract article content',
                 });
                 return;
             }
             if (!article.content || article.content.trim().length < 50) {
+                const fallbackMarkdown = `# ${article.title || 'Page Content'}\n\n` +
+                    `*Note: This page appears to be JavaScript-rendered. Limited content extracted.*\n\n` +
+                    (article.textContent
+                        ? article.textContent.substring(0, 1000) + '...'
+                        : 'No text content available');
                 this.results.push({
                     url: normalizedUrl,
-                    markdown: '',
-                    error: 'Page contains minimal extractable content'
+                    markdown: fallbackMarkdown,
+                    title: article.title || normalizedUrl,
+                    error: 'Limited content extracted (JavaScript-rendered page)',
                 });
                 return;
             }
@@ -128,14 +134,14 @@ export class CrawlQueue {
                 url: normalizedUrl,
                 markdown,
                 title: article.title,
-                links: links.length > 0 ? links : undefined
+                links: links.length > 0 ? links : undefined,
             });
         }
         catch (error) {
             this.results.push({
                 url: normalizedUrl,
                 markdown: '',
-                error: error instanceof Error ? error.message : 'Unknown error'
+                error: error instanceof Error ? error.message : 'Unknown error',
             });
         }
     }

package/dist/crawler/robots.js CHANGED Viewed

@@ -8,9 +8,9 @@ export async function getRobotsChecker(origin, userAgent = '*') {
         const robotsUrl = new URL('/robots.txt', origin).href;
         const robotsTxt = await fetchStream(robotsUrl, {
             timeout: 5000,
-            userAgent
+            userAgent,
         });
-        const robotsParserModule = await import('robots-parser');
+        const robotsParserModule = (await import('robots-parser'));
         const robotsParser = robotsParserModule.default || robotsParserModule;
         const robots = robotsParser(robotsUrl, robotsTxt);
         robotsCache.set(origin, robots);
@@ -19,7 +19,7 @@ export async function getRobotsChecker(origin, userAgent = '*') {
     catch {
         const permissive = {
             isAllowed: () => true,
-            getCrawlDelay: () => undefined
+            getCrawlDelay: () => undefined,
         };
         robotsCache.set(origin, permissive);
         return permissive;

package/dist/index.js CHANGED Viewed

@@ -32,7 +32,7 @@ program
             sameOriginOnly: !options.allOrigins,
             userAgent: options.userAgent,
             cacheDir: options.cacheDir,
-            timeout: parseInt(options.timeout, 10)
+            timeout: parseInt(options.timeout, 10),
         };
         const queue = new CrawlQueue(crawlOptions);
         await queue.init();
@@ -43,30 +43,33 @@ program
         }
         else if (options.output === 'markdown') {
             results.forEach(result => {
-                if (result.error) {
-                    console.error(`Error for ${result.url}: ${result.error}`);
-                }
-                else if (result.markdown) {
+                if (result.markdown) {
                     console.log(result.markdown);
                     if (results.length > 1) {
                         console.log('\n---\n');
                     }
                 }
+                if (result.error && result.markdown) {
+                    console.error(`Warning for ${result.url}: ${result.error}`);
+                }
+                else if (result.error && !result.markdown) {
+                    console.error(`Error for ${result.url}: ${result.error}`);
+                }
             });
         }
         else if (options.output === 'both') {
             results.forEach(result => {
                 console.log(`\n## URL: ${result.url}\n`);
-                if (result.error) {
-                    console.error(`Error: ${result.error}`);
-                }
-                else {
+                if (result.markdown) {
                     console.log(result.markdown);
                 }
+                if (result.error) {
+                    console.error(`${result.markdown ? 'Warning' : 'Error'}: ${result.error}`);
+                }
             });
         }
-        const hasErrors = results.some(r => r.error);
-        if (hasErrors) {
+        const hasFatalErrors = results.some(r => r.error && !r.markdown);
+        if (hasFatalErrors) {
             process.exit(1);
         }
     }

package/dist/internal/fetchMarkdown.js CHANGED Viewed

@@ -8,7 +8,7 @@ export async function fetchMarkdown(url, options = {}) {
             sameOriginOnly: options.sameOriginOnly ?? true,
             userAgent: options.userAgent,
             cacheDir: options.cacheDir ?? '.cache',
-            timeout: options.timeout ?? 30000
+            timeout: options.timeout ?? 30000,
         };
         const queue = new CrawlQueue(crawlOptions);
         await queue.init();
@@ -17,20 +17,20 @@ export async function fetchMarkdown(url, options = {}) {
         if (!mainResult) {
             return {
                 markdown: '',
-                error: 'No results returned'
+                error: 'No results returned',
             };
         }
         return {
             markdown: mainResult.markdown,
             title: mainResult.title,
             links: mainResult.links,
-            error: mainResult.error
+            error: mainResult.error,
         };
     }
     catch (error) {
         return {
             markdown: '',
-            error: error instanceof Error ? error.message : 'Unknown error'
+            error: error instanceof Error ? error.message : 'Unknown error',
         };
     }
 }

package/dist/parser/article.js CHANGED Viewed

@@ -4,10 +4,12 @@ export function extractArticle(dom) {
     const baseUrl = dom.window.location.href;
     const articleParagraph = document.querySelector('article p');
     const hasStrongArticleIndicators = (document.querySelector('article') !== null &&
-        articleParagraph?.textContent && articleParagraph.textContent.length > 200) ||
+        articleParagraph?.textContent &&
+        articleParagraph.textContent.length > 200) ||
         document.querySelector('[itemtype*="BlogPosting"]') !== null ||
         document.querySelector('[itemtype*="NewsArticle"]') !== null ||
-        document.querySelector('meta[property="article:published_time"]') !== null;
+        document.querySelector('meta[property="article:published_time"]') !==
+            null;
     if (hasStrongArticleIndicators) {
         const documentClone = document.cloneNode(true);
         const reader = new Readability(documentClone);
@@ -24,7 +26,7 @@ export function extractArticle(dom) {
                 lang: article.lang || null,
                 siteName: article.siteName || null,
                 publishedTime: article.publishedTime || null,
-                baseUrl
+                baseUrl,
             };
         }
     }
@@ -36,10 +38,16 @@ function extractContentManually(dom) {
         const baseUrl = dom.window.location.href;
         const title = document.querySelector('title')?.textContent ||
             document.querySelector('h1')?.textContent ||
-            document.querySelector('meta[property="og:title"]')?.getAttribute('content') ||
-            document.querySelector('meta[name="title"]')?.getAttribute('content') ||
+            document
+                .querySelector('meta[property="og:title"]')
+                ?.getAttribute('content') ||
+            document
+                .querySelector('meta[name="title"]')
+                ?.getAttribute('content') ||
             'Untitled Page';
-        const byline = document.querySelector('meta[name="author"]')?.getAttribute('content') ||
+        const byline = document
+            .querySelector('meta[name="author"]')
+            ?.getAttribute('content') ||
             document.querySelector('[rel="author"]')?.textContent ||
             document.querySelector('.author')?.textContent ||
             null;
@@ -56,18 +64,18 @@ function extractContentManually(dom) {
                 siteName: null,
                 textContent: document.documentElement?.textContent || '',
                 publishedTime: null,
-                baseUrl
+                baseUrl,
             };
         }
         const contentClone = document.body.cloneNode(true);
-        const selectorsToRemove = [
-            'script', 'style', 'noscript', 'template'
-        ];
+        const selectorsToRemove = ['script', 'style', 'noscript', 'template'];
         selectorsToRemove.forEach(selector => {
             try {
-                contentClone.querySelectorAll(selector).forEach(el => el.remove());
+                contentClone
+                    .querySelectorAll(selector)
+                    .forEach(el => el.remove());
             }
-            catch (e) {
+            catch {
             }
         });
         const mainContent = contentClone;
@@ -83,14 +91,16 @@ function extractContentManually(dom) {
             siteName: null,
             textContent: mainContent.textContent || '',
             publishedTime: null,
-            baseUrl
+            baseUrl,
         };
     }
     catch (error) {
         console.error('Error in manual extraction:', error);
         return {
             title: 'Error extracting content',
-            content: dom.window.document.body?.innerHTML || dom.window.document.documentElement?.innerHTML || '',
+            content: dom.window.document.body?.innerHTML ||
+                dom.window.document.documentElement?.innerHTML ||
+                '',
             byline: null,
             excerpt: '',
             dir: null,
@@ -99,7 +109,7 @@ function extractContentManually(dom) {
             siteName: null,
             textContent: dom.window.document.body?.textContent || '',
             publishedTime: null,
-            baseUrl: dom.window.location.href
+            baseUrl: dom.window.location.href,
         };
     }
 }

package/dist/parser/dom.js CHANGED Viewed

@@ -5,24 +5,25 @@ export function htmlToDom(html, url) {
             url,
             contentType: 'text/html',
             includeNodeLocations: false,
-            runScripts: 'outside-only',
-            resources: 'usable',
-            pretendToBeVisual: true
+            runScripts: undefined,
+            resources: undefined,
+            pretendToBeVisual: true,
+            virtualConsole: new JSDOM.VirtualConsole().sendTo(console, { omitJSDOMErrors: true }),
         });
     }
-    catch (error) {
-        console.error('Error parsing HTML with JSDOM, trying with minimal options:', error);
+    catch {
         try {
             return new JSDOM(html, {
                 url,
-                contentType: 'text/html'
+                contentType: 'text/html',
+                virtualConsole: new JSDOM.VirtualConsole().sendTo(console, { omitJSDOMErrors: true }),
             });
         }
-        catch (fallbackError) {
-            console.error('Fallback parsing also failed:', fallbackError);
+        catch {
             return new JSDOM(`<!DOCTYPE html><html><body>${html}</body></html>`, {
                 url,
-                contentType: 'text/html'
+                contentType: 'text/html',
+                virtualConsole: new JSDOM.VirtualConsole().sendTo(console, { omitJSDOMErrors: true }),
             });
         }
     }
@@ -32,7 +33,7 @@ export function extractLinks(dom) {
     const links = [];
     const baseUrl = dom.window.location.href;
     const anchorElements = document.querySelectorAll('a[href]');
-    anchorElements.forEach((element) => {
+    anchorElements.forEach(element => {
         try {
             const href = element.getAttribute('href');
             if (!href)

package/dist/parser/markdown.js CHANGED Viewed

@@ -7,34 +7,41 @@ function convertRelativeUrls(html, baseUrl) {
         const document = dom.window.document;
         document.querySelectorAll('a[href]').forEach(link => {
             const href = link.getAttribute('href');
-            if (href && !href.startsWith('http://') && !href.startsWith('https://') &&
-                !href.startsWith('//') && !href.startsWith('mailto:') &&
-                !href.startsWith('tel:') && !href.startsWith('javascript:') &&
+            if (href &&
+                !href.startsWith('http://') &&
+                !href.startsWith('https://') &&
+                !href.startsWith('//') &&
+                !href.startsWith('mailto:') &&
+                !href.startsWith('tel:') &&
+                !href.startsWith('javascript:') &&
                 !href.startsWith('#')) {
                 try {
                     const absoluteUrl = new URL(href, baseUrl).href;
                     link.setAttribute('href', absoluteUrl);
                 }
-                catch (e) {
+                catch {
                 }
             }
         });
         document.querySelectorAll('img[src]').forEach(img => {
             const src = img.getAttribute('src');
-            if (src && !src.startsWith('http://') && !src.startsWith('https://') &&
-                !src.startsWith('//') && !src.startsWith('data:')) {
+            if (src &&
+                !src.startsWith('http://') &&
+                !src.startsWith('https://') &&
+                !src.startsWith('//') &&
+                !src.startsWith('data:')) {
                 try {
                     const absoluteUrl = new URL(src, baseUrl).href;
                     img.setAttribute('src', absoluteUrl);
                 }
-                catch (e) {
+                catch {
                 }
             }
         });
         const bodyElement = document.body || document.documentElement;
         return bodyElement ? bodyElement.innerHTML : html;
     }
-    catch (e) {
+    catch {
         return html;
     }
 }
@@ -55,7 +62,7 @@ export function createTurndownService() {
         },
         defaultReplacement: (content, node) => {
             return node.isBlock ? '\n\n' + content + '\n\n' : content;
-        }
+        },
     });
     turndown.use(gfm);
     turndown.addRule('media', {
@@ -63,12 +70,14 @@ export function createTurndownService() {
         replacement: (_content, node) => {
             const element = node;
             const src = element.getAttribute('src') || element.getAttribute('data-src');
-            const title = element.getAttribute('title') || element.getAttribute('alt') || 'media';
+            const title = element.getAttribute('title') ||
+                element.getAttribute('alt') ||
+                'media';
             if (src) {
                 return `\n\n[${title}](${src})\n\n`;
             }
             return '';
-        }
+        },
     });
     turndown.addRule('figure', {
         filter: 'figure',
@@ -80,7 +89,7 @@ export function createTurndownService() {
                 return `\n\n${content.trim()}\n*${captionText}*\n\n`;
             }
             return `\n\n${content.trim()}\n\n`;
-        }
+        },
     });
     return turndown;
 }
@@ -119,7 +128,9 @@ export function formatArticleMarkdown(article) {
                 markdown += tempDiv.textContent || article.content;
             }
             else {
-                markdown += article.content.replace(/<[^>]*>/g, ' ').replace(/\s+/g, ' ');
+                markdown += article.content
+                    .replace(/<[^>]*>/g, ' ')
+                    .replace(/\s+/g, ' ');
             }
         }
         return markdown
@@ -129,6 +140,8 @@ export function formatArticleMarkdown(article) {
     }
     catch (error) {
         console.error('Fatal error in formatArticleMarkdown:', error);
-        return article.title ? `# ${article.title}\n\n[Content extraction failed]` : '[Content extraction failed]';
+        return article.title
+            ? `# ${article.title}\n\n[Content extraction failed]`
+            : '[Content extraction failed]';
     }
 }

package/dist/serve.js CHANGED Viewed

@@ -1,13 +1,13 @@
 #!/usr/bin/env node
-import { Server } from "@modelcontextprotocol/sdk/server/index.js";
-import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js";
-import { CallToolRequestSchema, ListToolsRequestSchema, ListResourcesRequestSchema, ReadResourceRequestSchema, } from "@modelcontextprotocol/sdk/types.js";
+import { Server } from '@modelcontextprotocol/sdk/server/index.js';
+import { StdioServerTransport } from '@modelcontextprotocol/sdk/server/stdio.js';
+import { CallToolRequestSchema, ListToolsRequestSchema, ListResourcesRequestSchema, ReadResourceRequestSchema, } from '@modelcontextprotocol/sdk/types.js';
 let fetchMarkdownModule;
 let fsPromises;
 let pathModule;
 const server = new Server({
-    name: "read-website-fast",
-    version: "0.1.0",
+    name: 'read-website-fast',
+    version: '0.1.0',
 }, {
     capabilities: {
         tools: {},
@@ -15,64 +15,83 @@ const server = new Server({
     },
 });
 const READ_WEBSITE_TOOL = {
-    name: "read_website_fast",
-    description: "Quickly reads webpages and converts to markdown for fast, token efficient web scraping",
+    name: 'read_website_fast',
+    description: 'Quickly reads webpages and converts to markdown for fast, token efficient web scraping',
     inputSchema: {
-        type: "object",
+        type: 'object',
         properties: {
             url: {
-                type: "string",
-                description: "HTTP/HTTPS URL to fetch and convert to markdown",
+                type: 'string',
+                description: 'HTTP/HTTPS URL to fetch and convert to markdown',
             },
             depth: {
-                type: "number",
-                description: "Crawl depth (0 = single page)",
+                type: 'number',
+                description: 'Crawl depth (0 = single page)',
                 default: 0,
             },
             respectRobots: {
-                type: "boolean",
-                description: "Whether to respect robots.txt",
+                type: 'boolean',
+                description: 'Whether to respect robots.txt',
                 default: true,
             },
         },
-        required: ["url"],
+        required: ['url'],
     },
 };
 const RESOURCES = [
     {
-        uri: "read-website-fast://status",
-        name: "Cache Status",
-        mimeType: "application/json",
-        description: "Get cache status information",
+        uri: 'read-website-fast://status',
+        name: 'Cache Status',
+        mimeType: 'application/json',
+        description: 'Get cache status information',
     },
     {
-        uri: "read-website-fast://clear-cache",
-        name: "Clear Cache",
-        mimeType: "application/json",
-        description: "Clear the cache directory",
+        uri: 'read-website-fast://clear-cache',
+        name: 'Clear Cache',
+        mimeType: 'application/json',
+        description: 'Clear the cache directory',
     },
 ];
 server.setRequestHandler(ListToolsRequestSchema, async () => ({
     tools: [READ_WEBSITE_TOOL],
 }));
 server.setRequestHandler(CallToolRequestSchema, async (request) => {
-    if (request.params.name !== "read_website_fast") {
+    if (request.params.name !== 'read_website_fast') {
         throw new Error(`Unknown tool: ${request.params.name}`);
     }
-    if (!fetchMarkdownModule) {
-        fetchMarkdownModule = await import("./internal/fetchMarkdown.js");
+    try {
+        if (!fetchMarkdownModule) {
+            fetchMarkdownModule = await import('./internal/fetchMarkdown.js');
+        }
+        const args = request.params.arguments;
+        if (!args.url || typeof args.url !== 'string') {
+            throw new Error('URL parameter is required and must be a string');
+        }
+        const result = await fetchMarkdownModule.fetchMarkdown(args.url, {
+            depth: args.depth ?? 0,
+            respectRobots: args.respectRobots ?? true,
+        });
+        if (result.error && result.markdown) {
+            return {
+                content: [
+                    {
+                        type: 'text',
+                        text: `${result.markdown}\n\n---\n*Note: ${result.error}*`,
+                    },
+                ],
+            };
+        }
+        if (result.error && !result.markdown) {
+            throw new Error(result.error);
+        }
+        return {
+            content: [{ type: 'text', text: result.markdown }],
+        };
     }
-    const args = request.params.arguments;
-    const result = await fetchMarkdownModule.fetchMarkdown(args.url, {
-        depth: args.depth ?? 0,
-        respectRobots: args.respectRobots ?? true,
-    });
-    if (result.error) {
-        throw new Error(result.error);
+    catch (error) {
+        console.error('Tool execution error:', error);
+        throw new Error(`Failed to fetch content: ${error instanceof Error ? error.message : 'Unknown error'}`);
     }
-    return {
-        content: [{ type: "text", text: result.markdown }],
-    };
 });
 server.setRequestHandler(ListResourcesRequestSchema, async () => ({
     resources: RESOURCES,
@@ -80,14 +99,14 @@ server.setRequestHandler(ListResourcesRequestSchema, async () => ({
 server.setRequestHandler(ReadResourceRequestSchema, async (request) => {
     const uri = request.params.uri;
     if (!fsPromises) {
-        fsPromises = await import("fs/promises");
+        fsPromises = await import('fs/promises');
     }
     if (!pathModule) {
-        pathModule = await import("path");
+        pathModule = await import('path');
     }
-    if (uri === "read-website-fast://status") {
+    if (uri === 'read-website-fast://status') {
         try {
-            const cacheDir = ".cache";
+            const cacheDir = '.cache';
             const files = await fsPromises.readdir(cacheDir).catch(() => []);
             let totalSize = 0;
             for (const file of files) {
@@ -102,7 +121,7 @@ server.setRequestHandler(ReadResourceRequestSchema, async (request) => {
                 contents: [
                     {
                         uri,
-                        mimeType: "application/json",
+                        mimeType: 'application/json',
                         text: JSON.stringify({
                             cacheSize: totalSize,
                             cacheFiles: files.length,
@@ -117,27 +136,29 @@ server.setRequestHandler(ReadResourceRequestSchema, async (request) => {
                 contents: [
                     {
                         uri,
-                        mimeType: "application/json",
+                        mimeType: 'application/json',
                         text: JSON.stringify({
-                            error: "Failed to get cache status",
-                            message: error instanceof Error ? error.message : "Unknown error",
+                            error: 'Failed to get cache status',
+                            message: error instanceof Error
+                                ? error.message
+                                : 'Unknown error',
                         }, null, 2),
                     },
                 ],
             };
         }
     }
-    if (uri === "read-website-fast://clear-cache") {
+    if (uri === 'read-website-fast://clear-cache') {
         try {
-            await fsPromises.rm(".cache", { recursive: true, force: true });
+            await fsPromises.rm('.cache', { recursive: true, force: true });
             return {
                 contents: [
                     {
                         uri,
-                        mimeType: "application/json",
+                        mimeType: 'application/json',
                         text: JSON.stringify({
-                            status: "success",
-                            message: "Cache cleared successfully",
+                            status: 'success',
+                            message: 'Cache cleared successfully',
                         }, null, 2),
                     },
                 ],
@@ -148,10 +169,12 @@ server.setRequestHandler(ReadResourceRequestSchema, async (request) => {
                 contents: [
                     {
                         uri,
-                        mimeType: "application/json",
+                        mimeType: 'application/json',
                         text: JSON.stringify({
-                            status: "error",
-                            message: error instanceof Error ? error.message : "Failed to clear cache",
+                            status: 'error',
+                            message: error instanceof Error
+                                ? error.message
+                                : 'Failed to clear cache',
                         }, null, 2),
                     },
                 ],
@@ -162,10 +185,35 @@ server.setRequestHandler(ReadResourceRequestSchema, async (request) => {
 });
 async function runServer() {
     const transport = new StdioServerTransport();
-    await server.connect(transport);
-    console.error("read-website-fast MCP server running");
+    process.on('SIGINT', async () => {
+        console.error('Received SIGINT, shutting down gracefully...');
+        await server.close();
+        process.exit(0);
+    });
+    process.on('SIGTERM', async () => {
+        console.error('Received SIGTERM, shutting down gracefully...');
+        await server.close();
+        process.exit(0);
+    });
+    process.on('uncaughtException', error => {
+        console.error('Uncaught exception:', error);
+        process.exit(1);
+    });
+    process.on('unhandledRejection', (reason, promise) => {
+        console.error('Unhandled rejection at:', promise, 'reason:', reason);
+        process.exit(1);
+    });
+    try {
+        await server.connect(transport);
+        console.error('read-website-fast MCP server running');
+        process.stdin.resume();
+    }
+    catch (error) {
+        console.error('Failed to start server:', error);
+        process.exit(1);
+    }
 }
-runServer().catch((error) => {
-    console.error("Server error:", error);
+runServer().catch(error => {
+    console.error('Server initialization error:', error);
     process.exit(1);
 });

package/dist/utils/chunker.js CHANGED Viewed

@@ -5,7 +5,7 @@ export class MarkdownChunker {
             maxTokens: options.maxTokens ?? 0,
             maxChars: options.maxChars ?? 4000,
             splitOn: options.splitOn ?? 'heading',
-            overlap: options.overlap ?? 200
+            overlap: options.overlap ?? 200,
         };
     }
     chunk(markdown) {
@@ -36,8 +36,8 @@ export class MarkdownChunker {
                     metadata: {
                         headings: [...currentHeadings],
                         startLine,
-                        endLine: i - 1
-                    }
+                        endLine: i - 1,
+                    },
                 });
                 const overlapLines = this.getOverlapLines(currentChunk);
                 currentChunk = [...overlapLines, line];
@@ -58,8 +58,8 @@ export class MarkdownChunker {
                     metadata: {
                         headings: [...currentHeadings],
                         startLine,
-                        endLine: i
-                    }
+                        endLine: i,
+                    },
                 });
                 const overlapLines = this.getOverlapLines(currentChunk);
                 currentChunk = [...overlapLines];
@@ -74,8 +74,8 @@ export class MarkdownChunker {
                 metadata: {
                     headings: currentHeadings,
                     startLine,
-                    endLine: lines.length - 1
-                }
+                    endLine: lines.length - 1,
+                },
             });
         }
         return chunks;
@@ -85,11 +85,12 @@ export class MarkdownChunker {
         const paragraphs = markdown.split(/\n\n+/);
         let currentChunk = [];
         for (const paragraph of paragraphs) {
-            const wouldExceedLimit = currentChunk.join('\n\n').length + paragraph.length > this.options.maxChars;
+            const wouldExceedLimit = currentChunk.join('\n\n').length + paragraph.length >
+                this.options.maxChars;
             if (wouldExceedLimit && currentChunk.length > 0) {
                 chunks.push({
                     content: currentChunk.join('\n\n').trim(),
-                    index: chunks.length
+                    index: chunks.length,
                 });
                 currentChunk = [];
             }
@@ -98,7 +99,7 @@ export class MarkdownChunker {
         if (currentChunk.length > 0) {
             chunks.push({
                 content: currentChunk.join('\n\n').trim(),
-                index: chunks.length
+                index: chunks.length,
             });
         }
         return chunks;
@@ -108,11 +109,12 @@ export class MarkdownChunker {
         const sentences = markdown.match(/[^.!?]+[.!?]+/g) || [markdown];
         let currentChunk = [];
         for (const sentence of sentences) {
-            const wouldExceedLimit = currentChunk.join(' ').length + sentence.length > this.options.maxChars;
+            const wouldExceedLimit = currentChunk.join(' ').length + sentence.length >
+                this.options.maxChars;
             if (wouldExceedLimit && currentChunk.length > 0) {
                 chunks.push({
                     content: currentChunk.join(' ').trim(),
-                    index: chunks.length
+                    index: chunks.length,
                 });
                 currentChunk = [];
             }
@@ -121,7 +123,7 @@ export class MarkdownChunker {
         if (currentChunk.length > 0) {
             chunks.push({
                 content: currentChunk.join(' ').trim(),
-                index: chunks.length
+                index: chunks.length,
             });
         }
         return chunks;

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@just-every/mcp-read-website-fast",
-  "version": "0.1.5",
+  "version": "0.1.7",
   "description": "Markdown Content Preprocessor - Fetch web pages, extract content, convert to clean Markdown",
   "main": "dist/index.js",
   "bin": {
@@ -67,8 +67,11 @@
     "@typescript-eslint/eslint-plugin": "^8.34.0",
     "@typescript-eslint/parser": "^8.34.0",
     "eslint": "^9.28.0",
+    "eslint-config-prettier": "^10.1.5",
+    "eslint-plugin-prettier": "^5.4.1",
     "tsx": "^4.7.0",
     "typescript": "^5.3.3",
+    "typescript-eslint": "^8.34.0",
     "vitest": "^3.2.3"
   },
   "engines": {