npm - @oh-my-pi/pi-coding-agent - Versions diffs - 3.25.0 → 3.31.0 - Mend

@oh-my-pi/pi-coding-agent 3.25.0 → 3.31.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (157) hide show

package/CHANGELOG.md +90 -0
package/package.json +5 -5
package/src/cli/args.ts +4 -0
package/src/core/agent-session.ts +29 -2
package/src/core/bash-executor.ts +2 -1
package/src/core/custom-commands/bundled/review/index.ts +369 -14
package/src/core/custom-commands/bundled/wt/index.ts +1 -1
package/src/core/session-manager.ts +158 -246
package/src/core/session-storage.ts +379 -0
package/src/core/settings-manager.ts +155 -4
package/src/core/system-prompt.ts +62 -64
package/src/core/tools/ask.ts +5 -4
package/src/core/tools/bash-interceptor.ts +26 -61
package/src/core/tools/bash.ts +13 -8
package/src/core/tools/complete.ts +2 -4
package/src/core/tools/edit-diff.ts +11 -4
package/src/core/tools/edit.ts +7 -13
package/src/core/tools/find.ts +111 -50
package/src/core/tools/gemini-image.ts +128 -147
package/src/core/tools/grep.ts +397 -415
package/src/core/tools/index.test.ts +5 -1
package/src/core/tools/index.ts +6 -8
package/src/core/tools/jtd-to-json-schema.ts +174 -196
package/src/core/tools/ls.ts +12 -10
package/src/core/tools/lsp/client.ts +58 -9
package/src/core/tools/lsp/config.ts +205 -656
package/src/core/tools/lsp/defaults.json +465 -0
package/src/core/tools/lsp/index.ts +55 -32
package/src/core/tools/lsp/rust-analyzer.ts +49 -10
package/src/core/tools/lsp/types.ts +1 -0
package/src/core/tools/lsp/utils.ts +1 -1
package/src/core/tools/read.ts +152 -76
package/src/core/tools/render-utils.ts +70 -10
package/src/core/tools/review.ts +38 -126
package/src/core/tools/task/artifacts.ts +5 -4
package/src/core/tools/task/executor.ts +204 -67
package/src/core/tools/task/index.ts +129 -92
package/src/core/tools/task/name-generator.ts +1544 -214
package/src/core/tools/task/parallel.ts +30 -3
package/src/core/tools/task/render.ts +85 -39
package/src/core/tools/task/types.ts +34 -11
package/src/core/tools/task/worker.ts +152 -27
package/src/core/tools/web-fetch.ts +220 -1657
package/src/core/tools/web-scrapers/academic.test.ts +239 -0
package/src/core/tools/web-scrapers/artifacthub.ts +215 -0
package/src/core/tools/web-scrapers/arxiv.ts +88 -0
package/src/core/tools/web-scrapers/aur.ts +175 -0
package/src/core/tools/web-scrapers/biorxiv.ts +141 -0
package/src/core/tools/web-scrapers/bluesky.ts +284 -0
package/src/core/tools/web-scrapers/brew.ts +177 -0
package/src/core/tools/web-scrapers/business.test.ts +82 -0
package/src/core/tools/web-scrapers/cheatsh.ts +78 -0
package/src/core/tools/web-scrapers/chocolatey.ts +158 -0
package/src/core/tools/web-scrapers/choosealicense.ts +110 -0
package/src/core/tools/web-scrapers/cisa-kev.ts +100 -0
package/src/core/tools/web-scrapers/clojars.ts +180 -0
package/src/core/tools/web-scrapers/coingecko.ts +184 -0
package/src/core/tools/web-scrapers/crates-io.ts +128 -0
package/src/core/tools/web-scrapers/crossref.ts +149 -0
package/src/core/tools/web-scrapers/dev-platforms.test.ts +254 -0
package/src/core/tools/web-scrapers/devto.ts +177 -0
package/src/core/tools/web-scrapers/discogs.ts +308 -0
package/src/core/tools/web-scrapers/discourse.ts +221 -0
package/src/core/tools/web-scrapers/dockerhub.ts +160 -0
package/src/core/tools/web-scrapers/documentation.test.ts +85 -0
package/src/core/tools/web-scrapers/fdroid.ts +158 -0
package/src/core/tools/web-scrapers/finance-media.test.ts +144 -0
package/src/core/tools/web-scrapers/firefox-addons.ts +214 -0
package/src/core/tools/web-scrapers/flathub.ts +239 -0
package/src/core/tools/web-scrapers/git-hosting.test.ts +272 -0
package/src/core/tools/web-scrapers/github-gist.ts +68 -0
package/src/core/tools/web-scrapers/github.ts +455 -0
package/src/core/tools/web-scrapers/gitlab.ts +456 -0
package/src/core/tools/web-scrapers/go-pkg.ts +275 -0
package/src/core/tools/web-scrapers/hackage.ts +94 -0
package/src/core/tools/web-scrapers/hackernews.ts +208 -0
package/src/core/tools/web-scrapers/hex.ts +121 -0
package/src/core/tools/web-scrapers/huggingface.ts +385 -0
package/src/core/tools/web-scrapers/iacr.ts +86 -0
package/src/core/tools/web-scrapers/index.ts +250 -0
package/src/core/tools/web-scrapers/jetbrains-marketplace.ts +169 -0
package/src/core/tools/web-scrapers/lemmy.ts +220 -0
package/src/core/tools/web-scrapers/lobsters.ts +186 -0
package/src/core/tools/web-scrapers/mastodon.ts +310 -0
package/src/core/tools/web-scrapers/maven.ts +152 -0
package/src/core/tools/web-scrapers/mdn.ts +174 -0
package/src/core/tools/web-scrapers/media.test.ts +138 -0
package/src/core/tools/web-scrapers/metacpan.ts +253 -0
package/src/core/tools/web-scrapers/musicbrainz.ts +273 -0
package/src/core/tools/web-scrapers/npm.ts +114 -0
package/src/core/tools/web-scrapers/nuget.ts +205 -0
package/src/core/tools/web-scrapers/nvd.ts +243 -0
package/src/core/tools/web-scrapers/ollama.ts +267 -0
package/src/core/tools/web-scrapers/open-vsx.ts +119 -0
package/src/core/tools/web-scrapers/opencorporates.ts +275 -0
package/src/core/tools/web-scrapers/openlibrary.ts +319 -0
package/src/core/tools/web-scrapers/orcid.ts +299 -0
package/src/core/tools/web-scrapers/osv.ts +189 -0
package/src/core/tools/web-scrapers/package-managers-2.test.ts +199 -0
package/src/core/tools/web-scrapers/package-managers.test.ts +171 -0
package/src/core/tools/web-scrapers/package-registries.test.ts +259 -0
package/src/core/tools/web-scrapers/packagist.ts +174 -0
package/src/core/tools/web-scrapers/pub-dev.ts +185 -0
package/src/core/tools/web-scrapers/pubmed.ts +178 -0
package/src/core/tools/web-scrapers/pypi.ts +129 -0
package/src/core/tools/web-scrapers/rawg.ts +124 -0
package/src/core/tools/web-scrapers/readthedocs.ts +126 -0
package/src/core/tools/web-scrapers/reddit.ts +104 -0
package/src/core/tools/web-scrapers/repology.ts +262 -0
package/src/core/tools/web-scrapers/research.test.ts +107 -0
package/src/core/tools/web-scrapers/rfc.ts +209 -0
package/src/core/tools/web-scrapers/rubygems.ts +117 -0
package/src/core/tools/web-scrapers/searchcode.ts +217 -0
package/src/core/tools/web-scrapers/sec-edgar.ts +274 -0
package/src/core/tools/web-scrapers/security.test.ts +103 -0
package/src/core/tools/web-scrapers/semantic-scholar.ts +190 -0
package/src/core/tools/web-scrapers/snapcraft.ts +200 -0
package/src/core/tools/web-scrapers/social-extended.test.ts +192 -0
package/src/core/tools/web-scrapers/social.test.ts +259 -0
package/src/core/tools/web-scrapers/sourcegraph.ts +373 -0
package/src/core/tools/web-scrapers/spdx.ts +121 -0
package/src/core/tools/web-scrapers/spotify.ts +218 -0
package/src/core/tools/web-scrapers/stackexchange.test.ts +120 -0
package/src/core/tools/web-scrapers/stackoverflow.ts +124 -0
package/src/core/tools/web-scrapers/standards.test.ts +122 -0
package/src/core/tools/web-scrapers/terraform.ts +304 -0
package/src/core/tools/web-scrapers/tldr.ts +51 -0
package/src/core/tools/web-scrapers/twitter.ts +96 -0
package/src/core/tools/web-scrapers/types.ts +234 -0
package/src/core/tools/web-scrapers/utils.ts +162 -0
package/src/core/tools/web-scrapers/vimeo.ts +152 -0
package/src/core/tools/web-scrapers/vscode-marketplace.ts +195 -0
package/src/core/tools/web-scrapers/w3c.ts +163 -0
package/src/core/tools/web-scrapers/wikidata.ts +357 -0
package/src/core/tools/web-scrapers/wikipedia.test.ts +73 -0
package/src/core/tools/web-scrapers/wikipedia.ts +95 -0
package/src/core/tools/web-scrapers/youtube.test.ts +198 -0
package/src/core/tools/web-scrapers/youtube.ts +371 -0
package/src/core/tools/write.ts +21 -18
package/src/core/voice.ts +3 -2
package/src/lib/worktree/collapse.ts +2 -1
package/src/lib/worktree/git.ts +2 -18
package/src/main.ts +59 -3
package/src/modes/interactive/components/extensions/extension-dashboard.ts +33 -19
package/src/modes/interactive/components/extensions/extension-list.ts +15 -8
package/src/modes/interactive/components/hook-editor.ts +2 -1
package/src/modes/interactive/components/model-selector.ts +19 -4
package/src/modes/interactive/interactive-mode.ts +41 -38
package/src/modes/interactive/theme/theme.ts +58 -58
package/src/modes/rpc/rpc-mode.ts +10 -9
package/src/prompts/review-request.md +27 -0
package/src/prompts/reviewer.md +64 -68
package/src/prompts/tools/output.md +22 -3
package/src/prompts/tools/task.md +32 -33
package/src/utils/clipboard.ts +2 -1
package/src/utils/tools-manager.ts +110 -8
package/examples/extensions/subagent/agents/reviewer.md +0 -35

package/src/core/tools/web-fetch.ts CHANGED Viewed

@@ -1,30 +1,26 @@
 import { tmpdir } from "node:os";
 import * as path from "node:path";
 import type { AgentTool } from "@oh-my-pi/pi-agent-core";
+import type { Component } from "@oh-my-pi/pi-tui";
+import { Text } from "@oh-my-pi/pi-tui";
 import { Type } from "@sinclair/typebox";
+import { nanoid } from "nanoid";
 import { parse as parseHtml } from "node-html-parser";
+import { type Theme, theme } from "../../modes/interactive/theme/theme";
 import webFetchDescription from "../../prompts/tools/web-fetch.md" with { type: "text" };
-import { logger } from "../logger";
+import { ensureTool } from "../../utils/tools-manager";
+import type { RenderResultOptions } from "../custom-tools/types";
 import type { ToolSession } from "./index";
+import { specialHandlers } from "./web-scrapers/index";
+import type { RenderResult } from "./web-scrapers/types";
+import { finalizeOutput, loadPage } from "./web-scrapers/types";
+import { convertWithMarkitdown, fetchBinary } from "./web-scrapers/utils";
 // =============================================================================
 // Types and Constants
 // =============================================================================
-interface RenderResult {
-	url: string;
-	finalUrl: string;
-	contentType: string;
-	method: string;
-	content: string;
-	fetchedAt: string;
-	truncated: boolean;
-	notes: string[];
-}
 const DEFAULT_TIMEOUT = 20;
-const MAX_BYTES = 50 * 1024 * 1024; // 50MB for binary files
-const MAX_OUTPUT_CHARS = 500_000;
 // Convertible document types (markitdown supported)
 const CONVERTIBLE_MIMES = new Set([
@@ -67,124 +63,11 @@ const CONVERTIBLE_EXTENSIONS = new Set([
 	".ogg",
 ]);
-const USER_AGENTS = [
-	"curl/8.0",
-	"Mozilla/5.0 (compatible; TextBot/1.0)",
-	"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",
-];
 // =============================================================================
 // Utilities
 // =============================================================================
-interface LoadPageResult {
-	content: string;
-	contentType: string;
-	finalUrl: string;
-	ok: boolean;
-	status?: number;
-}
-interface LoadPageOptions {
-	timeout?: number;
-	headers?: Record<string, string>;
-	maxBytes?: number;
-}
-/**
- * Check if response indicates bot blocking (Cloudflare, etc.)
- */
-function isBotBlocked(status: number, content: string): boolean {
-	if (status === 403 || status === 503) {
-		const lower = content.toLowerCase();
-		return (
-			lower.includes("cloudflare") ||
-			lower.includes("captcha") ||
-			lower.includes("challenge") ||
-			lower.includes("blocked") ||
-			lower.includes("access denied") ||
-			lower.includes("bot detection")
-		);
-	}
-	return false;
-}
-/**
- * Fetch a page with timeout, size limit, and automatic retry with browser UA if blocked
- */
-async function loadPage(url: string, options: LoadPageOptions = {}): Promise<LoadPageResult> {
-	const { timeout = 20, headers = {}, maxBytes = MAX_BYTES } = options;
-	for (let attempt = 0; attempt < USER_AGENTS.length; attempt++) {
-		const userAgent = USER_AGENTS[attempt];
-		try {
-			const controller = new AbortController();
-			const timeoutId = setTimeout(() => controller.abort(), timeout * 1000);
-			const response = await fetch(url, {
-				signal: controller.signal,
-				headers: {
-					"User-Agent": userAgent,
-					Accept: "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
-					"Accept-Language": "en-US,en;q=0.5",
-					...headers,
-				},
-				redirect: "follow",
-			});
-			clearTimeout(timeoutId);
-			const contentType = response.headers.get("content-type")?.split(";")[0]?.trim().toLowerCase() ?? "";
-			const finalUrl = response.url;
-			// Read with size limit
-			const reader = response.body?.getReader();
-			if (!reader) {
-				return { content: "", contentType, finalUrl, ok: false, status: response.status };
-			}
-			const chunks: Uint8Array[] = [];
-			let totalSize = 0;
-			while (true) {
-				const { done, value } = await reader.read();
-				if (done) break;
-				chunks.push(value);
-				totalSize += value.length;
-				if (totalSize > maxBytes) {
-					reader.cancel();
-					break;
-				}
-			}
-			const decoder = new TextDecoder();
-			const content = decoder.decode(Buffer.concat(chunks));
-			// Check if we got blocked and should retry with browser UA
-			if (isBotBlocked(response.status, content) && attempt < USER_AGENTS.length - 1) {
-				continue;
-			}
-			if (!response.ok) {
-				return { content, contentType, finalUrl, ok: false, status: response.status };
-			}
-			return { content, contentType, finalUrl, ok: true, status: response.status };
-		} catch (err) {
-			// On last attempt, return failure
-			if (attempt === USER_AGENTS.length - 1) {
-				logger.debug("Web fetch failed after retries", { url, error: String(err) });
-				return { content: "", contentType: "", finalUrl: url, ok: false };
-			}
-			// Otherwise retry with next UA
-		}
-	}
-	return { content: "", contentType: "", finalUrl: url, ok: false };
-}
+type SpawnSyncOptions = NonNullable<Parameters<typeof Bun.spawnSync>[1]>;
 /**
  * Execute a command and return stdout
@@ -194,8 +77,9 @@ function exec(
 	args: string[],
 	options?: { timeout?: number; input?: string | Buffer },
 ): { stdout: string; stderr: string; ok: boolean } {
+	const stdin = (options?.input ?? "ignore") as SpawnSyncOptions["stdin"];
 	const result = Bun.spawnSync([cmd, ...args], {
-		stdin: options?.input ? (options.input as any) : "ignore",
+		stdin,
 		stdout: "pipe",
 		stderr: "pipe",
 	});
@@ -288,38 +172,10 @@ function looksLikeHtml(content: string): boolean {
 	);
 }
-/**
- * Convert binary file to markdown using markitdown
- */
-async function convertWithMarkitdown(
-	content: Buffer,
-	extensionHint: string,
-	timeout: number,
-): Promise<{ content: string; ok: boolean }> {
-	if (!hasCommand("markitdown")) {
-		return { content: "", ok: false };
-	}
-	// Write to temp file with extension hint
-	const ext = extensionHint || ".bin";
-	const tmpDir = tmpdir();
-	const tmpFile = path.join(tmpDir, `omp-convert-${Date.now()}${ext}`);
-	try {
-		await Bun.write(tmpFile, content);
-		const result = exec("markitdown", [tmpFile], { timeout });
-		return { content: result.stdout, ok: result.ok };
-	} finally {
-		try {
-			await Bun.$`rm ${tmpFile}`.quiet();
-		} catch {}
-	}
-}
 /**
  * Try fetching URL with .md appended (llms.txt convention)
  */
-async function tryMdSuffix(url: string, timeout: number): Promise<string | null> {
+async function tryMdSuffix(url: string, timeout: number, signal?: AbortSignal): Promise<string | null> {
 	const candidates: string[] = [];
 	try {
@@ -340,8 +196,15 @@ async function tryMdSuffix(url: string, timeout: number): Promise<string | null>
 		return null;
 	}
+	if (signal?.aborted) {
+		return null;
+	}
 	for (const candidate of candidates) {
-		const result = await loadPage(candidate, { timeout: Math.min(timeout, 5) });
+		if (signal?.aborted) {
+			return null;
+		}
+		const result = await loadPage(candidate, { timeout: Math.min(timeout, 5), signal });
 		if (result.ok && result.content.trim().length > 100 && !looksLikeHtml(result.content)) {
 			return result.content;
 		}
@@ -353,11 +216,18 @@ async function tryMdSuffix(url: string, timeout: number): Promise<string | null>
 /**
  * Try to fetch LLM-friendly endpoints
  */
-async function tryLlmEndpoints(origin: string, timeout: number): Promise<string | null> {
+async function tryLlmEndpoints(origin: string, timeout: number, signal?: AbortSignal): Promise<string | null> {
 	const endpoints = [`${origin}/.well-known/llms.txt`, `${origin}/llms.txt`, `${origin}/llms.md`];
+	if (signal?.aborted) {
+		return null;
+	}
 	for (const endpoint of endpoints) {
-		const result = await loadPage(endpoint, { timeout: Math.min(timeout, 5) });
+		if (signal?.aborted) {
+			return null;
+		}
+		const result = await loadPage(endpoint, { timeout: Math.min(timeout, 5), signal });
 		if (result.ok && result.content.trim().length > 100 && !looksLikeHtml(result.content)) {
 			return result.content;
 		}
@@ -368,10 +238,19 @@ async function tryLlmEndpoints(origin: string, timeout: number): Promise<string
 /**
  * Try content negotiation for markdown/plain
  */
-async function tryContentNegotiation(url: string, timeout: number): Promise<{ content: string; type: string } | null> {
+async function tryContentNegotiation(
+	url: string,
+	timeout: number,
+	signal?: AbortSignal,
+): Promise<{ content: string; type: string } | null> {
+	if (signal?.aborted) {
+		return null;
+	}
 	const result = await loadPage(url, {
 		timeout,
 		headers: { Accept: "text/markdown, text/plain;q=0.9, text/html;q=0.8" },
+		signal,
 	});
 	if (!result.ok) return null;
@@ -522,18 +401,39 @@ function parseFeedToMarkdown(content: string, maxItems = 10): string {
 }
 /**
- * Render HTML to text using lynx
+ * Render HTML to text using lynx or html2text fallback
  */
-async function renderWithLynx(html: string, timeout: number): Promise<{ content: string; ok: boolean }> {
+async function renderHtmlToText(
+	html: string,
+	timeout: number,
+): Promise<{ content: string; ok: boolean; method: string }> {
 	const tmpDir = tmpdir();
-	const tmpFile = path.join(tmpDir, `omp-render-${Date.now()}.html`);
+	const tmpFile = path.join(tmpDir, `omp-${nanoid()}.html`);
 	try {
 		await Bun.write(tmpFile, html);
-		// Convert path to file URL (handles Windows paths correctly)
-		const normalizedPath = tmpFile.replace(/\\/g, "/");
-		const fileUrl = normalizedPath.startsWith("/") ? `file://${normalizedPath}` : `file:///${normalizedPath}`;
-		const result = exec("lynx", ["-dump", "-nolist", "-width", "120", fileUrl], { timeout });
-		return { content: result.stdout, ok: result.ok };
+		// Try lynx first (can't auto-install, system package)
+		const lynx = hasCommand("lynx");
+		if (lynx) {
+			const normalizedPath = tmpFile.replace(/\\/g, "/");
+			const fileUrl = normalizedPath.startsWith("/") ? `file://${normalizedPath}` : `file:///${normalizedPath}`;
+			const result = exec("lynx", ["-dump", "-nolist", "-width", "120", fileUrl], { timeout });
+			if (result.ok) {
+				return { content: result.stdout, ok: true, method: "lynx" };
+			}
+		}
+		// Fall back to html2text (auto-install via uv/pip)
+		const html2text = await ensureTool("html2text", true);
+		if (html2text) {
+			const result = exec(html2text, [tmpFile], { timeout });
+			if (result.ok) {
+				return { content: result.stdout, ok: true, method: "html2text" };
+			}
+		}
+		return { content: "", ok: false, method: "none" };
 	} finally {
 		try {
 			await Bun.$`rm ${tmpFile}`.quiet();
@@ -580,1488 +480,157 @@ function formatJson(content: string): string {
 	}
 }
-/**
- * Truncate and cleanup output
- */
-function finalizeOutput(content: string): { content: string; truncated: boolean } {
-	const cleaned = content.replace(/\n{3,}/g, "\n\n").trim();
-	const truncated = cleaned.length > MAX_OUTPUT_CHARS;
-	return {
-		content: cleaned.slice(0, MAX_OUTPUT_CHARS),
-		truncated,
-	};
-}
+// =============================================================================
+// Unified Special Handler Dispatch
+// =============================================================================
 /**
- * Fetch page as binary buffer (for convertible files)
+ * Try all special handlers
  */
-async function fetchBinary(
-	url: string,
-	timeout: number,
-): Promise<{ buffer: Buffer; contentType: string; contentDisposition?: string; ok: boolean }> {
-	try {
-		const controller = new AbortController();
-		const timeoutId = setTimeout(() => controller.abort(), timeout * 1000);
-		const response = await fetch(url, {
-			signal: controller.signal,
-			headers: {
-				"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 Chrome/131.0.0.0",
-			},
-			redirect: "follow",
-		});
-		clearTimeout(timeoutId);
-		if (!response.ok) {
-			return { buffer: Buffer.alloc(0), contentType: "", ok: false };
-		}
-		const contentType = response.headers.get("content-type") ?? "";
-		const contentDisposition = response.headers.get("content-disposition") ?? undefined;
-		const contentLength = response.headers.get("content-length");
-		if (contentLength) {
-			const size = Number.parseInt(contentLength, 10);
-			if (Number.isFinite(size) && size > MAX_BYTES) {
-				return { buffer: Buffer.alloc(0), contentType, contentDisposition, ok: false };
-			}
+async function handleSpecialUrls(url: string, timeout: number, signal?: AbortSignal): Promise<RenderResult | null> {
+	for (const handler of specialHandlers) {
+		if (signal?.aborted) {
+			throw new Error("Operation aborted");
 		}
-		const buffer = Buffer.from(await response.arrayBuffer());
-		if (buffer.length > MAX_BYTES) {
-			return { buffer: Buffer.alloc(0), contentType, contentDisposition, ok: false };
-		}
-		return { buffer, contentType, contentDisposition, ok: true };
-	} catch {
-		return { buffer: Buffer.alloc(0), contentType: "", ok: false };
+		const result = await handler(url, timeout, signal);
+		if (result) return result;
 	}
+	return null;
 }
 // =============================================================================
-// GitHub Special Handling
+// Main Render Function
 // =============================================================================
-interface GitHubUrl {
-	type: "blob" | "tree" | "repo" | "issue" | "issues" | "pull" | "pulls" | "discussion" | "discussions" | "other";
-	owner: string;
-	repo: string;
-	ref?: string;
-	path?: string;
-	number?: number;
-}
 /**
- * Parse GitHub URL into components
+ * Main render function implementing the full pipeline
  */
-function parseGitHubUrl(url: string): GitHubUrl | null {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "github.com") return null;
-		const parts = parsed.pathname.split("/").filter(Boolean);
-		if (parts.length < 2) return null;
-		const [owner, repo, ...rest] = parts;
-		if (rest.length === 0) {
-			return { type: "repo", owner, repo };
-		}
-		const [section, ...subParts] = rest;
-		switch (section) {
-			case "blob":
-			case "tree": {
-				const [ref, ...pathParts] = subParts;
-				return { type: section, owner, repo, ref, path: pathParts.join("/") };
-			}
-			case "issues":
-				if (subParts.length > 0 && /^\d+$/.test(subParts[0])) {
-					return { type: "issue", owner, repo, number: parseInt(subParts[0], 10) };
-				}
-				return { type: "issues", owner, repo };
-			case "pull":
-				if (subParts.length > 0 && /^\d+$/.test(subParts[0])) {
-					return { type: "pull", owner, repo, number: parseInt(subParts[0], 10) };
-				}
-				return { type: "pulls", owner, repo };
-			case "pulls":
-				return { type: "pulls", owner, repo };
-			case "discussions":
-				if (subParts.length > 0 && /^\d+$/.test(subParts[0])) {
-					return { type: "discussion", owner, repo, number: parseInt(subParts[0], 10) };
-				}
-				return { type: "discussions", owner, repo };
-			default:
-				return { type: "other", owner, repo };
-		}
-	} catch {
-		return null;
+async function renderUrl(
+	url: string,
+	timeout: number,
+	raw: boolean = false,
+	signal?: AbortSignal,
+): Promise<RenderResult> {
+	const notes: string[] = [];
+	const fetchedAt = new Date().toISOString();
+	if (signal?.aborted) {
+		throw new Error("Operation aborted");
 	}
-}
-/**
- * Convert GitHub blob URL to raw URL
- */
-function toRawGitHubUrl(gh: GitHubUrl): string {
-	return `https://raw.githubusercontent.com/${gh.owner}/${gh.repo}/refs/heads/${gh.ref}/${gh.path}`;
-}
+	// Step 0: Normalize URL (ensure scheme for special handlers)
+	url = normalizeUrl(url);
+	const origin = getOrigin(url);
-/**
- * Fetch from GitHub API
- */
-async function fetchGitHubApi(endpoint: string, timeout: number): Promise<{ data: unknown; ok: boolean }> {
-	try {
-		const controller = new AbortController();
-		const timeoutId = setTimeout(() => controller.abort(), timeout * 1000);
+	// Step 1: Try special handlers for known sites (unless raw mode)
+	if (!raw) {
+		const specialResult = await handleSpecialUrls(url, timeout, signal);
+		if (specialResult) return specialResult;
+	}
-		const headers: Record<string, string> = {
-			Accept: "application/vnd.github.v3+json",
-			"User-Agent": "omp-web-fetch/1.0",
+	// Step 2: Fetch page
+	const response = await loadPage(url, { timeout, signal });
+	if (signal?.aborted) {
+		throw new Error("Operation aborted");
+	}
+	if (!response.ok) {
+		return {
+			url,
+			finalUrl: url,
+			contentType: "unknown",
+			method: "failed",
+			content: "",
+			fetchedAt,
+			truncated: false,
+			notes: ["Failed to fetch URL"],
 		};
-		// Use GITHUB_TOKEN if available
-		const token = process.env.GITHUB_TOKEN || process.env.GH_TOKEN;
-		if (token) {
-			headers.Authorization = `Bearer ${token}`;
-		}
-		const response = await fetch(`https://api.github.com${endpoint}`, {
-			signal: controller.signal,
-			headers,
-		});
-		clearTimeout(timeoutId);
-		if (!response.ok) {
-			return { data: null, ok: false };
-		}
-		return { data: await response.json(), ok: true };
-	} catch {
-		return { data: null, ok: false };
 	}
-}
-/**
- * Render GitHub issue/PR to markdown
- */
-async function renderGitHubIssue(gh: GitHubUrl, timeout: number): Promise<{ content: string; ok: boolean }> {
-	const endpoint =
-		gh.type === "pull"
-			? `/repos/${gh.owner}/${gh.repo}/pulls/${gh.number}`
-			: `/repos/${gh.owner}/${gh.repo}/issues/${gh.number}`;
-	const result = await fetchGitHubApi(endpoint, timeout);
-	if (!result.ok || !result.data) return { content: "", ok: false };
-	const issue = result.data as {
-		title: string;
-		number: number;
-		state: string;
-		user: { login: string };
-		created_at: string;
-		updated_at: string;
-		body: string | null;
-		labels: Array<{ name: string }>;
-		comments: number;
-		html_url: string;
-	};
+	const { finalUrl, content: rawContent } = response;
+	const mime = normalizeMime(response.contentType);
+	const extHint = getExtensionHint(finalUrl);
-	let md = `# ${issue.title}\n\n`;
-	md += `**#${issue.number}** · ${issue.state} · opened by @${issue.user.login}\n`;
-	md += `Created: ${issue.created_at} · Updated: ${issue.updated_at}\n`;
-	if (issue.labels.length > 0) {
-		md += `Labels: ${issue.labels.map((l) => l.name).join(", ")}\n`;
-	}
-	md += `\n---\n\n`;
-	md += issue.body || "*No description provided.*";
-	md += `\n\n---\n\n`;
-	// Fetch comments if any
-	if (issue.comments > 0) {
-		const commentsResult = await fetchGitHubApi(
-			`/repos/${gh.owner}/${gh.repo}/issues/${gh.number}/comments?per_page=50`,
-			timeout,
-		);
-		if (commentsResult.ok && Array.isArray(commentsResult.data)) {
-			md += `## Comments (${issue.comments})\n\n`;
-			for (const comment of commentsResult.data as Array<{
-				user: { login: string };
-				created_at: string;
-				body: string;
-			}>) {
-				md += `### @${comment.user.login} · ${comment.created_at}\n\n`;
-				md += `${comment.body}\n\n---\n\n`;
+	// Step 3: Handle convertible binary files (PDF, DOCX, etc.)
+	if (isConvertible(mime, extHint)) {
+		const binary = await fetchBinary(finalUrl, timeout, signal);
+		if (binary.ok) {
+			const ext = getExtensionHint(finalUrl, binary.contentDisposition) || extHint;
+			const converted = await convertWithMarkitdown(binary.buffer, ext, timeout, signal);
+			if (converted.ok) {
+				if (converted.content.trim().length > 50) {
+					notes.push("Converted with markitdown");
+					const output = finalizeOutput(converted.content);
+					return {
+						url,
+						finalUrl,
+						contentType: mime,
+						method: "markitdown",
+						content: output.content,
+						fetchedAt,
+						truncated: output.truncated,
+						notes,
+					};
+				}
+				notes.push("markitdown conversion produced no usable output");
+			} else if (converted.error) {
+				notes.push(`markitdown conversion failed: ${converted.error}`);
+			} else {
+				notes.push("markitdown conversion failed");
 			}
+		} else if (binary.error) {
+			notes.push(`Binary fetch failed: ${binary.error}`);
+		} else {
+			notes.push("Binary fetch failed");
 		}
 	}
-	return { content: md, ok: true };
-}
+	// Step 4: Handle non-HTML text content
+	const isHtml = mime.includes("html") || mime.includes("xhtml");
+	const isJson = mime.includes("json");
+	const isXml = mime.includes("xml") && !isHtml;
+	const isText = mime.includes("text/plain") || mime.includes("text/markdown");
+	const isFeed = mime.includes("rss") || mime.includes("atom") || mime.includes("feed");
-/**
- * Render GitHub issues list to markdown
- */
-async function renderGitHubIssuesList(gh: GitHubUrl, timeout: number): Promise<{ content: string; ok: boolean }> {
-	const result = await fetchGitHubApi(`/repos/${gh.owner}/${gh.repo}/issues?state=open&per_page=30`, timeout);
-	if (!result.ok || !Array.isArray(result.data)) return { content: "", ok: false };
-	const issues = result.data as Array<{
-		number: number;
-		title: string;
-		state: string;
-		user: { login: string };
-		created_at: string;
-		comments: number;
-		labels: Array<{ name: string }>;
-		pull_request?: unknown;
-	}>;
-	let md = `# ${gh.owner}/${gh.repo} - Open Issues\n\n`;
-	for (const issue of issues) {
-		if (issue.pull_request) continue; // Skip PRs in issues list
-		const labels = issue.labels.length > 0 ? ` [${issue.labels.map((l) => l.name).join(", ")}]` : "";
-		md += `- **#${issue.number}** ${issue.title}${labels}\n`;
-		md += `  by @${issue.user.login} · ${issue.comments} comments · ${issue.created_at}\n\n`;
+	if (isJson) {
+		const output = finalizeOutput(formatJson(rawContent));
+		return {
+			url,
+			finalUrl,
+			contentType: mime,
+			method: "json",
+			content: output.content,
+			fetchedAt,
+			truncated: output.truncated,
+			notes,
+		};
 	}
-	return { content: md, ok: true };
-}
-/**
- * Render GitHub tree (directory) to markdown
- */
-async function renderGitHubTree(gh: GitHubUrl, timeout: number): Promise<{ content: string; ok: boolean }> {
-	// Fetch repo info first to get default branch if ref not specified
-	const repoResult = await fetchGitHubApi(`/repos/${gh.owner}/${gh.repo}`, timeout);
-	if (!repoResult.ok) return { content: "", ok: false };
-	const repo = repoResult.data as {
-		full_name: string;
-		default_branch: string;
-	};
-	const ref = gh.ref || repo.default_branch;
-	const dirPath = gh.path || "";
-	let md = `# ${repo.full_name}/${dirPath || "(root)"}\n\n`;
-	md += `**Branch:** ${ref}\n\n`;
-	// Fetch directory contents
-	const contentsResult = await fetchGitHubApi(`/repos/${gh.owner}/${gh.repo}/contents/${dirPath}?ref=${ref}`, timeout);
-	if (contentsResult.ok && Array.isArray(contentsResult.data)) {
-		const items = contentsResult.data as Array<{
-			name: string;
-			type: "file" | "dir" | "symlink" | "submodule";
-			size?: number;
-			path: string;
-		}>;
-		// Sort: directories first, then files, alphabetically
-		items.sort((a, b) => {
-			if (a.type === "dir" && b.type !== "dir") return -1;
-			if (a.type !== "dir" && b.type === "dir") return 1;
-			return a.name.localeCompare(b.name);
-		});
-		md += `## Contents\n\n`;
-		md += "```\n";
-		for (const item of items) {
-			const prefix = item.type === "dir" ? "[dir] " : "      ";
-			const size = item.size ? ` (${item.size} bytes)` : "";
-			md += `${prefix}${item.name}${item.type === "file" ? size : ""}\n`;
-		}
-		md += "```\n\n";
-		// Look for README in this directory
-		const readmeFile = items.find((item) => item.type === "file" && /^readme\.md$/i.test(item.name));
-		if (readmeFile) {
-			const readmePath = dirPath ? `${dirPath}/${readmeFile.name}` : readmeFile.name;
-			const rawUrl = `https://raw.githubusercontent.com/${gh.owner}/${gh.repo}/refs/heads/${ref}/${readmePath}`;
-			const readmeResult = await loadPage(rawUrl, { timeout });
-			if (readmeResult.ok) {
-				md += `---\n\n## README\n\n${readmeResult.content}`;
-			}
-		}
+	if (isFeed || (isXml && (rawContent.includes("<rss") || rawContent.includes("<feed")))) {
+		const parsed = parseFeedToMarkdown(rawContent);
+		const output = finalizeOutput(parsed);
+		return {
+			url,
+			finalUrl,
+			contentType: mime,
+			method: "feed",
+			content: output.content,
+			fetchedAt,
+			truncated: output.truncated,
+			notes,
+		};
 	}
-	return { content: md, ok: true };
-}
-/**
- * Render GitHub repo to markdown (file list + README)
- */
-async function renderGitHubRepo(gh: GitHubUrl, timeout: number): Promise<{ content: string; ok: boolean }> {
-	// Fetch repo info
-	const repoResult = await fetchGitHubApi(`/repos/${gh.owner}/${gh.repo}`, timeout);
-	if (!repoResult.ok) return { content: "", ok: false };
-	const repo = repoResult.data as {
-		full_name: string;
-		description: string | null;
-		stargazers_count: number;
-		forks_count: number;
-		open_issues_count: number;
-		default_branch: string;
-		language: string | null;
-		license: { name: string } | null;
-	};
-	let md = `# ${repo.full_name}\n\n`;
-	if (repo.description) md += `${repo.description}\n\n`;
-	md += `Stars: ${repo.stargazers_count} · Forks: ${repo.forks_count} · Issues: ${repo.open_issues_count}\n`;
-	if (repo.language) md += `Language: ${repo.language}\n`;
-	if (repo.license) md += `License: ${repo.license.name}\n`;
-	md += `\n---\n\n`;
-	// Fetch file tree
-	const treeResult = await fetchGitHubApi(
-		`/repos/${gh.owner}/${gh.repo}/git/trees/${repo.default_branch}?recursive=1`,
-		timeout,
-	);
-	if (treeResult.ok && treeResult.data) {
-		const tree = (treeResult.data as { tree: Array<{ path: string; type: string }> }).tree;
-		md += `## Files\n\n`;
-		md += "```\n";
-		for (const item of tree.slice(0, 100)) {
-			const prefix = item.type === "tree" ? "[dir] " : "      ";
-			md += `${prefix}${item.path}\n`;
-		}
-		if (tree.length > 100) {
-			md += `... and ${tree.length - 100} more files\n`;
-		}
-		md += "```\n\n";
-	}
-	// Fetch README
-	const readmeResult = await fetchGitHubApi(`/repos/${gh.owner}/${gh.repo}/readme`, timeout);
-	if (readmeResult.ok && readmeResult.data) {
-		const readme = readmeResult.data as { content: string; encoding: string };
-		if (readme.encoding === "base64") {
-			const decoded = Buffer.from(readme.content, "base64").toString("utf-8");
-			md += `## README\n\n${decoded}`;
-		}
-	}
-	return { content: md, ok: true };
-}
-/**
- * Handle GitHub URLs specially
- */
-async function handleGitHub(url: string, timeout: number): Promise<RenderResult | null> {
-	const gh = parseGitHubUrl(url);
-	if (!gh) return null;
-	const fetchedAt = new Date().toISOString();
-	const notes: string[] = [];
-	switch (gh.type) {
-		case "blob": {
-			// Convert to raw URL and fetch
-			const rawUrl = toRawGitHubUrl(gh);
-			notes.push(`Fetched raw: ${rawUrl}`);
-			const result = await loadPage(rawUrl, { timeout });
-			if (result.ok) {
-				const output = finalizeOutput(result.content);
-				return {
-					url,
-					finalUrl: rawUrl,
-					contentType: "text/plain",
-					method: "github-raw",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-			break;
-		}
-		case "tree": {
-			notes.push(`Fetched via GitHub API`);
-			const result = await renderGitHubTree(gh, timeout);
-			if (result.ok) {
-				const output = finalizeOutput(result.content);
-				return {
-					url,
-					finalUrl: url,
-					contentType: "text/markdown",
-					method: "github-tree",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-			break;
-		}
-		case "issue":
-		case "pull": {
-			notes.push(`Fetched via GitHub API`);
-			const result = await renderGitHubIssue(gh, timeout);
-			if (result.ok) {
-				const output = finalizeOutput(result.content);
-				return {
-					url,
-					finalUrl: url,
-					contentType: "text/markdown",
-					method: gh.type === "pull" ? "github-pr" : "github-issue",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-			break;
-		}
-		case "issues": {
-			notes.push(`Fetched via GitHub API`);
-			const result = await renderGitHubIssuesList(gh, timeout);
-			if (result.ok) {
-				const output = finalizeOutput(result.content);
-				return {
-					url,
-					finalUrl: url,
-					contentType: "text/markdown",
-					method: "github-issues",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-			break;
-		}
-		case "repo": {
-			notes.push(`Fetched via GitHub API`);
-			const result = await renderGitHubRepo(gh, timeout);
-			if (result.ok) {
-				const output = finalizeOutput(result.content);
-				return {
-					url,
-					finalUrl: url,
-					contentType: "text/markdown",
-					method: "github-repo",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-			break;
-		}
-	}
-	// Fall back to null (let normal rendering handle it)
-	return null;
-}
-// =============================================================================
-// Twitter/X Special Handling (via Nitter)
-// =============================================================================
-// Active Nitter instances - check https://status.d420.de/instances for current status
-const NITTER_INSTANCES = [
-	"nitter.privacyredirect.com",
-	"nitter.tiekoetter.com",
-	"nitter.poast.org",
-	"nitter.woodland.cafe",
-];
-/**
- * Handle Twitter/X URLs via Nitter
- */
-async function handleTwitter(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (!["twitter.com", "x.com", "www.twitter.com", "www.x.com"].includes(parsed.hostname)) {
-			return null;
-		}
-		const fetchedAt = new Date().toISOString();
-		// Try Nitter instances
-		for (const instance of NITTER_INSTANCES) {
-			const nitterUrl = `https://${instance}${parsed.pathname}`;
-			const result = await loadPage(nitterUrl, { timeout: Math.min(timeout, 10) });
-			if (result.ok && result.content.length > 500) {
-				// Parse the Nitter HTML
-				const doc = parseHtml(result.content);
-				// Extract tweet content
-				const tweetContent = doc.querySelector(".tweet-content")?.text?.trim();
-				const fullname = doc.querySelector(".fullname")?.text?.trim();
-				const username = doc.querySelector(".username")?.text?.trim();
-				const date = doc.querySelector(".tweet-date a")?.text?.trim();
-				const stats = doc.querySelector(".tweet-stats")?.text?.trim();
-				if (tweetContent) {
-					let md = `# Tweet by ${fullname || "Unknown"} (${username || "@?"})\n\n`;
-					if (date) md += `*${date}*\n\n`;
-					md += `${tweetContent}\n\n`;
-					if (stats) md += `---\n${stats.replace(/\s+/g, " ")}\n`;
-					// Check for replies/thread
-					const replies = doc.querySelectorAll(".timeline-item .tweet-content");
-					if (replies.length > 1) {
-						md += `\n---\n\n## Thread/Replies\n\n`;
-						for (const reply of Array.from(replies).slice(1, 10)) {
-							const replyUser = reply.parentNode?.querySelector(".username")?.text?.trim();
-							md += `**${replyUser || "@?"}**: ${reply.text?.trim()}\n\n`;
-						}
-					}
-					const output = finalizeOutput(md);
-					return {
-						url,
-						finalUrl: nitterUrl,
-						contentType: "text/markdown",
-						method: "twitter-nitter",
-						content: output.content,
-						fetchedAt,
-						truncated: output.truncated,
-						notes: [`Via Nitter: ${instance}`],
-					};
-				}
-			}
-		}
-	} catch {}
-	// X.com blocks all bots - return a helpful error instead of falling through
-	return {
-		url,
-		finalUrl: url,
-		contentType: "text/plain",
-		method: "twitter-blocked",
-		content:
-			"Twitter/X blocks automated access. Nitter instances were unavailable.\n\nTry:\n- Opening the link in a browser\n- Using a different Nitter instance manually\n- Checking if the tweet is available via an archive service",
-		fetchedAt: new Date().toISOString(),
-		truncated: false,
-		notes: ["X.com blocks bots; Nitter instances unavailable"],
-	};
-}
-// =============================================================================
-// Stack Overflow Special Handling
-// =============================================================================
-interface SOQuestion {
-	title: string;
-	body: string;
-	score: number;
-	owner: { display_name: string };
-	creation_date: number;
-	tags: string[];
-	answer_count: number;
-	is_answered: boolean;
-}
-interface SOAnswer {
-	body: string;
-	score: number;
-	is_accepted: boolean;
-	owner: { display_name: string };
-	creation_date: number;
-}
-/**
- * Convert basic HTML to markdown (for SO bodies)
- */
-function htmlToBasicMarkdown(html: string): string {
-	return html
-		.replace(/<pre><code[^>]*>/g, "\n```\n")
-		.replace(/<\/code><\/pre>/g, "\n```\n")
-		.replace(/<code>/g, "`")
-		.replace(/<\/code>/g, "`")
-		.replace(/<strong>/g, "**")
-		.replace(/<\/strong>/g, "**")
-		.replace(/<em>/g, "*")
-		.replace(/<\/em>/g, "*")
-		.replace(/<a href="([^"]+)"[^>]*>([^<]+)<\/a>/g, "[$2]($1)")
-		.replace(/<p>/g, "\n\n")
-		.replace(/<\/p>/g, "")
-		.replace(/<br\s*\/?>/g, "\n")
-		.replace(/<li>/g, "- ")
-		.replace(/<\/li>/g, "\n")
-		.replace(/<\/?[uo]l>/g, "\n")
-		.replace(/<h(\d)>/g, (_, n) => `\n${"#".repeat(parseInt(n, 10))} `)
-		.replace(/<\/h\d>/g, "\n")
-		.replace(/<blockquote>/g, "\n> ")
-		.replace(/<\/blockquote>/g, "\n")
-		.replace(/<[^>]+>/g, "") // Strip remaining tags
-		.replace(/&lt;/g, "<")
-		.replace(/&gt;/g, ">")
-		.replace(/&amp;/g, "&")
-		.replace(/&quot;/g, '"')
-		.replace(/&#39;/g, "'")
-		.replace(/\n{3,}/g, "\n\n")
-		.trim();
-}
-/**
- * Handle Stack Overflow URLs via API
- */
-async function handleStackOverflow(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (!parsed.hostname.includes("stackoverflow.com") && !parsed.hostname.includes("stackexchange.com")) {
-			return null;
-		}
-		// Extract question ID from URL patterns like /questions/12345/...
-		const match = parsed.pathname.match(/\/questions\/(\d+)/);
-		if (!match) return null;
-		const questionId = match[1];
-		const site = parsed.hostname.includes("stackoverflow") ? "stackoverflow" : parsed.hostname.split(".")[0];
-		const fetchedAt = new Date().toISOString();
-		// Fetch question with answers
-		const apiUrl = `https://api.stackexchange.com/2.3/questions/${questionId}?order=desc&sort=votes&site=${site}&filter=withbody`;
-		const qResult = await loadPage(apiUrl, { timeout });
-		if (!qResult.ok) return null;
-		const qData = JSON.parse(qResult.content) as { items: SOQuestion[] };
-		if (!qData.items?.length) return null;
-		const question = qData.items[0];
-		let md = `# ${question.title}\n\n`;
-		md += `**Score:** ${question.score} · **Answers:** ${question.answer_count}`;
-		md += question.is_answered ? " (Answered)" : "";
-		md += `\n**Tags:** ${question.tags.join(", ")}\n`;
-		md += `**Asked by:** ${question.owner.display_name} · ${new Date(question.creation_date * 1000).toISOString().split("T")[0]}\n\n`;
-		md += `---\n\n## Question\n\n${htmlToBasicMarkdown(question.body)}\n\n`;
-		// Fetch answers
-		const aUrl = `https://api.stackexchange.com/2.3/questions/${questionId}/answers?order=desc&sort=votes&site=${site}&filter=withbody`;
-		const aResult = await loadPage(aUrl, { timeout });
-		if (aResult.ok) {
-			const aData = JSON.parse(aResult.content) as { items: SOAnswer[] };
-			if (aData.items?.length) {
-				md += `---\n\n## Answers\n\n`;
-				for (const answer of aData.items.slice(0, 5)) {
-					const accepted = answer.is_accepted ? " (Accepted)" : "";
-					md += `### Score: ${answer.score}${accepted} · by ${answer.owner.display_name}\n\n`;
-					md += `${htmlToBasicMarkdown(answer.body)}\n\n---\n\n`;
-				}
-			}
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "stackoverflow",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via Stack Exchange API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// Wikipedia Special Handling
-// =============================================================================
-/**
- * Handle Wikipedia URLs via API
- */
-async function handleWikipedia(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		// Match *.wikipedia.org
-		const wikiMatch = parsed.hostname.match(/^(\w+)\.wikipedia\.org$/);
-		if (!wikiMatch) return null;
-		const lang = wikiMatch[1];
-		const titleMatch = parsed.pathname.match(/\/wiki\/(.+)/);
-		if (!titleMatch) return null;
-		const title = decodeURIComponent(titleMatch[1]);
-		const fetchedAt = new Date().toISOString();
-		// Use Wikipedia API to get plain text extract
-		const apiUrl = `https://${lang}.wikipedia.org/api/rest_v1/page/summary/${encodeURIComponent(title)}`;
-		const summaryResult = await loadPage(apiUrl, { timeout });
-		let md = "";
-		if (summaryResult.ok) {
-			const summary = JSON.parse(summaryResult.content) as {
-				title: string;
-				description?: string;
-				extract: string;
-			};
-			md = `# ${summary.title}\n\n`;
-			if (summary.description) md += `*${summary.description}*\n\n`;
-			md += `${summary.extract}\n\n---\n\n`;
-		}
-		// Get full article content via mobile-html or parse API
-		const contentUrl = `https://${lang}.wikipedia.org/api/rest_v1/page/mobile-html/${encodeURIComponent(title)}`;
-		const contentResult = await loadPage(contentUrl, { timeout });
-		if (contentResult.ok) {
-			const doc = parseHtml(contentResult.content);
-			// Extract main content sections
-			const sections = doc.querySelectorAll("section");
-			for (const section of sections) {
-				const heading = section.querySelector("h2, h3, h4");
-				const headingText = heading?.text?.trim();
-				// Skip certain sections
-				if (
-					headingText &&
-					["References", "External links", "See also", "Notes", "Further reading"].includes(headingText)
-				) {
-					continue;
-				}
-				if (headingText) {
-					const level = heading?.tagName === "H2" ? "##" : "###";
-					md += `${level} ${headingText}\n\n`;
-				}
-				const paragraphs = section.querySelectorAll("p");
-				for (const p of paragraphs) {
-					const text = p.text?.trim();
-					if (text && text.length > 20) {
-						md += `${text}\n\n`;
-					}
-				}
-			}
-		}
-		if (!md) return null;
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "wikipedia",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via Wikipedia API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// Reddit Special Handling
-// =============================================================================
-interface RedditPost {
-	title: string;
-	selftext: string;
-	author: string;
-	score: number;
-	num_comments: number;
-	created_utc: number;
-	subreddit: string;
-	url: string;
-	is_self: boolean;
-}
-interface RedditComment {
-	body: string;
-	author: string;
-	score: number;
-	created_utc: number;
-	replies?: { data: { children: Array<{ data: RedditComment }> } };
-}
-/**
- * Handle Reddit URLs via JSON API
- */
-async function handleReddit(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (!parsed.hostname.includes("reddit.com")) return null;
-		const fetchedAt = new Date().toISOString();
-		// Append .json to get JSON response
-		let jsonUrl = `${url.replace(/\/$/, "")}.json`;
-		if (parsed.search) {
-			jsonUrl = `${url.replace(/\/$/, "").replace(parsed.search, "")}.json${parsed.search}`;
-		}
-		const result = await loadPage(jsonUrl, { timeout });
-		if (!result.ok) return null;
-		const data = JSON.parse(result.content);
-		let md = "";
-		// Handle different Reddit URL types
-		if (Array.isArray(data) && data.length >= 1) {
-			// Post page (with comments)
-			const postData = data[0]?.data?.children?.[0]?.data as RedditPost | undefined;
-			if (postData) {
-				md = `# ${postData.title}\n\n`;
-				md += `**r/${postData.subreddit}** · u/${postData.author} · ${postData.score} points · ${postData.num_comments} comments\n`;
-				md += `*${new Date(postData.created_utc * 1000).toISOString().split("T")[0]}*\n\n`;
-				if (postData.is_self && postData.selftext) {
-					md += `---\n\n${postData.selftext}\n\n`;
-				} else if (!postData.is_self) {
-					md += `**Link:** ${postData.url}\n\n`;
-				}
-				// Add comments if available
-				if (data.length >= 2 && data[1]?.data?.children) {
-					md += `---\n\n## Top Comments\n\n`;
-					const comments = data[1].data.children.filter((c: { kind: string }) => c.kind === "t1").slice(0, 10);
-					for (const { data: comment } of comments as Array<{ data: RedditComment }>) {
-						md += `### u/${comment.author} · ${comment.score} points\n\n`;
-						md += `${comment.body}\n\n---\n\n`;
-					}
-				}
-			}
-		} else if (data?.data?.children) {
-			// Subreddit or listing page
-			const posts = data.data.children.slice(0, 20) as Array<{ data: RedditPost }>;
-			const subreddit = posts[0]?.data?.subreddit;
-			md = `# r/${subreddit || "Reddit"}\n\n`;
-			for (const { data: post } of posts) {
-				md += `- **${post.title}** (${post.score} pts, ${post.num_comments} comments)\n`;
-				md += `  by u/${post.author}\n\n`;
-			}
-		}
-		if (!md) return null;
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "reddit",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via Reddit JSON API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// NPM Special Handling
-// =============================================================================
-/**
- * Handle NPM URLs via registry API
- */
-async function handleNpm(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "www.npmjs.com" && parsed.hostname !== "npmjs.com") return null;
-		// Extract package name from /package/[scope/]name
-		const match = parsed.pathname.match(/^\/package\/(.+?)(?:\/|$)/);
-		if (!match) return null;
-		let packageName = decodeURIComponent(match[1]);
-		// Handle scoped packages: /package/@scope/name
-		if (packageName.startsWith("@")) {
-			const scopeMatch = parsed.pathname.match(/^\/package\/(@[^/]+\/[^/]+)/);
-			if (scopeMatch) packageName = decodeURIComponent(scopeMatch[1]);
-		}
-		const fetchedAt = new Date().toISOString();
-		// Fetch from npm registry - use /latest endpoint for smaller response
-		const latestUrl = `https://registry.npmjs.org/${packageName}/latest`;
-		const downloadsUrl = `https://api.npmjs.org/downloads/point/last-week/${encodeURIComponent(packageName)}`;
-		// Fetch package info and download stats in parallel
-		const [result, downloadsResult] = await Promise.all([
-			loadPage(latestUrl, { timeout }),
-			loadPage(downloadsUrl, { timeout: Math.min(timeout, 5) }),
-		]);
-		if (!result.ok) return null;
-		// Parse download stats
-		let weeklyDownloads: number | null = null;
-		if (downloadsResult.ok) {
-			try {
-				const dlData = JSON.parse(downloadsResult.content) as { downloads?: number };
-				weeklyDownloads = dlData.downloads ?? null;
-			} catch {}
-		}
-		let pkg: {
-			name: string;
-			version: string;
-			description?: string;
-			license?: string;
-			homepage?: string;
-			repository?: { url: string } | string;
-			keywords?: string[];
-			maintainers?: Array<{ name: string }>;
-			dependencies?: Record<string, string>;
-			readme?: string;
-		};
-		try {
-			pkg = JSON.parse(result.content);
-		} catch {
-			return null; // JSON parse failed (truncated response)
-		}
-		let md = `# ${pkg.name}\n\n`;
-		if (pkg.description) md += `${pkg.description}\n\n`;
-		md += `**Latest:** ${pkg.version || "unknown"}`;
-		if (pkg.license) md += ` · **License:** ${typeof pkg.license === "string" ? pkg.license : pkg.license}`;
-		md += "\n";
-		if (weeklyDownloads !== null) {
-			const formatted =
-				weeklyDownloads >= 1_000_000
-					? `${(weeklyDownloads / 1_000_000).toFixed(1)}M`
-					: weeklyDownloads >= 1_000
-						? `${(weeklyDownloads / 1_000).toFixed(1)}K`
-						: String(weeklyDownloads);
-			md += `**Weekly Downloads:** ${formatted}\n`;
-		}
-		md += "\n";
-		if (pkg.homepage) md += `**Homepage:** ${pkg.homepage}\n`;
-		const repoUrl = typeof pkg.repository === "string" ? pkg.repository : pkg.repository?.url;
-		if (repoUrl) md += `**Repository:** ${repoUrl.replace(/^git\+/, "").replace(/\.git$/, "")}\n`;
-		if (pkg.keywords?.length) md += `**Keywords:** ${pkg.keywords.join(", ")}\n`;
-		if (pkg.maintainers?.length) md += `**Maintainers:** ${pkg.maintainers.map((m) => m.name).join(", ")}\n`;
-		if (pkg.dependencies && Object.keys(pkg.dependencies).length > 0) {
-			md += `\n## Dependencies\n\n`;
-			for (const [dep, version] of Object.entries(pkg.dependencies)) {
-				md += `- ${dep}: ${version}\n`;
-			}
-		}
-		if (pkg.readme) {
-			md += `\n---\n\n## README\n\n${pkg.readme}\n`;
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "npm",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via npm registry"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// Crates.io Special Handling
-// =============================================================================
-/**
- * Handle crates.io URLs via API
- */
-async function handleCratesIo(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "crates.io" && parsed.hostname !== "www.crates.io") return null;
-		// Extract crate name from /crates/name or /crates/name/version
-		const match = parsed.pathname.match(/^\/crates\/([^/]+)/);
-		if (!match) return null;
-		const crateName = decodeURIComponent(match[1]);
-		const fetchedAt = new Date().toISOString();
-		// Fetch from crates.io API
-		const apiUrl = `https://crates.io/api/v1/crates/${crateName}`;
-		const result = await loadPage(apiUrl, {
-			timeout,
-			headers: { "User-Agent": "omp-web-fetch/1.0 (https://github.com/anthropics)" },
-		});
-		if (!result.ok) return null;
-		let data: {
-			crate: {
-				name: string;
-				description: string | null;
-				downloads: number;
-				recent_downloads: number;
-				max_version: string;
-				repository: string | null;
-				homepage: string | null;
-				documentation: string | null;
-				categories: string[];
-				keywords: string[];
-				created_at: string;
-				updated_at: string;
-			};
-			versions: Array<{
-				num: string;
-				downloads: number;
-				created_at: string;
-				license: string | null;
-				rust_version: string | null;
-			}>;
-		};
-		try {
-			data = JSON.parse(result.content);
-		} catch {
-			return null;
-		}
-		const crate = data.crate;
-		const latestVersion = data.versions?.[0];
-		// Format download counts
-		const formatDownloads = (n: number): string =>
-			n >= 1_000_000 ? `${(n / 1_000_000).toFixed(1)}M` : n >= 1_000 ? `${(n / 1_000).toFixed(1)}K` : String(n);
-		let md = `# ${crate.name}\n\n`;
-		if (crate.description) md += `${crate.description}\n\n`;
-		md += `**Latest:** ${crate.max_version}`;
-		if (latestVersion?.license) md += ` · **License:** ${latestVersion.license}`;
-		if (latestVersion?.rust_version) md += ` · **MSRV:** ${latestVersion.rust_version}`;
-		md += "\n";
-		md += `**Downloads:** ${formatDownloads(crate.downloads)} total · ${formatDownloads(crate.recent_downloads)} recent\n\n`;
-		if (crate.repository) md += `**Repository:** ${crate.repository}\n`;
-		if (crate.homepage && crate.homepage !== crate.repository) md += `**Homepage:** ${crate.homepage}\n`;
-		if (crate.documentation) md += `**Docs:** ${crate.documentation}\n`;
-		if (crate.keywords?.length) md += `**Keywords:** ${crate.keywords.join(", ")}\n`;
-		if (crate.categories?.length) md += `**Categories:** ${crate.categories.join(", ")}\n`;
-		// Show recent versions
-		if (data.versions?.length > 0) {
-			md += `\n## Recent Versions\n\n`;
-			for (const ver of data.versions.slice(0, 5)) {
-				const date = ver.created_at.split("T")[0];
-				md += `- **${ver.num}** (${date}) - ${formatDownloads(ver.downloads)} downloads\n`;
-			}
-		}
-		// Try to fetch README from docs.rs or repository
-		const docsRsUrl = `https://docs.rs/crate/${crateName}/${crate.max_version}/source/README.md`;
-		const readmeResult = await loadPage(docsRsUrl, { timeout: Math.min(timeout, 5) });
-		if (readmeResult.ok && readmeResult.content.length > 100 && !looksLikeHtml(readmeResult.content)) {
-			md += `\n---\n\n## README\n\n${readmeResult.content}\n`;
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "crates.io",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via crates.io API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// arXiv Special Handling
-// =============================================================================
-/**
- * Handle arXiv URLs - fetch abstract + optionally PDF
- */
-async function handleArxiv(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "arxiv.org") return null;
-		// Extract paper ID from various URL formats
-		// /abs/1234.56789, /pdf/1234.56789, /abs/cs/0123456
-		const match = parsed.pathname.match(/\/(abs|pdf)\/(.+?)(?:\.pdf)?$/);
-		if (!match) return null;
-		const paperId = match[2];
-		const fetchedAt = new Date().toISOString();
-		const notes: string[] = [];
-		// Fetch metadata via arXiv API
-		const apiUrl = `https://export.arxiv.org/api/query?id_list=${paperId}`;
-		const result = await loadPage(apiUrl, { timeout });
-		if (!result.ok) return null;
-		// Parse the Atom feed response
-		const doc = parseHtml(result.content, { parseNoneClosedTags: true });
-		const entry = doc.querySelector("entry");
-		if (!entry) return null;
-		const title = entry.querySelector("title")?.text?.trim()?.replace(/\s+/g, " ");
-		const summary = entry.querySelector("summary")?.text?.trim();
-		const authors = entry
-			.querySelectorAll("author name")
-			.map((n) => n.text?.trim())
-			.filter(Boolean);
-		const published = entry.querySelector("published")?.text?.trim()?.split("T")[0];
-		const categories = entry
-			.querySelectorAll("category")
-			.map((c) => c.getAttribute("term"))
-			.filter(Boolean);
-		const pdfLink = entry.querySelector('link[title="pdf"]')?.getAttribute("href");
-		let md = `# ${title || "arXiv Paper"}\n\n`;
-		if (authors.length) md += `**Authors:** ${authors.join(", ")}\n`;
-		if (published) md += `**Published:** ${published}\n`;
-		if (categories.length) md += `**Categories:** ${categories.join(", ")}\n`;
-		md += `**arXiv:** ${paperId}\n\n`;
-		md += `---\n\n## Abstract\n\n${summary || "No abstract available."}\n\n`;
-		// If it was a PDF link or we want full content, try to fetch and convert PDF
-		if (match[1] === "pdf" || parsed.pathname.includes(".pdf")) {
-			if (pdfLink) {
-				notes.push("Fetching PDF for full content...");
-				const pdfResult = await fetchBinary(pdfLink, timeout);
-				if (pdfResult.ok) {
-					const converted = await convertWithMarkitdown(pdfResult.buffer, ".pdf", timeout);
-					if (converted.ok && converted.content.length > 500) {
-						md += `---\n\n## Full Paper\n\n${converted.content}\n`;
-						notes.push("PDF converted via markitdown");
-					}
-				}
-			}
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "arxiv",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: notes.length ? notes : ["Fetched via arXiv API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// IACR ePrint Special Handling
-// =============================================================================
-/**
- * Handle IACR Cryptology ePrint Archive URLs
- */
-async function handleIacr(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "eprint.iacr.org") return null;
-		// Extract paper ID from /year/number or /year/number.pdf
-		const match = parsed.pathname.match(/\/(\d{4})\/(\d+)(?:\.pdf)?$/);
-		if (!match) return null;
-		const [, year, number] = match;
-		const paperId = `${year}/${number}`;
-		const fetchedAt = new Date().toISOString();
-		const notes: string[] = [];
-		// Fetch the HTML page for metadata
-		const pageUrl = `https://eprint.iacr.org/${paperId}`;
-		const result = await loadPage(pageUrl, { timeout });
-		if (!result.ok) return null;
-		const doc = parseHtml(result.content);
-		// Extract metadata from the page
-		const title =
-			doc.querySelector("h3.mb-3")?.text?.trim() ||
-			doc.querySelector('meta[name="citation_title"]')?.getAttribute("content");
-		const authors = doc
-			.querySelectorAll('meta[name="citation_author"]')
-			.map((m) => m.getAttribute("content"))
-			.filter(Boolean);
-		// Abstract is in <p> after <h5>Abstract</h5>
-		const abstractHeading = doc.querySelectorAll("h5").find((h) => h.text?.includes("Abstract"));
-		const abstract =
-			abstractHeading?.parentNode?.querySelector("p")?.text?.trim() ||
-			doc.querySelector('meta[name="description"]')?.getAttribute("content");
-		const keywords = doc.querySelector(".keywords")?.text?.replace("Keywords:", "").trim();
-		const pubDate = doc.querySelector('meta[name="citation_publication_date"]')?.getAttribute("content");
-		let md = `# ${title || "IACR ePrint Paper"}\n\n`;
-		if (authors.length) md += `**Authors:** ${authors.join(", ")}\n`;
-		if (pubDate) md += `**Date:** ${pubDate}\n`;
-		md += `**ePrint:** ${paperId}\n`;
-		if (keywords) md += `**Keywords:** ${keywords}\n`;
-		md += `\n---\n\n## Abstract\n\n${abstract || "No abstract available."}\n\n`;
-		// If it was a PDF link, try to fetch and convert PDF
-		if (parsed.pathname.endsWith(".pdf")) {
-			const pdfUrl = `https://eprint.iacr.org/${paperId}.pdf`;
-			notes.push("Fetching PDF for full content...");
-			const pdfResult = await fetchBinary(pdfUrl, timeout);
-			if (pdfResult.ok) {
-				const converted = await convertWithMarkitdown(pdfResult.buffer, ".pdf", timeout);
-				if (converted.ok && converted.content.length > 500) {
-					md += `---\n\n## Full Paper\n\n${converted.content}\n`;
-					notes.push("PDF converted via markitdown");
-				}
-			}
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "iacr",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: notes.length ? notes : ["Fetched from IACR ePrint Archive"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// GitHub Gist Special Handling
-// =============================================================================
-/**
- * Handle GitHub Gist URLs via API
- */
-async function handleGitHubGist(url: string, timeout: number): Promise<RenderResult | null> {
-	try {
-		const parsed = new URL(url);
-		if (parsed.hostname !== "gist.github.com") return null;
-		// Extract gist ID from /username/gistId or just /gistId
-		const parts = parsed.pathname.split("/").filter(Boolean);
-		if (parts.length === 0) return null;
-		// Gist ID is always the last path segment (or only segment for anonymous gists)
-		const gistId = parts[parts.length - 1];
-		if (!gistId || !/^[a-f0-9]+$/i.test(gistId)) return null;
-		const fetchedAt = new Date().toISOString();
-		// Fetch via GitHub API
-		const result = await fetchGitHubApi(`/gists/${gistId}`, timeout);
-		if (!result.ok || !result.data) return null;
-		const gist = result.data as {
-			description: string | null;
-			owner?: { login: string };
-			created_at: string;
-			updated_at: string;
-			files: Record<string, { filename: string; language: string | null; size: number; content: string }>;
-			html_url: string;
-		};
-		const files = Object.values(gist.files);
-		const owner = gist.owner?.login || "anonymous";
-		let md = `# Gist by ${owner}\n\n`;
-		if (gist.description) md += `${gist.description}\n\n`;
-		md += `**Created:** ${gist.created_at} · **Updated:** ${gist.updated_at}\n`;
-		md += `**Files:** ${files.length}\n\n`;
-		for (const file of files) {
-			const lang = file.language?.toLowerCase() || "";
-			md += `---\n\n## ${file.filename}\n\n`;
-			md += `\`\`\`${lang}\n${file.content}\n\`\`\`\n\n`;
-		}
-		const output = finalizeOutput(md);
-		return {
-			url,
-			finalUrl: url,
-			contentType: "text/markdown",
-			method: "github-gist",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes: ["Fetched via GitHub API"],
-		};
-	} catch {}
-	return null;
-}
-// =============================================================================
-// Unified Special Handler Dispatch
-// =============================================================================
-/**
- * Try all special handlers
- */
-async function handleSpecialUrls(url: string, timeout: number): Promise<RenderResult | null> {
-	// Order matters - more specific first
-	return (
-		(await handleGitHubGist(url, timeout)) ||
-		(await handleGitHub(url, timeout)) ||
-		(await handleTwitter(url, timeout)) ||
-		(await handleStackOverflow(url, timeout)) ||
-		(await handleWikipedia(url, timeout)) ||
-		(await handleReddit(url, timeout)) ||
-		(await handleNpm(url, timeout)) ||
-		(await handleCratesIo(url, timeout)) ||
-		(await handleArxiv(url, timeout)) ||
-		(await handleIacr(url, timeout))
-	);
-}
-// =============================================================================
-// Main Render Function
-// =============================================================================
-/**
- * Main render function implementing the full pipeline
- */
-async function renderUrl(url: string, timeout: number, raw: boolean = false): Promise<RenderResult> {
-	const notes: string[] = [];
-	const fetchedAt = new Date().toISOString();
-	// Step 0: Normalize URL (ensure scheme for special handlers)
-	url = normalizeUrl(url);
-	const origin = getOrigin(url);
-	// Step 1: Try special handlers for known sites (unless raw mode)
-	if (!raw) {
-		const specialResult = await handleSpecialUrls(url, timeout);
-		if (specialResult) return specialResult;
-	}
-	// Step 2: Fetch page
-	const response = await loadPage(url, { timeout });
-	if (!response.ok) {
-		return {
-			url,
-			finalUrl: url,
-			contentType: "unknown",
-			method: "failed",
-			content: "",
-			fetchedAt,
-			truncated: false,
-			notes: ["Failed to fetch URL"],
-		};
-	}
-	const { finalUrl, content: rawContent } = response;
-	const mime = normalizeMime(response.contentType);
-	const extHint = getExtensionHint(finalUrl);
-	// Step 3: Handle convertible binary files (PDF, DOCX, etc.)
-	if (isConvertible(mime, extHint)) {
-		const binary = await fetchBinary(finalUrl, timeout);
-		if (binary.ok) {
-			const ext = getExtensionHint(finalUrl, binary.contentDisposition) || extHint;
-			const converted = await convertWithMarkitdown(binary.buffer, ext, timeout);
-			if (converted.ok && converted.content.trim().length > 50) {
-				notes.push(`Converted with markitdown`);
-				const output = finalizeOutput(converted.content);
-				return {
-					url,
-					finalUrl,
-					contentType: mime,
-					method: "markitdown",
-					content: output.content,
-					fetchedAt,
-					truncated: output.truncated,
-					notes,
-				};
-			}
-		}
-		notes.push("markitdown conversion failed");
-	}
-	// Step 4: Handle non-HTML text content
-	const isHtml = mime.includes("html") || mime.includes("xhtml");
-	const isJson = mime.includes("json");
-	const isXml = mime.includes("xml") && !isHtml;
-	const isText = mime.includes("text/plain") || mime.includes("text/markdown");
-	const isFeed = mime.includes("rss") || mime.includes("atom") || mime.includes("feed");
-	if (isJson) {
-		const output = finalizeOutput(formatJson(rawContent));
-		return {
-			url,
-			finalUrl,
-			contentType: mime,
-			method: "json",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes,
-		};
-	}
-	if (isFeed || (isXml && (rawContent.includes("<rss") || rawContent.includes("<feed")))) {
-		const parsed = parseFeedToMarkdown(rawContent);
-		const output = finalizeOutput(parsed);
-		return {
-			url,
-			finalUrl,
-			contentType: mime,
-			method: "feed",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes,
-		};
-	}
-	if (isText && !looksLikeHtml(rawContent)) {
-		const output = finalizeOutput(rawContent);
-		return {
-			url,
-			finalUrl,
-			contentType: mime,
-			method: "text",
-			content: output.content,
-			fetchedAt,
-			truncated: output.truncated,
-			notes,
-		};
+	if (isText && !looksLikeHtml(rawContent)) {
+		const output = finalizeOutput(rawContent);
+		return {
+			url,
+			finalUrl,
+			contentType: mime,
+			method: "text",
+			content: output.content,
+			fetchedAt,
+			truncated: output.truncated,
+			notes,
+		};
 	}
 	// Step 5: For HTML, try digestible formats first (unless raw mode)
@@ -2071,7 +640,7 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		const markdownAlt = alternates.find((alt) => alt.endsWith(".md") || alt.includes("markdown"));
 		if (markdownAlt) {
 			const resolved = markdownAlt.startsWith("http") ? markdownAlt : new URL(markdownAlt, finalUrl).href;
-			const altResult = await loadPage(resolved, { timeout });
+			const altResult = await loadPage(resolved, { timeout, signal });
 			if (altResult.ok && altResult.content.trim().length > 100 && !looksLikeHtml(altResult.content)) {
 				notes.push(`Used markdown alternate: ${resolved}`);
 				const output = finalizeOutput(altResult.content);
@@ -2089,7 +658,7 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		}
 		// 5B: Try URL.md suffix (llms.txt convention)
-		const mdSuffix = await tryMdSuffix(finalUrl, timeout);
+		const mdSuffix = await tryMdSuffix(finalUrl, timeout, signal);
 		if (mdSuffix) {
 			notes.push("Found .md suffix version");
 			const output = finalizeOutput(mdSuffix);
@@ -2106,7 +675,7 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		}
 		// 5C: LLM-friendly endpoints
-		const llmContent = await tryLlmEndpoints(origin, timeout);
+		const llmContent = await tryLlmEndpoints(origin, timeout, signal);
 		if (llmContent) {
 			notes.push("Found llms.txt");
 			const output = finalizeOutput(llmContent);
@@ -2123,7 +692,7 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		}
 		// 5D: Content negotiation
-		const negotiated = await tryContentNegotiation(url, timeout);
+		const negotiated = await tryContentNegotiation(url, timeout, signal);
 		if (negotiated) {
 			notes.push(`Content negotiation returned ${negotiated.type}`);
 			const output = finalizeOutput(negotiated.content);
@@ -2143,7 +712,7 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		const feedAlternates = alternates.filter((alt) => !alt.endsWith(".md") && !alt.includes("markdown"));
 		for (const altUrl of feedAlternates.slice(0, 2)) {
 			const resolved = altUrl.startsWith("http") ? altUrl : new URL(altUrl, finalUrl).href;
-			const altResult = await loadPage(resolved, { timeout });
+			const altResult = await loadPage(resolved, { timeout, signal });
 			if (altResult.ok && altResult.content.trim().length > 200) {
 				notes.push(`Used feed alternate: ${resolved}`);
 				const parsed = parseFeedToMarkdown(altResult.content);
@@ -2161,25 +730,14 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 			}
 		}
-		// Step 6: Render HTML with lynx
-		if (!hasCommand("lynx")) {
-			notes.push("lynx not installed");
-			const output = finalizeOutput(rawContent);
-			return {
-				url,
-				finalUrl,
-				contentType: mime,
-				method: "raw-html",
-				content: output.content,
-				fetchedAt,
-				truncated: output.truncated,
-				notes,
-			};
+		if (signal?.aborted) {
+			throw new Error("Operation aborted");
 		}
-		const lynxResult = await renderWithLynx(rawContent, timeout);
-		if (!lynxResult.ok) {
-			notes.push("lynx failed");
+		// Step 6: Render HTML with lynx or html2text
+		const htmlResult = await renderHtmlToText(rawContent, timeout);
+		if (!htmlResult.ok) {
+			notes.push("html rendering failed (lynx/html2text unavailable)");
 			const output = finalizeOutput(rawContent);
 			return {
 				url,
@@ -2194,15 +752,15 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 		}
 		// Step 7: If lynx output is low quality, try extracting document links
-		if (isLowQualityOutput(lynxResult.content)) {
+		if (isLowQualityOutput(htmlResult.content)) {
 			const docLinks = extractDocumentLinks(rawContent, finalUrl);
 			if (docLinks.length > 0) {
 				const docUrl = docLinks[0];
-				const binary = await fetchBinary(docUrl, timeout);
+				const binary = await fetchBinary(docUrl, timeout, signal);
 				if (binary.ok) {
 					const ext = getExtensionHint(docUrl, binary.contentDisposition);
-					const converted = await convertWithMarkitdown(binary.buffer, ext, timeout);
-					if (converted.ok && converted.content.trim().length > lynxResult.content.length) {
+					const converted = await convertWithMarkitdown(binary.buffer, ext, timeout, signal);
+					if (converted.ok && converted.content.trim().length > htmlResult.content.length) {
 						notes.push(`Extracted and converted document: ${docUrl}`);
 						const output = finalizeOutput(converted.content);
 						return {
@@ -2216,17 +774,22 @@ async function renderUrl(url: string, timeout: number, raw: boolean = false): Pr
 							notes,
 						};
 					}
+					if (!converted.ok && converted.error) {
+						notes.push(`markitdown conversion failed: ${converted.error}`);
+					}
+				} else if (binary.error) {
+					notes.push(`Binary fetch failed: ${binary.error}`);
 				}
 			}
 			notes.push("Page appears to require JavaScript or is mostly navigation");
 		}
-		const output = finalizeOutput(lynxResult.content);
+		const output = finalizeOutput(htmlResult.content);
 		return {
 			url,
 			finalUrl,
 			contentType: mime,
-			method: "lynx",
+			method: htmlResult.method,
 			content: output.content,
 			fetchedAt,
 			truncated: output.truncated,
@@ -2278,11 +841,16 @@ export function createWebFetchTool(_session: ToolSession): AgentTool<typeof webF
 		execute: async (
 			_toolCallId: string,
 			{ url, timeout = DEFAULT_TIMEOUT, raw = false }: { url: string; timeout?: number; raw?: boolean },
+			signal?: AbortSignal,
 		) => {
+			if (signal?.aborted) {
+				throw new Error("Operation aborted");
+			}
 			// Clamp timeout
 			const effectiveTimeout = Math.min(Math.max(timeout, 1), 120);
-			const result = await renderUrl(url, effectiveTimeout, raw);
+			const result = await renderUrl(url, effectiveTimeout, raw, signal);
 			// Format output
 			let output = "";
@@ -2319,11 +887,6 @@ export function createWebFetchTool(_session: ToolSession): AgentTool<typeof webF
 // TUI Rendering
 // =============================================================================
-import type { Component } from "@oh-my-pi/pi-tui";
-import { Text } from "@oh-my-pi/pi-tui";
-import { type Theme, theme } from "../../modes/interactive/theme/theme";
-import type { RenderResultOptions } from "../custom-tools/types";
 /** Truncate text to max length with ellipsis */
 function truncate(text: string, maxLen: number, ellipsis: string): string {
 	if (text.length <= maxLen) return text;