npm - pagerts - Versions diffs - 1.4.1 → 1.4.3 - Mend

pagerts 1.4.1 → 1.4.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/README.md CHANGED Viewed

@@ -1,243 +1,242 @@
-# PagerTS
-[![CI/CD Security Pipeline](https://github.com/akinevz2/pagerts/actions/workflows/ci.yml/badge.svg?branch=dev)](https://github.com/akinevz2/pagerts/actions/workflows/ci.yml)
-[![Security](https://img.shields.io/badge/security-maintained-green.svg)](./SECURITY.md)
-[![Node.js Version](https://img.shields.io/badge/node-%3E%3D20.0.0-brightgreen.svg)](https://nodejs.org)
-[![License](https://img.shields.io/badge/license-MIT-blue.svg)](./LICENSE)
-PagerTS is a secure, modern command-line utility that transforms URLs into structured JSON objects, extracting all navigable items and resources from webpages.
-## Features
-- 🔒 **Security-First**: Built-in URL validation, rate limiting, and XSS protection
-- 🚀 **Modern TypeScript**: Strict type checking and modern ES2022 syntax
-- ⚡ **Fast**: Efficient parsing with LinkeDOM and concurrent request handling
-- 🧪 **Well-Tested**: Comprehensive test coverage with Jest
-- 📦 **Easy to Use**: Simple CLI interface with sensible defaults
-## Installation
-### Global Installation
-```bash
-npm install -g pagerts
-pagerts <url>
-```
-### Using npx (No Installation Required)
-```bash
-npx pagerts <url>
-```
-### From Source
-```bash
-git clone https://github.com/akinevz0/pagerts.git
-cd pagerts
-npm install
-npm run build
-npm link
-```
-## Usage
-### Basic Usage
-Extract resources from a remote URL:
-```bash
-pagerts https://example.com
-```
-Extract from multiple URLs:
-```bash
-pagerts https://example.com https://example.org
-```
-Extract from a local HTML file:
-```bash
-pagerts file:///path/to/file.html
-```
-### Output Format
-The output is a JSON object containing:
-```json
-{
-  "title": "Page Title",
-  "url": "https://example.com",
-  "resources": [
-    {
-      "name": "Link Text",
-      "url": "https://example.com/page"
-    }
-  ]
-}
-```
-Fields:
-- `title`: The page's title extracted from the `<title>` tag
-- `url`: The URL of the page
-- `resources`: Array of resources found on the page (links, meta tags, embeds)
-  - `name`: Readable text or description
-  - `url`: Target URL of the resource
-## Security
-PagerTS takes security seriously. See [SECURITY.md](./SECURITY.md) for:
-- Security features and protections
-- How to report vulnerabilities
-- Best practices for users
-- Security checklist for contributors
-### Built-in Security Features
-- ✅ URL validation (only allows `http://`, `https://`, `file://`)
-- ✅ Input sanitization to prevent XSS attacks
-- ✅ Rate limiting (50 requests/minute by default)
-- ✅ Request timeouts to prevent hanging
-- ✅ Maximum URL length enforcement
-- ✅ Suspicious pattern detection
-- ✅ Safe HTML parsing (no script execution)
-## Development
-### Prerequisites
-- Node.js >= 20.0.0
-- npm >= 9.0.0
-### Setup
-```bash
-# Clone the repository
-git clone https://github.com/akinevz0/pagerts.git
-cd pagerts
-# Install dependencies
-npm install
-# Run in development mode
-npm run dev <url>
-```
-### Available Scripts
-```bash
-# Run tests
-npm test
-# Run tests in watch mode
-npm test:watch
-# Build the project
-npm run build
-# Lint code
-npm run lint
-# Fix linting issues
-npm run lint:fix
-# Type check
-npm run type-check
-# Format code
-npm run format
-# Check formatting
-npm run format:check
-# Security audit
-npm run security:audit
-# Complete security check (audit + lint)
-npm run security:check
-```
-### Project Structure
-```
-pagerts/
-├── src/
-│   ├── main.ts                 # CLI entry point
-│   ├── security.ts             # Security utilities
-│   ├── resource.ts             # Resource types
-│   ├── extractors/             # Content extractors
-│   │   ├── AbstractExtractor.ts
-│   │   ├── PageExtractor.ts
-│   │   ├── ResourceExtractor.ts
-│   │   └── TagExtractor.ts
-│   ├── page/                   # Page fetching
-│   │   ├── Page.ts
-│   │   └── PageFetcher.ts
-│   ├── printers/               # Output formatters
-│   │   ├── AbstractResourcePrinter.ts
-│   │   ├── JSONStylePrinter.ts
-│   │   └── LogStylePrinter.ts
-│   └── __tests__/              # Test files
-├── bin/                        # Built files
-├── .github/workflows/          # CI/CD pipelines
-├── package.json
-├── tsconfig.json
-├── jest.config.js
-├── eslint.config.js
-└── SECURITY.md
-```
-## Contributing
-Contributions are welcome! Please:
-1. Fork the repository
-2. Create a feature branch (`git checkout -b feature/amazing-feature`)
-3. Commit your changes (`git commit -m 'Add amazing feature'`)
-4. Push to the branch (`git push origin feature/amazing-feature`)
-5. Open a Pull Request
-### Contribution Guidelines
-- Write tests for new features
-- Follow the existing code style (enforced by ESLint and Prettier)
-- Update documentation as needed
-- Ensure all tests pass (`npm test`)
-- Run security checks (`npm run security:check`)
-- Follow security best practices (see [SECURITY.md](./SECURITY.md))
-## License
-This project is licensed under the MIT License - see the [LICENSE](./LICENSE) file for details.
-## Author
-**Kirill <kine> Nevzorov**
-## Support
-- 🐛 [Report bugs](https://github.com/akinevz0/pagerts/issues)
-- 💡 [Request features](https://github.com/akinevz0/pagerts/issues)
-- 🔒 [Report security issues](./SECURITY.md)
-## Changelog
-### v0.3.0 (Latest)
-- ✨ Added comprehensive security features
-- ✨ Implemented URL validation and sanitization
-- ✨ Added rate limiting
-- ✨ Modernized codebase with TypeScript strict mode
-- ✨ Added ESLint with security plugin
-- ✨ Added comprehensive test suite
-- ✨ Added CI/CD with GitHub Actions
-- ✨ Improved error handling and retry logic
-- 📚 Added security documentation
-### v0.2.0
-- Initial public release
+# PagerTS
+[![CI/CD Security Pipeline](https://github.com/akinevz2/pagerts/actions/workflows/ci.yml/badge.svg?branch=main-stable)](https://github.com/akinevz2/pagerts/actions/workflows/ci.yml)
+[![Security](https://img.shields.io/badge/security-maintained-green.svg)](./SECURITY.md)
+[![Node.js Version](https://img.shields.io/badge/node-%3E%3D20.0.0-brightgreen.svg)](https://nodejs.org)
+[![License](https://img.shields.io/badge/license-MIT-blue.svg)](./LICENSE)
+PagerTS is a secure, modern command-line utility that transforms URLs into structured JSON objects, extracting all navigable items and resources from webpages.
+## Features
+- 🔒 **Security-First**: Built-in URL validation, rate limiting, and XSS protection
+- 🚀 **Modern TypeScript**: Strict type checking and modern ES2022 syntax
+- ⚡ **Fast**: Efficient parsing with LinkeDOM and concurrent request handling
+- 🧪 **Well-Tested**: Comprehensive test coverage with Jest
+- 📦 **Easy to Use**: Simple CLI interface with sensible defaults
+## Installation
+### Global Installation
+```bash
+npm install -g pagerts
+pagerts <url>
+```
+### Using npx (No Installation Required)
+```bash
+npx pagerts <url>
+```
+### From Source
+```bash
+git clone https://github.com/akinevz0/pagerts.git
+cd pagerts
+npm install
+npm run build
+npm link
+```
+## Usage
+### Basic Usage
+Extract resources from a remote URL:
+```bash
+pagerts https://example.com
+```
+Extract from multiple URLs:
+```bash
+pagerts https://example.com https://example.org
+```
+Extract from a local HTML file:
+```bash
+pagerts file:///path/to/file.html
+```
+### Output Format
+The output is a JSON object containing:
+```json
+{
+  "title": "Page Title",
+  "url": "https://example.com",
+  "resources": [
+    {
+      "name": "Link Text",
+      "url": "https://example.com/page"
+    }
+  ]
+}
+```
+Fields:
+- `title`: The page's title extracted from the `<title>` tag
+- `url`: The URL of the page
+- `resources`: Array of resources found on the page (links, meta tags, embeds)
+  - `name`: Readable text or description
+  - `url`: Target URL of the resource
+## Security
+PagerTS takes security seriously. See [SECURITY.md](./SECURITY.md) for:
+- Security features and protections
+- How to report vulnerabilities
+- Best practices for users
+- Security checklist for contributors
+### Built-in Security Features
+- ✅ URL validation (only allows `http://`, `https://`, `file://`)
+- ✅ Input sanitization to prevent XSS attacks
+- ✅ Rate limiting (50 requests/minute by default)
+- ✅ Request timeouts to prevent hanging
+- ✅ Maximum URL length enforcement
+- ✅ Suspicious pattern detection
+- ✅ Safe HTML parsing (no script execution)
+## Development
+### Prerequisites
+- Node.js >= 20.0.0
+- npm >= 9.0.0
+### Setup
+```bash
+# Clone the repository
+git clone https://github.com/akinevz0/pagerts.git
+cd pagerts
+# Install dependencies
+npm install
+# Run in development mode
+npm run dev <url>
+```
+### Available Scripts
+```bash
+# Run tests
+npm test
+# Run tests in watch mode
+npm test:watch
+# Build the project
+npm run build
+# Lint code
+npm run lint
+# Fix linting issues
+npm run lint:fix
+# Type check
+npm run type-check
+# Format code
+npm run format
+# Check formatting
+npm run format:check
+# Security audit
+npm run security:audit
+# Complete security check (audit + lint)
+npm run security:check
+```
+### Project Structure
+```
+pagerts/
+├── src/
+│   ├── main.ts                 # CLI entry point
+│   ├── security.ts             # Security utilities
+│   ├── resource.ts             # Resource types
+│   ├── extractors/             # Content extractors
+│   │   ├── AbstractExtractor.ts
+│   │   ├── PageExtractor.ts
+│   │   ├── ResourceExtractor.ts
+│   │   └── TagExtractor.ts
+│   ├── page/                   # Page fetching
+│   │   ├── Page.ts
+│   │   └── PageFetcher.ts
+│   ├── printers/               # Output formatters
+│   │   ├── AbstractResourcePrinter.ts
+│   │   ├── JSONStylePrinter.ts
+│   │   └── LogStylePrinter.ts
+│   └── __tests__/              # Test files
+├── bin/                        # Built files
+├── .github/workflows/          # CI/CD pipelines
+├── package.json
+├── tsconfig.json
+├── jest.config.js
+├── eslint.config.js
+└── SECURITY.md
+```
+## Contributing
+Contributions are welcome! Please:
+1. Fork the repository
+2. Create a feature branch (`git checkout -b feature/amazing-feature`)
+3. Commit your changes (`git commit -m 'Add amazing feature'`)
+4. Push to the branch (`git push origin feature/amazing-feature`)
+5. Open a Pull Request
+### Contribution Guidelines
+- Write tests for new features
+- Follow the existing code style (enforced by ESLint and Prettier)
+- Update documentation as needed
+- Ensure all tests pass (`npm test`)
+- Run security checks (`npm run security:check`)
+- Follow security best practices (see [SECURITY.md](./SECURITY.md))
+## License
+This project is licensed under the MIT License - see the [LICENSE](./LICENSE) file for details.
+## Author
+**Kirill <kine> Nevzorov**
+## Support
+- 🐛 [Report bugs](https://github.com/akinevz0/pagerts/issues)
+- 💡 [Request features](https://github.com/akinevz0/pagerts/issues)
+- 🔒 [Report security issues](./SECURITY.md)
+## Changelog
+### v0.3.0 -> v1.4.1 summary
+Key changes in this range:
+- Security hardening and dependency-surface reduction (`863389a`).
+- CI/security gate tightening and scan-noise cleanup (`da73bdb`, `46875e8`).
+- Packaging/runtime interoperability fixes for CJS/ESM builds and publishes (`4054ab9`, `74d3f98`, `64b2a2f`, `e67acd6`).
+- Regression fix for ignored script resources (`bc13b55`).
+- Dependency tree refresh/stabilization (`1f8f86d`) and release bump to `v1.4.1` (`8846bec`).
+- General code hardening and cleanup across extractors/fetching/printers, plus lockfile and build artifact maintenance in the same span.
+### v0.2.0
+- Initial public release

package/bin/main.js CHANGED Viewed

@@ -1,12 +1,361 @@
 #!/usr/bin/env node
-import{Command as q,createArgument as _,Option as $}from"commander";var w={name:"pagerts",description:"A tool for viewing external relations in a webpage",version:"1.3.0",type:"module",main:"main.js",bin:{pagerts:"bin/main.js"},files:["bin"],engines:{node:">=18.0.0"},scripts:{test:"jest --coverage","test:watch":"jest --watch",build:"esbuild src/main.ts --bundle --packages=external --outdir=bin --minify --sourcemap --platform=node --format=esm",lint:"eslint src/**/*.ts","lint:fix":"eslint src/**/*.ts --fix","type-check":"tsc --noEmit",format:'prettier --write "src/**/*.ts"',"format:check":'prettier --check "src/**/*.ts"',"security:audit":"npm audit --audit-level=moderate","security:check":"npm run security:audit && npm run lint",start:"node ./bin/main.js",dev:"tsx src/main.ts",prepare:"npm run build"},keywords:["webpage","hierarchy","management","web-scraping","cli","url-extraction"],author:"Kirill <kine> Nevzorov",license:"MIT",bugs:{url:"https://github.com/akinevz2/pagerts/issues"},homepage:"https://github.com/akinevz2/pagerts",dependencies:{"@exodus/bytes":"^1.15.0",commander:"^12.1.0",linkedom:"^0.18.9"},devDependencies:{"@types/jest":"^29.5.14","@types/node":"^22.10.5","@typescript-eslint/eslint-plugin":"^8.20.0","@typescript-eslint/parser":"^8.20.0",esbuild:"^0.25.1",eslint:"^9.18.0","eslint-config-prettier":"^9.1.0","eslint-plugin-security":"^3.0.1",jest:"^29.7.0",prettier:"^3.4.2","ts-jest":"^29.2.5",tsx:"^4.19.2",typescript:"^5.7.2"}};var u=class{constructor(t){this.name=t}};var d=class extends u{constructor(){super("page-extractor")}async extract(t){let{window:{document:e},url:r}=t;return{title:e.title,url:r}}};var L=["id","innerText","textContent","class","ariaLabel","ariaDescription","alt"],k=["href","data-src","target","action","src","url"],P=(s,t)=>{let e=s.getAttribute(t);return e!=null&&e.trim()!==""?e:void 0};function b(s){for(let t of L){let e=P(s,t);if(e!==void 0)return{key:t,value:e}}}function v(s){for(let t of k){let e=P(s,t);if(e!==void 0)return{key:t,value:e}}}var g=class extends u{constructor(e){super("page-extractor");this.tags=e}async extract(e){let{document:r}=e.window;return this.tags.flatMap(o=>Array.from(r.querySelectorAll(o)).flatMap(i=>{let a=v(i);return a?[{text:b(i)??{key:"src",value:a.value},link:a}]:[]}))}};import{readFile as O}from"fs/promises";import{parseHTML as D}from"linkedom";import{legacyHookDecode as S}from"@exodus/bytes/encoding.js";var f=class{timeout;maxRetries;constructor(t=1e4,e=2){this.timeout=t,this.maxRetries=e}buildDOMResult(t,e){let{document:r}=D(t);return{window:{document:r},url:e}}async fetchPage(t,e=0){try{let r;t.startsWith("file://")?r=O(t.substring(7),"utf-8").then(i=>this.buildDOMResult(i,t)):r=fetch(t).then(async i=>{let a=await i.arrayBuffer(),x=i.headers.get("content-type")??"",m=/charset=([^\s;]+)/i.exec(x),n=S(new Uint8Array(a),m?.[1]??"utf-8");return this.buildDOMResult(n,t)});let o=await(this.timeout>0?Promise.race([r,new Promise((i,a)=>setTimeout(()=>a(new Error("Request timeout")),this.timeout))]):r);return{url:t,content:o}}catch(r){let o=r instanceof Error?r.message:"Unknown error";return e<this.maxRetries&&this.isRetryableError(o)?(process.stderr.write(`Retrying ${t} (attempt ${e+1}/${this.maxRetries})...
-`),await this.delay(1e3*(e+1)),this.fetchPage(t,e+1)):{url:t,error:`Failed to fetch: ${o}`}}}isRetryableError(t){return[/timeout/i,/ECONNRESET/i,/ETIMEDOUT/i,/ENOTFOUND/i,/network/i].some(r=>r.test(t))}delay(t){return new Promise(e=>setTimeout(e,t))}async fetchAll(t){return(await Promise.all(t.map(r=>this.fetchPage(r)))).filter(r=>r.content!==void 0||r.error)}};var p=class{constructor(){}};var y=class extends p{print(...t){let e=JSON.stringify(t);process.stdout.write(e+`
-`)}};var E=["http:","https:","file:"];var K=[/javascript:/i,/data:/i,/vbscript:/i,/<script/i,/on\w+=/i];function N(s){if(!s||!s.trim())return{isValid:!1,error:"URL cannot be empty"};let t=s.trim();if(t.length>2048)return{isValid:!1,error:"URL exceeds maximum length of 2048 characters"};for(let i of K)if(i.test(t))return{isValid:!1,error:"URL contains suspicious patterns"};let e;try{e=new URL(t)}catch{return t.startsWith("file://")?{isValid:!0,sanitizedUrl:t}:{isValid:!1,error:"Invalid URL format"}}if(!E.includes(e.protocol))return{isValid:!1,error:`Protocol ${e.protocol} is not allowed. Allowed protocols: ${E.join(", ")}`};let r=e.hostname.toLowerCase();return(r==="localhost"||r==="127.0.0.1"||r==="::1"||r.startsWith("192.168.")||r.startsWith("10.")||/^172\.(1[6-9]|2\d|3[01])\./.test(r))&&e.protocol!=="file:"&&console.warn(`Warning: Accessing local network resource: ${t}`),{isValid:!0,sanitizedUrl:e.toString()}}function M(s){let t=[],e=[];for(let r of s){let o=N(r);o.isValid&&o.sanitizedUrl?t.push(o.sanitizedUrl):e.push({url:r,error:o.error||"Unknown validation error"})}return{validUrls:t,errors:e}}var{description:I,name:V,version:C}=w,z=new q,F=_("<url | file...>","remote https://URL or local file://resource.html to extract from");(async()=>await z.name(V).version(C,"-v, --version").description(I).addArgument(F).addOption(new $("--watch","keep running: SIGWINCH re-fetches after resize, Ctrl-D releases in-flight requests, Ctrl-C exits")).action(async(s,t)=>{try{let{validUrls:e,errors:r}=M(s);r.length>0&&(console.error(`
-\u274C URL Validation Errors:`),r.forEach(({url:n,error:c})=>{console.error(`  - ${n}: ${c}`)})),e.length===0&&(console.error(`
-\u274C No valid URLs to process. Exiting.`),process.exit(1)),console.error(`
-\u2705 Processing ${e.length} valid URL(s)...`);let o=new y,i=new f(t.watch?0:1e4,2),a=new d,x=new g(["a","meta","link","embed","script"]),m=async()=>{let n=await i.fetchAll(e),c=[];for(let{content:l,url:T,error:h}of n){let R=h!==void 0||!l?[]:await x.extract(l),U=h!==void 0||!l?{url:T,error:h??"Unknown error",resources:R}:await a.extract(l);c.push({...U,resources:R})}await o.print(...c)};if(t.watch){process.stdin.resume(),process.on("SIGINT",()=>{process.exit(0)});let n=null;process.stdin.on("end",()=>{n=null});let c=null;process.on("SIGWINCH",()=>{c!==null&&clearTimeout(c),c=setTimeout(()=>{c=null,n=m().catch(l=>{console.error(`
-\u274C An error occurred:`,l instanceof Error?l.message:l)})},150)}),n=m(),await n}else await m()}catch(e){console.error(`
-\u274C An error occurred:`,e instanceof Error?e.message:e),process.exit(1)}}).parseAsync(process.argv))();
+// src/main.ts
+import { Command, createArgument, Option } from "commander";
+import { createRequire } from "node:module";
+// src/extractors/AbstractExtractor.ts
+var AbstractExtractor = class {
+  constructor(name2) {
+    this.name = name2;
+  }
+};
+// src/extractors/PageExtractor.ts
+var PageExtractor = class extends AbstractExtractor {
+  constructor() {
+    super("page-extractor");
+  }
+  async extract(value) {
+    const {
+      window: { document },
+      url
+    } = value;
+    return { title: document.title, url };
+  }
+};
+// src/resource.ts
+var RESOURCE_DISPLAYABLE_KEYS = [
+  "id",
+  "innerText",
+  "textContent",
+  "class",
+  "ariaLabel",
+  "ariaDescription",
+  "alt"
+];
+var RESOURCE_LINK_KEYS = ["href", "data-src", "target", "action", "src", "url"];
+var readAttr = (element, key) => {
+  const v = element.getAttribute(key);
+  return v != null && v.trim() !== "" ? v : void 0;
+};
+function findResourceText(element) {
+  for (const key of RESOURCE_DISPLAYABLE_KEYS) {
+    const value = readAttr(element, key);
+    if (value !== void 0) return { key, value };
+  }
+  return void 0;
+}
+function findResourceLink(element) {
+  for (const key of RESOURCE_LINK_KEYS) {
+    const value = readAttr(element, key);
+    if (value !== void 0) return { key, value };
+  }
+  return void 0;
+}
+// src/extractors/ResourceExtractor.ts
+var ResourceExtractor = class extends AbstractExtractor {
+  constructor(tags) {
+    super("page-extractor");
+    this.tags = tags;
+  }
+  async extract(value) {
+    const { document } = value.window;
+    return this.tags.flatMap(
+      (tag) => Array.from(document.querySelectorAll(tag)).flatMap((element) => {
+        const link = findResourceLink(element);
+        if (!link) return [];
+        const text = findResourceText(element) ?? { key: "src", value: link.value };
+        return [{ text, link }];
+      })
+    );
+  }
+};
+// src/page/PageFetcher.ts
+import { parseHTML } from "linkedom";
+var PageFetcher = class {
+  timeout;
+  maxRetries;
+  constructor(timeout = 1e4, maxRetries = 2) {
+    this.timeout = timeout;
+    this.maxRetries = maxRetries;
+  }
+  buildDOMResult(html, url) {
+    const { document } = parseHTML(html);
+    return { window: { document }, url };
+  }
+  decodeHtml(buffer, charset) {
+    try {
+      return new TextDecoder(charset).decode(new Uint8Array(buffer));
+    } catch {
+      return new TextDecoder("utf-8").decode(new Uint8Array(buffer));
+    }
+  }
+  async fetchPage(url, retryCount = 0) {
+    try {
+      const domPromise = fetch(url).then(async (response) => {
+        const buffer = await response.arrayBuffer();
+        const contentType = response.headers.get("content-type") ?? "";
+        const charsetMatch = /charset=([^\s;]+)/i.exec(contentType);
+        const html = this.decodeHtml(buffer, charsetMatch?.[1] ?? "utf-8");
+        return this.buildDOMResult(html, url);
+      });
+      const content = await (this.timeout > 0 ? Promise.race([
+        domPromise,
+        new Promise(
+          (_, reject) => setTimeout(() => reject(new Error("Request timeout")), this.timeout)
+        )
+      ]) : domPromise);
+      return { url, content };
+    } catch (error) {
+      const message = error instanceof Error ? error.message : "Unknown error";
+      if (retryCount < this.maxRetries && this.isRetryableError(message)) {
+        process.stderr.write(`Retrying ${url} (attempt ${retryCount + 1}/${this.maxRetries})...
+`);
+        await this.delay(1e3 * (retryCount + 1));
+        return this.fetchPage(url, retryCount + 1);
+      }
+      return { url, error: `Failed to fetch: ${message}` };
+    }
+  }
+  isRetryableError(message) {
+    const retryablePatterns = [/timeout/i, /ECONNRESET/i, /ETIMEDOUT/i, /ENOTFOUND/i, /network/i];
+    return retryablePatterns.some((pattern) => pattern.test(message));
+  }
+  delay(ms) {
+    return new Promise((resolve) => setTimeout(resolve, ms));
+  }
+  async fetchAll(urls) {
+    const responses = await Promise.all(urls.map((url) => this.fetchPage(url)));
+    return responses.filter((response) => response.content !== void 0 || response.error);
+  }
+};
+// src/page/FileFetcher.ts
+import { readFile } from "node:fs/promises";
+import { parseHTML as parseHTML2 } from "linkedom";
+var MAX_FILES_FAILSAFE = 254;
+var FileFetcher = class {
+  buildDOMResult(html, filePath) {
+    const { document } = parseHTML2(html);
+    return { window: { document }, url: `file://${filePath}` };
+  }
+  async fetchFile(filePath) {
+    try {
+      const html = await readFile(filePath, "utf-8");
+      return { path: filePath, content: this.buildDOMResult(html, filePath) };
+    } catch (error) {
+      return {
+        path: filePath,
+        error: error instanceof Error ? error.message : "Unknown error"
+      };
+    }
+  }
+  async fetchAll(filePaths) {
+    return Promise.all(filePaths.map((p) => this.fetchFile(p)));
+  }
+};
+// src/printers/AbstractResourcePrinter.ts
+var AbstractResourcePrinter = class {
+  constructor() {
+  }
+};
+// src/printers/JSONStylePrinter.ts
+var JSONStylePrinter = class extends AbstractResourcePrinter {
+  print(...pages) {
+    const json = JSON.stringify(pages);
+    process.stdout.write(json + "\n");
+  }
+};
+// src/security.ts
+var ALLOWED_PROTOCOLS = ["http:", "https:"];
+var MAX_URL_LENGTH = 2048;
+var SUSPICIOUS_PATTERNS = [
+  /javascript:/i,
+  /data:/i,
+  /vbscript:/i,
+  /<script/i,
+  /on\w+=/i
+  // Event handlers like onclick=
+];
+function validateUrl(url) {
+  if (!url || !url.trim()) {
+    return {
+      isValid: false,
+      error: "URL cannot be empty"
+    };
+  }
+  const trimmedUrl = url.trim();
+  if (trimmedUrl.length > MAX_URL_LENGTH) {
+    return {
+      isValid: false,
+      error: `URL exceeds maximum length of ${MAX_URL_LENGTH} characters`
+    };
+  }
+  for (const pattern of SUSPICIOUS_PATTERNS) {
+    if (pattern.test(trimmedUrl)) {
+      return {
+        isValid: false,
+        error: "URL contains suspicious patterns"
+      };
+    }
+  }
+  let parsedUrl;
+  try {
+    parsedUrl = new URL(trimmedUrl);
+  } catch {
+    return {
+      isValid: false,
+      error: "Invalid URL format"
+    };
+  }
+  if (!ALLOWED_PROTOCOLS.includes(parsedUrl.protocol)) {
+    return {
+      isValid: false,
+      error: `Protocol ${parsedUrl.protocol} is not allowed. Allowed protocols: ${ALLOWED_PROTOCOLS.join(", ")}`
+    };
+  }
+  const hostname = parsedUrl.hostname.toLowerCase();
+  const isLocalhost = hostname === "localhost" || hostname === "127.0.0.1" || hostname === "::1" || hostname.startsWith("192.168.") || hostname.startsWith("10.") || /^172\.(1[6-9]|2\d|3[01])\./.test(hostname);
+  if (isLocalhost) {
+    console.warn(`Warning: Accessing local network resource: ${trimmedUrl}`);
+  }
+  return {
+    isValid: true,
+    sanitizedUrl: parsedUrl.toString()
+  };
+}
+function validateUrls(urls) {
+  const validUrls = [];
+  const errors = [];
+  for (const url of urls) {
+    const result = validateUrl(url);
+    if (result.isValid && result.sanitizedUrl) {
+      validUrls.push(result.sanitizedUrl);
+    } else {
+      errors.push({
+        url,
+        error: result.error || "Unknown validation error"
+      });
+    }
+  }
+  return { validUrls, errors };
+}
+// src/main.ts
+var require2 = createRequire(import.meta.url);
+var pkg = require2("../package.json");
+var { description, name, version } = pkg;
+var program = new Command();
+var urlArg = createArgument("<url...>", "remote https://URL to extract from");
+var fileArg = createArgument("<paths...>", "local file paths to extract from");
+var pageExtractor = new PageExtractor();
+var resourceExtractor = new ResourceExtractor(["a", "meta", "link", "embed", "script"]);
+var printer = new JSONStylePrinter();
+async function buildPageMetadata(responses) {
+  const pageMetadatas = [];
+  for (const { content, url: responseUrl, path, error } of responses) {
+    const resolvedUrl = responseUrl ?? path ?? "";
+    const resources = error !== void 0 || !content ? [] : await resourceExtractor.extract(content);
+    const descriptor = error !== void 0 || !content ? { url: resolvedUrl, error: error ?? "Unknown error", resources } : await pageExtractor.extract(content);
+    pageMetadatas.push({ ...descriptor, resources });
+  }
+  return pageMetadatas;
+}
+(async () => {
+  program.name(name).version(version, "-v, --version").description(description);
+  program.command("fetch", { isDefault: true }).description("fetch and extract resources from remote URL(s)").addArgument(urlArg).addOption(
+    new Option(
+      "--watch",
+      "keep running: SIGWINCH re-fetches after resize, Ctrl-D releases in-flight requests, Ctrl-C exits"
+    )
+  ).action(async (urls, options) => {
+    try {
+      const { validUrls, errors } = validateUrls(urls);
+      if (errors.length > 0) {
+        console.error("\n\u274C URL Validation Errors:");
+        errors.forEach(({ url: invalidUrl, error }) => {
+          console.error(`  - ${invalidUrl}: ${error}`);
+        });
+      }
+      if (validUrls.length === 0) {
+        console.error("\n\u274C No valid URLs to process. Exiting.");
+        process.exit(1);
+      }
+      console.error(`
+\u2705 Processing ${validUrls.length} valid URL(s)...`);
+      const pageFetcher = new PageFetcher(options.watch ? 0 : 1e4, 2);
+      const execute = async () => {
+        const responses = await pageFetcher.fetchAll(validUrls);
+        const pageMetadatas = await buildPageMetadata(responses);
+        await printer.print(...pageMetadatas);
+      };
+      if (options.watch) {
+        process.stdin.resume();
+        process.on("SIGINT", () => process.exit(0));
+        let activeExecution = null;
+        process.stdin.on("end", () => {
+          activeExecution = null;
+        });
+        let winchTimer = null;
+        process.on("SIGWINCH", () => {
+          if (winchTimer !== null) clearTimeout(winchTimer);
+          winchTimer = setTimeout(() => {
+            winchTimer = null;
+            activeExecution = execute().catch((err) => {
+              console.error("\n\u274C An error occurred:", err instanceof Error ? err.message : err);
+            });
+          }, 150);
+        });
+        activeExecution = execute();
+        await activeExecution;
+      } else {
+        await execute();
+      }
+    } catch (error) {
+      console.error("\n\u274C An error occurred:", error instanceof Error ? error.message : error);
+      process.exit(1);
+    }
+  });
+  program.command("file").description("extract resources from local file(s) via direct filesystem access").addArgument(fileArg).addOption(
+    new Option("--no-failsafe", `bypass the ${MAX_FILES_FAILSAFE}-file limit safety check`)
+  ).action(async (paths, options) => {
+    try {
+      if (options.failsafe && paths.length > MAX_FILES_FAILSAFE) {
+        console.error(
+          `
+\u274C ${paths.length} files specified exceeds the safety limit of ${MAX_FILES_FAILSAFE}.`
+        );
+        console.error(`   Pass --no-failsafe to bypass this check and process all files.`);
+        process.exit(1);
+      }
+      if (!options.failsafe && paths.length > MAX_FILES_FAILSAFE) {
+        console.error(
+          `
+\u26A0\uFE0F  Failsafe bypassed: processing ${paths.length} files (limit is ${MAX_FILES_FAILSAFE}).`
+        );
+      }
+      console.error(`
+\u2705 Processing ${paths.length} file(s)...`);
+      const fileFetcher = new FileFetcher();
+      const responses = await fileFetcher.fetchAll(paths);
+      const pageMetadatas = await buildPageMetadata(
+        responses.map(({ path, content, error }) => ({ path, content, error }))
+      );
+      await printer.print(...pageMetadatas);
+    } catch (error) {
+      console.error("\n\u274C An error occurred:", error instanceof Error ? error.message : error);
+      process.exit(1);
+    }
+  });
+  await program.parseAsync(process.argv);
+})();
 /**
  * @license MIT
  * We are interested in visualising a page as a collection of tags.

package/bin/main.js.map CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "version": 3,
-  "sources": ["../src/main.ts", "../package.json", "../src/extractors/AbstractExtractor.ts", "../src/extractors/PageExtractor.ts", "../src/resource.ts", "../src/extractors/ResourceExtractor.ts", "../src/page/PageFetcher.ts", "../src/printers/AbstractResourcePrinter.ts", "../src/printers/JSONStylePrinter.ts", "../src/security.ts"],
-  "sourcesContent": ["#!/usr/bin/env node\nimport { Command, createArgument, Option } from 'commander';\n\nimport pkg from '../package.json' with { type: 'json' };\nimport { PageExtractor, ResourceExtractor } from './extractors/index.js';\nimport { PageFetcher, type PageMetadata } from './page/index.js';\nimport { JSONStylePrinter } from './printers/index.js';\nimport { validateUrls } from './security.js';\n\nconst { description, name, version } = pkg;\n\nconst program = new Command();\n\nconst url = createArgument(\n  '<url | file...>',\n  'remote https://URL or local file://resource.html to extract from'\n);\n\n(async (): Promise<void> => {\n  await program\n    .name(name)\n    .version(version, '-v, --version')\n    .description(description)\n    .addArgument(url)\n    .addOption(new Option('--watch', 'keep running: SIGWINCH re-fetches after resize, Ctrl-D releases in-flight requests, Ctrl-C exits'))\n    .action(async (urls: string[], options: { watch: boolean }) => {\n      try {\n        // Validate URLs first\n        const { validUrls, errors } = validateUrls(urls);\n\n        // Report validation errors\n        if (errors.length > 0) {\n          console.error('\\n\u274C URL Validation Errors:');\n          errors.forEach(({ url: invalidUrl, error }) => {\n            console.error(`  - ${invalidUrl}: ${error}`);\n          });\n        }\n\n        // Exit if no valid URLs\n        if (validUrls.length === 0) {\n          console.error('\\n\u274C No valid URLs to process. Exiting.');\n          process.exit(1);\n        }\n\n        console.error(`\\n\u2705 Processing ${validUrls.length} valid URL(s)...`);\n\n        const printer = new JSONStylePrinter();\n        // watch mode is unbounded (timeout=0); default mode uses 10s timeout\n        const pageFetcher = new PageFetcher(options.watch ? 0 : 10000, 2);\n        const pageExtractor = new PageExtractor();\n        const resourceExtractor = new ResourceExtractor(['a', 'meta', 'link', 'embed', 'script']);\n\n        const execute = async (): Promise<void> => {\n          const pageResponses = await pageFetcher.fetchAll(validUrls);\n          const pageMetadatas: PageMetadata[] = [];\n\n          for (const { content, url: responseUrl, error } of pageResponses) {\n            const resources =\n              error !== undefined || !content ? [] : await resourceExtractor.extract(content);\n            const descriptor =\n              error !== undefined || !content\n                ? { url: responseUrl, error: error ?? 'Unknown error', resources }\n                : await pageExtractor.extract(content);\n            pageMetadatas.push({ ...descriptor, resources });\n\n\n          }\n\n          await printer.print(...pageMetadatas);\n        };\n\n        if (options.watch) {\n          process.stdin.resume();\n\n          process.on('SIGINT', () => {\n            process.exit(0);\n          });\n\n          let activeExecution: Promise<void> | null = null;\n\n          process.stdin.on('end', () => {\n            // Ctrl-D: detach in-flight requests and let them fly off\n            activeExecution = null;\n          });\n\n          let winchTimer: ReturnType<typeof setTimeout> | null = null;\n          process.on('SIGWINCH', () => {\n            if (winchTimer !== null) clearTimeout(winchTimer);\n            winchTimer = setTimeout(() => {\n              winchTimer = null;\n              activeExecution = execute().catch((err: unknown) => {\n                console.error('\\n\u274C An error occurred:', err instanceof Error ? err.message : err);\n              });\n            }, 150);\n          });\n\n          activeExecution = execute();\n          await activeExecution;\n        } else {\n          await execute();\n        }\n      } catch (error) {\n        console.error('\\n\u274C An error occurred:', error instanceof Error ? error.message : error);\n        process.exit(1);\n      }\n    })\n    .parseAsync(process.argv);\n})();\n", "{\r\n  \"name\": \"pagerts\",\r\n  \"description\": \"A tool for viewing external relations in a webpage\",\r\n  \"version\": \"1.3.0\",\r\n  \"type\": \"module\",\r\n  \"main\": \"main.js\",\r\n  \"bin\": {\r\n    \"pagerts\": \"bin/main.js\"\r\n  },\r\n  \"files\": [\r\n    \"bin\"\r\n  ],\r\n  \"engines\": {\r\n    \"node\": \">=18.0.0\"\r\n  },\r\n  \"scripts\": {\r\n    \"test\": \"jest --coverage\",\r\n    \"test:watch\": \"jest --watch\",\r\n    \"build\": \"esbuild src/main.ts --bundle --packages=external --outdir=bin --minify --sourcemap --platform=node --format=esm\",\r\n    \"lint\": \"eslint src/**/*.ts\",\r\n    \"lint:fix\": \"eslint src/**/*.ts --fix\",\r\n    \"type-check\": \"tsc --noEmit\",\r\n    \"format\": \"prettier --write \\\"src/**/*.ts\\\"\",\r\n    \"format:check\": \"prettier --check \\\"src/**/*.ts\\\"\",\r\n    \"security:audit\": \"npm audit --audit-level=moderate\",\r\n    \"security:check\": \"npm run security:audit && npm run lint\",\r\n    \"start\": \"node ./bin/main.js\",\r\n    \"dev\": \"tsx src/main.ts\",\r\n    \"prepare\": \"npm run build\"\r\n  },\r\n  \"keywords\": [\r\n    \"webpage\",\r\n    \"hierarchy\",\r\n    \"management\",\r\n    \"web-scraping\",\r\n    \"cli\",\r\n    \"url-extraction\"\r\n  ],\r\n  \"author\": \"Kirill <kine> Nevzorov\",\r\n  \"license\": \"MIT\",\r\n  \"bugs\": {\r\n    \"url\": \"https://github.com/akinevz2/pagerts/issues\"\r\n  },\r\n  \"homepage\": \"https://github.com/akinevz2/pagerts\",\r\n  \"dependencies\": {\r\n    \"@exodus/bytes\": \"^1.15.0\",\r\n    \"commander\": \"^12.1.0\",\r\n    \"linkedom\": \"^0.18.9\"\r\n  },\r\n  \"devDependencies\": {\r\n    \"@types/jest\": \"^29.5.14\",\r\n    \"@types/node\": \"^22.10.5\",\r\n    \"@typescript-eslint/eslint-plugin\": \"^8.20.0\",\r\n    \"@typescript-eslint/parser\": \"^8.20.0\",\r\n    \"esbuild\": \"^0.25.1\",\r\n    \"eslint\": \"^9.18.0\",\r\n    \"eslint-config-prettier\": \"^9.1.0\",\r\n    \"eslint-plugin-security\": \"^3.0.1\",\r\n    \"jest\": \"^29.7.0\",\r\n    \"prettier\": \"^3.4.2\",\r\n    \"ts-jest\": \"^29.2.5\",\r\n    \"tsx\": \"^4.19.2\",\r\n    \"typescript\": \"^5.7.2\"\r\n  }\r\n}", "export abstract class AbstractExtractor<V, R> {\n  constructor(readonly name: string) {}\n  abstract extract(value: V): Promise<R>;\n}\n", "import type { Page } from '../page/index.js';\nimport type { DOMResult } from '../page/index.js';\nimport { AbstractExtractor } from './AbstractExtractor.js';\n\nexport class PageExtractor extends AbstractExtractor<DOMResult, Page> {\n  constructor() {\n    super('page-extractor');\n  }\n\n  async extract(value: DOMResult): Promise<Page> {\n    const { window: { document }, url } = value;\n    return { title: document.title, url };\n  }\n}\n", "/**\n * @license MIT\n * We are interested in visualising a page as a collection of tags.\n *\n * We wish to work with tags that can be compactly previewed on a webpage.\n * Here we must declare all of the element types that can be used to represent\n * a resource that can be hyperlinked off a webpage.\n */\ntype Tags = HTMLElementTagNameMap;\n\nexport const RESOURCE_DISPLAYABLE_KEYS = [\n  'id',\n  'innerText',\n  'textContent',\n  'class',\n  'ariaLabel',\n  'ariaDescription',\n  'alt',\n] as const;\n\nexport type DisplayableKey = (typeof RESOURCE_DISPLAYABLE_KEYS)[number];\n\nexport const RESOURCE_LINK_KEYS = ['href', 'data-src', 'target', 'action', 'src', 'url'] as const;\n\nexport type LinkKey = (typeof RESOURCE_LINK_KEYS)[number];\n\nexport type AttributeKey = DisplayableKey | LinkKey;\n\nexport type ResourceKey = { key: AttributeKey; value: string };\nexport type ResourceLink = { key: LinkKey; value: string };\n\nexport type ExternalResource = {\n  text: ResourceKey;\n  link: ResourceLink;\n};\n\nexport type Tag = keyof Tags;\n\nexport type Resource = HTMLElement & {\n  [K in AttributeKey]?: string | null;\n};\n\nexport type ResourceByName<T extends keyof Tags> = Tags[T];\n\n// --- adapters ---\n\nconst readAttr = (element: Resource, key: AttributeKey): string | undefined => {\n  const v = element.getAttribute(key);\n  return v != null && v.trim() !== '' ? v : undefined;\n};\n\nexport function findResourceText(element: Resource): ResourceKey | undefined {\n  for (const key of RESOURCE_DISPLAYABLE_KEYS) {\n    const value = readAttr(element, key);\n    if (value !== undefined) return { key, value };\n  }\n  return undefined;\n}\n\nexport function findResourceLink(element: Resource): ResourceLink | undefined {\n  for (const key of RESOURCE_LINK_KEYS) {\n    const value = readAttr(element, key);\n    if (value !== undefined) return { key, value };\n  }\n  return undefined;\n}\n\nexport const isResourceKey = (key: string): key is AttributeKey =>\n  (RESOURCE_DISPLAYABLE_KEYS as readonly string[]).includes(key) ||\n  (RESOURCE_LINK_KEYS as readonly string[]).includes(key);\n", "import type { DOMResult } from '../page/index.js';\nimport {\n  findResourceLink,\n  findResourceText,\n  type ExternalResource,\n  type Resource,\n  type Tag,\n} from '../resource.js';\nimport { AbstractExtractor } from './AbstractExtractor.js';\n\nexport class ResourceExtractor extends AbstractExtractor<DOMResult, ExternalResource[]> {\n  constructor(private readonly tags: Tag[]) {\n    super('page-extractor');\n  }\n  async extract(value: DOMResult): Promise<ExternalResource[]> {\n    const { document } = value.window;\n    return this.tags.flatMap((tag) =>\n      Array.from(document.querySelectorAll<Resource>(tag)).flatMap((element) => {\n        const link = findResourceLink(element);\n        if (!link) return [];\n        const text = findResourceText(element) ?? { key: 'src' as const, value: link.value };\n        return [{ text, link }];\n      })\n    );\n  }\n}\n", "import { readFile } from 'fs/promises';\nimport { parseHTML } from 'linkedom';\nimport { legacyHookDecode } from '@exodus/bytes/encoding.js';\n\nexport interface DOMResult {\n  window: { document: Document };\n  url: string;\n}\n\ninterface PageResponse {\n  url: string;\n  content?: DOMResult;\n  error?: string;\n}\n\nexport class PageFetcher {\n  private readonly timeout: number;\n  private readonly maxRetries: number;\n\n  constructor(timeout = 10000, maxRetries = 2) {\n    this.timeout = timeout;\n    this.maxRetries = maxRetries;\n  }\n\n  private buildDOMResult(html: string, url: string): DOMResult {\n    const { document } = parseHTML(html) as { document: Document };\n    return { window: { document }, url };\n  }\n\n  private async fetchPage(url: string, retryCount = 0): Promise<PageResponse> {\n    try {\n      let domPromise: Promise<DOMResult>;\n\n      if (url.startsWith('file://')) {\n        domPromise = readFile(url.substring(7), 'utf-8').then((html) =>\n          this.buildDOMResult(html, url)\n        );\n      } else {\n        domPromise = fetch(url).then(async (response) => {\n          const buffer = await response.arrayBuffer();\n          const contentType = response.headers.get('content-type') ?? '';\n          const charsetMatch = /charset=([^\\s;]+)/i.exec(contentType);\n          const html = legacyHookDecode(new Uint8Array(buffer), charsetMatch?.[1] ?? 'utf-8');\n          return this.buildDOMResult(html, url);\n        });\n      }\n\n      const content = await (this.timeout > 0\n        ? Promise.race([\n            domPromise,\n            new Promise<never>((_, reject) =>\n              setTimeout(() => reject(new Error('Request timeout')), this.timeout)\n            ),\n          ])\n        : domPromise);\n\n      return { url, content };\n    } catch (error) {\n      const message = error instanceof Error ? error.message : 'Unknown error';\n\n      // Retry logic for transient errors\n      if (retryCount < this.maxRetries && this.isRetryableError(message)) {\n        process.stderr.write(`Retrying ${url} (attempt ${retryCount + 1}/${this.maxRetries})...\\n`);\n        await this.delay(1000 * (retryCount + 1)); // Exponential backoff\n        return this.fetchPage(url, retryCount + 1);\n      }\n\n      return { url, error: `Failed to fetch: ${message}` };\n    }\n  }\n\n  private isRetryableError(message: string): boolean {\n    const retryablePatterns = [/timeout/i, /ECONNRESET/i, /ETIMEDOUT/i, /ENOTFOUND/i, /network/i];\n    return retryablePatterns.some((pattern) => pattern.test(message));\n  }\n\n  private delay(ms: number): Promise<void> {\n    return new Promise((resolve) => setTimeout(resolve, ms));\n  }\n\n  async fetchAll(urls: string[]): Promise<PageResponse[]> {\n    const responses = await Promise.all(urls.map((url) => this.fetchPage(url)));\n    return responses.filter((response) => response.content !== undefined || response.error);\n  }\n}\n", "import type { PageMetadata } from '../page/index.js';\n\nexport abstract class AbstractResourcePrinter {\n  constructor() {}\n  abstract print(...pages: PageMetadata[]): void | Promise<void>;\n}\n", "import type { PageMetadata } from '../page/index.js';\nimport { AbstractResourcePrinter } from './AbstractResourcePrinter.js';\n\nexport class JSONStylePrinter extends AbstractResourcePrinter {\n  print(...pages: PageMetadata[]): void | Promise<void> {\n    const json = JSON.stringify(pages);\n    process.stdout.write(json + '\\n');\n  }\n}\n", "/**\n * Security utilities for URL validation and sanitization\n */\n\nconst ALLOWED_PROTOCOLS = ['http:', 'https:', 'file:'];\nconst MAX_URL_LENGTH = 2048;\nconst SUSPICIOUS_PATTERNS = [\n  /javascript:/i,\n  /data:/i,\n  /vbscript:/i,\n  /<script/i,\n  /on\\w+=/i, // Event handlers like onclick=\n];\n\nexport interface ValidationResult {\n  isValid: boolean;\n  error?: string;\n  sanitizedUrl?: string;\n}\n\n/**\n * Validates a URL for security concerns\n * @param url - The URL to validate\n * @returns ValidationResult object with validation status\n */\nexport function validateUrl(url: string): ValidationResult {\n  // Check if URL is empty or whitespace\n  if (!url || !url.trim()) {\n    return {\n      isValid: false,\n      error: 'URL cannot be empty',\n    };\n  }\n\n  const trimmedUrl = url.trim();\n\n  // Check URL length to prevent DoS\n  if (trimmedUrl.length > MAX_URL_LENGTH) {\n    return {\n      isValid: false,\n      error: `URL exceeds maximum length of ${MAX_URL_LENGTH} characters`,\n    };\n  }\n\n  // Check for suspicious patterns\n  for (const pattern of SUSPICIOUS_PATTERNS) {\n    if (pattern.test(trimmedUrl)) {\n      return {\n        isValid: false,\n        error: 'URL contains suspicious patterns',\n      };\n    }\n  }\n\n  // Parse the URL\n  let parsedUrl: URL;\n  try {\n    parsedUrl = new URL(trimmedUrl);\n  } catch (error) {\n    // If URL parsing fails, it might be a file path\n    if (trimmedUrl.startsWith('file://')) {\n      return {\n        isValid: true,\n        sanitizedUrl: trimmedUrl,\n      };\n    }\n    return {\n      isValid: false,\n      error: 'Invalid URL format',\n    };\n  }\n\n  // Check protocol\n  if (!ALLOWED_PROTOCOLS.includes(parsedUrl.protocol)) {\n    return {\n      isValid: false,\n      error: `Protocol ${parsedUrl.protocol} is not allowed. Allowed protocols: ${ALLOWED_PROTOCOLS.join(', ')}`,\n    };\n  }\n\n  // Check for localhost/internal IPs in production (security consideration)\n  const hostname = parsedUrl.hostname.toLowerCase();\n  const isLocalhost =\n    hostname === 'localhost' ||\n    hostname === '127.0.0.1' ||\n    hostname === '::1' ||\n    hostname.startsWith('192.168.') ||\n    hostname.startsWith('10.') ||\n    /^172\\.(1[6-9]|2\\d|3[01])\\./.test(hostname);\n\n  if (isLocalhost && parsedUrl.protocol !== 'file:') {\n    // Allow but warn about localhost URLs\n    console.warn(`Warning: Accessing local network resource: ${trimmedUrl}`);\n  }\n\n  return {\n    isValid: true,\n    sanitizedUrl: parsedUrl.toString(),\n  };\n}\n\n/**\n * Validates an array of URLs\n * @param urls - Array of URLs to validate\n * @returns Object with valid URLs and errors\n */\nexport function validateUrls(urls: string[]): {\n  validUrls: string[];\n  errors: Array<{ url: string; error: string }>;\n} {\n  const validUrls: string[] = [];\n  const errors: Array<{ url: string; error: string }> = [];\n\n  for (const url of urls) {\n    const result = validateUrl(url);\n    if (result.isValid && result.sanitizedUrl) {\n      validUrls.push(result.sanitizedUrl);\n    } else {\n      errors.push({\n        url,\n        error: result.error || 'Unknown validation error',\n      });\n    }\n  }\n\n  return { validUrls, errors };\n}\n\n/**\n * Rate limiter to prevent abuse\n */\nexport class RateLimiter {\n  private requests: number[] = [];\n  private readonly maxRequests: number;\n  private readonly windowMs: number;\n\n  constructor(maxRequests = 10, windowMs = 60000) {\n    this.maxRequests = maxRequests;\n    this.windowMs = windowMs;\n  }\n\n  /**\n   * Check if a request is allowed under rate limiting\n   * @returns true if request is allowed, false otherwise\n   */\n  public isAllowed(): boolean {\n    const now = Date.now();\n\n    // Remove old requests outside the time window\n    this.requests = this.requests.filter((time) => now - time < this.windowMs);\n\n    if (this.requests.length >= this.maxRequests) {\n      return false;\n    }\n\n    this.requests.push(now);\n    return true;\n  }\n\n  /**\n   * Get remaining requests in current window\n   */\n  public getRemainingRequests(): number {\n    const now = Date.now();\n    this.requests = this.requests.filter((time) => now - time < this.windowMs);\n    return Math.max(0, this.maxRequests - this.requests.length);\n  }\n}\n\n/**\n * Sanitizes HTML content to prevent XSS attacks\n * @param text - Text to sanitize\n * @returns Sanitized text\n */\nexport function sanitizeText(text: string): string {\n  if (!text) return '';\n\n  return text\n    .replace(/</g, '&lt;')\n    .replace(/>/g, '&gt;')\n    .replace(/\"/g, '&quot;')\n    .replace(/'/g, '&#x27;')\n    .replace(/\\//g, '&#x2F;');\n}\n"],
-  "mappings": ";AACA,OAAS,WAAAA,EAAS,kBAAAC,EAAgB,UAAAC,MAAc,YCDhD,IAAAC,EAAA,CACE,KAAQ,UACR,YAAe,qDACf,QAAW,QACX,KAAQ,SACR,KAAQ,UACR,IAAO,CACL,QAAW,aACb,EACA,MAAS,CACP,KACF,EACA,QAAW,CACT,KAAQ,UACV,EACA,QAAW,CACT,KAAQ,kBACR,aAAc,eACd,MAAS,kHACT,KAAQ,qBACR,WAAY,2BACZ,aAAc,eACd,OAAU,iCACV,eAAgB,iCAChB,iBAAkB,mCAClB,iBAAkB,yCAClB,MAAS,qBACT,IAAO,kBACP,QAAW,eACb,EACA,SAAY,CACV,UACA,YACA,aACA,eACA,MACA,gBACF,EACA,OAAU,yBACV,QAAW,MACX,KAAQ,CACN,IAAO,4CACT,EACA,SAAY,sCACZ,aAAgB,CACd,gBAAiB,UACjB,UAAa,UACb,SAAY,SACd,EACA,gBAAmB,CACjB,cAAe,WACf,cAAe,WACf,mCAAoC,UACpC,4BAA6B,UAC7B,QAAW,UACX,OAAU,UACV,yBAA0B,SAC1B,yBAA0B,SAC1B,KAAQ,UACR,SAAY,SACZ,UAAW,UACX,IAAO,UACP,WAAc,QAChB,CACF,EChEO,IAAeC,EAAf,KAAuC,CAC5C,YAAqBC,EAAc,CAAd,UAAAA,CAAe,CAEtC,ECCO,IAAMC,EAAN,cAA4BC,CAAmC,CACpE,aAAc,CACZ,MAAM,gBAAgB,CACxB,CAEA,MAAM,QAAQC,EAAiC,CAC7C,GAAM,CAAE,OAAQ,CAAE,SAAAC,CAAS,EAAG,IAAAC,CAAI,EAAIF,EACtC,MAAO,CAAE,MAAOC,EAAS,MAAO,IAAAC,CAAI,CACtC,CACF,ECHO,IAAMC,EAA4B,CACvC,KACA,YACA,cACA,QACA,YACA,kBACA,KACF,EAIaC,EAAqB,CAAC,OAAQ,WAAY,SAAU,SAAU,MAAO,KAAK,EAwBjFC,EAAW,CAACC,EAAmBC,IAA0C,CAC7E,IAAMC,EAAIF,EAAQ,aAAaC,CAAG,EAClC,OAAOC,GAAK,MAAQA,EAAE,KAAK,IAAM,GAAKA,EAAI,MAC5C,EAEO,SAASC,EAAiBH,EAA4C,CAC3E,QAAWC,KAAOJ,EAA2B,CAC3C,IAAMO,EAAQL,EAASC,EAASC,CAAG,EACnC,GAAIG,IAAU,OAAW,MAAO,CAAE,IAAAH,EAAK,MAAAG,CAAM,CAC/C,CAEF,CAEO,SAASC,EAAiBL,EAA6C,CAC5E,QAAWC,KAAOH,EAAoB,CACpC,IAAMM,EAAQL,EAASC,EAASC,CAAG,EACnC,GAAIG,IAAU,OAAW,MAAO,CAAE,IAAAH,EAAK,MAAAG,CAAM,CAC/C,CAEF,CCvDO,IAAME,EAAN,cAAgCC,CAAiD,CACtF,YAA6BC,EAAa,CACxC,MAAM,gBAAgB,EADK,UAAAA,CAE7B,CACA,MAAM,QAAQC,EAA+C,CAC3D,GAAM,CAAE,SAAAC,CAAS,EAAID,EAAM,OAC3B,OAAO,KAAK,KAAK,QAASE,GACxB,MAAM,KAAKD,EAAS,iBAA2BC,CAAG,CAAC,EAAE,QAASC,GAAY,CACxE,IAAMC,EAAOC,EAAiBF,CAAO,EACrC,OAAKC,EAEE,CAAC,CAAE,KADGE,EAAiBH,CAAO,GAAK,CAAE,IAAK,MAAgB,MAAOC,EAAK,KAAM,EACnE,KAAAA,CAAK,CAAC,EAFJ,CAAC,CAGrB,CAAC,CACH,CACF,CACF,ECzBA,OAAS,YAAAG,MAAgB,cACzB,OAAS,aAAAC,MAAiB,WAC1B,OAAS,oBAAAC,MAAwB,4BAa1B,IAAMC,EAAN,KAAkB,CACN,QACA,WAEjB,YAAYC,EAAU,IAAOC,EAAa,EAAG,CAC3C,KAAK,QAAUD,EACf,KAAK,WAAaC,CACpB,CAEQ,eAAeC,EAAcC,EAAwB,CAC3D,GAAM,CAAE,SAAAC,CAAS,EAAIP,EAAUK,CAAI,EACnC,MAAO,CAAE,OAAQ,CAAE,SAAAE,CAAS,EAAG,IAAAD,CAAI,CACrC,CAEA,MAAc,UAAUA,EAAaE,EAAa,EAA0B,CAC1E,GAAI,CACF,IAAIC,EAEAH,EAAI,WAAW,SAAS,EAC1BG,EAAaV,EAASO,EAAI,UAAU,CAAC,EAAG,OAAO,EAAE,KAAMD,GACrD,KAAK,eAAeA,EAAMC,CAAG,CAC/B,EAEAG,EAAa,MAAMH,CAAG,EAAE,KAAK,MAAOI,GAAa,CAC/C,IAAMC,EAAS,MAAMD,EAAS,YAAY,EACpCE,EAAcF,EAAS,QAAQ,IAAI,cAAc,GAAK,GACtDG,EAAe,qBAAqB,KAAKD,CAAW,EACpDP,EAAOJ,EAAiB,IAAI,WAAWU,CAAM,EAAGE,IAAe,CAAC,GAAK,OAAO,EAClF,OAAO,KAAK,eAAeR,EAAMC,CAAG,CACtC,CAAC,EAGH,IAAMQ,EAAU,MAAO,KAAK,QAAU,EAClC,QAAQ,KAAK,CACXL,EACA,IAAI,QAAe,CAACM,EAAGC,IACrB,WAAW,IAAMA,EAAO,IAAI,MAAM,iBAAiB,CAAC,EAAG,KAAK,OAAO,CACrE,CACF,CAAC,EACDP,GAEJ,MAAO,CAAE,IAAAH,EAAK,QAAAQ,CAAQ,CACxB,OAASG,EAAO,CACd,IAAMC,EAAUD,aAAiB,MAAQA,EAAM,QAAU,gBAGzD,OAAIT,EAAa,KAAK,YAAc,KAAK,iBAAiBU,CAAO,GAC/D,QAAQ,OAAO,MAAM,YAAYZ,CAAG,aAAaE,EAAa,CAAC,IAAI,KAAK,UAAU;AAAA,CAAQ,EAC1F,MAAM,KAAK,MAAM,KAAQA,EAAa,EAAE,EACjC,KAAK,UAAUF,EAAKE,EAAa,CAAC,GAGpC,CAAE,IAAAF,EAAK,MAAO,oBAAoBY,CAAO,EAAG,CACrD,CACF,CAEQ,iBAAiBA,EAA0B,CAEjD,MAD0B,CAAC,WAAY,cAAe,aAAc,aAAc,UAAU,EACnE,KAAMC,GAAYA,EAAQ,KAAKD,CAAO,CAAC,CAClE,CAEQ,MAAME,EAA2B,CACvC,OAAO,IAAI,QAASC,GAAY,WAAWA,EAASD,CAAE,CAAC,CACzD,CAEA,MAAM,SAASE,EAAyC,CAEtD,OADkB,MAAM,QAAQ,IAAIA,EAAK,IAAKhB,GAAQ,KAAK,UAAUA,CAAG,CAAC,CAAC,GACzD,OAAQI,GAAaA,EAAS,UAAY,QAAaA,EAAS,KAAK,CACxF,CACF,EClFO,IAAea,EAAf,KAAuC,CAC5C,aAAc,CAAC,CAEjB,ECFO,IAAMC,EAAN,cAA+BC,CAAwB,CAC5D,SAASC,EAA6C,CACpD,IAAMC,EAAO,KAAK,UAAUD,CAAK,EACjC,QAAQ,OAAO,MAAMC,EAAO;AAAA,CAAI,CAClC,CACF,ECJA,IAAMC,EAAoB,CAAC,QAAS,SAAU,OAAO,EAErD,IAAMC,EAAsB,CAC1B,eACA,SACA,aACA,WACA,SACF,EAaO,SAASC,EAAYC,EAA+B,CAEzD,GAAI,CAACA,GAAO,CAACA,EAAI,KAAK,EACpB,MAAO,CACL,QAAS,GACT,MAAO,qBACT,EAGF,IAAMC,EAAaD,EAAI,KAAK,EAG5B,GAAIC,EAAW,OAAS,KACtB,MAAO,CACL,QAAS,GACT,MAAO,+CACT,EAIF,QAAWC,KAAWJ,EACpB,GAAII,EAAQ,KAAKD,CAAU,EACzB,MAAO,CACL,QAAS,GACT,MAAO,kCACT,EAKJ,IAAIE,EACJ,GAAI,CACFA,EAAY,IAAI,IAAIF,CAAU,CAChC,MAAgB,CAEd,OAAIA,EAAW,WAAW,SAAS,EAC1B,CACL,QAAS,GACT,aAAcA,CAChB,EAEK,CACL,QAAS,GACT,MAAO,oBACT,CACF,CAGA,GAAI,CAACG,EAAkB,SAASD,EAAU,QAAQ,EAChD,MAAO,CACL,QAAS,GACT,MAAO,YAAYA,EAAU,QAAQ,uCAAuCC,EAAkB,KAAK,IAAI,CAAC,EAC1G,EAIF,IAAMC,EAAWF,EAAU,SAAS,YAAY,EAShD,OAPEE,IAAa,aACbA,IAAa,aACbA,IAAa,OACbA,EAAS,WAAW,UAAU,GAC9BA,EAAS,WAAW,KAAK,GACzB,6BAA6B,KAAKA,CAAQ,IAEzBF,EAAU,WAAa,SAExC,QAAQ,KAAK,8CAA8CF,CAAU,EAAE,EAGlE,CACL,QAAS,GACT,aAAcE,EAAU,SAAS,CACnC,CACF,CAOO,SAASG,EAAaC,EAG3B,CACA,IAAMC,EAAsB,CAAC,EACvBC,EAAgD,CAAC,EAEvD,QAAWT,KAAOO,EAAM,CACtB,IAAMG,EAASX,EAAYC,CAAG,EAC1BU,EAAO,SAAWA,EAAO,aAC3BF,EAAU,KAAKE,EAAO,YAAY,EAElCD,EAAO,KAAK,CACV,IAAAT,EACA,MAAOU,EAAO,OAAS,0BACzB,CAAC,CAEL,CAEA,MAAO,CAAE,UAAAF,EAAW,OAAAC,CAAO,CAC7B,CTrHA,GAAM,CAAE,YAAAE,EAAa,KAAAC,EAAM,QAAAC,CAAQ,EAAIC,EAEjCC,EAAU,IAAIC,EAEdC,EAAMC,EACV,kBACA,kEACF,GAEC,SACC,MAAMH,EACH,KAAKH,CAAI,EACT,QAAQC,EAAS,eAAe,EAChC,YAAYF,CAAW,EACvB,YAAYM,CAAG,EACf,UAAU,IAAIE,EAAO,UAAW,kGAAkG,CAAC,EACnI,OAAO,MAAOC,EAAgBC,IAAgC,CAC7D,GAAI,CAEF,GAAM,CAAE,UAAAC,EAAW,OAAAC,CAAO,EAAIC,EAAaJ,CAAI,EAG3CG,EAAO,OAAS,IAClB,QAAQ,MAAM;AAAA,8BAA4B,EAC1CA,EAAO,QAAQ,CAAC,CAAE,IAAKE,EAAY,MAAAC,CAAM,IAAM,CAC7C,QAAQ,MAAM,OAAOD,CAAU,KAAKC,CAAK,EAAE,CAC7C,CAAC,GAICJ,EAAU,SAAW,IACvB,QAAQ,MAAM;AAAA,0CAAwC,EACtD,QAAQ,KAAK,CAAC,GAGhB,QAAQ,MAAM;AAAA,oBAAkBA,EAAU,MAAM,kBAAkB,EAElE,IAAMK,EAAU,IAAIC,EAEdC,EAAc,IAAIC,EAAYT,EAAQ,MAAQ,EAAI,IAAO,CAAC,EAC1DU,EAAgB,IAAIC,EACpBC,EAAoB,IAAIC,EAAkB,CAAC,IAAK,OAAQ,OAAQ,QAAS,QAAQ,CAAC,EAElFC,EAAU,SAA2B,CACzC,IAAMC,EAAgB,MAAMP,EAAY,SAASP,CAAS,EACpDe,EAAgC,CAAC,EAEvC,OAAW,CAAE,QAAAC,EAAS,IAAKC,EAAa,MAAAb,CAAM,IAAKU,EAAe,CAChE,IAAMI,EACJd,IAAU,QAAa,CAACY,EAAU,CAAC,EAAI,MAAML,EAAkB,QAAQK,CAAO,EAC1EG,EACJf,IAAU,QAAa,CAACY,EACpB,CAAE,IAAKC,EAAa,MAAOb,GAAS,gBAAiB,UAAAc,CAAU,EAC/D,MAAMT,EAAc,QAAQO,CAAO,EACzCD,EAAc,KAAK,CAAE,GAAGI,EAAY,UAAAD,CAAU,CAAC,CAGjD,CAEA,MAAMb,EAAQ,MAAM,GAAGU,CAAa,CACtC,EAEA,GAAIhB,EAAQ,MAAO,CACjB,QAAQ,MAAM,OAAO,EAErB,QAAQ,GAAG,SAAU,IAAM,CACzB,QAAQ,KAAK,CAAC,CAChB,CAAC,EAED,IAAIqB,EAAwC,KAE5C,QAAQ,MAAM,GAAG,MAAO,IAAM,CAE5BA,EAAkB,IACpB,CAAC,EAED,IAAIC,EAAmD,KACvD,QAAQ,GAAG,WAAY,IAAM,CACvBA,IAAe,MAAM,aAAaA,CAAU,EAChDA,EAAa,WAAW,IAAM,CAC5BA,EAAa,KACbD,EAAkBP,EAAQ,EAAE,MAAOS,GAAiB,CAClD,QAAQ,MAAM;AAAA,2BAA0BA,aAAe,MAAQA,EAAI,QAAUA,CAAG,CAClF,CAAC,CACH,EAAG,GAAG,CACR,CAAC,EAEDF,EAAkBP,EAAQ,EAC1B,MAAMO,CACR,MACE,MAAMP,EAAQ,CAElB,OAAST,EAAO,CACd,QAAQ,MAAM;AAAA,2BAA0BA,aAAiB,MAAQA,EAAM,QAAUA,CAAK,EACtF,QAAQ,KAAK,CAAC,CAChB,CACF,CAAC,EACA,WAAW,QAAQ,IAAI",
-  "names": ["Command", "createArgument", "Option", "package_default", "AbstractExtractor", "name", "PageExtractor", "AbstractExtractor", "value", "document", "url", "RESOURCE_DISPLAYABLE_KEYS", "RESOURCE_LINK_KEYS", "readAttr", "element", "key", "v", "findResourceText", "value", "findResourceLink", "ResourceExtractor", "AbstractExtractor", "tags", "value", "document", "tag", "element", "link", "findResourceLink", "findResourceText", "readFile", "parseHTML", "legacyHookDecode", "PageFetcher", "timeout", "maxRetries", "html", "url", "document", "retryCount", "domPromise", "response", "buffer", "contentType", "charsetMatch", "content", "_", "reject", "error", "message", "pattern", "ms", "resolve", "urls", "AbstractResourcePrinter", "JSONStylePrinter", "AbstractResourcePrinter", "pages", "json", "ALLOWED_PROTOCOLS", "SUSPICIOUS_PATTERNS", "validateUrl", "url", "trimmedUrl", "pattern", "parsedUrl", "ALLOWED_PROTOCOLS", "hostname", "validateUrls", "urls", "validUrls", "errors", "result", "description", "name", "version", "package_default", "program", "Command", "url", "createArgument", "Option", "urls", "options", "validUrls", "errors", "validateUrls", "invalidUrl", "error", "printer", "JSONStylePrinter", "pageFetcher", "PageFetcher", "pageExtractor", "PageExtractor", "resourceExtractor", "ResourceExtractor", "execute", "pageResponses", "pageMetadatas", "content", "responseUrl", "resources", "descriptor", "activeExecution", "winchTimer", "err"]
+  "sources": ["../src/main.ts", "../src/extractors/AbstractExtractor.ts", "../src/extractors/PageExtractor.ts", "../src/resource.ts", "../src/extractors/ResourceExtractor.ts", "../src/page/PageFetcher.ts", "../src/page/FileFetcher.ts", "../src/printers/AbstractResourcePrinter.ts", "../src/printers/JSONStylePrinter.ts", "../src/security.ts"],
+  "sourcesContent": ["#!/usr/bin/env node\nimport { Command, createArgument, Option } from 'commander';\nimport { createRequire } from 'node:module';\n\nimport { PageExtractor, ResourceExtractor } from './extractors/index.js';\nimport { FileFetcher, MAX_FILES_FAILSAFE, PageFetcher, type PageMetadata } from './page/index.js';\nimport { JSONStylePrinter } from './printers/index.js';\nimport { validateUrls } from './security.js';\n\nconst require = createRequire(import.meta.url);\nconst pkg = require('../package.json') as {\n  description: string;\n  name: string;\n  version: string;\n};\n\nconst { description, name, version } = pkg;\n\nconst program = new Command();\n\nconst urlArg = createArgument('<url...>', 'remote https://URL to extract from');\nconst fileArg = createArgument('<paths...>', 'local file paths to extract from');\n\n// Shared extractor instances.\nconst pageExtractor = new PageExtractor();\nconst resourceExtractor = new ResourceExtractor(['a', 'meta', 'link', 'embed', 'script']);\nconst printer = new JSONStylePrinter();\n\nasync function buildPageMetadata(\n  responses: Array<{\n    url?: string;\n    path?: string;\n    content?: import('./page/index.js').DOMResult;\n    error?: string;\n  }>\n): Promise<PageMetadata[]> {\n  const pageMetadatas: PageMetadata[] = [];\n\n  for (const { content, url: responseUrl, path, error } of responses) {\n    const resolvedUrl = responseUrl ?? path ?? '';\n    const resources =\n      error !== undefined || !content ? [] : await resourceExtractor.extract(content);\n    const descriptor =\n      error !== undefined || !content\n        ? { url: resolvedUrl, error: error ?? 'Unknown error', resources }\n        : await pageExtractor.extract(content);\n    pageMetadatas.push({ ...descriptor, resources });\n  }\n\n  return pageMetadatas;\n}\n\n(async (): Promise<void> => {\n  program.name(name).version(version, '-v, --version').description(description);\n\n  // \u2500\u2500 fetch subcommand (default remote URL mode) \u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\n  program\n    .command('fetch', { isDefault: true })\n    .description('fetch and extract resources from remote URL(s)')\n    .addArgument(urlArg)\n    .addOption(\n      new Option(\n        '--watch',\n        'keep running: SIGWINCH re-fetches after resize, Ctrl-D releases in-flight requests, Ctrl-C exits'\n      )\n    )\n    .action(async (urls: string[], options: { watch: boolean }) => {\n      try {\n        const { validUrls, errors } = validateUrls(urls);\n\n        if (errors.length > 0) {\n          console.error('\\n\u274C URL Validation Errors:');\n          errors.forEach(({ url: invalidUrl, error }) => {\n            console.error(`  - ${invalidUrl}: ${error}`);\n          });\n        }\n\n        if (validUrls.length === 0) {\n          console.error('\\n\u274C No valid URLs to process. Exiting.');\n          process.exit(1);\n        }\n\n        console.error(`\\n\u2705 Processing ${validUrls.length} valid URL(s)...`);\n\n        const pageFetcher = new PageFetcher(options.watch ? 0 : 10000, 2);\n\n        const execute = async (): Promise<void> => {\n          const responses = await pageFetcher.fetchAll(validUrls);\n          const pageMetadatas = await buildPageMetadata(responses);\n          await printer.print(...pageMetadatas);\n        };\n\n        if (options.watch) {\n          process.stdin.resume();\n          process.on('SIGINT', () => process.exit(0));\n\n          let activeExecution: Promise<void> | null = null;\n          process.stdin.on('end', () => {\n            activeExecution = null;\n          });\n\n          let winchTimer: ReturnType<typeof setTimeout> | null = null;\n          process.on('SIGWINCH', () => {\n            if (winchTimer !== null) clearTimeout(winchTimer);\n            winchTimer = setTimeout(() => {\n              winchTimer = null;\n              activeExecution = execute().catch((err: unknown) => {\n                console.error('\\n\u274C An error occurred:', err instanceof Error ? err.message : err);\n              });\n            }, 150);\n          });\n\n          activeExecution = execute();\n          await activeExecution;\n        } else {\n          await execute();\n        }\n      } catch (error) {\n        console.error('\\n\u274C An error occurred:', error instanceof Error ? error.message : error);\n        process.exit(1);\n      }\n    });\n\n  // \u2500\u2500 file subcommand (local filesystem access) \u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\n  program\n    .command('file')\n    .description('extract resources from local file(s) via direct filesystem access')\n    .addArgument(fileArg)\n    .addOption(\n      new Option('--no-failsafe', `bypass the ${MAX_FILES_FAILSAFE}-file limit safety check`)\n    )\n    .action(async (paths: string[], options: { failsafe: boolean }) => {\n      try {\n        if (options.failsafe && paths.length > MAX_FILES_FAILSAFE) {\n          console.error(\n            `\\n\u274C ${paths.length} files specified exceeds the safety limit of ${MAX_FILES_FAILSAFE}.`\n          );\n          console.error(`   Pass --no-failsafe to bypass this check and process all files.`);\n          process.exit(1);\n        }\n\n        if (!options.failsafe && paths.length > MAX_FILES_FAILSAFE) {\n          console.error(\n            `\\n\u26A0\uFE0F  Failsafe bypassed: processing ${paths.length} files (limit is ${MAX_FILES_FAILSAFE}).`\n          );\n        }\n\n        console.error(`\\n\u2705 Processing ${paths.length} file(s)...`);\n\n        const fileFetcher = new FileFetcher();\n        const responses = await fileFetcher.fetchAll(paths);\n        const pageMetadatas = await buildPageMetadata(\n          responses.map(({ path, content, error }) => ({ path, content, error }))\n        );\n\n        await printer.print(...pageMetadatas);\n      } catch (error) {\n        console.error('\\n\u274C An error occurred:', error instanceof Error ? error.message : error);\n        process.exit(1);\n      }\n    });\n\n  await program.parseAsync(process.argv);\n})();\n", "export abstract class AbstractExtractor<V, R> {\n  constructor(readonly name: string) {}\n  abstract extract(value: V): Promise<R>;\n}\n", "import type { Page } from '../page/index.js';\nimport type { DOMResult } from '../page/index.js';\nimport { AbstractExtractor } from './AbstractExtractor.js';\n\nexport class PageExtractor extends AbstractExtractor<DOMResult, Page> {\n  constructor() {\n    super('page-extractor');\n  }\n\n  async extract(value: DOMResult): Promise<Page> {\n    const {\n      window: { document },\n      url,\n    } = value;\n    return { title: document.title, url };\n  }\n}\n", "/**\n * @license MIT\n * We are interested in visualising a page as a collection of tags.\n *\n * We wish to work with tags that can be compactly previewed on a webpage.\n * Here we must declare all of the element types that can be used to represent\n * a resource that can be hyperlinked off a webpage.\n */\ntype Tags = HTMLElementTagNameMap;\n\nexport const RESOURCE_DISPLAYABLE_KEYS = [\n  'id',\n  'innerText',\n  'textContent',\n  'class',\n  'ariaLabel',\n  'ariaDescription',\n  'alt',\n] as const;\n\nexport type DisplayableKey = (typeof RESOURCE_DISPLAYABLE_KEYS)[number];\n\nexport const RESOURCE_LINK_KEYS = ['href', 'data-src', 'target', 'action', 'src', 'url'] as const;\n\nexport type LinkKey = (typeof RESOURCE_LINK_KEYS)[number];\n\nexport type AttributeKey = DisplayableKey | LinkKey;\n\nexport type ResourceKey = { key: AttributeKey; value: string };\nexport type ResourceLink = { key: LinkKey; value: string };\n\nexport type ExternalResource = {\n  text: ResourceKey;\n  link: ResourceLink;\n};\n\nexport type Tag = keyof Tags;\n\nexport type Resource = HTMLElement & {\n  [K in AttributeKey]?: string | null;\n};\n\nexport type ResourceByName<T extends keyof Tags> = Tags[T];\n\n// --- adapters ---\n\nconst readAttr = (element: Resource, key: AttributeKey): string | undefined => {\n  const v = element.getAttribute(key);\n  return v != null && v.trim() !== '' ? v : undefined;\n};\n\nexport function findResourceText(element: Resource): ResourceKey | undefined {\n  for (const key of RESOURCE_DISPLAYABLE_KEYS) {\n    const value = readAttr(element, key);\n    if (value !== undefined) return { key, value };\n  }\n  return undefined;\n}\n\nexport function findResourceLink(element: Resource): ResourceLink | undefined {\n  for (const key of RESOURCE_LINK_KEYS) {\n    const value = readAttr(element, key);\n    if (value !== undefined) return { key, value };\n  }\n  return undefined;\n}\n\nexport const isResourceKey = (key: string): key is AttributeKey =>\n  (RESOURCE_DISPLAYABLE_KEYS as readonly string[]).includes(key) ||\n  (RESOURCE_LINK_KEYS as readonly string[]).includes(key);\n", "import type { DOMResult } from '../page/index.js';\nimport {\n  findResourceLink,\n  findResourceText,\n  type ExternalResource,\n  type Resource,\n  type Tag,\n} from '../resource.js';\nimport { AbstractExtractor } from './AbstractExtractor.js';\n\nexport class ResourceExtractor extends AbstractExtractor<DOMResult, ExternalResource[]> {\n  constructor(private readonly tags: Tag[]) {\n    super('page-extractor');\n  }\n  async extract(value: DOMResult): Promise<ExternalResource[]> {\n    const { document } = value.window;\n    return this.tags.flatMap((tag) =>\n      Array.from(document.querySelectorAll<Resource>(tag)).flatMap((element) => {\n        const link = findResourceLink(element);\n        if (!link) return [];\n        const text = findResourceText(element) ?? { key: 'src' as const, value: link.value };\n        return [{ text, link }];\n      })\n    );\n  }\n}\n", "import { parseHTML } from 'linkedom';\n\ntype ParseHTMLResult = {\n  document: Document;\n};\n\nexport interface DOMResult {\n  window: { document: Document };\n  url: string;\n}\n\ninterface PageResponse {\n  url: string;\n  content?: DOMResult;\n  error?: string;\n}\n\nexport class PageFetcher {\n  private readonly timeout: number;\n  private readonly maxRetries: number;\n\n  constructor(timeout = 10000, maxRetries = 2) {\n    this.timeout = timeout;\n    this.maxRetries = maxRetries;\n  }\n\n  private buildDOMResult(html: string, url: string): DOMResult {\n    const { document } = parseHTML(html) as ParseHTMLResult;\n    return { window: { document }, url };\n  }\n\n  private decodeHtml(buffer: ArrayBuffer, charset: string): string {\n    try {\n      return new TextDecoder(charset).decode(new Uint8Array(buffer));\n    } catch {\n      return new TextDecoder('utf-8').decode(new Uint8Array(buffer));\n    }\n  }\n\n  private async fetchPage(url: string, retryCount = 0): Promise<PageResponse> {\n    try {\n      const domPromise = fetch(url).then(async (response) => {\n        const buffer = await response.arrayBuffer();\n        const contentType = response.headers.get('content-type') ?? '';\n        const charsetMatch = /charset=([^\\s;]+)/i.exec(contentType);\n        const html = this.decodeHtml(buffer, charsetMatch?.[1] ?? 'utf-8');\n        return this.buildDOMResult(html, url);\n      });\n\n      const content = await (this.timeout > 0\n        ? Promise.race([\n            domPromise,\n            new Promise<never>((_, reject) =>\n              setTimeout(() => reject(new Error('Request timeout')), this.timeout)\n            ),\n          ])\n        : domPromise);\n\n      return { url, content };\n    } catch (error) {\n      const message = error instanceof Error ? error.message : 'Unknown error';\n\n      // Retry logic for transient errors\n      if (retryCount < this.maxRetries && this.isRetryableError(message)) {\n        process.stderr.write(`Retrying ${url} (attempt ${retryCount + 1}/${this.maxRetries})...\\n`);\n        await this.delay(1000 * (retryCount + 1)); // Exponential backoff\n        return this.fetchPage(url, retryCount + 1);\n      }\n\n      return { url, error: `Failed to fetch: ${message}` };\n    }\n  }\n\n  private isRetryableError(message: string): boolean {\n    const retryablePatterns = [/timeout/i, /ECONNRESET/i, /ETIMEDOUT/i, /ENOTFOUND/i, /network/i];\n    return retryablePatterns.some((pattern) => pattern.test(message));\n  }\n\n  private delay(ms: number): Promise<void> {\n    return new Promise((resolve) => setTimeout(resolve, ms));\n  }\n\n  async fetchAll(urls: string[]): Promise<PageResponse[]> {\n    const responses = await Promise.all(urls.map((url) => this.fetchPage(url)));\n    return responses.filter((response) => response.content !== undefined || response.error);\n  }\n}\n", "import { readFile } from 'node:fs/promises';\nimport { parseHTML } from 'linkedom';\n\nimport type { DOMResult } from './PageFetcher.js';\n\nexport const MAX_FILES_FAILSAFE = 254;\n\ntype ParseHTMLResult = {\n  document: Document;\n};\n\nexport interface FileResponse {\n  path: string;\n  content?: DOMResult;\n  error?: string;\n}\n\nexport class FileFetcher {\n  private buildDOMResult(html: string, filePath: string): DOMResult {\n    const { document } = parseHTML(html) as ParseHTMLResult;\n    return { window: { document }, url: `file://${filePath}` };\n  }\n\n  async fetchFile(filePath: string): Promise<FileResponse> {\n    try {\n      // filePath is supplied directly by the CLI user, not derived from network input.\n      // eslint-disable-next-line security/detect-non-literal-fs-filename\n      const html = await readFile(filePath, 'utf-8');\n      return { path: filePath, content: this.buildDOMResult(html, filePath) };\n    } catch (error) {\n      return {\n        path: filePath,\n        error: error instanceof Error ? error.message : 'Unknown error',\n      };\n    }\n  }\n\n  async fetchAll(filePaths: string[]): Promise<FileResponse[]> {\n    return Promise.all(filePaths.map((p) => this.fetchFile(p)));\n  }\n}\n", "import type { PageMetadata } from '../page/index.js';\n\nexport abstract class AbstractResourcePrinter {\n  constructor() {}\n  abstract print(...pages: PageMetadata[]): void | Promise<void>;\n}\n", "import type { PageMetadata } from '../page/index.js';\nimport { AbstractResourcePrinter } from './AbstractResourcePrinter.js';\n\nexport class JSONStylePrinter extends AbstractResourcePrinter {\n  print(...pages: PageMetadata[]): void | Promise<void> {\n    const json = JSON.stringify(pages);\n    process.stdout.write(json + '\\n');\n  }\n}\n", "/**\n * Security utilities for URL validation and sanitization\n */\n\nconst ALLOWED_PROTOCOLS = ['http:', 'https:'];\nconst MAX_URL_LENGTH = 2048;\nconst SUSPICIOUS_PATTERNS = [\n  /javascript:/i,\n  /data:/i,\n  /vbscript:/i,\n  /<script/i,\n  /on\\w+=/i, // Event handlers like onclick=\n];\n\nexport interface ValidationResult {\n  isValid: boolean;\n  error?: string;\n  sanitizedUrl?: string;\n}\n\n/**\n * Validates a URL for security concerns\n * @param url - The URL to validate\n * @returns ValidationResult object with validation status\n */\nexport function validateUrl(url: string): ValidationResult {\n  // Check if URL is empty or whitespace\n  if (!url || !url.trim()) {\n    return {\n      isValid: false,\n      error: 'URL cannot be empty',\n    };\n  }\n\n  const trimmedUrl = url.trim();\n\n  // Check URL length to prevent DoS\n  if (trimmedUrl.length > MAX_URL_LENGTH) {\n    return {\n      isValid: false,\n      error: `URL exceeds maximum length of ${MAX_URL_LENGTH} characters`,\n    };\n  }\n\n  // Check for suspicious patterns\n  for (const pattern of SUSPICIOUS_PATTERNS) {\n    if (pattern.test(trimmedUrl)) {\n      return {\n        isValid: false,\n        error: 'URL contains suspicious patterns',\n      };\n    }\n  }\n\n  // Parse the URL\n  let parsedUrl: URL;\n  try {\n    parsedUrl = new URL(trimmedUrl);\n  } catch {\n    return {\n      isValid: false,\n      error: 'Invalid URL format',\n    };\n  }\n\n  // Check protocol\n  if (!ALLOWED_PROTOCOLS.includes(parsedUrl.protocol)) {\n    return {\n      isValid: false,\n      error: `Protocol ${parsedUrl.protocol} is not allowed. Allowed protocols: ${ALLOWED_PROTOCOLS.join(', ')}`,\n    };\n  }\n\n  // Check for localhost/internal IPs in production (security consideration)\n  const hostname = parsedUrl.hostname.toLowerCase();\n  const isLocalhost =\n    hostname === 'localhost' ||\n    hostname === '127.0.0.1' ||\n    hostname === '::1' ||\n    hostname.startsWith('192.168.') ||\n    hostname.startsWith('10.') ||\n    /^172\\.(1[6-9]|2\\d|3[01])\\./.test(hostname);\n\n  if (isLocalhost) {\n    // Allow but warn about localhost URLs\n    console.warn(`Warning: Accessing local network resource: ${trimmedUrl}`);\n  }\n\n  return {\n    isValid: true,\n    sanitizedUrl: parsedUrl.toString(),\n  };\n}\n\n/**\n * Validates an array of URLs\n * @param urls - Array of URLs to validate\n * @returns Object with valid URLs and errors\n */\nexport function validateUrls(urls: string[]): {\n  validUrls: string[];\n  errors: Array<{ url: string; error: string }>;\n} {\n  const validUrls: string[] = [];\n  const errors: Array<{ url: string; error: string }> = [];\n\n  for (const url of urls) {\n    const result = validateUrl(url);\n    if (result.isValid && result.sanitizedUrl) {\n      validUrls.push(result.sanitizedUrl);\n    } else {\n      errors.push({\n        url,\n        error: result.error || 'Unknown validation error',\n      });\n    }\n  }\n\n  return { validUrls, errors };\n}\n\n/**\n * Rate limiter to prevent abuse\n */\nexport class RateLimiter {\n  private requests: number[] = [];\n  private readonly maxRequests: number;\n  private readonly windowMs: number;\n\n  constructor(maxRequests = 10, windowMs = 60000) {\n    this.maxRequests = maxRequests;\n    this.windowMs = windowMs;\n  }\n\n  /**\n   * Check if a request is allowed under rate limiting\n   * @returns true if request is allowed, false otherwise\n   */\n  public isAllowed(): boolean {\n    const now = Date.now();\n\n    // Remove old requests outside the time window\n    this.requests = this.requests.filter((time) => now - time < this.windowMs);\n\n    if (this.requests.length >= this.maxRequests) {\n      return false;\n    }\n\n    this.requests.push(now);\n    return true;\n  }\n\n  /**\n   * Get remaining requests in current window\n   */\n  public getRemainingRequests(): number {\n    const now = Date.now();\n    this.requests = this.requests.filter((time) => now - time < this.windowMs);\n    return Math.max(0, this.maxRequests - this.requests.length);\n  }\n}\n\n/**\n * Sanitizes HTML content to prevent XSS attacks\n * @param text - Text to sanitize\n * @returns Sanitized text\n */\nexport function sanitizeText(text: string): string {\n  if (!text) return '';\n\n  return text\n    .replace(/</g, '&lt;')\n    .replace(/>/g, '&gt;')\n    .replace(/\"/g, '&quot;')\n    .replace(/'/g, '&#x27;')\n    .replace(/\\//g, '&#x2F;');\n}\n"],
+  "mappings": ";;;AACA,SAAS,SAAS,gBAAgB,cAAc;AAChD,SAAS,qBAAqB;;;ACFvB,IAAe,oBAAf,MAAuC;AAAA,EAC5C,YAAqBA,OAAc;AAAd,gBAAAA;AAAA,EAAe;AAEtC;;;ACCO,IAAM,gBAAN,cAA4B,kBAAmC;AAAA,EACpE,cAAc;AACZ,UAAM,gBAAgB;AAAA,EACxB;AAAA,EAEA,MAAM,QAAQ,OAAiC;AAC7C,UAAM;AAAA,MACJ,QAAQ,EAAE,SAAS;AAAA,MACnB;AAAA,IACF,IAAI;AACJ,WAAO,EAAE,OAAO,SAAS,OAAO,IAAI;AAAA,EACtC;AACF;;;ACNO,IAAM,4BAA4B;AAAA,EACvC;AAAA,EACA;AAAA,EACA;AAAA,EACA;AAAA,EACA;AAAA,EACA;AAAA,EACA;AACF;AAIO,IAAM,qBAAqB,CAAC,QAAQ,YAAY,UAAU,UAAU,OAAO,KAAK;AAwBvF,IAAM,WAAW,CAAC,SAAmB,QAA0C;AAC7E,QAAM,IAAI,QAAQ,aAAa,GAAG;AAClC,SAAO,KAAK,QAAQ,EAAE,KAAK,MAAM,KAAK,IAAI;AAC5C;AAEO,SAAS,iBAAiB,SAA4C;AAC3E,aAAW,OAAO,2BAA2B;AAC3C,UAAM,QAAQ,SAAS,SAAS,GAAG;AACnC,QAAI,UAAU,OAAW,QAAO,EAAE,KAAK,MAAM;AAAA,EAC/C;AACA,SAAO;AACT;AAEO,SAAS,iBAAiB,SAA6C;AAC5E,aAAW,OAAO,oBAAoB;AACpC,UAAM,QAAQ,SAAS,SAAS,GAAG;AACnC,QAAI,UAAU,OAAW,QAAO,EAAE,KAAK,MAAM;AAAA,EAC/C;AACA,SAAO;AACT;;;ACvDO,IAAM,oBAAN,cAAgC,kBAAiD;AAAA,EACtF,YAA6B,MAAa;AACxC,UAAM,gBAAgB;AADK;AAAA,EAE7B;AAAA,EACA,MAAM,QAAQ,OAA+C;AAC3D,UAAM,EAAE,SAAS,IAAI,MAAM;AAC3B,WAAO,KAAK,KAAK;AAAA,MAAQ,CAAC,QACxB,MAAM,KAAK,SAAS,iBAA2B,GAAG,CAAC,EAAE,QAAQ,CAAC,YAAY;AACxE,cAAM,OAAO,iBAAiB,OAAO;AACrC,YAAI,CAAC,KAAM,QAAO,CAAC;AACnB,cAAM,OAAO,iBAAiB,OAAO,KAAK,EAAE,KAAK,OAAgB,OAAO,KAAK,MAAM;AACnF,eAAO,CAAC,EAAE,MAAM,KAAK,CAAC;AAAA,MACxB,CAAC;AAAA,IACH;AAAA,EACF;AACF;;;ACzBA,SAAS,iBAAiB;AAiBnB,IAAM,cAAN,MAAkB;AAAA,EACN;AAAA,EACA;AAAA,EAEjB,YAAY,UAAU,KAAO,aAAa,GAAG;AAC3C,SAAK,UAAU;AACf,SAAK,aAAa;AAAA,EACpB;AAAA,EAEQ,eAAe,MAAc,KAAwB;AAC3D,UAAM,EAAE,SAAS,IAAI,UAAU,IAAI;AACnC,WAAO,EAAE,QAAQ,EAAE,SAAS,GAAG,IAAI;AAAA,EACrC;AAAA,EAEQ,WAAW,QAAqB,SAAyB;AAC/D,QAAI;AACF,aAAO,IAAI,YAAY,OAAO,EAAE,OAAO,IAAI,WAAW,MAAM,CAAC;AAAA,IAC/D,QAAQ;AACN,aAAO,IAAI,YAAY,OAAO,EAAE,OAAO,IAAI,WAAW,MAAM,CAAC;AAAA,IAC/D;AAAA,EACF;AAAA,EAEA,MAAc,UAAU,KAAa,aAAa,GAA0B;AAC1E,QAAI;AACF,YAAM,aAAa,MAAM,GAAG,EAAE,KAAK,OAAO,aAAa;AACrD,cAAM,SAAS,MAAM,SAAS,YAAY;AAC1C,cAAM,cAAc,SAAS,QAAQ,IAAI,cAAc,KAAK;AAC5D,cAAM,eAAe,qBAAqB,KAAK,WAAW;AAC1D,cAAM,OAAO,KAAK,WAAW,QAAQ,eAAe,CAAC,KAAK,OAAO;AACjE,eAAO,KAAK,eAAe,MAAM,GAAG;AAAA,MACtC,CAAC;AAED,YAAM,UAAU,OAAO,KAAK,UAAU,IAClC,QAAQ,KAAK;AAAA,QACX;AAAA,QACA,IAAI;AAAA,UAAe,CAAC,GAAG,WACrB,WAAW,MAAM,OAAO,IAAI,MAAM,iBAAiB,CAAC,GAAG,KAAK,OAAO;AAAA,QACrE;AAAA,MACF,CAAC,IACD;AAEJ,aAAO,EAAE,KAAK,QAAQ;AAAA,IACxB,SAAS,OAAO;AACd,YAAM,UAAU,iBAAiB,QAAQ,MAAM,UAAU;AAGzD,UAAI,aAAa,KAAK,cAAc,KAAK,iBAAiB,OAAO,GAAG;AAClE,gBAAQ,OAAO,MAAM,YAAY,GAAG,aAAa,aAAa,CAAC,IAAI,KAAK,UAAU;AAAA,CAAQ;AAC1F,cAAM,KAAK,MAAM,OAAQ,aAAa,EAAE;AACxC,eAAO,KAAK,UAAU,KAAK,aAAa,CAAC;AAAA,MAC3C;AAEA,aAAO,EAAE,KAAK,OAAO,oBAAoB,OAAO,GAAG;AAAA,IACrD;AAAA,EACF;AAAA,EAEQ,iBAAiB,SAA0B;AACjD,UAAM,oBAAoB,CAAC,YAAY,eAAe,cAAc,cAAc,UAAU;AAC5F,WAAO,kBAAkB,KAAK,CAAC,YAAY,QAAQ,KAAK,OAAO,CAAC;AAAA,EAClE;AAAA,EAEQ,MAAM,IAA2B;AACvC,WAAO,IAAI,QAAQ,CAAC,YAAY,WAAW,SAAS,EAAE,CAAC;AAAA,EACzD;AAAA,EAEA,MAAM,SAAS,MAAyC;AACtD,UAAM,YAAY,MAAM,QAAQ,IAAI,KAAK,IAAI,CAAC,QAAQ,KAAK,UAAU,GAAG,CAAC,CAAC;AAC1E,WAAO,UAAU,OAAO,CAAC,aAAa,SAAS,YAAY,UAAa,SAAS,KAAK;AAAA,EACxF;AACF;;;ACtFA,SAAS,gBAAgB;AACzB,SAAS,aAAAC,kBAAiB;AAInB,IAAM,qBAAqB;AAY3B,IAAM,cAAN,MAAkB;AAAA,EACf,eAAe,MAAc,UAA6B;AAChE,UAAM,EAAE,SAAS,IAAIA,WAAU,IAAI;AACnC,WAAO,EAAE,QAAQ,EAAE,SAAS,GAAG,KAAK,UAAU,QAAQ,GAAG;AAAA,EAC3D;AAAA,EAEA,MAAM,UAAU,UAAyC;AACvD,QAAI;AAGF,YAAM,OAAO,MAAM,SAAS,UAAU,OAAO;AAC7C,aAAO,EAAE,MAAM,UAAU,SAAS,KAAK,eAAe,MAAM,QAAQ,EAAE;AAAA,IACxE,SAAS,OAAO;AACd,aAAO;AAAA,QACL,MAAM;AAAA,QACN,OAAO,iBAAiB,QAAQ,MAAM,UAAU;AAAA,MAClD;AAAA,IACF;AAAA,EACF;AAAA,EAEA,MAAM,SAAS,WAA8C;AAC3D,WAAO,QAAQ,IAAI,UAAU,IAAI,CAAC,MAAM,KAAK,UAAU,CAAC,CAAC,CAAC;AAAA,EAC5D;AACF;;;ACtCO,IAAe,0BAAf,MAAuC;AAAA,EAC5C,cAAc;AAAA,EAAC;AAEjB;;;ACFO,IAAM,mBAAN,cAA+B,wBAAwB;AAAA,EAC5D,SAAS,OAA6C;AACpD,UAAM,OAAO,KAAK,UAAU,KAAK;AACjC,YAAQ,OAAO,MAAM,OAAO,IAAI;AAAA,EAClC;AACF;;;ACJA,IAAM,oBAAoB,CAAC,SAAS,QAAQ;AAC5C,IAAM,iBAAiB;AACvB,IAAM,sBAAsB;AAAA,EAC1B;AAAA,EACA;AAAA,EACA;AAAA,EACA;AAAA,EACA;AAAA;AACF;AAaO,SAAS,YAAY,KAA+B;AAEzD,MAAI,CAAC,OAAO,CAAC,IAAI,KAAK,GAAG;AACvB,WAAO;AAAA,MACL,SAAS;AAAA,MACT,OAAO;AAAA,IACT;AAAA,EACF;AAEA,QAAM,aAAa,IAAI,KAAK;AAG5B,MAAI,WAAW,SAAS,gBAAgB;AACtC,WAAO;AAAA,MACL,SAAS;AAAA,MACT,OAAO,iCAAiC,cAAc;AAAA,IACxD;AAAA,EACF;AAGA,aAAW,WAAW,qBAAqB;AACzC,QAAI,QAAQ,KAAK,UAAU,GAAG;AAC5B,aAAO;AAAA,QACL,SAAS;AAAA,QACT,OAAO;AAAA,MACT;AAAA,IACF;AAAA,EACF;AAGA,MAAI;AACJ,MAAI;AACF,gBAAY,IAAI,IAAI,UAAU;AAAA,EAChC,QAAQ;AACN,WAAO;AAAA,MACL,SAAS;AAAA,MACT,OAAO;AAAA,IACT;AAAA,EACF;AAGA,MAAI,CAAC,kBAAkB,SAAS,UAAU,QAAQ,GAAG;AACnD,WAAO;AAAA,MACL,SAAS;AAAA,MACT,OAAO,YAAY,UAAU,QAAQ,uCAAuC,kBAAkB,KAAK,IAAI,CAAC;AAAA,IAC1G;AAAA,EACF;AAGA,QAAM,WAAW,UAAU,SAAS,YAAY;AAChD,QAAM,cACJ,aAAa,eACb,aAAa,eACb,aAAa,SACb,SAAS,WAAW,UAAU,KAC9B,SAAS,WAAW,KAAK,KACzB,6BAA6B,KAAK,QAAQ;AAE5C,MAAI,aAAa;AAEf,YAAQ,KAAK,8CAA8C,UAAU,EAAE;AAAA,EACzE;AAEA,SAAO;AAAA,IACL,SAAS;AAAA,IACT,cAAc,UAAU,SAAS;AAAA,EACnC;AACF;AAOO,SAAS,aAAa,MAG3B;AACA,QAAM,YAAsB,CAAC;AAC7B,QAAM,SAAgD,CAAC;AAEvD,aAAW,OAAO,MAAM;AACtB,UAAM,SAAS,YAAY,GAAG;AAC9B,QAAI,OAAO,WAAW,OAAO,cAAc;AACzC,gBAAU,KAAK,OAAO,YAAY;AAAA,IACpC,OAAO;AACL,aAAO,KAAK;AAAA,QACV;AAAA,QACA,OAAO,OAAO,SAAS;AAAA,MACzB,CAAC;AAAA,IACH;AAAA,EACF;AAEA,SAAO,EAAE,WAAW,OAAO;AAC7B;;;AT9GA,IAAMC,WAAU,cAAc,YAAY,GAAG;AAC7C,IAAM,MAAMA,SAAQ,iBAAiB;AAMrC,IAAM,EAAE,aAAa,MAAM,QAAQ,IAAI;AAEvC,IAAM,UAAU,IAAI,QAAQ;AAE5B,IAAM,SAAS,eAAe,YAAY,oCAAoC;AAC9E,IAAM,UAAU,eAAe,cAAc,kCAAkC;AAG/E,IAAM,gBAAgB,IAAI,cAAc;AACxC,IAAM,oBAAoB,IAAI,kBAAkB,CAAC,KAAK,QAAQ,QAAQ,SAAS,QAAQ,CAAC;AACxF,IAAM,UAAU,IAAI,iBAAiB;AAErC,eAAe,kBACb,WAMyB;AACzB,QAAM,gBAAgC,CAAC;AAEvC,aAAW,EAAE,SAAS,KAAK,aAAa,MAAM,MAAM,KAAK,WAAW;AAClE,UAAM,cAAc,eAAe,QAAQ;AAC3C,UAAM,YACJ,UAAU,UAAa,CAAC,UAAU,CAAC,IAAI,MAAM,kBAAkB,QAAQ,OAAO;AAChF,UAAM,aACJ,UAAU,UAAa,CAAC,UACpB,EAAE,KAAK,aAAa,OAAO,SAAS,iBAAiB,UAAU,IAC/D,MAAM,cAAc,QAAQ,OAAO;AACzC,kBAAc,KAAK,EAAE,GAAG,YAAY,UAAU,CAAC;AAAA,EACjD;AAEA,SAAO;AACT;AAAA,CAEC,YAA2B;AAC1B,UAAQ,KAAK,IAAI,EAAE,QAAQ,SAAS,eAAe,EAAE,YAAY,WAAW;AAG5E,UACG,QAAQ,SAAS,EAAE,WAAW,KAAK,CAAC,EACpC,YAAY,gDAAgD,EAC5D,YAAY,MAAM,EAClB;AAAA,IACC,IAAI;AAAA,MACF;AAAA,MACA;AAAA,IACF;AAAA,EACF,EACC,OAAO,OAAO,MAAgB,YAAgC;AAC7D,QAAI;AACF,YAAM,EAAE,WAAW,OAAO,IAAI,aAAa,IAAI;AAE/C,UAAI,OAAO,SAAS,GAAG;AACrB,gBAAQ,MAAM,iCAA4B;AAC1C,eAAO,QAAQ,CAAC,EAAE,KAAK,YAAY,MAAM,MAAM;AAC7C,kBAAQ,MAAM,OAAO,UAAU,KAAK,KAAK,EAAE;AAAA,QAC7C,CAAC;AAAA,MACH;AAEA,UAAI,UAAU,WAAW,GAAG;AAC1B,gBAAQ,MAAM,6CAAwC;AACtD,gBAAQ,KAAK,CAAC;AAAA,MAChB;AAEA,cAAQ,MAAM;AAAA,oBAAkB,UAAU,MAAM,kBAAkB;AAElE,YAAM,cAAc,IAAI,YAAY,QAAQ,QAAQ,IAAI,KAAO,CAAC;AAEhE,YAAM,UAAU,YAA2B;AACzC,cAAM,YAAY,MAAM,YAAY,SAAS,SAAS;AACtD,cAAM,gBAAgB,MAAM,kBAAkB,SAAS;AACvD,cAAM,QAAQ,MAAM,GAAG,aAAa;AAAA,MACtC;AAEA,UAAI,QAAQ,OAAO;AACjB,gBAAQ,MAAM,OAAO;AACrB,gBAAQ,GAAG,UAAU,MAAM,QAAQ,KAAK,CAAC,CAAC;AAE1C,YAAI,kBAAwC;AAC5C,gBAAQ,MAAM,GAAG,OAAO,MAAM;AAC5B,4BAAkB;AAAA,QACpB,CAAC;AAED,YAAI,aAAmD;AACvD,gBAAQ,GAAG,YAAY,MAAM;AAC3B,cAAI,eAAe,KAAM,cAAa,UAAU;AAChD,uBAAa,WAAW,MAAM;AAC5B,yBAAa;AACb,8BAAkB,QAAQ,EAAE,MAAM,CAAC,QAAiB;AAClD,sBAAQ,MAAM,+BAA0B,eAAe,QAAQ,IAAI,UAAU,GAAG;AAAA,YAClF,CAAC;AAAA,UACH,GAAG,GAAG;AAAA,QACR,CAAC;AAED,0BAAkB,QAAQ;AAC1B,cAAM;AAAA,MACR,OAAO;AACL,cAAM,QAAQ;AAAA,MAChB;AAAA,IACF,SAAS,OAAO;AACd,cAAQ,MAAM,+BAA0B,iBAAiB,QAAQ,MAAM,UAAU,KAAK;AACtF,cAAQ,KAAK,CAAC;AAAA,IAChB;AAAA,EACF,CAAC;AAGH,UACG,QAAQ,MAAM,EACd,YAAY,mEAAmE,EAC/E,YAAY,OAAO,EACnB;AAAA,IACC,IAAI,OAAO,iBAAiB,cAAc,kBAAkB,0BAA0B;AAAA,EACxF,EACC,OAAO,OAAO,OAAiB,YAAmC;AACjE,QAAI;AACF,UAAI,QAAQ,YAAY,MAAM,SAAS,oBAAoB;AACzD,gBAAQ;AAAA,UACN;AAAA,SAAO,MAAM,MAAM,gDAAgD,kBAAkB;AAAA,QACvF;AACA,gBAAQ,MAAM,mEAAmE;AACjF,gBAAQ,KAAK,CAAC;AAAA,MAChB;AAEA,UAAI,CAAC,QAAQ,YAAY,MAAM,SAAS,oBAAoB;AAC1D,gBAAQ;AAAA,UACN;AAAA,8CAAuC,MAAM,MAAM,oBAAoB,kBAAkB;AAAA,QAC3F;AAAA,MACF;AAEA,cAAQ,MAAM;AAAA,oBAAkB,MAAM,MAAM,aAAa;AAEzD,YAAM,cAAc,IAAI,YAAY;AACpC,YAAM,YAAY,MAAM,YAAY,SAAS,KAAK;AAClD,YAAM,gBAAgB,MAAM;AAAA,QAC1B,UAAU,IAAI,CAAC,EAAE,MAAM,SAAS,MAAM,OAAO,EAAE,MAAM,SAAS,MAAM,EAAE;AAAA,MACxE;AAEA,YAAM,QAAQ,MAAM,GAAG,aAAa;AAAA,IACtC,SAAS,OAAO;AACd,cAAQ,MAAM,+BAA0B,iBAAiB,QAAQ,MAAM,UAAU,KAAK;AACtF,cAAQ,KAAK,CAAC;AAAA,IAChB;AAAA,EACF,CAAC;AAEH,QAAM,QAAQ,WAAW,QAAQ,IAAI;AACvC,GAAG;",
+  "names": ["name", "parseHTML", "require"]
 }

package/package.json CHANGED Viewed

@@ -1,65 +1,65 @@
-{
-  "name": "pagerts",
-  "description": "A tool for viewing external relations in a webpage",
-  "version": "1.4.1",
-  "type": "module",
-  "main": "main.js",
-  "bin": {
-    "pagerts": "bin/main.js"
-  },
-  "files": [
-    "bin"
-  ],
-  "engines": {
-    "node": ">=20.0.0"
-  },
-  "scripts": {
-    "test": "jest --coverage",
-    "test:watch": "jest --watch",
-    "build": "esbuild src/main.ts --bundle --packages=external --outdir=bin --minify --sourcemap --platform=node --format=esm",
-    "lint": "eslint src/**/*.ts",
-    "lint:fix": "eslint src/**/*.ts --fix",
-    "type-check": "tsc --noEmit",
-    "format": "prettier --write \"src/**/*.ts\"",
-    "format:check": "prettier --check \"src/**/*.ts\"",
-    "security:audit": "npm audit --audit-level=moderate",
-    "security:check": "npm run security:audit && npm run lint",
-    "start": "node ./bin/main.js",
-    "dev": "tsx src/main.ts",
-    "prepare": "npm run build"
-  },
-  "keywords": [
-    "webpage",
-    "hierarchy",
-    "management",
-    "web-scraping",
-    "cli",
-    "url-extraction"
-  ],
-  "author": "Kirill <kine> Nevzorov",
-  "license": "MIT",
-  "bugs": {
-    "url": "https://github.com/akinevz2/pagerts/issues"
-  },
-  "homepage": "https://github.com/akinevz2/pagerts",
-  "dependencies": {
-    "@exodus/bytes": "^1.15.0",
-    "commander": "^14.0.3",
-    "linkedom": "^0.18.9"
-  },
-  "devDependencies": {
-    "@types/jest": "^29.5.14",
-    "@types/node": "^22.10.5",
-    "@typescript-eslint/eslint-plugin": "^8.20.0",
-    "@typescript-eslint/parser": "^8.20.0",
-    "esbuild": "^0.25.1",
-    "eslint": "^9.18.0",
-    "eslint-config-prettier": "^9.1.0",
-    "eslint-plugin-security": "^3.0.1",
-    "jest": "^29.7.0",
-    "prettier": "^3.4.2",
-    "ts-jest": "^29.2.5",
-    "tsx": "^4.19.2",
-    "typescript": "^5.7.2"
-  }
-}
+{
+  "name": "pagerts",
+  "description": "A tool for viewing external relations in a webpage",
+  "version": "1.4.3",
+  "type": "module",
+  "main": "main.js",
+  "bin": {
+    "pagerts": "bin/main.js"
+  },
+  "files": [
+    "bin"
+  ],
+  "engines": {
+    "node": ">=20.0.0"
+  },
+  "scripts": {
+    "test": "jest --coverage",
+    "test:watch": "jest --watch",
+    "build": "esbuild src/main.ts --bundle --packages=external --outdir=bin --sourcemap --platform=node --format=esm",
+    "lint": "eslint src/**/*.ts",
+    "lint:fix": "eslint src/**/*.ts --fix",
+    "type-check": "tsc --noEmit",
+    "format": "prettier --write \"**/*.{ts,js,mjs,cjs,json,yml,yaml,md}\"",
+    "format:check": "prettier --check \"**/*.{ts,js,mjs,cjs,json,yml,yaml,md}\"",
+    "security:audit": "npm audit --audit-level=moderate",
+    "security:check": "npm run security:audit && npm run lint",
+    "start": "node ./bin/main.js",
+    "dev": "tsx src/main.ts",
+    "prepare": "npm run build"
+  },
+  "keywords": [
+    "webpage",
+    "hierarchy",
+    "management",
+    "web-scraping",
+    "cli",
+    "url-extraction"
+  ],
+  "author": "Kirill <kine> Nevzorov",
+  "license": "MIT",
+  "bugs": {
+    "url": "https://github.com/akinevz2/pagerts/issues"
+  },
+  "homepage": "https://github.com/akinevz2/pagerts",
+  "dependencies": {
+    "@exodus/bytes": "^1.15.0",
+    "commander": "^14.0.3",
+    "linkedom": "^0.18.9"
+  },
+  "devDependencies": {
+    "@types/jest": "^29.5.14",
+    "@types/node": "^22.10.5",
+    "@typescript-eslint/eslint-plugin": "^8.20.0",
+    "@typescript-eslint/parser": "^8.20.0",
+    "esbuild": "^0.25.1",
+    "eslint": "^9.18.0",
+    "eslint-config-prettier": "^9.1.0",
+    "eslint-plugin-security": "^3.0.1",
+    "jest": "^29.7.0",
+    "prettier": "^3.4.2",
+    "ts-jest": "^29.2.5",
+    "tsx": "^4.19.2",
+    "typescript": "^5.7.2"
+  }
+}