npm - defuddle - Versions diffs - 0.3.8 → 0.4.0 - Mend

defuddle 0.3.8 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/dist/extractor-registry.d.ts +15 -0
package/dist/extractors/_base.d.ts +9 -0
package/dist/extractors/_conversation.d.ts +9 -0
package/dist/extractors/chatgpt.d.ts +13 -0
package/dist/extractors/claude.d.ts +10 -0
package/dist/extractors/hackernews.d.ts +21 -0
package/dist/extractors/reddit.d.ts +16 -0
package/dist/extractors/twitter.d.ts +16 -0
package/dist/extractors/youtube.d.ts +12 -0
package/dist/index.full.js +1 -1
package/dist/index.js +1 -1
package/dist/types/extractors.d.ts +41 -0
package/dist/types.d.ts +13 -0
package/package.json +1 -1

package/dist/extractor-registry.d.ts ADDED Viewed

@@ -0,0 +1,15 @@
+import { BaseExtractor } from './extractors/_base';
+type ExtractorConstructor = new (document: Document, url: string, schemaOrgData?: any) => BaseExtractor;
+interface ExtractorMapping {
+    patterns: (string | RegExp)[];
+    extractor: ExtractorConstructor;
+}
+export declare class ExtractorRegistry {
+    private static mappings;
+    private static domainCache;
+    static initialize(): void;
+    static register(mapping: ExtractorMapping): void;
+    static findExtractor(document: Document, url: string, schemaOrgData?: any): BaseExtractor | null;
+    static clearCache(): void;
+}
+export {};

package/dist/extractors/_base.d.ts ADDED Viewed

@@ -0,0 +1,9 @@
+import { ExtractorResult } from '../types/extractors';
+export declare abstract class BaseExtractor {
+    protected document: Document;
+    protected url: string;
+    protected schemaOrgData?: any;
+    constructor(document: Document, url: string, schemaOrgData?: any);
+    abstract canExtract(): boolean;
+    abstract extract(): ExtractorResult;
+}

package/dist/extractors/_conversation.d.ts ADDED Viewed

@@ -0,0 +1,9 @@
+import { BaseExtractor } from './_base';
+import { ConversationMessage, ConversationMetadata, Footnote, ExtractorResult } from '../types/extractors';
+export declare abstract class ConversationExtractor extends BaseExtractor {
+    protected abstract extractMessages(): ConversationMessage[];
+    protected abstract getMetadata(): ConversationMetadata;
+    protected getFootnotes(): Footnote[];
+    extract(): ExtractorResult;
+    protected createContentHtml(messages: ConversationMessage[], footnotes: Footnote[]): string;
+}

package/dist/extractors/chatgpt.d.ts ADDED Viewed

@@ -0,0 +1,13 @@
+import { ConversationExtractor } from './_conversation';
+import { ConversationMessage, ConversationMetadata, Footnote } from '../types/extractors';
+export declare class ChatGPTExtractor extends ConversationExtractor {
+    private articles;
+    private footnotes;
+    private footnoteCounter;
+    constructor(document: Document, url: string);
+    canExtract(): boolean;
+    protected extractMessages(): ConversationMessage[];
+    protected getFootnotes(): Footnote[];
+    protected getMetadata(): ConversationMetadata;
+    private getTitle;
+}

package/dist/extractors/claude.d.ts ADDED Viewed

@@ -0,0 +1,10 @@
+import { ConversationExtractor } from './_conversation';
+import { ConversationMessage, ConversationMetadata } from '../types/extractors';
+export declare class ClaudeExtractor extends ConversationExtractor {
+    private articles;
+    constructor(document: Document, url: string);
+    canExtract(): boolean;
+    protected extractMessages(): ConversationMessage[];
+    protected getMetadata(): ConversationMetadata;
+    private getTitle;
+}

package/dist/extractors/hackernews.d.ts ADDED Viewed

@@ -0,0 +1,21 @@
+import { BaseExtractor } from './_base';
+import { ExtractorResult } from '../types/extractors';
+export declare class HackerNewsExtractor extends BaseExtractor {
+    private mainPost;
+    private isCommentPage;
+    private mainComment;
+    constructor(document: Document, url: string);
+    private detectCommentPage;
+    private findMainComment;
+    canExtract(): boolean;
+    extract(): ExtractorResult;
+    private createContentHtml;
+    private getPostContent;
+    private extractComments;
+    private processComments;
+    private getPostId;
+    private getPostTitle;
+    private getPostAuthor;
+    private createDescription;
+    private getPostDate;
+}

package/dist/extractors/reddit.d.ts ADDED Viewed

@@ -0,0 +1,16 @@
+import { BaseExtractor } from './_base';
+import { ExtractorResult } from '../types/extractors';
+export declare class RedditExtractor extends BaseExtractor {
+    private shredditPost;
+    constructor(document: Document, url: string);
+    canExtract(): boolean;
+    extract(): ExtractorResult;
+    private getPostContent;
+    private createContentHtml;
+    private extractComments;
+    private getPostId;
+    private getSubreddit;
+    private getPostAuthor;
+    private createDescription;
+    private processComments;
+}

package/dist/extractors/twitter.d.ts ADDED Viewed

@@ -0,0 +1,16 @@
+import { BaseExtractor } from './_base';
+import { ExtractorResult } from '../types/extractors';
+export declare class TwitterExtractor extends BaseExtractor {
+    private mainTweet;
+    private threadTweets;
+    constructor(document: Document, url: string);
+    canExtract(): boolean;
+    extract(): ExtractorResult;
+    private formatTweetText;
+    private extractTweet;
+    private extractUserInfo;
+    private extractImages;
+    private getTweetId;
+    private getTweetAuthor;
+    private createDescription;
+}

package/dist/extractors/youtube.d.ts ADDED Viewed

@@ -0,0 +1,12 @@
+import { BaseExtractor } from './_base';
+import { ExtractorResult } from '../types/extractors';
+export declare class YoutubeExtractor extends BaseExtractor {
+    private videoElement;
+    protected schemaOrgData: any;
+    constructor(document: Document, url: string, schemaOrgData?: any);
+    canExtract(): boolean;
+    extract(): ExtractorResult;
+    private formatDescription;
+    private getVideoData;
+    private getVideoId;
+}