npm - @elizaos/plugin-research - Versions diffs - 0.1.0 - Mend

@elizaos/plugin-research 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (71) hide show

package/README.md +400 -0
package/dist/index.cjs +9366 -0
package/dist/index.cjs.map +1 -0
package/dist/index.js +9284 -0
package/dist/index.js.map +1 -0
package/package.json +80 -0
package/src/__tests__/action-chaining.test.ts +532 -0
package/src/__tests__/actions.test.ts +118 -0
package/src/__tests__/cache-rate-limiter.test.ts +303 -0
package/src/__tests__/content-extractors.test.ts +26 -0
package/src/__tests__/deepresearch-bench-integration.test.ts +520 -0
package/src/__tests__/deepresearch-bench-simplified.e2e.test.ts +290 -0
package/src/__tests__/deepresearch-bench.e2e.test.ts +376 -0
package/src/__tests__/e2e.test.ts +1870 -0
package/src/__tests__/multi-benchmark-runner.ts +427 -0
package/src/__tests__/providers.test.ts +156 -0
package/src/__tests__/real-world.e2e.test.ts +788 -0
package/src/__tests__/research-scenarios.test.ts +755 -0
package/src/__tests__/research.e2e.test.ts +704 -0
package/src/__tests__/research.test.ts +174 -0
package/src/__tests__/search-providers.test.ts +174 -0
package/src/__tests__/single-benchmark-runner.ts +735 -0
package/src/__tests__/test-search-providers.ts +171 -0
package/src/__tests__/verify-apis.test.ts +82 -0
package/src/actions.ts +1677 -0
package/src/benchmark/deepresearch-benchmark.ts +369 -0
package/src/evaluation/research-evaluator.ts +444 -0
package/src/examples/api-integration.md +498 -0
package/src/examples/browserbase-integration.md +132 -0
package/src/examples/debug-research-query.ts +162 -0
package/src/examples/defi-code-scenarios.md +536 -0
package/src/examples/defi-implementation-guide.md +454 -0
package/src/examples/eliza-research-example.ts +142 -0
package/src/examples/fix-renewable-energy-research.ts +209 -0
package/src/examples/research-scenarios.md +408 -0
package/src/examples/run-complete-renewable-research.ts +303 -0
package/src/examples/run-deep-research.ts +352 -0
package/src/examples/run-logged-research.ts +304 -0
package/src/examples/run-real-research.ts +151 -0
package/src/examples/save-research-output.ts +133 -0
package/src/examples/test-file-logging.ts +199 -0
package/src/examples/test-real-research.ts +67 -0
package/src/examples/test-renewable-energy-research.ts +229 -0
package/src/index.ts +28 -0
package/src/integrations/cache.ts +128 -0
package/src/integrations/content-extractors/firecrawl.ts +314 -0
package/src/integrations/content-extractors/pdf-extractor.ts +350 -0
package/src/integrations/content-extractors/playwright.ts +420 -0
package/src/integrations/factory.ts +419 -0
package/src/integrations/index.ts +18 -0
package/src/integrations/rate-limiter.ts +181 -0
package/src/integrations/search-providers/academic.ts +290 -0
package/src/integrations/search-providers/exa.ts +205 -0
package/src/integrations/search-providers/npm.ts +330 -0
package/src/integrations/search-providers/pypi.ts +211 -0
package/src/integrations/search-providers/serpapi.ts +277 -0
package/src/integrations/search-providers/serper.ts +358 -0
package/src/integrations/search-providers/stagehand-google.ts +87 -0
package/src/integrations/search-providers/tavily.ts +187 -0
package/src/processing/relevance-analyzer.ts +353 -0
package/src/processing/research-logger.ts +450 -0
package/src/processing/result-processor.ts +372 -0
package/src/prompts/research-prompts.ts +419 -0
package/src/providers/cacheProvider.ts +164 -0
package/src/providers.ts +173 -0
package/src/service.ts +2588 -0
package/src/services/swe-bench.ts +286 -0
package/src/strategies/research-strategies.ts +790 -0
package/src/types/pdf-parse.d.ts +34 -0
package/src/types.ts +551 -0
package/src/verification/claim-verifier.ts +443 -0

package/src/integrations/search-providers/academic.ts ADDED Viewed

@@ -0,0 +1,290 @@
+import { elizaLogger } from '@elizaos/core';
+import axios from 'axios';
+import { SearchResult, SourceType } from '../../types';
+export interface AcademicSearchConfig {
+  semanticScholarApiKey?: string;
+  useProxy?: boolean;
+  timeout?: number;
+}
+export class AcademicSearchProvider {
+  public readonly name = 'Academic';
+  private config: AcademicSearchConfig;
+  constructor(config: AcademicSearchConfig = {}) {
+    this.config = {
+      timeout: 30000,
+      useProxy: false,
+      ...config,
+    };
+  }
+  async search(query: string, maxResults: number = 20): Promise<SearchResult[]> {
+    elizaLogger.info(`[Academic] Searching for: ${query}`);
+    const results: SearchResult[] = [];
+    // Search multiple academic sources in parallel
+    const searches = await Promise.allSettled([
+      this.searchSemanticScholar(query, Math.ceil(maxResults / 3)),
+      this.searchArxiv(query, Math.ceil(maxResults / 3)),
+      this.searchCrossRef(query, Math.ceil(maxResults / 3)),
+    ]);
+    for (const search of searches) {
+      if (search.status === 'fulfilled') {
+        results.push(...search.value);
+      } else {
+        elizaLogger.warn(`[Academic] Search failed:`, search.reason);
+      }
+    }
+    // Sort by relevance score and limit results
+    return results
+      .sort((a, b) => b.score - a.score)
+      .slice(0, maxResults);
+  }
+  private async searchSemanticScholar(query: string, limit: number): Promise<SearchResult[]> {
+    try {
+      const url = 'https://api.semanticscholar.org/graph/v1/paper/search';
+      const params = {
+        query,
+        limit,
+        fields: 'paperId,title,abstract,authors,year,citationCount,url,venue,publicationDate',
+      };
+      const headers: any = {
+        'User-Agent': 'Mozilla/5.0 (compatible; ElizaOS/1.0)',
+      };
+      if (this.config.semanticScholarApiKey) {
+        headers['x-api-key'] = this.config.semanticScholarApiKey;
+      }
+      const response = await axios.get(url, {
+        params,
+        headers,
+        timeout: this.config.timeout,
+        validateStatus: (status) => status < 500, // Don't throw on 4xx errors
+      });
+      if (response.status === 429) {
+        elizaLogger.warn('[Semantic Scholar] Rate limited, falling back to public rate');
+        // Try again without API key
+        delete headers['x-api-key'];
+        const retryResponse = await axios.get(url, {
+          params,
+          headers,
+          timeout: this.config.timeout,
+        });
+        response.data = retryResponse.data;
+      } else if (response.status >= 400) {
+        elizaLogger.warn(`[Semantic Scholar] HTTP ${response.status}: ${response.statusText}`);
+        return [];
+      }
+      const results: SearchResult[] = [];
+      for (const paper of response.data.data || []) {
+        results.push({
+          title: paper.title || 'Untitled',
+          url: paper.url || `https://api.semanticscholar.org/paper/${paper.paperId}`,
+          snippet: paper.abstract || 'No abstract available',
+          score: this.calculateRelevanceScore(paper, query),
+          provider: 'semantic-scholar',
+          metadata: {
+            type: 'academic',
+            language: 'en',
+            domain: 'semanticscholar.org',
+            author: paper.authors?.map((a: any) => a.name),
+            publishDate: paper.publicationDate,
+            citationCount: paper.citationCount,
+            venue: paper.venue,
+            paperId: paper.paperId,
+          } as any,
+        });
+      }
+      elizaLogger.info(`[Semantic Scholar] Found ${results.length} results`);
+      return results;
+    } catch (error) {
+      elizaLogger.error('[Semantic Scholar] Search error:', error);
+      return [];
+    }
+  }
+  private async searchArxiv(query: string, limit: number): Promise<SearchResult[]> {
+    try {
+      const url = 'http://export.arxiv.org/api/query';
+      const params = {
+        search_query: `all:${query}`,
+        start: 0,
+        max_results: limit,
+        sortBy: 'relevance',
+        sortOrder: 'descending',
+      };
+      const response = await axios.get(url, {
+        params,
+        timeout: this.config.timeout,
+      });
+      // Parse XML response
+      const results: SearchResult[] = [];
+      const entries = response.data.match(/<entry>([\s\S]*?)<\/entry>/g) || [];
+      for (const entry of entries) {
+        const title = this.extractXmlValue(entry, 'title');
+        const summary = this.extractXmlValue(entry, 'summary');
+        const id = this.extractXmlValue(entry, 'id');
+        const published = this.extractXmlValue(entry, 'published');
+        const authors = this.extractXmlAuthors(entry);
+        if (title && id) {
+          results.push({
+            title: title.trim(),
+            url: id,
+            snippet: summary?.trim() || 'No summary available',
+            score: 0.85, // arXiv is highly reliable
+            provider: 'arxiv',
+                         metadata: {
+               type: 'academic',
+               language: 'en',
+               domain: 'arxiv.org',
+               author: authors,
+               publishDate: published,
+               arxivId: id.split('/').pop(),
+             } as any,
+          });
+        }
+      }
+      elizaLogger.info(`[arXiv] Found ${results.length} results`);
+      return results;
+    } catch (error) {
+      elizaLogger.error('[arXiv] Search error:', error);
+      return [];
+    }
+  }
+  private async searchCrossRef(query: string, limit: number): Promise<SearchResult[]> {
+    try {
+      // CrossRef requires more specific queries, so enhance simple queries
+      const enhancedQuery = query.length < 5 ? `${query} research paper` : query;
+      const url = 'https://api.crossref.org/works';
+      const params = {
+        query: enhancedQuery,
+        rows: limit,
+        select: 'DOI,title,author,published-print,abstract,container-title,URL,cited-by-count',
+      };
+      const response = await axios.get(url, {
+        params,
+        headers: {
+          'User-Agent': 'ElizaOS/1.0 (mailto:research@eliza.ai)',
+        },
+        timeout: this.config.timeout,
+        validateStatus: (status) => status < 500, // Don't throw on 4xx
+      });
+      if (response.status >= 400) {
+        elizaLogger.warn(`[CrossRef] HTTP ${response.status}: Query too short or invalid`);
+        return [];
+      }
+      const results: SearchResult[] = [];
+      for (const item of response.data.message.items || []) {
+        const title = Array.isArray(item.title) ? item.title[0] : item.title;
+        const abstract = item.abstract?.replace(/<[^>]*>/g, ''); // Remove HTML tags
+        results.push({
+          title: title || 'Untitled',
+          url: item.URL || `https://doi.org/${item.DOI}`,
+          snippet: abstract || 'No abstract available',
+          score: this.calculateCrossRefScore(item, query),
+          provider: 'crossref',
+                     metadata: {
+             type: 'academic',
+             language: 'en',
+             domain: 'crossref.org',
+             doi: item.DOI,
+             author: item.author?.map((a: any) => `${a.given} ${a.family}`),
+             publishDate: item['published-print']?.['date-parts']?.[0]?.join('-'),
+             citationCount: item['cited-by-count'],
+             journal: item['container-title']?.[0],
+           } as any,
+        });
+      }
+      elizaLogger.info(`[CrossRef] Found ${results.length} results`);
+      return results;
+    } catch (error: any) {
+      if (axios.isAxiosError(error)) {
+        elizaLogger.error(`[CrossRef] API error: ${error.message}`, {
+          status: error.response?.status,
+          statusText: error.response?.statusText,
+          data: error.response?.data,
+        });
+      } else {
+        elizaLogger.error('[CrossRef] Search error:', error.message || error);
+      }
+      return [];
+    }
+  }
+  private calculateRelevanceScore(paper: any, query: string): number {
+    let score = 0.7; // Base score for academic papers
+    // Boost for citation count
+    if (paper.citationCount > 100) score += 0.1;
+    else if (paper.citationCount > 50) score += 0.05;
+    // Boost for recent papers
+    if (paper.year && paper.year >= new Date().getFullYear() - 2) score += 0.05;
+    // Boost for title match
+    const queryTerms = query.toLowerCase().split(' ');
+    const titleLower = paper.title?.toLowerCase() || '';
+    const matchCount = queryTerms.filter(term => titleLower.includes(term)).length;
+    score += (matchCount / queryTerms.length) * 0.1;
+    return Math.min(score, 1.0);
+  }
+  private calculateCrossRefScore(item: any, query: string): number {
+    let score = 0.65; // Base score
+    if (item['cited-by-count'] > 50) score += 0.1;
+    if (item.abstract) score += 0.1;
+    // Title relevance
+    const queryTerms = query.toLowerCase().split(' ');
+    const titleLower = (item.title?.[0] || '').toLowerCase();
+    const matchCount = queryTerms.filter(term => titleLower.includes(term)).length;
+    score += (matchCount / queryTerms.length) * 0.15;
+    return Math.min(score, 1.0);
+  }
+  private extractXmlValue(xml: string, tag: string): string | undefined {
+    const regex = new RegExp(`<${tag}[^>]*>([\\s\\S]*?)<\\/${tag}>`, 'i');
+    const match = xml.match(regex);
+    return match ? match[1].trim() : undefined;
+  }
+  private extractXmlAuthors(xml: string): string[] {
+    const authors: string[] = [];
+    const authorMatches = xml.match(/<author>[\s\S]*?<\/author>/g) || [];
+    for (const authorXml of authorMatches) {
+      const name = this.extractXmlValue(authorXml, 'name');
+      if (name) authors.push(name);
+    }
+    return authors;
+  }
+}

package/src/integrations/search-providers/exa.ts ADDED Viewed

@@ -0,0 +1,205 @@
+import axios from 'axios';
+import { SearchResult } from '../../types';
+import { elizaLogger } from '@elizaos/core';
+export interface ExaConfig {
+  apiKey: string;
+  searchType?: 'neural' | 'keyword' | 'auto';
+  category?: string;
+  language?: string;
+}
+export class ExaSearchProvider {
+  private readonly apiKey: string;
+  private readonly baseUrl = 'https://api.exa.ai';
+  private readonly config: ExaConfig;
+  public readonly name = 'Exa';
+  constructor(config: ExaConfig) {
+    if (!config.apiKey) {
+      throw new Error('Exa API key is required');
+    }
+    this.apiKey = config.apiKey;
+    this.config = {
+      searchType: 'auto',
+      language: 'en',
+      ...config,
+    };
+  }
+  async search(query: string, maxResults?: number): Promise<SearchResult[]> {
+    try {
+      elizaLogger.info(`[Exa] Searching for: ${query}`);
+      const response = await axios.post(
+        `${this.baseUrl}/search`,
+        {
+          query,
+          type: this.config.searchType || 'auto',
+          numResults: maxResults || 10,
+          text: true, // Get text content
+          summary: {
+            query: "Key points and main findings"
+          },
+          highlights: {
+            numSentences: 3,
+            highlightsPerUrl: 2
+          }
+        },
+        {
+          headers: {
+            'x-api-key': this.apiKey,
+            'Content-Type': 'application/json',
+          },
+        }
+      );
+      if (!response.data || !response.data.results) {
+        elizaLogger.warn('[Exa] No results found');
+        return [];
+      }
+      const results: SearchResult[] = response.data.results.map((result: any, index: number) => ({
+        title: result.title || 'Untitled',
+        url: result.url,
+        snippet: result.summary || result.text?.substring(0, 200) || 'No description available',
+        score: result.score || (0.95 - index * 0.05),
+        provider: 'exa',
+        metadata: {
+          language: this.config.language || 'en',
+          type: this.config.searchType || 'auto',
+          resolvedSearchType: response.data.resolvedSearchType,
+          author: result.author,
+          publishedDate: result.publishedDate,
+          highlights: result.highlights,
+          image: result.image,
+          favicon: result.favicon,
+        },
+      }));
+      elizaLogger.info(`[Exa] Found ${results.length} results`);
+      return results;
+    } catch (error: any) {
+      if (error.response) {
+        elizaLogger.error(`[Exa] API error: ${error.response.status} - ${JSON.stringify(error.response.data)}`);
+        if (error.response.status === 401) {
+          throw new Error('Invalid Exa API key');
+        }
+        if (error.response.status === 429) {
+          throw new Error('Exa API rate limit exceeded');
+        }
+      } else {
+        elizaLogger.error(`[Exa] Search error:`, error);
+      }
+      throw error;
+    }
+  }
+  async searchAcademic(query: string, maxResults?: number): Promise<SearchResult[]> {
+    try {
+      elizaLogger.info(`[Exa] Searching academic papers for: ${query}`);
+      const response = await axios.post(
+        `${this.baseUrl}/search`,
+        {
+          query,
+          type: 'neural', // Neural search works better for academic content
+          category: 'research paper',
+          numResults: maxResults || 10,
+          text: true,
+          summary: {
+            query: "Main contributions and findings"
+          },
+          highlights: {
+            numSentences: 5,
+            highlightsPerUrl: 3
+          }
+        },
+        {
+          headers: {
+            'x-api-key': this.apiKey,
+            'Content-Type': 'application/json',
+          },
+        }
+      );
+      if (!response.data || !response.data.results) {
+        elizaLogger.warn('[Exa] No academic results found');
+        return [];
+      }
+      const results: SearchResult[] = response.data.results.map((result: any, index: number) => ({
+        title: result.title || 'Untitled',
+        url: result.url,
+        snippet: result.summary || result.text?.substring(0, 300) || 'No abstract available',
+        score: result.score || (0.95 - index * 0.03),
+        provider: 'exa',
+        metadata: {
+          language: 'en',
+          type: 'research_paper',
+          category: 'research paper',
+          author: result.author,
+          publishedDate: result.publishedDate,
+          highlights: result.highlights,
+          image: result.image,
+        },
+      }));
+      elizaLogger.info(`[Exa] Found ${results.length} academic results`);
+      return results;
+    } catch (error: any) {
+      elizaLogger.error(`[Exa] Academic search error:`, error);
+      throw error;
+    }
+  }
+  async findSimilar(url: string, maxResults?: number): Promise<SearchResult[]> {
+    try {
+      elizaLogger.info(`[Exa] Finding similar pages to: ${url}`);
+      const response = await axios.post(
+        `${this.baseUrl}/findSimilar`,
+        {
+          url,
+          numResults: maxResults || 10,
+          text: true,
+          summary: {
+            query: "Key similarities and main points"
+          }
+        },
+        {
+          headers: {
+            'x-api-key': this.apiKey,
+            'Content-Type': 'application/json',
+          },
+        }
+      );
+      if (!response.data || !response.data.results) {
+        elizaLogger.warn('[Exa] No similar results found');
+        return [];
+      }
+      const results: SearchResult[] = response.data.results.map((result: any, index: number) => ({
+        title: result.title || 'Untitled',
+        url: result.url,
+        snippet: result.summary || result.text?.substring(0, 200) || 'No description available',
+        score: result.score || (0.9 - index * 0.05),
+        provider: 'exa',
+        metadata: {
+          language: 'en',
+          type: 'similar',
+          author: result.author,
+          publishedDate: result.publishedDate,
+          image: result.image,
+        },
+      }));
+      elizaLogger.info(`[Exa] Found ${results.length} similar results`);
+      return results;
+    } catch (error: any) {
+      elizaLogger.error(`[Exa] Find similar error:`, error);
+      throw error;
+    }
+  }
+}