npm - @weave_protocol/domere - Versions diffs - 1.0.0 - Mend

@weave_protocol/domere 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (104) hide show

package/PLANNING.md +231 -0
package/README.md +50 -0
package/dist/anchoring/ethereum.d.ts +135 -0
package/dist/anchoring/ethereum.d.ts.map +1 -0
package/dist/anchoring/ethereum.js +474 -0
package/dist/anchoring/ethereum.js.map +1 -0
package/dist/anchoring/index.d.ts +93 -0
package/dist/anchoring/index.d.ts.map +1 -0
package/dist/anchoring/index.js +184 -0
package/dist/anchoring/index.js.map +1 -0
package/dist/anchoring/merkle.d.ts +91 -0
package/dist/anchoring/merkle.d.ts.map +1 -0
package/dist/anchoring/merkle.js +203 -0
package/dist/anchoring/merkle.js.map +1 -0
package/dist/anchoring/solana.d.ts +85 -0
package/dist/anchoring/solana.d.ts.map +1 -0
package/dist/anchoring/solana.js +301 -0
package/dist/anchoring/solana.js.map +1 -0
package/dist/constants.d.ts +130 -0
package/dist/constants.d.ts.map +1 -0
package/dist/constants.js +536 -0
package/dist/constants.js.map +1 -0
package/dist/index.d.ts +13 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +37 -0
package/dist/index.js.map +1 -0
package/dist/language/code-analyzer.d.ts +80 -0
package/dist/language/code-analyzer.d.ts.map +1 -0
package/dist/language/code-analyzer.js +489 -0
package/dist/language/code-analyzer.js.map +1 -0
package/dist/language/detector.d.ts +53 -0
package/dist/language/detector.d.ts.map +1 -0
package/dist/language/detector.js +248 -0
package/dist/language/detector.js.map +1 -0
package/dist/language/index.d.ts +61 -0
package/dist/language/index.d.ts.map +1 -0
package/dist/language/index.js +109 -0
package/dist/language/index.js.map +1 -0
package/dist/language/nl-analyzer.d.ts +59 -0
package/dist/language/nl-analyzer.d.ts.map +1 -0
package/dist/language/nl-analyzer.js +350 -0
package/dist/language/nl-analyzer.js.map +1 -0
package/dist/language/semantic.d.ts +48 -0
package/dist/language/semantic.d.ts.map +1 -0
package/dist/language/semantic.js +329 -0
package/dist/language/semantic.js.map +1 -0
package/dist/storage/index.d.ts +6 -0
package/dist/storage/index.d.ts.map +1 -0
package/dist/storage/index.js +6 -0
package/dist/storage/index.js.map +1 -0
package/dist/storage/memory.d.ts +48 -0
package/dist/storage/memory.d.ts.map +1 -0
package/dist/storage/memory.js +211 -0
package/dist/storage/memory.js.map +1 -0
package/dist/thread/drift.d.ts +43 -0
package/dist/thread/drift.d.ts.map +1 -0
package/dist/thread/drift.js +248 -0
package/dist/thread/drift.js.map +1 -0
package/dist/thread/index.d.ts +9 -0
package/dist/thread/index.d.ts.map +1 -0
package/dist/thread/index.js +9 -0
package/dist/thread/index.js.map +1 -0
package/dist/thread/intent.d.ts +68 -0
package/dist/thread/intent.d.ts.map +1 -0
package/dist/thread/intent.js +333 -0
package/dist/thread/intent.js.map +1 -0
package/dist/thread/manager.d.ts +85 -0
package/dist/thread/manager.d.ts.map +1 -0
package/dist/thread/manager.js +305 -0
package/dist/thread/manager.js.map +1 -0
package/dist/thread/weave.d.ts +61 -0
package/dist/thread/weave.d.ts.map +1 -0
package/dist/thread/weave.js +158 -0
package/dist/thread/weave.js.map +1 -0
package/dist/tools/index.d.ts +18 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +102 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +466 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +48 -0
package/dist/types.js.map +1 -0
package/package.json +24 -0
package/src/anchoring/ethereum.ts +568 -0
package/src/anchoring/index.ts +236 -0
package/src/anchoring/merkle.ts +256 -0
package/src/anchoring/solana.ts +370 -0
package/src/constants.ts +566 -0
package/src/index.ts +43 -0
package/src/language/code-analyzer.ts +564 -0
package/src/language/detector.ts +297 -0
package/src/language/index.ts +129 -0
package/src/language/nl-analyzer.ts +411 -0
package/src/language/semantic.ts +385 -0
package/src/storage/index.ts +6 -0
package/src/storage/memory.ts +271 -0
package/src/thread/drift.ts +319 -0
package/src/thread/index.ts +9 -0
package/src/thread/intent.ts +409 -0
package/src/thread/manager.ts +414 -0
package/src/thread/weave.ts +205 -0
package/src/tools/index.ts +107 -0
package/src/types.ts +736 -0
package/tsconfig.json +19 -0

package/src/language/detector.ts ADDED Viewed

@@ -0,0 +1,297 @@
+/**
+ * Dōmere - The Judge Protocol
+ * Language Detection
+ */
+import type {
+  LanguageAnalysis,
+  DetectedLanguage,
+  LanguageSegment,
+  LanguageType,
+} from '../types.js';
+import { LANGUAGE_PATTERNS } from '../constants.js';
+// ============================================================================
+// Language Detector
+// ============================================================================
+export class LanguageDetector {
+  /**
+   * Detect the primary language(s) in content
+   */
+  detect(content: string): LanguageAnalysis {
+    const detectedLanguages = this.detectLanguages(content);
+    const primary = this.determinePrimaryLanguage(detectedLanguages);
+    return {
+      detected_languages: detectedLanguages,
+      primary_language: primary.language,
+      confidence: primary.confidence,
+    };
+  }
+  /**
+   * Detect all languages present in content
+   */
+  detectLanguages(content: string): DetectedLanguage[] {
+    const results: Map<LanguageType, { score: number; segments: LanguageSegment[] }> = new Map();
+    // First pass: detect code languages (more specific patterns)
+    const codeLanguages: LanguageType[] = [
+      'typescript', 'javascript', 'python', 'sql', 'java', 'csharp', 'go', 'rust',
+      'ruby', 'php', 'swift', 'kotlin', 'scala', 'bash', 'powershell',
+      'json', 'yaml', 'xml', 'html', 'css', 'markdown',
+      'graphql', 'protobuf', 'regex',
+    ];
+    for (const lang of codeLanguages) {
+      const detection = this.detectLanguage(content, lang);
+      if (detection.score > 0.1) {
+        results.set(lang, detection);
+      }
+    }
+    // If no code detected, check for natural language
+    if (results.size === 0 || this.isLikelyNaturalLanguage(content)) {
+      const nlLanguages: LanguageType[] = ['english', 'spanish', 'french', 'german', 'chinese', 'japanese'];
+      for (const lang of nlLanguages) {
+        const detection = this.detectLanguage(content, lang);
+        if (detection.score > 0.1) {
+          // Check if we already have code - if so, this might be mixed
+          const existingTotal = Array.from(results.values()).reduce((sum, d) => sum + d.score, 0);
+          if (existingTotal < 0.5 || detection.score > 0.3) {
+            results.set(lang, detection);
+          }
+        }
+      }
+    }
+    // Convert to array and normalize
+    const detected: DetectedLanguage[] = [];
+    const totalScore = Array.from(results.values()).reduce((sum, d) => sum + d.score, 0);
+    for (const [language, data] of results) {
+      const confidence = totalScore > 0 ? data.score / totalScore : 0;
+      if (confidence > 0.05) {  // Only include if > 5% confidence
+        detected.push({
+          language,
+          confidence,
+          segments: data.segments,
+        });
+      }
+    }
+    // Sort by confidence
+    detected.sort((a, b) => b.confidence - a.confidence);
+    // If nothing detected, return unknown
+    if (detected.length === 0) {
+      return [{
+        language: 'unknown',
+        confidence: 1,
+        segments: [{ start: 0, end: content.length, language: 'unknown', content, confidence: 1 }],
+      }];
+    }
+    return detected;
+  }
+  /**
+   * Detect a specific language in content
+   */
+  private detectLanguage(content: string, language: LanguageType): { score: number; segments: LanguageSegment[] } {
+    const config = LANGUAGE_PATTERNS[language];
+    if (!config) {
+      return { score: 0, segments: [] };
+    }
+    let score = 0;
+    const segments: LanguageSegment[] = [];
+    const contentLower = content.toLowerCase();
+    // Check patterns
+    for (const pattern of config.patterns) {
+      const matches = content.match(pattern);
+      if (matches) {
+        score += matches.length * 0.15;
+        // Find positions of matches
+        let lastIndex = 0;
+        for (const match of matches) {
+          const index = content.indexOf(match, lastIndex);
+          if (index !== -1) {
+            segments.push({
+              start: index,
+              end: index + match.length,
+              language,
+              content: match,
+              confidence: 0.8,
+            });
+            lastIndex = index + match.length;
+          }
+        }
+      }
+    }
+    // Check keywords
+    for (const keyword of config.keywords) {
+      const keywordLower = keyword.toLowerCase();
+      // Match whole words only
+      const regex = new RegExp(`\\b${this.escapeRegex(keywordLower)}\\b`, 'gi');
+      const matches = contentLower.match(regex);
+      if (matches) {
+        score += matches.length * 0.05;
+      }
+    }
+    // Normalize score (cap at 1)
+    score = Math.min(1, score);
+    // Merge overlapping segments
+    const mergedSegments = this.mergeSegments(segments);
+    return { score, segments: mergedSegments };
+  }
+  /**
+   * Check if content is likely natural language (not code)
+   */
+  private isLikelyNaturalLanguage(content: string): boolean {
+    // Check for common indicators of natural language
+    const sentencePattern = /[.!?]\s+[A-Z]/g;
+    const sentences = content.match(sentencePattern)?.length || 0;
+    // Check for lack of code indicators
+    const codeIndicators = /[{}();=<>]|\bfunction\b|\bclass\b|\bdef\b|\bimport\b|\bexport\b/g;
+    const codeMatches = content.match(codeIndicators)?.length || 0;
+    // Natural language has more sentences than code indicators
+    return sentences > codeMatches || (sentences > 2 && codeMatches < 5);
+  }
+  /**
+   * Determine the primary language
+   */
+  private determinePrimaryLanguage(detected: DetectedLanguage[]): { language: LanguageType; confidence: number } {
+    if (detected.length === 0) {
+      return { language: 'unknown', confidence: 0 };
+    }
+    // If multiple languages with similar confidence, it's mixed
+    if (detected.length > 1 && detected[0].confidence < 0.6 &&
+        detected[1].confidence > detected[0].confidence * 0.5) {
+      return { language: 'mixed', confidence: detected[0].confidence };
+    }
+    return { language: detected[0].language, confidence: detected[0].confidence };
+  }
+  /**
+   * Merge overlapping segments
+   */
+  private mergeSegments(segments: LanguageSegment[]): LanguageSegment[] {
+    if (segments.length <= 1) return segments;
+    // Sort by start position
+    segments.sort((a, b) => a.start - b.start);
+    const merged: LanguageSegment[] = [];
+    let current = segments[0];
+    for (let i = 1; i < segments.length; i++) {
+      const next = segments[i];
+      if (next.start <= current.end) {
+        // Overlapping - merge
+        current = {
+          start: current.start,
+          end: Math.max(current.end, next.end),
+          language: current.language,
+          content: current.content + next.content.slice(Math.max(0, current.end - next.start)),
+          confidence: Math.max(current.confidence, next.confidence),
+        };
+      } else {
+        merged.push(current);
+        current = next;
+      }
+    }
+    merged.push(current);
+    return merged;
+  }
+  /**
+   * Escape regex special characters
+   */
+  private escapeRegex(str: string): string {
+    return str.replace(/[.*+?^${}()|[\]\\]/g, '\\$&');
+  }
+  /**
+   * Check if content is a specific language type
+   */
+  isLanguage(content: string, language: LanguageType): boolean {
+    const detection = this.detectLanguage(content, language);
+    return detection.score > 0.3;
+  }
+  /**
+   * Check if content contains code
+   */
+  containsCode(content: string): boolean {
+    const codeLanguages: LanguageType[] = [
+      'javascript', 'typescript', 'python', 'sql', 'java', 'csharp', 'go', 'rust',
+      'ruby', 'php', 'swift', 'kotlin', 'bash', 'powershell',
+    ];
+    for (const lang of codeLanguages) {
+      if (this.isLanguage(content, lang)) {
+        return true;
+      }
+    }
+    return false;
+  }
+  /**
+   * Extract code blocks from content
+   */
+  extractCodeBlocks(content: string): { language: string; code: string; start: number; end: number }[] {
+    const blocks: { language: string; code: string; start: number; end: number }[] = [];
+    // Match fenced code blocks (```language ... ```)
+    const fencedRegex = /```(\w+)?\s*\n([\s\S]*?)```/g;
+    let match;
+    while ((match = fencedRegex.exec(content)) !== null) {
+      const language = match[1] || 'unknown';
+      const code = match[2];
+      blocks.push({
+        language,
+        code,
+        start: match.index,
+        end: match.index + match[0].length,
+      });
+    }
+    // Match indented code blocks (4 spaces or tab)
+    const indentedRegex = /(?:^|\n)((?:(?:    |\t).+\n?)+)/g;
+    while ((match = indentedRegex.exec(content)) !== null) {
+      const code = match[1].replace(/^(    |\t)/gm, '');
+      // Detect language of this block
+      const detection = this.detectLanguages(code);
+      const language = detection[0]?.language || 'unknown';
+      blocks.push({
+        language,
+        code,
+        start: match.index,
+        end: match.index + match[0].length,
+      });
+    }
+    return blocks;
+  }
+}

package/src/language/index.ts ADDED Viewed

@@ -0,0 +1,129 @@
+/**
+ * Dōmere - The Judge Protocol
+ * Language Module
+ */
+export { LanguageDetector } from './detector.js';
+export { SemanticAnalyzer } from './semantic.js';
+export { CodeAnalyzer } from './code-analyzer.js';
+export { NLAnalyzer } from './nl-analyzer.js';
+import type { LanguageAnalysis, LanguageType } from '../types.js';
+import { LanguageDetector } from './detector.js';
+import { SemanticAnalyzer } from './semantic.js';
+import { CodeAnalyzer } from './code-analyzer.js';
+import { NLAnalyzer } from './nl-analyzer.js';
+// ============================================================================
+// Unified Language Analyzer
+// ============================================================================
+export class LanguageAnalyzerService {
+  private detector: LanguageDetector;
+  private semantic: SemanticAnalyzer;
+  private code: CodeAnalyzer;
+  private nl: NLAnalyzer;
+  constructor() {
+    this.detector = new LanguageDetector();
+    this.semantic = new SemanticAnalyzer();
+    this.code = new CodeAnalyzer();
+    this.nl = new NLAnalyzer();
+  }
+  /**
+   * Perform complete language analysis
+   */
+  analyze(content: string): LanguageAnalysis {
+    // First detect languages
+    const detection = this.detector.detect(content);
+    // Build full analysis
+    const analysis: LanguageAnalysis = {
+      ...detection,
+    };
+    // Add semantic analysis
+    analysis.semantic = this.semantic.analyze(content);
+    // Add code analysis if code detected
+    const codeLanguages: LanguageType[] = [
+      'javascript', 'typescript', 'python', 'sql', 'java', 'csharp', 'go', 'rust',
+      'ruby', 'php', 'swift', 'kotlin', 'bash', 'powershell',
+    ];
+    if (codeLanguages.includes(detection.primary_language as LanguageType)) {
+      analysis.code_analysis = this.code.analyze(content, detection.primary_language as LanguageType);
+    }
+    // Add NL analysis for natural language or mixed content
+    const nlLanguages: LanguageType[] = ['english', 'spanish', 'french', 'german', 'chinese', 'japanese', 'mixed', 'unknown'];
+    if (nlLanguages.includes(detection.primary_language as LanguageType) ||
+        detection.detected_languages.some(d => nlLanguages.includes(d.language))) {
+      analysis.nl_analysis = this.nl.analyze(content);
+    }
+    return analysis;
+  }
+  /**
+   * Quick language detection
+   */
+  detectLanguage(content: string): { language: LanguageType; confidence: number } {
+    const detection = this.detector.detect(content);
+    return {
+      language: detection.primary_language as LanguageType,
+      confidence: detection.confidence,
+    };
+  }
+  /**
+   * Check if content contains code
+   */
+  containsCode(content: string): boolean {
+    return this.detector.containsCode(content);
+  }
+  /**
+   * Analyze code specifically
+   */
+  analyzeCode(code: string, language?: LanguageType) {
+    const lang = language || this.detectLanguage(code).language;
+    return this.code.analyze(code, lang);
+  }
+  /**
+   * Check for injection attempts
+   */
+  checkInjection(content: string) {
+    return this.nl.analyze(content);
+  }
+  /**
+   * Get injection risk score
+   */
+  getInjectionRisk(content: string): number {
+    return this.nl.getInjectionRiskScore(content);
+  }
+  /**
+   * Extract entities
+   */
+  extractEntities(content: string) {
+    return this.semantic.extractEntities(content);
+  }
+  /**
+   * Classify intent
+   */
+  classifyIntent(content: string) {
+    return this.semantic.classifyIntent(content);
+  }
+  /**
+   * Extract code blocks from mixed content
+   */
+  extractCodeBlocks(content: string) {
+    return this.detector.extractCodeBlocks(content);
+  }
+}