npm - @juspay/yama - Versions diffs - 1.3.0 → 1.4.1 - Mend

@juspay/yama 1.3.0 → 1.4.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

package/CHANGELOG.md +12 -0
package/README.md +29 -1
package/dist/core/Guardian.d.ts +1 -0
package/dist/core/Guardian.js +21 -8
package/dist/core/providers/BitbucketProvider.d.ts +1 -1
package/dist/core/providers/BitbucketProvider.js +31 -1
package/dist/features/CodeReviewer.d.ts +17 -9
package/dist/features/CodeReviewer.js +274 -215
package/dist/features/MultiInstanceProcessor.d.ts +74 -0
package/dist/features/MultiInstanceProcessor.js +359 -0
package/dist/types/index.d.ts +124 -1
package/dist/utils/ContentSimilarityService.d.ts +74 -0
package/dist/utils/ContentSimilarityService.js +215 -0
package/dist/utils/ExactDuplicateRemover.d.ts +77 -0
package/dist/utils/ExactDuplicateRemover.js +361 -0
package/dist/utils/Logger.d.ts +3 -2
package/dist/utils/Logger.js +8 -4
package/dist/utils/ParallelProcessing.d.ts +112 -0
package/dist/utils/ParallelProcessing.js +228 -0
package/package.json +17 -17
package/yama.config.example.yaml +46 -4

package/dist/features/MultiInstanceProcessor.d.ts ADDED Viewed

@@ -0,0 +1,74 @@
+/**
+ * Multi-Instance Processor for Parallel Code Review
+ * Orchestrates multiple Neurolink SDK instances for diverse code analysis
+ */
+import { MultiInstanceConfig, MultiInstanceResult, CodeReviewConfig, ReviewOptions } from "../types/index.js";
+import { UnifiedContext } from "../core/ContextGatherer.js";
+import { BitbucketProvider } from "../core/providers/BitbucketProvider.js";
+/**
+ * Multi-Instance Processor
+ * Manages parallel execution of multiple CodeReviewer instances
+ */
+export declare class MultiInstanceProcessor {
+    private bitbucketProvider;
+    private baseReviewConfig;
+    private duplicateRemover;
+    constructor(bitbucketProvider: BitbucketProvider, baseReviewConfig: CodeReviewConfig);
+    /**
+     * Process code review using multiple instances
+     */
+    processWithMultipleInstances(context: UnifiedContext, options: ReviewOptions, multiInstanceConfig: MultiInstanceConfig): Promise<MultiInstanceResult>;
+    /**
+     * Execute all instances in parallel with concurrency control
+     */
+    private executeInstancesInParallel;
+    /**
+     * Execute a single instance with concurrency control
+     */
+    private executeInstanceWithConcurrency;
+    /**
+     * Validate provider string against allowed provider types
+     */
+    private validateProvider;
+    /**
+     * Execute a single instance
+     */
+    private executeInstance;
+    /**
+     * Validate multi-instance configuration
+     */
+    private validateMultiInstanceConfig;
+    /**
+     * Estimate tokens per instance based on context
+     */
+    private estimateTokensPerInstance;
+    /**
+     * Calculate total token budget for all instances
+     */
+    private calculateTotalTokenBudget;
+    /**
+     * Extract token usage from review result (if available)
+     */
+    private extractTokenUsage;
+    /**
+     * Create non-deduplicated result (when deduplication is disabled)
+     */
+    private createNonDeduplicatedResult;
+    /**
+     * Apply final filtering based on configuration
+     */
+    private applyFinalFiltering;
+    /**
+     * Prioritize violations based on strategy
+     */
+    private prioritizeViolations;
+    /**
+     * Create summary of multi-instance processing
+     */
+    private createSummary;
+}
+/**
+ * Factory function to create MultiInstanceProcessor
+ */
+export declare function createMultiInstanceProcessor(bitbucketProvider: BitbucketProvider, baseReviewConfig: CodeReviewConfig): MultiInstanceProcessor;
+//# sourceMappingURL=MultiInstanceProcessor.d.ts.map

package/dist/features/MultiInstanceProcessor.js ADDED Viewed

@@ -0,0 +1,359 @@
+/**
+ * Multi-Instance Processor for Parallel Code Review
+ * Orchestrates multiple Neurolink SDK instances for diverse code analysis
+ */
+import { createCodeReviewer } from "./CodeReviewer.js";
+import { createExactDuplicateRemover, } from "../utils/ExactDuplicateRemover.js";
+import { Semaphore, TokenBudgetManager, calculateOptimalConcurrency, } from "../utils/ParallelProcessing.js";
+import { getProviderTokenLimit } from "../utils/ProviderLimits.js";
+import { logger } from "../utils/Logger.js";
+/**
+ * Multi-Instance Processor
+ * Manages parallel execution of multiple CodeReviewer instances
+ */
+export class MultiInstanceProcessor {
+    bitbucketProvider;
+    baseReviewConfig;
+    duplicateRemover;
+    constructor(bitbucketProvider, baseReviewConfig) {
+        this.bitbucketProvider = bitbucketProvider;
+        this.baseReviewConfig = baseReviewConfig;
+        this.duplicateRemover = createExactDuplicateRemover();
+    }
+    /**
+     * Process code review using multiple instances
+     */
+    async processWithMultipleInstances(context, options, multiInstanceConfig) {
+        const startTime = Date.now();
+        try {
+            logger.phase("🚀 Starting multi-instance code review processing");
+            logger.info(`🔄 Launching ${multiInstanceConfig.instanceCount} instances: ${multiInstanceConfig.instances.map((i) => i.name).join(", ")}`);
+            // Step 1: Validate configuration
+            this.validateMultiInstanceConfig(multiInstanceConfig);
+            // Step 2: Execute instances in parallel
+            const instanceResults = await this.executeInstancesInParallel(context, options, multiInstanceConfig);
+            // Step 3: Deduplicate results
+            const deduplicationResult = multiInstanceConfig.deduplication.enabled
+                ? this.duplicateRemover.removeDuplicates(instanceResults)
+                : this.createNonDeduplicatedResult(instanceResults);
+            // Step 4: Apply final filtering if configured
+            const finalViolations = this.applyFinalFiltering(deduplicationResult.uniqueViolations, multiInstanceConfig.deduplication);
+            // Step 5: Create summary
+            const totalProcessingTime = Date.now() - startTime;
+            const summary = this.createSummary(instanceResults, deduplicationResult, finalViolations, totalProcessingTime);
+            logger.success(`✅ Multi-instance processing completed: ${summary.totalViolationsFound} → ${summary.uniqueViolationsAfterDedup} violations ` +
+                `(${summary.deduplicationRate.toFixed(1)}% reduction) in ${Math.round(totalProcessingTime / 1000)}s`);
+            // Step 6: Log detailed statistics
+            if (logger.getConfig().verbose) {
+                logger.info(this.duplicateRemover.getDeduplicationStats(deduplicationResult));
+            }
+            return {
+                instances: instanceResults,
+                deduplication: deduplicationResult,
+                finalViolations,
+                summary,
+            };
+        }
+        catch (error) {
+            logger.error(`Multi-instance processing failed: ${error.message}`);
+            throw error;
+        }
+    }
+    /**
+     * Execute all instances in parallel with concurrency control
+     */
+    async executeInstancesInParallel(context, options, multiInstanceConfig) {
+        const instances = multiInstanceConfig.instances;
+        // Calculate optimal concurrency
+        const avgTokensPerInstance = this.estimateTokensPerInstance(context);
+        const totalTokenBudget = this.calculateTotalTokenBudget(instances);
+        const optimalConcurrency = calculateOptimalConcurrency(instances.length, Math.min(instances.length, 3), // Max 3 concurrent instances by default
+        avgTokensPerInstance, totalTokenBudget);
+        // Initialize concurrency control
+        const semaphore = new Semaphore(optimalConcurrency);
+        const tokenBudget = new TokenBudgetManager(totalTokenBudget);
+        logger.info(`🎯 Parallel execution: ${optimalConcurrency} concurrent instances, ${totalTokenBudget} total token budget`);
+        // Execute instances with controlled concurrency
+        const instancePromises = instances.map((instanceConfig, index) => this.executeInstanceWithConcurrency(instanceConfig, context, options, semaphore, tokenBudget, index, instances.length));
+        // Wait for all instances to complete
+        const results = await Promise.allSettled(instancePromises);
+        // Process results and handle failures
+        const instanceResults = [];
+        for (let i = 0; i < results.length; i++) {
+            const result = results[i];
+            const instanceConfig = instances[i];
+            if (result.status === "fulfilled") {
+                instanceResults.push(result.value);
+            }
+            else {
+                logger.error(`❌ Instance ${instanceConfig.name} failed: ${result.reason.message}`);
+                instanceResults.push({
+                    instanceName: instanceConfig.name,
+                    violations: [],
+                    processingTime: 0,
+                    error: result.reason.message,
+                    success: false,
+                });
+            }
+        }
+        return instanceResults;
+    }
+    /**
+     * Execute a single instance with concurrency control
+     */
+    async executeInstanceWithConcurrency(instanceConfig, context, options, semaphore, tokenBudget, instanceIndex, totalInstances) {
+        // Acquire semaphore permit
+        await semaphore.acquire();
+        try {
+            const estimatedTokens = this.estimateTokensPerInstance(context);
+            // Check token budget
+            if (!tokenBudget.allocateForBatch(instanceIndex, estimatedTokens)) {
+                throw new Error(`Insufficient token budget for instance ${instanceConfig.name}`);
+            }
+            logger.info(`🔄 Processing instance ${instanceIndex + 1}/${totalInstances}: ${instanceConfig.name} ` +
+                `(${instanceConfig.provider}, temp: ${instanceConfig.temperature || "default"})`);
+            // Execute the instance
+            const result = await this.executeInstance(instanceConfig, context, options);
+            logger.info(`✅ Instance ${instanceConfig.name} completed: ${result.violations.length} violations ` +
+                `in ${Math.round(result.processingTime / 1000)}s`);
+            return result;
+        }
+        finally {
+            // Always release resources
+            tokenBudget.releaseBatch(instanceIndex);
+            semaphore.release();
+        }
+    }
+    /**
+     * Validate provider string against allowed provider types
+     */
+    validateProvider(provider) {
+        const validProviders = [
+            "auto",
+            "google-ai",
+            "openai",
+            "anthropic",
+            "azure",
+            "bedrock",
+            "vertex",
+        ];
+        if (!validProviders.includes(provider)) {
+            logger.warn(`Unknown provider '${provider}', falling back to 'auto'`);
+            return "auto";
+        }
+        return provider;
+    }
+    /**
+     * Execute a single instance
+     */
+    async executeInstance(instanceConfig, context, options) {
+        const startTime = Date.now();
+        try {
+            // Create instance-specific AI config
+            const aiConfig = {
+                provider: this.validateProvider(instanceConfig.provider),
+                model: instanceConfig.model,
+                temperature: instanceConfig.temperature,
+                maxTokens: instanceConfig.maxTokens,
+                timeout: instanceConfig.timeout,
+                enableAnalytics: true,
+                enableEvaluation: false,
+            };
+            // Create CodeReviewer for this instance
+            const codeReviewer = createCodeReviewer(this.bitbucketProvider, aiConfig, this.baseReviewConfig);
+            // Execute review with dry run to get violations without posting
+            const instanceOptions = { ...options, dryRun: true };
+            const reviewResult = await codeReviewer.reviewCodeWithContext(context, instanceOptions);
+            const processingTime = Date.now() - startTime;
+            return {
+                instanceName: instanceConfig.name,
+                violations: reviewResult.violations,
+                processingTime,
+                tokenUsage: this.extractTokenUsage(reviewResult),
+                success: true,
+            };
+        }
+        catch (error) {
+            const processingTime = Date.now() - startTime;
+            return {
+                instanceName: instanceConfig.name,
+                violations: [],
+                processingTime,
+                error: error.message,
+                success: false,
+            };
+        }
+    }
+    /**
+     * Validate multi-instance configuration
+     */
+    validateMultiInstanceConfig(config) {
+        if (!config.enabled) {
+            throw new Error("Multi-instance processing is not enabled");
+        }
+        if (config.instances.length === 0) {
+            throw new Error("No instances configured for multi-instance processing");
+        }
+        if (config.instances.length !== config.instanceCount) {
+            logger.warn(`Instance count mismatch: configured ${config.instanceCount}, found ${config.instances.length} instances`);
+        }
+        // Validate each instance
+        for (const instance of config.instances) {
+            if (!instance.name || !instance.provider) {
+                throw new Error(`Invalid instance configuration: name and provider are required`);
+            }
+        }
+        // Validate deduplication config
+        if (config.deduplication.enabled) {
+            if (config.deduplication.similarityThreshold < 0 ||
+                config.deduplication.similarityThreshold > 100) {
+                throw new Error("Similarity threshold must be between 0 and 100");
+            }
+            if (config.deduplication.maxCommentsToPost <= 0) {
+                throw new Error("Max comments to post must be greater than 0");
+            }
+        }
+    }
+    /**
+     * Estimate tokens per instance based on context
+     */
+    estimateTokensPerInstance(context) {
+        // Base estimation: context size + overhead
+        const contextSize = JSON.stringify(context).length;
+        const estimatedTokens = Math.ceil(contextSize / 4); // ~4 chars per token
+        // Add overhead for prompts and response
+        const overhead = 5000;
+        return estimatedTokens + overhead;
+    }
+    /**
+     * Calculate total token budget for all instances
+     */
+    calculateTotalTokenBudget(instances) {
+        // Use the most restrictive provider limit among all instances
+        let minLimit = Infinity;
+        for (const instance of instances) {
+            const providerLimit = getProviderTokenLimit(instance.provider, true);
+            const instanceLimit = instance.maxTokens || providerLimit;
+            minLimit = Math.min(minLimit, instanceLimit);
+        }
+        // Total budget is the sum of all instance limits, but with safety margin
+        const totalBudget = instances.length * minLimit * 0.8; // 80% safety margin
+        logger.debug(`Calculated total token budget: ${totalBudget} (${instances.length} instances × ${minLimit} × 0.8)`);
+        return totalBudget;
+    }
+    /**
+     * Extract token usage from review result (if available)
+     */
+    extractTokenUsage(reviewResult) {
+        // This would need to be implemented based on how NeuroLink returns usage data
+        // For now, return undefined as we don't have access to this data
+        return undefined;
+    }
+    /**
+     * Create non-deduplicated result (when deduplication is disabled)
+     */
+    createNonDeduplicatedResult(instanceResults) {
+        const allViolations = [];
+        const instanceContributions = new Map();
+        for (const result of instanceResults) {
+            if (result.success && result.violations) {
+                allViolations.push(...result.violations);
+                instanceContributions.set(result.instanceName, result.violations.length);
+            }
+        }
+        return {
+            uniqueViolations: allViolations,
+            duplicatesRemoved: {
+                exactDuplicates: 0,
+                normalizedDuplicates: 0,
+                sameLineDuplicates: 0,
+            },
+            instanceContributions,
+            processingMetrics: {
+                totalViolationsInput: allViolations.length,
+                exactDuplicatesRemoved: 0,
+                normalizedDuplicatesRemoved: 0,
+                sameLineDuplicatesRemoved: 0,
+                finalUniqueViolations: allViolations.length,
+                deduplicationRate: 0,
+                instanceContributions: Object.fromEntries(instanceContributions),
+                processingTimeMs: 0,
+            },
+        };
+    }
+    /**
+     * Apply final filtering based on configuration
+     */
+    applyFinalFiltering(violations, deduplicationConfig) {
+        if (!deduplicationConfig.maxCommentsToPost ||
+            violations.length <= deduplicationConfig.maxCommentsToPost) {
+            return violations;
+        }
+        logger.info(`📊 Applying final filtering: ${violations.length} → ${deduplicationConfig.maxCommentsToPost} violations`);
+        // Sort by priority based on configuration
+        const prioritized = this.prioritizeViolations(violations, deduplicationConfig.prioritizeBy);
+        // Take only the top N violations
+        const filtered = prioritized.slice(0, deduplicationConfig.maxCommentsToPost);
+        logger.info(`🎯 Final filtering applied: kept top ${filtered.length} violations prioritized by ${deduplicationConfig.prioritizeBy}`);
+        return filtered;
+    }
+    /**
+     * Prioritize violations based on strategy
+     */
+    prioritizeViolations(violations, strategy) {
+        const severityOrder = {
+            CRITICAL: 4,
+            MAJOR: 3,
+            MINOR: 2,
+            SUGGESTION: 1,
+        };
+        switch (strategy) {
+            case "severity":
+                return violations.sort((a, b) => {
+                    const aScore = severityOrder[a.severity] || 0;
+                    const bScore = severityOrder[b.severity] || 0;
+                    return bScore - aScore; // Higher severity first
+                });
+            case "similarity":
+            case "confidence":
+                // For now, fall back to severity-based sorting
+                // These could be implemented with more sophisticated algorithms
+                logger.debug(`Prioritization strategy '${strategy}' not fully implemented, using severity`);
+                return this.prioritizeViolations(violations, "severity");
+            default:
+                logger.warn(`Unknown prioritization strategy: ${strategy}, using severity`);
+                return this.prioritizeViolations(violations, "severity");
+        }
+    }
+    /**
+     * Create summary of multi-instance processing
+     */
+    createSummary(instanceResults, deduplicationResult, finalViolations, totalProcessingTime) {
+        const successfulInstances = instanceResults.filter((r) => r.success).length;
+        const failedInstances = instanceResults.length - successfulInstances;
+        const totalViolationsFound = instanceResults
+            .filter((r) => r.success)
+            .reduce((sum, r) => sum + r.violations.length, 0);
+        const deduplicationRate = totalViolationsFound > 0
+            ? ((totalViolationsFound - finalViolations.length) /
+                totalViolationsFound) *
+                100
+            : 0;
+        return {
+            totalInstances: instanceResults.length,
+            successfulInstances,
+            failedInstances,
+            totalViolationsFound,
+            uniqueViolationsAfterDedup: finalViolations.length,
+            deduplicationRate,
+            totalProcessingTime,
+        };
+    }
+}
+/**
+ * Factory function to create MultiInstanceProcessor
+ */
+export function createMultiInstanceProcessor(bitbucketProvider, baseReviewConfig) {
+    return new MultiInstanceProcessor(bitbucketProvider, baseReviewConfig);
+}
+//# sourceMappingURL=MultiInstanceProcessor.js.map

package/dist/types/index.d.ts CHANGED Viewed

@@ -163,7 +163,7 @@ export interface ReviewStatistics {
     minorCount: number;
     suggestionCount: number;
     batchCount?: number;
-    processingStrategy?: "single-request" | "batch-processing";
+    processingStrategy?: "single-request" | "batch-processing" | "multi-instance";
     averageBatchSize?: number;
     totalProcessingTime?: number;
 }
@@ -250,7 +250,11 @@ export interface EnhancementResult {
         totalSections: number;
     };
 }
+export interface DisplayConfig {
+    showBanner: boolean;
+}
 export interface GuardianConfig {
+    display?: DisplayConfig;
     providers: {
         ai: AIProviderConfig;
         git: GitProviderConfig;
@@ -280,6 +284,16 @@ export interface CodeReviewConfig {
     analysisTemplate?: string;
     focusAreas?: string[];
     batchProcessing?: BatchProcessingConfig;
+    multiInstance?: MultiInstanceConfig;
+    semanticDeduplication?: SemanticDeduplicationConfig;
+}
+export interface SemanticDeduplicationConfig {
+    enabled: boolean;
+    similarityThreshold: number;
+    batchSize: number;
+    timeout: string;
+    fallbackOnError: boolean;
+    logMatches: boolean;
 }
 export interface BatchProcessingConfig {
     enabled: boolean;
@@ -288,6 +302,93 @@ export interface BatchProcessingConfig {
     parallelBatches: boolean;
     batchDelayMs: number;
     singleRequestThreshold: number;
+    parallel?: {
+        enabled: boolean;
+        maxConcurrentBatches: number;
+        rateLimitStrategy: "fixed" | "adaptive";
+        tokenBudgetDistribution: "equal" | "weighted";
+        failureHandling: "stop-all" | "continue";
+    };
+}
+export interface MultiInstanceConfig {
+    enabled: boolean;
+    instanceCount: number;
+    instances: InstanceConfig[];
+    deduplication: DeduplicationConfig;
+}
+export interface InstanceConfig {
+    name: string;
+    provider: string;
+    model?: string;
+    temperature?: number;
+    maxTokens?: number;
+    weight?: number;
+    timeout?: string;
+}
+export interface DeduplicationConfig {
+    enabled: boolean;
+    similarityThreshold: number;
+    aiProvider?: string;
+    maxCommentsToPost: number;
+    prioritizeBy: "severity" | "similarity" | "confidence";
+}
+export interface InstanceResult {
+    instanceName: string;
+    violations: Violation[];
+    processingTime: number;
+    tokenUsage?: {
+        input: number;
+        output: number;
+        total: number;
+    };
+    error?: string;
+    success: boolean;
+}
+export interface DeduplicationResult {
+    uniqueViolations: Violation[];
+    duplicatesRemoved: {
+        exactDuplicates: number;
+        normalizedDuplicates: number;
+        sameLineDuplicates: number;
+        semanticDuplicates?: number;
+    };
+    instanceContributions: Map<string, number>;
+    processingMetrics: DeduplicationMetrics;
+}
+export interface DeduplicationMetrics {
+    totalViolationsInput: number;
+    exactDuplicatesRemoved: number;
+    normalizedDuplicatesRemoved: number;
+    sameLineDuplicatesRemoved: number;
+    semanticDuplicatesRemoved?: number;
+    finalUniqueViolations: number;
+    deduplicationRate: number;
+    instanceContributions: Record<string, number>;
+    processingTimeMs: number;
+}
+export interface CommentDeduplicationResult {
+    uniqueViolations: Violation[];
+    duplicatesRemoved: number;
+    semanticMatches: Array<{
+        violation: string;
+        comment: string;
+        similarityScore: number;
+        reasoning?: string;
+    }>;
+}
+export interface MultiInstanceResult {
+    instances: InstanceResult[];
+    deduplication: DeduplicationResult;
+    finalViolations: Violation[];
+    summary: {
+        totalInstances: number;
+        successfulInstances: number;
+        failedInstances: number;
+        totalViolationsFound: number;
+        uniqueViolationsAfterDedup: number;
+        deduplicationRate: number;
+        totalProcessingTime: number;
+    };
 }
 export interface DescriptionEnhancementConfig {
     enabled: boolean;
@@ -446,6 +547,28 @@ export interface Cache {
         size: number;
     };
 }
+export interface ParallelProcessingMetrics {
+    totalBatches: number;
+    concurrentBatches: number;
+    parallelSpeedup: number;
+    tokenEfficiency: number;
+    failedBatches: number;
+    averageBatchTime: number;
+    totalProcessingTime: number;
+    serialProcessingTime?: number;
+}
+export interface SemaphoreInterface {
+    acquire(): Promise<void>;
+    release(): void;
+    getAvailablePermits(): number;
+}
+export interface TokenBudgetManagerInterface {
+    allocateForBatch(batchIndex: number, estimatedTokens: number): boolean;
+    releaseBatch(batchIndex: number): void;
+    getAvailableBudget(): number;
+    getTotalBudget(): number;
+    getUsedTokens(): number;
+}
 export declare class GuardianError extends Error {
     code: string;
     context?: any | undefined;

package/dist/utils/ContentSimilarityService.d.ts ADDED Viewed

@@ -0,0 +1,74 @@
+/**
+ * Content Similarity Service for Semantic Deduplication
+ * Uses AI to compare violations with existing PR comments for semantic similarity
+ */
+import { Violation, PRComment, AIProviderConfig } from "../types/index.js";
+export interface SimilarityResult {
+    violationIndex: number;
+    commentIndex: number;
+    violationId: string;
+    commentId: number;
+    similarityScore: number;
+    reasoning?: string;
+}
+export interface SimilarityBatch {
+    violations: Array<{
+        index: number;
+        id: string;
+        content: string;
+    }>;
+    comments: Array<{
+        index: number;
+        id: number;
+        content: string;
+    }>;
+}
+/**
+ * Service for calculating semantic similarity between violations and PR comments
+ */
+export declare class ContentSimilarityService {
+    private neurolink;
+    private aiConfig;
+    constructor(aiConfig: AIProviderConfig);
+    /**
+     * Calculate similarity scores between violations and comments in batches
+     */
+    batchCalculateSimilarity(violations: Violation[], comments: PRComment[], batchSize?: number): Promise<SimilarityResult[]>;
+    /**
+     * Prepare violation content for AI analysis
+     */
+    private prepareViolationContent;
+    /**
+     * Prepare comment content for AI analysis
+     */
+    private prepareCommentContent;
+    /**
+     * Extract meaningful content from violation for comparison
+     */
+    private extractViolationContent;
+    /**
+     * Extract meaningful content from comment for comparison
+     */
+    private extractCommentContent;
+    /**
+     * Process a single batch of violations against all comments
+     */
+    private processSimilarityBatch;
+    /**
+     * Create AI prompt for similarity analysis
+     */
+    private createSimilarityPrompt;
+    /**
+     * Parse AI response to extract similarity results
+     */
+    private parseSimilarityResponse;
+    /**
+     * Simple delay utility for rate limiting
+     */
+    private delay;
+}
+/**
+ * Factory function to create ContentSimilarityService
+ */
+export declare function createContentSimilarityService(aiConfig: AIProviderConfig): ContentSimilarityService;
+//# sourceMappingURL=ContentSimilarityService.d.ts.map