npm - rag-lite-ts - Versions diffs - 1.0.2 → 2.0.0 - Mend

rag-lite-ts 1.0.2 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

package/README.md +606 -93
package/dist/cli/indexer.js +192 -4
package/dist/cli/search.js +50 -11
package/dist/cli.js +183 -26
package/dist/core/abstract-embedder.d.ts +125 -0
package/dist/core/abstract-embedder.js +264 -0
package/dist/core/actionable-error-messages.d.ts +60 -0
package/dist/core/actionable-error-messages.js +397 -0
package/dist/core/batch-processing-optimizer.d.ts +155 -0
package/dist/core/batch-processing-optimizer.js +541 -0
package/dist/core/chunker.d.ts +2 -0
package/dist/core/cli-database-utils.d.ts +53 -0
package/dist/core/cli-database-utils.js +239 -0
package/dist/core/config.js +10 -3
package/dist/core/content-errors.d.ts +111 -0
package/dist/core/content-errors.js +362 -0
package/dist/core/content-manager.d.ts +343 -0
package/dist/core/content-manager.js +1504 -0
package/dist/core/content-performance-optimizer.d.ts +150 -0
package/dist/core/content-performance-optimizer.js +516 -0
package/dist/core/content-resolver.d.ts +104 -0
package/dist/core/content-resolver.js +285 -0
package/dist/core/cross-modal-search.d.ts +164 -0
package/dist/core/cross-modal-search.js +342 -0
package/dist/core/database-connection-manager.d.ts +109 -0
package/dist/core/database-connection-manager.js +304 -0
package/dist/core/db.d.ts +141 -2
package/dist/core/db.js +631 -89
package/dist/core/embedder-factory.d.ts +176 -0
package/dist/core/embedder-factory.js +338 -0
package/dist/core/index.d.ts +3 -1
package/dist/core/index.js +4 -1
package/dist/core/ingestion.d.ts +85 -15
package/dist/core/ingestion.js +510 -45
package/dist/core/lazy-dependency-loader.d.ts +152 -0
package/dist/core/lazy-dependency-loader.js +453 -0
package/dist/core/mode-detection-service.d.ts +150 -0
package/dist/core/mode-detection-service.js +565 -0
package/dist/core/mode-model-validator.d.ts +92 -0
package/dist/core/mode-model-validator.js +203 -0
package/dist/core/model-registry.d.ts +120 -0
package/dist/core/model-registry.js +415 -0
package/dist/core/model-validator.d.ts +217 -0
package/dist/core/model-validator.js +782 -0
package/dist/core/polymorphic-search-factory.d.ts +154 -0
package/dist/core/polymorphic-search-factory.js +344 -0
package/dist/core/raglite-paths.d.ts +121 -0
package/dist/core/raglite-paths.js +145 -0
package/dist/core/reranking-config.d.ts +42 -0
package/dist/core/reranking-config.js +156 -0
package/dist/core/reranking-factory.d.ts +92 -0
package/dist/core/reranking-factory.js +591 -0
package/dist/core/reranking-strategies.d.ts +325 -0
package/dist/core/reranking-strategies.js +720 -0
package/dist/core/resource-cleanup.d.ts +163 -0
package/dist/core/resource-cleanup.js +371 -0
package/dist/core/resource-manager.d.ts +212 -0
package/dist/core/resource-manager.js +564 -0
package/dist/core/search.d.ts +28 -1
package/dist/core/search.js +83 -5
package/dist/core/streaming-operations.d.ts +145 -0
package/dist/core/streaming-operations.js +409 -0
package/dist/core/types.d.ts +3 -0
package/dist/core/universal-embedder.d.ts +177 -0
package/dist/core/universal-embedder.js +139 -0
package/dist/core/validation-messages.d.ts +99 -0
package/dist/core/validation-messages.js +334 -0
package/dist/core/vector-index.js +7 -8
package/dist/factories/index.d.ts +1 -1
package/dist/factories/text-factory.d.ts +128 -34
package/dist/factories/text-factory.js +346 -97
package/dist/file-processor.d.ts +88 -2
package/dist/file-processor.js +720 -17
package/dist/index.d.ts +9 -0
package/dist/index.js +11 -0
package/dist/ingestion.d.ts +16 -0
package/dist/ingestion.js +21 -0
package/dist/mcp-server.d.ts +35 -3
package/dist/mcp-server.js +1107 -31
package/dist/multimodal/clip-embedder.d.ts +314 -0
package/dist/multimodal/clip-embedder.js +945 -0
package/dist/multimodal/index.d.ts +6 -0
package/dist/multimodal/index.js +6 -0
package/dist/run-error-recovery-tests.d.ts +7 -0
package/dist/run-error-recovery-tests.js +101 -0
package/dist/search.d.ts +26 -0
package/dist/search.js +54 -1
package/dist/test-utils.d.ts +8 -26
package/dist/text/chunker.d.ts +1 -0
package/dist/text/embedder.js +15 -8
package/dist/text/index.d.ts +1 -0
package/dist/text/index.js +1 -0
package/dist/text/reranker.d.ts +1 -2
package/dist/text/reranker.js +17 -47
package/dist/text/sentence-transformer-embedder.d.ts +96 -0
package/dist/text/sentence-transformer-embedder.js +340 -0
package/dist/types.d.ts +39 -0
package/dist/utils/vector-math.d.ts +31 -0
package/dist/utils/vector-math.js +70 -0
package/package.json +15 -3
package/dist/api-errors.d.ts.map +0 -1
package/dist/api-errors.js.map +0 -1
package/dist/cli/indexer.d.ts.map +0 -1
package/dist/cli/indexer.js.map +0 -1
package/dist/cli/search.d.ts.map +0 -1
package/dist/cli/search.js.map +0 -1
package/dist/cli.d.ts.map +0 -1
package/dist/cli.js.map +0 -1
package/dist/config.d.ts.map +0 -1
package/dist/config.js.map +0 -1
package/dist/core/adapters.d.ts.map +0 -1
package/dist/core/adapters.js.map +0 -1
package/dist/core/chunker.d.ts.map +0 -1
package/dist/core/chunker.js.map +0 -1
package/dist/core/config.d.ts.map +0 -1
package/dist/core/config.js.map +0 -1
package/dist/core/db.d.ts.map +0 -1
package/dist/core/db.js.map +0 -1
package/dist/core/error-handler.d.ts.map +0 -1
package/dist/core/error-handler.js.map +0 -1
package/dist/core/index.d.ts.map +0 -1
package/dist/core/index.js.map +0 -1
package/dist/core/ingestion.d.ts.map +0 -1
package/dist/core/ingestion.js.map +0 -1
package/dist/core/interfaces.d.ts.map +0 -1
package/dist/core/interfaces.js.map +0 -1
package/dist/core/path-manager.d.ts.map +0 -1
package/dist/core/path-manager.js.map +0 -1
package/dist/core/search-example.d.ts +0 -25
package/dist/core/search-example.d.ts.map +0 -1
package/dist/core/search-example.js +0 -138
package/dist/core/search-example.js.map +0 -1
package/dist/core/search-pipeline-example.d.ts +0 -21
package/dist/core/search-pipeline-example.d.ts.map +0 -1
package/dist/core/search-pipeline-example.js +0 -188
package/dist/core/search-pipeline-example.js.map +0 -1
package/dist/core/search-pipeline.d.ts.map +0 -1
package/dist/core/search-pipeline.js.map +0 -1
package/dist/core/search.d.ts.map +0 -1
package/dist/core/search.js.map +0 -1
package/dist/core/types.d.ts.map +0 -1
package/dist/core/types.js.map +0 -1
package/dist/core/vector-index.d.ts.map +0 -1
package/dist/core/vector-index.js.map +0 -1
package/dist/dom-polyfills.d.ts.map +0 -1
package/dist/dom-polyfills.js.map +0 -1
package/dist/examples/clean-api-examples.d.ts +0 -44
package/dist/examples/clean-api-examples.d.ts.map +0 -1
package/dist/examples/clean-api-examples.js +0 -206
package/dist/examples/clean-api-examples.js.map +0 -1
package/dist/factories/index.d.ts.map +0 -1
package/dist/factories/index.js.map +0 -1
package/dist/factories/text-factory.d.ts.map +0 -1
package/dist/factories/text-factory.js.map +0 -1
package/dist/file-processor.d.ts.map +0 -1
package/dist/file-processor.js.map +0 -1
package/dist/index-manager.d.ts.map +0 -1
package/dist/index-manager.js.map +0 -1
package/dist/index.d.ts.map +0 -1
package/dist/index.js.map +0 -1
package/dist/indexer.d.ts.map +0 -1
package/dist/indexer.js.map +0 -1
package/dist/ingestion.d.ts.map +0 -1
package/dist/ingestion.js.map +0 -1
package/dist/mcp-server.d.ts.map +0 -1
package/dist/mcp-server.js.map +0 -1
package/dist/preprocess.d.ts.map +0 -1
package/dist/preprocess.js.map +0 -1
package/dist/preprocessors/index.d.ts.map +0 -1
package/dist/preprocessors/index.js.map +0 -1
package/dist/preprocessors/mdx.d.ts.map +0 -1
package/dist/preprocessors/mdx.js.map +0 -1
package/dist/preprocessors/mermaid.d.ts.map +0 -1
package/dist/preprocessors/mermaid.js.map +0 -1
package/dist/preprocessors/registry.d.ts.map +0 -1
package/dist/preprocessors/registry.js.map +0 -1
package/dist/search-standalone.d.ts.map +0 -1
package/dist/search-standalone.js.map +0 -1
package/dist/search.d.ts.map +0 -1
package/dist/search.js.map +0 -1
package/dist/test-utils.d.ts.map +0 -1
package/dist/test-utils.js.map +0 -1
package/dist/text/chunker.d.ts.map +0 -1
package/dist/text/chunker.js.map +0 -1
package/dist/text/embedder.d.ts.map +0 -1
package/dist/text/embedder.js.map +0 -1
package/dist/text/index.d.ts.map +0 -1
package/dist/text/index.js.map +0 -1
package/dist/text/preprocessors/index.d.ts.map +0 -1
package/dist/text/preprocessors/index.js.map +0 -1
package/dist/text/preprocessors/mdx.d.ts.map +0 -1
package/dist/text/preprocessors/mdx.js.map +0 -1
package/dist/text/preprocessors/mermaid.d.ts.map +0 -1
package/dist/text/preprocessors/mermaid.js.map +0 -1
package/dist/text/preprocessors/registry.d.ts.map +0 -1
package/dist/text/preprocessors/registry.js.map +0 -1
package/dist/text/reranker.d.ts.map +0 -1
package/dist/text/reranker.js.map +0 -1
package/dist/text/tokenizer.d.ts.map +0 -1
package/dist/text/tokenizer.js.map +0 -1
package/dist/types.d.ts.map +0 -1
package/dist/types.js.map +0 -1

package/dist/multimodal/index.d.ts ADDED Viewed

@@ -0,0 +1,6 @@
+/**
+ * Multimodal implementation layer exports
+ * Provides CLIP-based embedders for cross-modal search capabilities
+ */
+export { CLIPEmbedder } from './clip-embedder.js';
+//# sourceMappingURL=index.d.ts.map

package/dist/multimodal/index.js ADDED Viewed

@@ -0,0 +1,6 @@
+/**
+ * Multimodal implementation layer exports
+ * Provides CLIP-based embedders for cross-modal search capabilities
+ */
+export { CLIPEmbedder } from './clip-embedder.js';
+//# sourceMappingURL=index.js.map

package/dist/run-error-recovery-tests.d.ts ADDED Viewed

@@ -0,0 +1,7 @@
+/**
+ * Test Runner for Chameleon Error Recovery and Reliability Tests
+ * Runs the comprehensive error recovery test suite
+ */
+declare function runTests(): Promise<boolean>;
+export { runTests };
+//# sourceMappingURL=run-error-recovery-tests.d.ts.map

package/dist/run-error-recovery-tests.js ADDED Viewed

@@ -0,0 +1,101 @@
+/**
+ * Test Runner for Chameleon Error Recovery and Reliability Tests
+ * Runs the comprehensive error recovery test suite
+ */
+import { spawn } from 'child_process';
+import { fileURLToPath } from 'url';
+import { dirname } from 'path';
+const __filename = fileURLToPath(import.meta.url);
+const __dirname = dirname(__filename);
+async function runTests() {
+    console.log('🧪 Running Chameleon Error Recovery and Reliability Tests...\n');
+    const testFiles = [
+        'chameleon-error-recovery.test.ts',
+        'chameleon-reliability-integration.test.ts',
+        'chameleon-stress-testing.test.ts',
+        'chameleon-error-simulation.test.ts'
+    ];
+    let totalTests = 0;
+    let passedTests = 0;
+    let failedTests = 0;
+    for (const testFile of testFiles) {
+        console.log(`\n📋 Running ${testFile}...`);
+        try {
+            // Build the test file first
+            const buildProcess = spawn('npx', ['tsc', '--project', 'tsconfig.test.json'], {
+                stdio: 'pipe',
+                shell: true
+            });
+            await new Promise((resolve, reject) => {
+                buildProcess.on('close', (code) => {
+                    if (code === 0) {
+                        resolve(code);
+                    }
+                    else {
+                        reject(new Error(`Build failed with code ${code}`));
+                    }
+                });
+            });
+            // Run the compiled test
+            const testProcess = spawn('node', ['--test', `dist/${testFile.replace('.ts', '.js')}`], {
+                stdio: 'pipe',
+                shell: true
+            });
+            let output = '';
+            let errorOutput = '';
+            testProcess.stdout?.on('data', (data) => {
+                output += data.toString();
+            });
+            testProcess.stderr?.on('data', (data) => {
+                errorOutput += data.toString();
+            });
+            await new Promise((resolve) => {
+                testProcess.on('close', (code) => {
+                    console.log(`Exit code: ${code}`);
+                    if (output) {
+                        console.log('Output:', output);
+                    }
+                    if (errorOutput) {
+                        console.log('Errors:', errorOutput);
+                    }
+                    // Count tests (this is a simple approximation)
+                    const testMatches = output.match(/✓|×/g);
+                    const currentTests = testMatches ? testMatches.length : 0;
+                    totalTests += currentTests;
+                    if (code === 0) {
+                        passedTests += currentTests;
+                        console.log(`✅ ${testFile} completed successfully`);
+                    }
+                    else {
+                        failedTests += currentTests;
+                        console.log(`❌ ${testFile} failed`);
+                    }
+                    resolve(code);
+                });
+            });
+        }
+        catch (error) {
+            console.error(`❌ Failed to run ${testFile}:`, error instanceof Error ? error.message : String(error));
+            failedTests++;
+        }
+    }
+    console.log('\n📊 Test Summary:');
+    console.log(`Total Tests: ${totalTests}`);
+    console.log(`Passed: ${passedTests}`);
+    console.log(`Failed: ${failedTests}`);
+    if (failedTests === 0) {
+        console.log('\n🎉 All error recovery tests completed!');
+        console.log('✅ System demonstrates robust error handling and recovery mechanisms');
+    }
+    else {
+        console.log('\n⚠️  Some tests failed - this may be expected in test environments');
+        console.log('🔍 Review the output above for specific failure details');
+    }
+    return failedTests === 0;
+}
+// Run tests if this file is executed directly
+if (import.meta.url === `file://${process.argv[1]}`) {
+    runTests().catch(console.error);
+}
+export { runTests };
+//# sourceMappingURL=run-error-recovery-tests.js.map

package/dist/search.d.ts CHANGED Viewed

@@ -40,6 +40,32 @@ export declare class SearchEngine {
      * Perform semantic search
      */
     search(query: string, options?: SearchOptions): Promise<SearchResult[]>;
+    /**
+     * Retrieve content by ID in the specified format
+     * @param contentId - Content ID to retrieve
+     * @param format - Format to return ('file' for CLI clients, 'base64' for MCP clients)
+     * @returns Promise that resolves to content in requested format
+     */
+    getContent(contentId: string, format?: 'file' | 'base64'): Promise<string>;
+    /**
+     * Retrieve multiple content items efficiently in batch
+     * @param contentIds - Array of content IDs to retrieve
+     * @param format - Format to return ('file' for CLI clients, 'base64' for MCP clients)
+     * @returns Promise that resolves to array of content in requested format
+     */
+    getContentBatch(contentIds: string[], format?: 'file' | 'base64'): Promise<string[]>;
+    /**
+     * Retrieve content metadata for result enhancement
+     * @param contentId - Content ID to get metadata for
+     * @returns Promise that resolves to content metadata
+     */
+    getContentMetadata(contentId: string): Promise<import('./core/content-resolver.js').ContentMetadata>;
+    /**
+     * Verify that content exists and is accessible
+     * @param contentId - Content ID to verify
+     * @returns Promise that resolves to true if content exists, false otherwise
+     */
+    verifyContentExists(contentId: string): Promise<boolean>;
     /**
      * Clean up resources
      */

package/dist/search.js CHANGED Viewed

@@ -74,8 +74,11 @@ export class SearchEngine {
                 const db = await openDatabase(this.dbPath);
                 const indexManager = new IndexManager(this.indexPath, this.dbPath, modelDefaults.dimensions, this.options.embeddingModel);
                 await indexManager.initialize();
+                // Create ContentResolver for unified content system
+                const { ContentResolver } = await import('./core/content-resolver.js');
+                const contentResolver = new ContentResolver(db);
                 // Create core engine with dependency injection
-                this.coreEngine = new CoreSearchEngine(embedFn, indexManager, db, this.options.rerankFn);
+                this.coreEngine = new CoreSearchEngine(embedFn, indexManager, db, this.options.rerankFn, contentResolver);
             }
             else {
                 // Use factory for standard initialization
@@ -94,6 +97,56 @@ export class SearchEngine {
         }
         return this.coreEngine.search(query, options);
     }
+    /**
+     * Retrieve content by ID in the specified format
+     * @param contentId - Content ID to retrieve
+     * @param format - Format to return ('file' for CLI clients, 'base64' for MCP clients)
+     * @returns Promise that resolves to content in requested format
+     */
+    async getContent(contentId, format = 'file') {
+        await this.initialize();
+        if (!this.coreEngine) {
+            throw new Error('SearchEngine failed to initialize');
+        }
+        return this.coreEngine.getContent(contentId, format);
+    }
+    /**
+     * Retrieve multiple content items efficiently in batch
+     * @param contentIds - Array of content IDs to retrieve
+     * @param format - Format to return ('file' for CLI clients, 'base64' for MCP clients)
+     * @returns Promise that resolves to array of content in requested format
+     */
+    async getContentBatch(contentIds, format = 'file') {
+        await this.initialize();
+        if (!this.coreEngine) {
+            throw new Error('SearchEngine failed to initialize');
+        }
+        return this.coreEngine.getContentBatch(contentIds, format);
+    }
+    /**
+     * Retrieve content metadata for result enhancement
+     * @param contentId - Content ID to get metadata for
+     * @returns Promise that resolves to content metadata
+     */
+    async getContentMetadata(contentId) {
+        await this.initialize();
+        if (!this.coreEngine) {
+            throw new Error('SearchEngine failed to initialize');
+        }
+        return this.coreEngine.getContentMetadata(contentId);
+    }
+    /**
+     * Verify that content exists and is accessible
+     * @param contentId - Content ID to verify
+     * @returns Promise that resolves to true if content exists, false otherwise
+     */
+    async verifyContentExists(contentId) {
+        await this.initialize();
+        if (!this.coreEngine) {
+            throw new Error('SearchEngine failed to initialize');
+        }
+        return this.coreEngine.verifyContentExists(contentId);
+    }
     /**
      * Clean up resources
      */

package/dist/test-utils.d.ts CHANGED Viewed

@@ -2,35 +2,17 @@
  * Test utilities for multi-model support
  * Provides common configurations and helpers for testing with different embedding models
  */
-export declare const TEST_MODELS: readonly [{
-    readonly name: "sentence-transformers/all-MiniLM-L6-v2";
-    readonly dimensions: 384;
-    readonly chunkSize: 250;
-    readonly batchSize: 16;
-}, {
-    readonly name: "Xenova/all-mpnet-base-v2";
-    readonly dimensions: 768;
-    readonly chunkSize: 400;
-    readonly batchSize: 8;
-}];
+export interface TestModel {
+    name: string;
+    dimensions: number;
+    chunkSize: number;
+    batchSize: number;
+}
+export declare const TEST_MODELS: TestModel[];
 /**
  * Retrieve model configuration by name
  * @param modelName - The name of the model to retrieve
  * @returns Model configuration object or undefined if not found
  */
-export declare function getTestModel(modelName: string): {
-    readonly name: "sentence-transformers/all-MiniLM-L6-v2";
-    readonly dimensions: 384;
-    readonly chunkSize: 250;
-    readonly batchSize: 16;
-} | {
-    readonly name: "Xenova/all-mpnet-base-v2";
-    readonly dimensions: 768;
-    readonly chunkSize: 400;
-    readonly batchSize: 8;
-} | undefined;
-/**
- * Type for test model configuration
- */
-export type TestModel = typeof TEST_MODELS[number];
+export declare function getTestModel(modelName: string): TestModel | undefined;
 //# sourceMappingURL=test-utils.d.ts.map

package/dist/text/chunker.d.ts CHANGED Viewed

@@ -11,6 +11,7 @@ export interface Document {
     source: string;
     title: string;
     content: string;
+    metadata?: Record<string, any>;
 }
 export interface Chunk {
     text: string;

package/dist/text/embedder.js CHANGED Viewed

@@ -2,6 +2,7 @@ import '../dom-polyfills.js';
 import { createHash } from 'crypto';
 import { config } from '../core/config.js';
 import { handleError, ErrorCategory, ErrorSeverity, safeExecute } from '../core/error-handler.js';
+import { createModelLoadingError, createInvalidContentError, createMissingDependencyError } from '../core/actionable-error-messages.js';
 /**
  * List of supported embedding models
  */
@@ -22,8 +23,7 @@ export class EmbeddingEngine {
         this.batchSize = batchSize || config.batch_size;
         // Validate that the model is supported
         if (!SUPPORTED_MODELS.includes(this.modelName)) {
-            throw new Error(`Unsupported model: ${this.modelName}\n` +
-                `Supported models: ${SUPPORTED_MODELS.join(', ')}`);
+            throw createModelLoadingError(this.modelName, `Model not in supported list. Supported models: ${SUPPORTED_MODELS.join(', ')}`, { operationContext: 'EmbeddingEngine constructor' });
         }
         console.log(`🤖 EmbeddingEngine initialized with model: ${this.modelName}, batchSize: ${this.batchSize}`);
     }
@@ -88,7 +88,10 @@ export class EmbeddingEngine {
      */
     async embedBatch(texts) {
         if (!this.model) {
-            throw new Error('Model not loaded. Call loadModel() first.');
+            throw createMissingDependencyError('model', 'object', {
+                operationContext: 'embedBatch',
+                includeTroubleshooting: true
+            });
         }
         if (texts.length === 0) {
             return [];
@@ -123,7 +126,8 @@ export class EmbeddingEngine {
                 const vector = new Float32Array(embeddingData[i]);
                 results.push({
                     embedding_id,
-                    vector
+                    vector,
+                    contentType: 'text'
                 });
             }
             return results;
@@ -173,7 +177,8 @@ export class EmbeddingEngine {
             const vector = new Float32Array(embeddingData[0]);
             return {
                 embedding_id,
-                vector
+                vector,
+                contentType: 'text'
             };
         }
         catch (error) {
@@ -189,7 +194,9 @@ export class EmbeddingEngine {
     async embedSingle(text) {
         const results = await this.embedBatch([text]);
         if (results.length === 0) {
-            throw new Error('Failed to generate embedding for single text');
+            throw createInvalidContentError('text', 'empty', {
+                operationContext: 'embedText'
+            });
         }
         return results[0];
     }
@@ -357,10 +364,10 @@ export function createTextEmbedFunction(modelName, batchSize) {
         }
         // Use the existing embedSingle method
         const result = await engine.embedSingle(query);
-        // Add contentType to the result
+        // Ensure contentType is present (should already be included from embedSingle)
         return {
             ...result,
-            contentType: 'text'
+            contentType: result.contentType || 'text'
         };
     };
     return embedFunction;

package/dist/text/index.d.ts CHANGED Viewed

@@ -3,5 +3,6 @@ export { CrossEncoderReranker, createTextRerankFunction, createTextReranker } fr
 export { countTokens, getTokenizer, resetTokenizer } from './tokenizer.js';
 export { chunkDocument, type Chunk, type Document } from '../core/chunker.js';
 export { type ChunkConfig } from '../core/chunker.js';
+export { SentenceTransformerEmbedder } from './sentence-transformer-embedder.js';
 export * from './preprocessors/index.js';
 //# sourceMappingURL=index.d.ts.map

package/dist/text/index.js CHANGED Viewed

@@ -3,6 +3,7 @@ export { EmbeddingEngine, getEmbeddingEngine, initializeEmbeddingEngine, createT
 export { CrossEncoderReranker, createTextRerankFunction, createTextReranker } from './reranker.js';
 export { countTokens, getTokenizer, resetTokenizer } from './tokenizer.js';
 export { chunkDocument } from '../core/chunker.js';
+export { SentenceTransformerEmbedder } from './sentence-transformer-embedder.js';
 // Re-export preprocessors
 export * from './preprocessors/index.js';
 //# sourceMappingURL=index.js.map

package/dist/text/reranker.d.ts CHANGED Viewed

@@ -8,13 +8,12 @@ export declare class CrossEncoderReranker {
     private model;
     private tokenizer;
     private modelName;
-    private static readonly FALLBACK_MODELS;
     /**
      * Ensure DOM polyfills are set up for transformers.js
      */
     private ensurePolyfills;
     /**
-     * Load the embedding model with graceful fallback
+     * Load the embedding model
      */
     loadModel(): Promise<void>;
     /**

package/dist/text/reranker.js CHANGED Viewed

@@ -18,12 +18,6 @@ export class CrossEncoderReranker {
     model = null; // Use any to avoid complex transformers.js typing issues
     tokenizer = null;
     modelName = 'Xenova/ms-marco-MiniLM-L-6-v2'; // Use working cross-encoder model
-    // Alternative models in case the primary fails
-    static FALLBACK_MODELS = [
-        'Xenova/ms-marco-MiniLM-L-6-v2', // Primary - proven to work in standalone test
-        'cross-encoder/ms-marco-MiniLM-L-6-v2', // Original (may have issues)
-        'cross-encoder/ms-marco-MiniLM-L-2-v2', // Smaller original (may have issues)
-    ];
     /**
      * Ensure DOM polyfills are set up for transformers.js
      */
@@ -40,54 +34,30 @@ export class CrossEncoderReranker {
         }
     }
     /**
-     * Load the embedding model with graceful fallback
+     * Load the embedding model
      */
     async loadModel() {
-        // Try primary model first (should work since it's Xenova)
-        if (await this.tryLoadModel(this.modelName)) {
-            return;
-        }
-        // Try fallback models if primary fails
-        console.warn(`Primary model ${this.modelName} failed, trying fallbacks...`);
-        for (const fallbackModel of CrossEncoderReranker.FALLBACK_MODELS) {
-            if (fallbackModel === this.modelName)
-                continue; // Skip already tried model
-            console.warn(`Trying fallback model: ${fallbackModel}`);
-            if (await this.tryLoadModel(fallbackModel)) {
-                this.modelName = fallbackModel;
-                return;
-            }
-        }
-        console.warn('All embedding models failed to load. Reranking will be disabled.');
-        this.model = null;
-        this.tokenizer = null;
+        await this.tryLoadModel(this.modelName);
     }
     /**
      * Try to load a specific model
      */
     async tryLoadModel(modelName) {
-        try {
-            console.log(`Loading cross-encoder model: ${modelName}`);
-            // Ensure polyfills are set up exactly like the working standalone version
-            this.ensurePolyfills();
-            // Use the exact same approach as the working standalone test
-            const { AutoTokenizer, AutoModelForSequenceClassification } = await import('@huggingface/transformers');
-            console.log('Loading model...');
-            this.model = await AutoModelForSequenceClassification.from_pretrained(modelName, {
-                cache_dir: config.model_cache_path,
-                dtype: 'fp32'
-            });
-            console.log('Loading tokenizer...');
-            this.tokenizer = await AutoTokenizer.from_pretrained(modelName, {
-                cache_dir: config.model_cache_path
-            });
-            console.log(`Cross-encoder model loaded successfully: ${modelName}`);
-            return true;
-        }
-        catch (error) {
-            console.warn(`Failed to load model ${modelName}: ${error instanceof Error ? error.message : 'Unknown error'}`);
-            return false;
-        }
+        console.log(`Loading cross-encoder model: ${modelName}`);
+        // Ensure polyfills are set up exactly like the working standalone version
+        this.ensurePolyfills();
+        // Use the exact same approach as the working standalone test
+        const { AutoTokenizer, AutoModelForSequenceClassification } = await import('@huggingface/transformers');
+        console.log('Loading model...');
+        this.model = await AutoModelForSequenceClassification.from_pretrained(modelName, {
+            cache_dir: config.model_cache_path,
+            dtype: 'fp32'
+        });
+        console.log('Loading tokenizer...');
+        this.tokenizer = await AutoTokenizer.from_pretrained(modelName, {
+            cache_dir: config.model_cache_path
+        });
+        console.log(`Cross-encoder model loaded successfully: ${modelName}`);
     }
     /**
      * Rerank search results using embedding similarity scoring

package/dist/text/sentence-transformer-embedder.d.ts ADDED Viewed

@@ -0,0 +1,96 @@
+/**
+ * TEXT IMPLEMENTATION — Sentence Transformer Embedder Implementation
+ * Implements UniversalEmbedder interface for sentence-transformer models
+ * Adapts existing text embedding logic to the universal interface
+ */
+import '../dom-polyfills.js';
+import { BaseUniversalEmbedder, type EmbedderOptions } from '../core/abstract-embedder.js';
+import type { EmbeddingResult } from '../types.js';
+/**
+ * Sentence transformer embedder implementation
+ * Supports sentence-transformers/all-MiniLM-L6-v2 and Xenova/all-mpnet-base-v2
+ * Ensures consistent EmbeddingResult format with contentType='text'
+ * Adapts existing EmbeddingEngine to UniversalEmbedder interface
+ */
+export declare class SentenceTransformerEmbedder extends BaseUniversalEmbedder {
+    private embeddingEngine;
+    private resourceManager;
+    private embedderResourceId?;
+    private engineResourceId?;
+    constructor(modelName: string, options?: EmbedderOptions);
+    /**
+     * Load the sentence transformer model using existing EmbeddingEngine
+     */
+    loadModel(): Promise<void>;
+    /**
+     * Clean up model resources with comprehensive disposal
+     */
+    cleanup(): Promise<void>;
+    /**
+     * Embed text using the existing EmbeddingEngine
+     */
+    embedText(text: string): Promise<EmbeddingResult>;
+    /**
+     * Optimized batch processing using existing EmbeddingEngine and BatchProcessingOptimizer
+     * Overrides the base implementation for better performance with progress reporting
+     */
+    protected processBatch(batch: Array<{
+        content: string;
+        contentType: string;
+        metadata?: Record<string, any>;
+    }>): Promise<EmbeddingResult[]>;
+    /**
+     * Get model-specific information
+     */
+    getModelInfo(): {
+        capabilities: {
+            supportsSemanticSimilarity: boolean;
+            supportsTextClassification: boolean;
+            supportsTextClustering: boolean;
+            recommendedUseCase: string;
+            supportsText: boolean;
+            supportsImages: boolean;
+            supportsBatchProcessing: boolean;
+            supportsMetadata: boolean;
+            maxBatchSize?: number;
+            maxTextLength?: number;
+            supportedImageFormats?: readonly string[];
+            supportsMultimodal?: boolean;
+            supportsCrossModalSearch?: boolean;
+            unifiedEmbeddingSpace?: boolean;
+            reliableImplementation?: boolean;
+        };
+        name: string;
+        type: import("../core/universal-embedder.js").ModelType;
+        dimensions: number;
+        version: string;
+        supportedContentTypes: readonly string[];
+        requirements: import("../types.js").ModelRequirements;
+    };
+    /**
+     * Check if the model is suitable for a specific task
+     */
+    isSuitableForTask(task: 'similarity' | 'classification' | 'clustering' | 'retrieval'): boolean;
+    /**
+     * Embed document batch using existing EmbeddingEngine's optimized method
+     * This method provides compatibility with the existing document ingestion pipeline
+     */
+    embedDocumentBatch(chunks: string[]): Promise<EmbeddingResult[]>;
+    /**
+     * Get the model version from the underlying EmbeddingEngine
+     */
+    getModelVersion(): string;
+    /**
+     * Get the batch size from the underlying EmbeddingEngine
+     */
+    getBatchSize(): number;
+    /**
+     * Check if the underlying EmbeddingEngine is loaded
+     */
+    isEngineLoaded(): boolean;
+    /**
+     * Override isLoaded to check both internal state and engine state
+     */
+    isLoaded(): boolean;
+}
+//# sourceMappingURL=sentence-transformer-embedder.d.ts.map