npm - rag-lite-ts - Versions diffs - 1.0.2 → 2.0.0 - Mend

rag-lite-ts 1.0.2 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

package/README.md +606 -93
package/dist/cli/indexer.js +192 -4
package/dist/cli/search.js +50 -11
package/dist/cli.js +183 -26
package/dist/core/abstract-embedder.d.ts +125 -0
package/dist/core/abstract-embedder.js +264 -0
package/dist/core/actionable-error-messages.d.ts +60 -0
package/dist/core/actionable-error-messages.js +397 -0
package/dist/core/batch-processing-optimizer.d.ts +155 -0
package/dist/core/batch-processing-optimizer.js +541 -0
package/dist/core/chunker.d.ts +2 -0
package/dist/core/cli-database-utils.d.ts +53 -0
package/dist/core/cli-database-utils.js +239 -0
package/dist/core/config.js +10 -3
package/dist/core/content-errors.d.ts +111 -0
package/dist/core/content-errors.js +362 -0
package/dist/core/content-manager.d.ts +343 -0
package/dist/core/content-manager.js +1504 -0
package/dist/core/content-performance-optimizer.d.ts +150 -0
package/dist/core/content-performance-optimizer.js +516 -0
package/dist/core/content-resolver.d.ts +104 -0
package/dist/core/content-resolver.js +285 -0
package/dist/core/cross-modal-search.d.ts +164 -0
package/dist/core/cross-modal-search.js +342 -0
package/dist/core/database-connection-manager.d.ts +109 -0
package/dist/core/database-connection-manager.js +304 -0
package/dist/core/db.d.ts +141 -2
package/dist/core/db.js +631 -89
package/dist/core/embedder-factory.d.ts +176 -0
package/dist/core/embedder-factory.js +338 -0
package/dist/core/index.d.ts +3 -1
package/dist/core/index.js +4 -1
package/dist/core/ingestion.d.ts +85 -15
package/dist/core/ingestion.js +510 -45
package/dist/core/lazy-dependency-loader.d.ts +152 -0
package/dist/core/lazy-dependency-loader.js +453 -0
package/dist/core/mode-detection-service.d.ts +150 -0
package/dist/core/mode-detection-service.js +565 -0
package/dist/core/mode-model-validator.d.ts +92 -0
package/dist/core/mode-model-validator.js +203 -0
package/dist/core/model-registry.d.ts +120 -0
package/dist/core/model-registry.js +415 -0
package/dist/core/model-validator.d.ts +217 -0
package/dist/core/model-validator.js +782 -0
package/dist/core/polymorphic-search-factory.d.ts +154 -0
package/dist/core/polymorphic-search-factory.js +344 -0
package/dist/core/raglite-paths.d.ts +121 -0
package/dist/core/raglite-paths.js +145 -0
package/dist/core/reranking-config.d.ts +42 -0
package/dist/core/reranking-config.js +156 -0
package/dist/core/reranking-factory.d.ts +92 -0
package/dist/core/reranking-factory.js +591 -0
package/dist/core/reranking-strategies.d.ts +325 -0
package/dist/core/reranking-strategies.js +720 -0
package/dist/core/resource-cleanup.d.ts +163 -0
package/dist/core/resource-cleanup.js +371 -0
package/dist/core/resource-manager.d.ts +212 -0
package/dist/core/resource-manager.js +564 -0
package/dist/core/search.d.ts +28 -1
package/dist/core/search.js +83 -5
package/dist/core/streaming-operations.d.ts +145 -0
package/dist/core/streaming-operations.js +409 -0
package/dist/core/types.d.ts +3 -0
package/dist/core/universal-embedder.d.ts +177 -0
package/dist/core/universal-embedder.js +139 -0
package/dist/core/validation-messages.d.ts +99 -0
package/dist/core/validation-messages.js +334 -0
package/dist/core/vector-index.js +7 -8
package/dist/factories/index.d.ts +1 -1
package/dist/factories/text-factory.d.ts +128 -34
package/dist/factories/text-factory.js +346 -97
package/dist/file-processor.d.ts +88 -2
package/dist/file-processor.js +720 -17
package/dist/index.d.ts +9 -0
package/dist/index.js +11 -0
package/dist/ingestion.d.ts +16 -0
package/dist/ingestion.js +21 -0
package/dist/mcp-server.d.ts +35 -3
package/dist/mcp-server.js +1107 -31
package/dist/multimodal/clip-embedder.d.ts +314 -0
package/dist/multimodal/clip-embedder.js +945 -0
package/dist/multimodal/index.d.ts +6 -0
package/dist/multimodal/index.js +6 -0
package/dist/run-error-recovery-tests.d.ts +7 -0
package/dist/run-error-recovery-tests.js +101 -0
package/dist/search.d.ts +26 -0
package/dist/search.js +54 -1
package/dist/test-utils.d.ts +8 -26
package/dist/text/chunker.d.ts +1 -0
package/dist/text/embedder.js +15 -8
package/dist/text/index.d.ts +1 -0
package/dist/text/index.js +1 -0
package/dist/text/reranker.d.ts +1 -2
package/dist/text/reranker.js +17 -47
package/dist/text/sentence-transformer-embedder.d.ts +96 -0
package/dist/text/sentence-transformer-embedder.js +340 -0
package/dist/types.d.ts +39 -0
package/dist/utils/vector-math.d.ts +31 -0
package/dist/utils/vector-math.js +70 -0
package/package.json +15 -3
package/dist/api-errors.d.ts.map +0 -1
package/dist/api-errors.js.map +0 -1
package/dist/cli/indexer.d.ts.map +0 -1
package/dist/cli/indexer.js.map +0 -1
package/dist/cli/search.d.ts.map +0 -1
package/dist/cli/search.js.map +0 -1
package/dist/cli.d.ts.map +0 -1
package/dist/cli.js.map +0 -1
package/dist/config.d.ts.map +0 -1
package/dist/config.js.map +0 -1
package/dist/core/adapters.d.ts.map +0 -1
package/dist/core/adapters.js.map +0 -1
package/dist/core/chunker.d.ts.map +0 -1
package/dist/core/chunker.js.map +0 -1
package/dist/core/config.d.ts.map +0 -1
package/dist/core/config.js.map +0 -1
package/dist/core/db.d.ts.map +0 -1
package/dist/core/db.js.map +0 -1
package/dist/core/error-handler.d.ts.map +0 -1
package/dist/core/error-handler.js.map +0 -1
package/dist/core/index.d.ts.map +0 -1
package/dist/core/index.js.map +0 -1
package/dist/core/ingestion.d.ts.map +0 -1
package/dist/core/ingestion.js.map +0 -1
package/dist/core/interfaces.d.ts.map +0 -1
package/dist/core/interfaces.js.map +0 -1
package/dist/core/path-manager.d.ts.map +0 -1
package/dist/core/path-manager.js.map +0 -1
package/dist/core/search-example.d.ts +0 -25
package/dist/core/search-example.d.ts.map +0 -1
package/dist/core/search-example.js +0 -138
package/dist/core/search-example.js.map +0 -1
package/dist/core/search-pipeline-example.d.ts +0 -21
package/dist/core/search-pipeline-example.d.ts.map +0 -1
package/dist/core/search-pipeline-example.js +0 -188
package/dist/core/search-pipeline-example.js.map +0 -1
package/dist/core/search-pipeline.d.ts.map +0 -1
package/dist/core/search-pipeline.js.map +0 -1
package/dist/core/search.d.ts.map +0 -1
package/dist/core/search.js.map +0 -1
package/dist/core/types.d.ts.map +0 -1
package/dist/core/types.js.map +0 -1
package/dist/core/vector-index.d.ts.map +0 -1
package/dist/core/vector-index.js.map +0 -1
package/dist/dom-polyfills.d.ts.map +0 -1
package/dist/dom-polyfills.js.map +0 -1
package/dist/examples/clean-api-examples.d.ts +0 -44
package/dist/examples/clean-api-examples.d.ts.map +0 -1
package/dist/examples/clean-api-examples.js +0 -206
package/dist/examples/clean-api-examples.js.map +0 -1
package/dist/factories/index.d.ts.map +0 -1
package/dist/factories/index.js.map +0 -1
package/dist/factories/text-factory.d.ts.map +0 -1
package/dist/factories/text-factory.js.map +0 -1
package/dist/file-processor.d.ts.map +0 -1
package/dist/file-processor.js.map +0 -1
package/dist/index-manager.d.ts.map +0 -1
package/dist/index-manager.js.map +0 -1
package/dist/index.d.ts.map +0 -1
package/dist/index.js.map +0 -1
package/dist/indexer.d.ts.map +0 -1
package/dist/indexer.js.map +0 -1
package/dist/ingestion.d.ts.map +0 -1
package/dist/ingestion.js.map +0 -1
package/dist/mcp-server.d.ts.map +0 -1
package/dist/mcp-server.js.map +0 -1
package/dist/preprocess.d.ts.map +0 -1
package/dist/preprocess.js.map +0 -1
package/dist/preprocessors/index.d.ts.map +0 -1
package/dist/preprocessors/index.js.map +0 -1
package/dist/preprocessors/mdx.d.ts.map +0 -1
package/dist/preprocessors/mdx.js.map +0 -1
package/dist/preprocessors/mermaid.d.ts.map +0 -1
package/dist/preprocessors/mermaid.js.map +0 -1
package/dist/preprocessors/registry.d.ts.map +0 -1
package/dist/preprocessors/registry.js.map +0 -1
package/dist/search-standalone.d.ts.map +0 -1
package/dist/search-standalone.js.map +0 -1
package/dist/search.d.ts.map +0 -1
package/dist/search.js.map +0 -1
package/dist/test-utils.d.ts.map +0 -1
package/dist/test-utils.js.map +0 -1
package/dist/text/chunker.d.ts.map +0 -1
package/dist/text/chunker.js.map +0 -1
package/dist/text/embedder.d.ts.map +0 -1
package/dist/text/embedder.js.map +0 -1
package/dist/text/index.d.ts.map +0 -1
package/dist/text/index.js.map +0 -1
package/dist/text/preprocessors/index.d.ts.map +0 -1
package/dist/text/preprocessors/index.js.map +0 -1
package/dist/text/preprocessors/mdx.d.ts.map +0 -1
package/dist/text/preprocessors/mdx.js.map +0 -1
package/dist/text/preprocessors/mermaid.d.ts.map +0 -1
package/dist/text/preprocessors/mermaid.js.map +0 -1
package/dist/text/preprocessors/registry.d.ts.map +0 -1
package/dist/text/preprocessors/registry.js.map +0 -1
package/dist/text/reranker.d.ts.map +0 -1
package/dist/text/reranker.js.map +0 -1
package/dist/text/tokenizer.d.ts.map +0 -1
package/dist/text/tokenizer.js.map +0 -1
package/dist/types.d.ts.map +0 -1
package/dist/types.js.map +0 -1

package/dist/cli/indexer.js CHANGED Viewed

@@ -1,7 +1,110 @@
 import { existsSync, statSync } from 'fs';
 import { resolve } from 'path';
 import { TextIngestionFactory } from '../factories/text-factory.js';
+import { withCLIDatabaseAccess, setupCLICleanup, isDatabaseBusy } from '../core/cli-database-utils.js';
 import { EXIT_CODES, ConfigurationError } from '../core/config.js';
+/**
+ * Validate mode-specific model and strategy combinations
+ * Ensures that the selected model is compatible with the chosen mode
+ * and that reranking strategies are valid for the mode
+ */
+async function validateModeConfiguration(options) {
+    const mode = options.mode || 'text';
+    const model = options.embeddingModel;
+    const rerankingStrategy = options.rerankingStrategy;
+    // Define supported models for each mode
+    const textModels = [
+        'sentence-transformers/all-MiniLM-L6-v2',
+        'Xenova/all-mpnet-base-v2'
+    ];
+    const multimodalModels = [
+        'Xenova/clip-vit-base-patch32'
+    ];
+    // Validate model compatibility with mode
+    if (model) {
+        if (mode === 'text' && !textModels.includes(model)) {
+            if (multimodalModels.includes(model)) {
+                throw new ConfigurationError(`Model '${model}' is a multimodal model but text mode was selected.\n` +
+                    `\n` +
+                    `To use this model, specify multimodal mode:\n` +
+                    `  raglite ingest <path> --mode multimodal --model ${model}\n` +
+                    `\n` +
+                    `Or choose a text model for text mode:\n` +
+                    `  ${textModels.map(m => `raglite ingest <path> --model ${m}`).join('\n  ')}\n`, EXIT_CODES.INVALID_ARGUMENTS);
+            }
+            else {
+                throw new ConfigurationError(`Model '${model}' is not supported for text mode.\n` +
+                    `\n` +
+                    `Supported models for text mode:\n` +
+                    `  ${textModels.join('\n  ')}\n` +
+                    `\n` +
+                    `Examples:\n` +
+                    `  raglite ingest <path> --model sentence-transformers/all-MiniLM-L6-v2\n` +
+                    `  raglite ingest <path> --model Xenova/all-mpnet-base-v2\n`, EXIT_CODES.INVALID_ARGUMENTS);
+            }
+        }
+        if (mode === 'multimodal' && !multimodalModels.includes(model)) {
+            if (textModels.includes(model)) {
+                throw new ConfigurationError(`Model '${model}' is a text-only model but multimodal mode was selected.\n` +
+                    `\n` +
+                    `To use this model, specify text mode:\n` +
+                    `  raglite ingest <path> --mode text --model ${model}\n` +
+                    `\n` +
+                    `Or choose a multimodal model for multimodal mode:\n` +
+                    `  ${multimodalModels.map(m => `raglite ingest <path> --mode multimodal --model ${m}`).join('\n  ')}\n`, EXIT_CODES.INVALID_ARGUMENTS);
+            }
+            else {
+                throw new ConfigurationError(`Model '${model}' is not supported for multimodal mode.\n` +
+                    `\n` +
+                    `Supported models for multimodal mode:\n` +
+                    `  ${multimodalModels.join('\n  ')}\n` +
+                    `\n` +
+                    `Example:\n` +
+                    `  raglite ingest <path> --mode multimodal --model Xenova/clip-vit-base-patch32\n`, EXIT_CODES.INVALID_ARGUMENTS);
+            }
+        }
+    }
+    // Validate reranking strategy compatibility with mode
+    if (rerankingStrategy) {
+        const textStrategies = ['cross-encoder', 'disabled'];
+        const multimodalStrategies = ['text-derived', 'metadata', 'disabled'];
+        if (mode === 'text' && !textStrategies.includes(rerankingStrategy)) {
+            throw new ConfigurationError(`Reranking strategy '${rerankingStrategy}' is not supported for text mode.\n` +
+                `\n` +
+                `Supported strategies for text mode:\n` +
+                `  cross-encoder  Use cross-encoder model for reranking (default)\n` +
+                `  disabled       No reranking, use vector similarity only\n` +
+                `\n` +
+                `Examples:\n` +
+                `  raglite ingest <path> --mode text --rerank-strategy cross-encoder\n` +
+                `  raglite ingest <path> --mode text --rerank-strategy disabled\n`, EXIT_CODES.INVALID_ARGUMENTS);
+        }
+        if (mode === 'multimodal' && !multimodalStrategies.includes(rerankingStrategy)) {
+            throw new ConfigurationError(`Reranking strategy '${rerankingStrategy}' is not supported for multimodal mode.\n` +
+                `\n` +
+                `Supported strategies for multimodal mode:\n` +
+                `  text-derived  Convert images to text, then use cross-encoder (default)\n` +
+                `  metadata      Use filename and metadata-based scoring\n` +
+                `  disabled      No reranking, use vector similarity only\n` +
+                `\n` +
+                `Examples:\n` +
+                `  raglite ingest <path> --mode multimodal --rerank-strategy text-derived\n` +
+                `  raglite ingest <path> --mode multimodal --rerank-strategy metadata\n` +
+                `  raglite ingest <path> --mode multimodal --rerank-strategy disabled\n`, EXIT_CODES.INVALID_ARGUMENTS);
+        }
+    }
+    // Log the final configuration
+    console.log('✅ Mode configuration validated successfully');
+    if (mode !== 'text') {
+        console.log(`   Mode: ${mode}`);
+    }
+    if (model) {
+        console.log(`   Model: ${model}`);
+    }
+    if (rerankingStrategy) {
+        console.log(`   Reranking: ${rerankingStrategy}`);
+    }
+}
 /**
  * Run document ingestion from CLI
  * @param path - File or directory path to ingest
@@ -9,6 +112,7 @@ import { EXIT_CODES, ConfigurationError } from '../core/config.js';
  */
 export async function runIngest(path, options = {}) {
     try {
+        // Handle --rebuild-if-needed flag immediately to prevent dimension mismatch error
         // Validate path exists
         const resolvedPath = resolve(path);
         if (!existsSync(resolvedPath)) {
@@ -64,15 +168,53 @@ export async function runIngest(path, options = {}) {
             factoryOptions.embeddingModel = options.model;
             console.log(`Using embedding model: ${options.model}`);
         }
+        if (options.mode) {
+            factoryOptions.mode = options.mode;
+            console.log(`Using processing mode: ${options.mode}`);
+        }
+        if (options['rerank-strategy']) {
+            factoryOptions.rerankingStrategy = options['rerank-strategy'];
+            console.log(`Using reranking strategy: ${options['rerank-strategy']}`);
+        }
         if (options.rebuildIfNeeded) {
             factoryOptions.forceRebuild = true;
             console.log('Force rebuild enabled due to rebuildIfNeeded option');
+            // Delete old index file immediately to prevent dimension mismatch errors
+            const indexPath = process.env.RAG_INDEX_FILE || './vector-index.bin';
+            const { existsSync, unlinkSync } = await import('fs');
+            if (existsSync(indexPath)) {
+                try {
+                    unlinkSync(indexPath);
+                    console.log('🗑️ Removed old index file to prevent dimension mismatch');
+                }
+                catch (error) {
+                    console.warn(`⚠️ Could not remove old index file: ${error}`);
+                }
+            }
+        }
+        // Validate mode-specific model and strategy combinations
+        await validateModeConfiguration(factoryOptions);
+        const dbPath = process.env.RAG_DB_FILE || './db.sqlite';
+        const indexPath = process.env.RAG_INDEX_FILE || './vector-index.bin';
+        // Setup graceful cleanup
+        setupCLICleanup(dbPath);
+        // Check if database is busy before starting
+        const busyStatus = await isDatabaseBusy(dbPath);
+        if (busyStatus.isBusy) {
+            console.log('⚠️  Database appears to be in use by another process');
+            console.log(`   Reason: ${busyStatus.reason}`);
+            console.log('   Attempting to proceed anyway...');
+            console.log('');
         }
         // Create ingestion pipeline using factory
         let pipeline;
         try {
-            // Create ingestion pipeline using TextIngestionFactory
-            pipeline = await TextIngestionFactory.create(process.env.RAG_DB_FILE || './db.sqlite', process.env.RAG_INDEX_FILE || './vector-index.bin', factoryOptions);
+            // Create ingestion pipeline using TextIngestionFactory with database protection
+            pipeline = await withCLIDatabaseAccess(dbPath, () => TextIngestionFactory.create(dbPath, indexPath, factoryOptions), {
+                commandName: 'Ingestion command',
+                showProgress: true,
+                maxWaitMs: 15000 // Longer timeout for ingestion
+            });
             const result = await pipeline.ingestPath(resolvedPath);
             // Display final results
             console.log('\n' + '='.repeat(50));
@@ -93,12 +235,26 @@ export async function runIngest(path, options = {}) {
                 console.log(`Processing rate: ${chunksPerSecond} chunks/second`);
             }
             console.log('\nIngestion completed successfully!');
+            // Display mode-specific information
+            const mode = options.mode || 'text';
+            if (mode === 'multimodal') {
+                console.log('✨ Multimodal mode enabled - you can now search across text and image content');
+            }
             console.log('You can now search your documents using: raglite search "your query"');
+            console.log('');
+            console.log('💡 The search command will automatically detect and use the ingestion mode.');
         }
         finally {
             if (pipeline) {
                 await pipeline.cleanup();
             }
+            // Ensure clean exit for CLI commands
+            const { DatabaseConnectionManager } = await import('../core/database-connection-manager.js');
+            await DatabaseConnectionManager.closeAllConnections();
+            // Force exit for CLI commands to prevent hanging
+            setTimeout(() => {
+                process.exit(0);
+            }, 100);
         }
     }
     catch (error) {
@@ -178,12 +334,37 @@ export async function runRebuild() {
         console.log('');
         console.log('Progress will be shown below...');
         console.log('');
+        // Detect mode from existing database for rebuild
+        const dbPath = process.env.RAG_DB_FILE || './db.sqlite';
+        const indexPath = process.env.RAG_INDEX_FILE || './vector-index.bin';
+        let rebuildOptions = { forceRebuild: true };
+        if (existsSync(dbPath)) {
+            try {
+                // Import mode detection service
+                const { ModeDetectionService } = await import('../core/mode-detection-service.js');
+                const modeService = new ModeDetectionService(dbPath);
+                const systemInfo = await modeService.detectMode();
+                console.log(`🎯 Detected existing configuration:`);
+                console.log(`   Mode: ${systemInfo.mode}`);
+                console.log(`   Model: ${systemInfo.modelName}`);
+                console.log(`   Reranking: ${systemInfo.rerankingStrategy}`);
+                console.log('');
+                // Use the detected configuration for rebuild
+                rebuildOptions.mode = systemInfo.mode;
+                rebuildOptions.embeddingModel = systemInfo.modelName;
+                rebuildOptions.rerankingStrategy = systemInfo.rerankingStrategy;
+            }
+            catch (error) {
+                console.warn('⚠️  Could not detect existing mode configuration, using defaults');
+                console.warn(`   Error: ${error instanceof Error ? error.message : 'Unknown error'}`);
+            }
+        }
         // Create ingestion pipeline with force rebuild using factory
-        const pipeline = await TextIngestionFactory.create(process.env.RAG_DB_FILE || './db.sqlite', process.env.RAG_INDEX_FILE || './vector-index.bin', { forceRebuild: true });
+        const pipeline = await TextIngestionFactory.create(dbPath, indexPath, rebuildOptions);
         try {
             // Get all documents from database and re-ingest them
             const { openDatabase } = await import('../core/db.js');
-            const db = await openDatabase(process.env.RAG_DB_FILE || './db.sqlite');
+            const db = await openDatabase(dbPath);
             try {
                 const documents = await db.all('SELECT DISTINCT source FROM documents ORDER BY source');
                 if (documents.length === 0) {
@@ -240,6 +421,13 @@ export async function runRebuild() {
         }
         finally {
             await pipeline.cleanup();
+            // Ensure clean exit for CLI commands
+            const { DatabaseConnectionManager } = await import('../core/database-connection-manager.js');
+            await DatabaseConnectionManager.closeAllConnections();
+            // Force exit for CLI commands to prevent hanging
+            setTimeout(() => {
+                process.exit(0);
+            }, 100);
         }
     }
     catch (error) {

package/dist/cli/search.js CHANGED Viewed

@@ -1,5 +1,6 @@
 import { existsSync } from 'fs';
-import { TextSearchFactory } from '../factories/text-factory.js';
+import { PolymorphicSearchFactory } from '../core/polymorphic-search-factory.js';
+import { withCLIDatabaseAccess, setupCLICleanup } from '../core/cli-database-utils.js';
 import { config, EXIT_CODES, ConfigurationError } from '../core/config.js';
 /**
  * Run search from CLI
@@ -54,15 +55,16 @@ export async function runSearch(query, options = {}) {
         }
         console.log(`Searching for: "${query}"`);
         console.log('');
-        // Initialize search engine using factory
+        // Setup graceful cleanup
+        setupCLICleanup(effectiveConfig.db_file);
+        // Initialize search engine using polymorphic factory with database protection
         let searchEngine;
         try {
-            // Prepare factory options
-            const factoryOptions = {
-                enableReranking: options.rerank !== undefined ? options.rerank : effectiveConfig.rerank_enabled
-            };
-            // Create search engine using TextSearchFactory
-            searchEngine = await TextSearchFactory.create(effectiveConfig.index_file, effectiveConfig.db_file, factoryOptions);
+            // Create search engine using PolymorphicSearchFactory (auto-detects mode)
+            searchEngine = await withCLIDatabaseAccess(effectiveConfig.db_file, () => PolymorphicSearchFactory.create(effectiveConfig.index_file, effectiveConfig.db_file), {
+                commandName: 'Search command',
+                showProgress: true
+            });
             // Prepare search options
             const searchOptions = {};
             if (options['top-k'] !== undefined) {
@@ -73,8 +75,18 @@ export async function runSearch(query, options = {}) {
             }
             // Perform search
             const startTime = Date.now();
-            const results = await searchEngine.search(query, searchOptions);
+            let results = await searchEngine.search(query, searchOptions);
             const searchTime = Date.now() - startTime;
+            // Apply content type filter if specified
+            const contentTypeFilter = options['content-type'];
+            if (contentTypeFilter && contentTypeFilter !== 'all') {
+                const originalCount = results.length;
+                results = results.filter(r => r.contentType === contentTypeFilter);
+                if (results.length < originalCount) {
+                    console.log(`Filtered to ${results.length} ${contentTypeFilter} result${results.length === 1 ? '' : 's'} (from ${originalCount} total)`);
+                    console.log('');
+                }
+            }
             // Display results
             if (results.length === 0) {
                 console.log('No results found.');
@@ -86,10 +98,30 @@ export async function runSearch(query, options = {}) {
             else {
                 console.log(`Found ${results.length} result${results.length === 1 ? '' : 's'} in ${searchTime}ms:\n`);
                 results.forEach((result, index) => {
-                    console.log(`${index + 1}. ${result.document.title}`);
+                    // Add content type icon for visual distinction
+                    const contentTypeIcon = result.contentType === 'image' ? '🖼️ ' : '📄 ';
+                    const contentTypeLabel = result.contentType === 'image' ? '[IMAGE]' : '[TEXT]';
+                    console.log(`${index + 1}. ${contentTypeIcon}${result.document.title}`);
                     console.log(`   Source: ${result.document.source}`);
+                    console.log(`   Type: ${contentTypeLabel}`);
                     console.log(`   Score: ${(result.score * 100).toFixed(1)}%`);
-                    console.log(`   Text: ${truncateText(result.content, 200)}`);
+                    // Display content differently based on type
+                    if (result.contentType === 'image') {
+                        // For images, show metadata if available
+                        if (result.metadata?.description) {
+                            console.log(`   Description: ${truncateText(result.metadata.description, 200)}`);
+                        }
+                        if (result.metadata?.dimensions) {
+                            console.log(`   Dimensions: ${result.metadata.dimensions}`);
+                        }
+                        if (result.metadata?.format) {
+                            console.log(`   Format: ${result.metadata.format}`);
+                        }
+                    }
+                    else {
+                        // For text, show content preview
+                        console.log(`   Text: ${truncateText(result.content, 200)}`);
+                    }
                     console.log('');
                 });
                 // Show search statistics
@@ -107,6 +139,13 @@ export async function runSearch(query, options = {}) {
             if (searchEngine) {
                 await searchEngine.cleanup();
             }
+            // Ensure clean exit for CLI commands
+            const { DatabaseConnectionManager } = await import('../core/database-connection-manager.js');
+            await DatabaseConnectionManager.closeAllConnections();
+            // Force exit for CLI commands to prevent hanging
+            setTimeout(() => {
+                process.exit(0);
+            }, 100);
         }
     }
     catch (error) {

package/dist/cli.js CHANGED Viewed

@@ -29,26 +29,40 @@ Examples:
   raglite ingest ./docs/           # Ingest all .md/.txt files in docs/
   raglite ingest ./readme.md       # Ingest single file
   raglite ingest ./docs/ --model Xenova/all-mpnet-base-v2  # Use higher quality model
+  raglite ingest ./docs/ --mode multimodal  # Enable multimodal processing
+  raglite ingest ./docs/ --mode multimodal --rerank-strategy metadata  # Use metadata reranking
   raglite ingest ./docs/ --path-strategy relative --path-base /project  # Use relative paths
   raglite search "machine learning" # Search for documents about machine learning
   raglite search "API documentation" --top-k 10  # Get top 10 results
+  raglite search "red car" --content-type image  # Search only image results
   raglite rebuild                  # Rebuild the entire index
 Options for search:
-  --top-k <number>    Number of results to return (default: 10)
-  --rerank           Enable reranking for better results
-  --no-rerank        Disable reranking
+  --top-k <number>       Number of results to return (default: 10)
+  --rerank              Enable reranking for better results
+  --no-rerank           Disable reranking
+  --content-type <type> Filter results by content type: 'text', 'image', or 'all' (default: all)
 Options for ingest:
   --model <name>       Use specific embedding model
+  --mode <mode>        Processing mode: 'text' (default) or 'multimodal'
+  --rerank-strategy <strategy>  Reranking strategy for multimodal mode
   --rebuild-if-needed  Automatically rebuild if model mismatch detected (WARNING: rebuilds entire index)
   --path-strategy <strategy>  Path storage strategy: 'relative' (default) or 'absolute'
   --path-base <path>   Base directory for relative paths (defaults to current directory)
 Available models:
-  sentence-transformers/all-MiniLM-L6-v2  (384 dim, fast, default)
-  Xenova/all-mpnet-base-v2               (768 dim, higher quality)
+  Text mode:
+    sentence-transformers/all-MiniLM-L6-v2  (384 dim, fast, default)
+    Xenova/all-mpnet-base-v2               (768 dim, higher quality)
+  Multimodal mode:
+    Xenova/clip-vit-base-patch32           (512 dim, text + image support)
+Available reranking strategies (multimodal mode):
+  text-derived  Use image-to-text conversion + cross-encoder (default)
+  metadata      Use filename and metadata-based scoring
+  disabled      No reranking, use vector similarity only
 For more information, visit: https://github.com/your-repo/rag-lite-ts
 `);
@@ -115,9 +129,13 @@ function validateArgs(command, args, options) {
                 console.error('  raglite ingest ./docs/           # Ingest all .md/.txt files in docs/');
                 console.error('  raglite ingest ./readme.md       # Ingest single file');
                 console.error('  raglite ingest ./docs/ --model Xenova/all-mpnet-base-v2  # Use higher quality model');
+                console.error('  raglite ingest ./docs/ --mode multimodal  # Enable multimodal processing');
+                console.error('  raglite ingest ./docs/ --mode multimodal --rerank-strategy metadata  # Use metadata reranking');
                 console.error('');
                 console.error('Options:');
                 console.error('  --model <name>         Use specific embedding model');
+                console.error('  --mode <mode>          Processing mode: text (default) or multimodal');
+                console.error('  --rerank-strategy <strategy>  Reranking strategy for multimodal mode');
                 console.error('  --rebuild-if-needed    Automatically rebuild if model mismatch detected');
                 console.error('');
                 console.error('The path can be either a file (.md or .txt) or a directory.');
@@ -134,11 +152,13 @@ function validateArgs(command, args, options) {
                 console.error('  raglite search "machine learning"');
                 console.error('  raglite search "API documentation" --top-k 10');
                 console.error('  raglite search "tutorial" --rerank');
+                console.error('  raglite search "red car" --content-type image');
                 console.error('');
                 console.error('Options:');
-                console.error('  --top-k <number>    Number of results to return (default: 10)');
-                console.error('  --rerank           Enable reranking for better results');
-                console.error('  --no-rerank        Disable reranking');
+                console.error('  --top-k <number>       Number of results to return (default: 10)');
+                console.error('  --rerank              Enable reranking for better results');
+                console.error('  --no-rerank           Disable reranking');
+                console.error('  --content-type <type> Filter by content type: text, image, or all (default: all)');
                 process.exit(EXIT_CODES.INVALID_ARGUMENTS);
             }
             break;
@@ -173,6 +193,96 @@ function validateArgs(command, args, options) {
         }
         options['top-k'] = topK;
     }
+    // Validate content-type option (only for search command)
+    if (options['content-type'] !== undefined) {
+        if (command !== 'search') {
+            console.error(`Error: --content-type option is only available for the 'search' command`);
+            console.error('');
+            console.error('Use this option to filter search results by content type.');
+            console.error('');
+            console.error('Examples:');
+            console.error('  raglite search "query" --content-type text   # Only text results');
+            console.error('  raglite search "query" --content-type image  # Only image results');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+        const supportedTypes = ['text', 'image', 'all'];
+        if (!supportedTypes.includes(options['content-type'])) {
+            console.error(`Error: Unsupported content type '${options['content-type']}'`);
+            console.error('');
+            console.error('Supported content types:');
+            console.error('  text   Filter to show only text results');
+            console.error('  image  Filter to show only image results');
+            console.error('  all    Show all results (default)');
+            console.error('');
+            console.error('Examples:');
+            console.error('  --content-type text');
+            console.error('  --content-type image');
+            console.error('  --content-type all');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+    }
+    // Validate mode option (only for ingest command)
+    if (options.mode !== undefined) {
+        if (command !== 'ingest') {
+            console.error(`Error: --mode option is only available for the 'ingest' command`);
+            console.error('');
+            console.error('The search command automatically detects the mode from the database.');
+            console.error('Mode is set once during ingestion and persists for all searches.');
+            console.error('');
+            console.error('Examples:');
+            console.error('  raglite ingest ./docs/ --mode multimodal');
+            console.error('  raglite search "your query"  # Uses mode from ingestion');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+        const supportedModes = ['text', 'multimodal'];
+        if (!supportedModes.includes(options.mode)) {
+            console.error(`Error: Unsupported mode '${options.mode}'`);
+            console.error('');
+            console.error('Supported modes:');
+            console.error('  text        Process text documents only (default)');
+            console.error('  multimodal  Process text and image documents');
+            console.error('');
+            console.error('Examples:');
+            console.error('  --mode text');
+            console.error('  --mode multimodal');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+    }
+    // Validate rerank-strategy option (only for ingest command with multimodal mode)
+    if (options['rerank-strategy'] !== undefined) {
+        if (command !== 'ingest') {
+            console.error(`Error: --rerank-strategy option is only available for the 'ingest' command`);
+            console.error('');
+            console.error('Reranking strategy is configured during ingestion and used automatically during search.');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+        const mode = options.mode || 'text';
+        if (mode !== 'multimodal') {
+            console.error(`Error: --rerank-strategy option is only available in multimodal mode`);
+            console.error('');
+            console.error('To use reranking strategies, specify --mode multimodal');
+            console.error('');
+            console.error('Examples:');
+            console.error('  raglite ingest ./docs/ --mode multimodal --rerank-strategy text-derived');
+            console.error('  raglite ingest ./docs/ --mode multimodal --rerank-strategy metadata');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+        const supportedStrategies = ['text-derived', 'metadata', 'disabled'];
+        if (!supportedStrategies.includes(options['rerank-strategy'])) {
+            console.error(`Error: Unsupported reranking strategy '${options['rerank-strategy']}'`);
+            console.error('');
+            console.error('Supported strategies for multimodal mode:');
+            console.error('  text-derived  Convert images to text, then use cross-encoder (default)');
+            console.error('  metadata      Use filename and metadata-based scoring');
+            console.error('  disabled      No reranking, use vector similarity only');
+            console.error('');
+            console.error('Examples:');
+            console.error('  --rerank-strategy text-derived');
+            console.error('  --rerank-strategy metadata');
+            console.error('  --rerank-strategy disabled');
+            process.exit(EXIT_CODES.INVALID_ARGUMENTS);
+        }
+    }
     // Validate model option (only for ingest command)
     if (options.model !== undefined) {
         if (command !== 'ingest') {
@@ -186,20 +296,45 @@ function validateArgs(command, args, options) {
             console.error('  raglite search "your query"  # Uses the model from ingestion');
             process.exit(EXIT_CODES.INVALID_ARGUMENTS);
         }
-        const supportedModels = [
+        const mode = options.mode || 'text';
+        const textModels = [
             'sentence-transformers/all-MiniLM-L6-v2',
             'Xenova/all-mpnet-base-v2'
         ];
+        const multimodalModels = [
+            'Xenova/clip-vit-base-patch32'
+        ];
+        let supportedModels;
+        let modelTypeDescription;
+        if (mode === 'multimodal') {
+            supportedModels = multimodalModels;
+            modelTypeDescription = 'multimodal models';
+        }
+        else {
+            supportedModels = textModels;
+            modelTypeDescription = 'text models';
+        }
         if (!supportedModels.includes(options.model)) {
-            console.error(`Error: Unsupported model '${options.model}'`);
+            console.error(`Error: Model '${options.model}' is not supported for ${mode} mode`);
             console.error('');
-            console.error('Supported models:');
-            console.error('  sentence-transformers/all-MiniLM-L6-v2  (384 dim, fast, default)');
-            console.error('  Xenova/all-mpnet-base-v2               (768 dim, higher quality)');
+            if (mode === 'text') {
+                console.error('Supported models for text mode:');
+                console.error('  sentence-transformers/all-MiniLM-L6-v2  (384 dim, fast, default)');
+                console.error('  Xenova/all-mpnet-base-v2               (768 dim, higher quality)');
+            }
+            else {
+                console.error('Supported models for multimodal mode:');
+                console.error('  Xenova/clip-vit-base-patch32           (512 dim, text + image support)');
+            }
             console.error('');
             console.error('Examples:');
-            console.error('  --model sentence-transformers/all-MiniLM-L6-v2');
-            console.error('  --model Xenova/all-mpnet-base-v2');
+            if (mode === 'text') {
+                console.error('  --model sentence-transformers/all-MiniLM-L6-v2');
+                console.error('  --model Xenova/all-mpnet-base-v2');
+            }
+            else {
+                console.error('  --model Xenova/clip-vit-base-patch32 --mode multimodal');
+            }
             process.exit(EXIT_CODES.INVALID_ARGUMENTS);
         }
     }
@@ -243,6 +378,8 @@ function validateArgs(command, args, options) {
  * Main CLI entry point
  */
 async function main() {
+    // Set CLI mode to prevent database connection manager from starting timers
+    process.env.RAG_CLI_MODE = 'true';
     try {
         const { command, args, options } = parseArgs();
         // Validate arguments
@@ -340,23 +477,43 @@ process.on('uncaughtException', (error) => {
     process.exit(EXIT_CODES.GENERAL_ERROR);
 });
 // Handle process termination signals gracefully
-process.on('SIGINT', () => {
+process.on('SIGINT', async () => {
     console.log('\n\nReceived SIGINT (Ctrl+C). Shutting down gracefully...');
     console.log('If you need to force quit, press Ctrl+C again.');
+    // Clean up database connections before exit
+    try {
+        const { DatabaseConnectionManager } = await import('./core/database-connection-manager.js');
+        await DatabaseConnectionManager.closeAllConnections();
+    }
+    catch (error) {
+        // Ignore cleanup errors during shutdown
+    }
     process.exit(EXIT_CODES.SUCCESS);
 });
-process.on('SIGTERM', () => {
+process.on('SIGTERM', async () => {
     console.log('\n\nReceived SIGTERM. Shutting down gracefully...');
-    process.exit(EXIT_CODES.SUCCESS);
-});
-// Run the CLI
-main().catch((error) => {
-    console.error('Fatal error:', error instanceof Error ? error.message : String(error));
-    if (error instanceof ConfigurationError) {
-        process.exit(error.exitCode);
+    // Clean up database connections before exit
+    try {
+        const { DatabaseConnectionManager } = await import('./core/database-connection-manager.js');
+        await DatabaseConnectionManager.closeAllConnections();
     }
-    else {
-        process.exit(EXIT_CODES.GENERAL_ERROR);
+    catch (error) {
+        // Ignore cleanup errors during shutdown
     }
+    process.exit(EXIT_CODES.SUCCESS);
 });
+// Run the CLI only if this file is executed directly
+// In ES modules, we need to check import.meta.url instead of require.main
+// Check if this file is being run directly
+if (process.argv[1] === __filename || process.argv[1].endsWith('cli.js')) {
+    main().catch((error) => {
+        console.error('Fatal error:', error instanceof Error ? error.message : String(error));
+        if (error instanceof ConfigurationError) {
+            process.exit(error.exitCode);
+        }
+        else {
+            process.exit(EXIT_CODES.GENERAL_ERROR);
+        }
+    });
+}
 //# sourceMappingURL=cli.js.map