npm - @cmdoss/memwal-sdk - Versions diffs - 0.9.0 → 1.0.0 - Mend

@cmdoss/memwal-sdk 0.9.0 → 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (174) hide show

package/README.md +157 -52
package/dist/client/ClientMemoryManager.d.ts.map +1 -1
package/dist/client/ClientMemoryManager.js +25 -8
package/dist/client/ClientMemoryManager.js.map +1 -1
package/dist/client/PersonalDataWallet.d.ts.map +1 -1
package/dist/client/SimplePDWClient.d.ts +2 -1
package/dist/client/SimplePDWClient.d.ts.map +1 -1
package/dist/client/SimplePDWClient.js +23 -6
package/dist/client/SimplePDWClient.js.map +1 -1
package/dist/client/namespaces/MemoryNamespace.d.ts +6 -0
package/dist/client/namespaces/MemoryNamespace.d.ts.map +1 -1
package/dist/client/namespaces/MemoryNamespace.js +131 -18
package/dist/client/namespaces/MemoryNamespace.js.map +1 -1
package/dist/client/namespaces/consolidated/StorageNamespace.d.ts +3 -1
package/dist/client/namespaces/consolidated/StorageNamespace.d.ts.map +1 -1
package/dist/client/namespaces/consolidated/StorageNamespace.js.map +1 -1
package/dist/config/ConfigurationHelper.js +61 -61
package/dist/config/index.d.ts +1 -0
package/dist/config/index.d.ts.map +1 -1
package/dist/config/index.js +2 -0
package/dist/config/index.js.map +1 -1
package/dist/config/modelDefaults.d.ts +67 -0
package/dist/config/modelDefaults.d.ts.map +1 -0
package/dist/config/modelDefaults.js +91 -0
package/dist/config/modelDefaults.js.map +1 -0
package/dist/graph/GraphService.d.ts.map +1 -1
package/dist/graph/GraphService.js +22 -21
package/dist/graph/GraphService.js.map +1 -1
package/dist/index.d.ts +1 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +1 -1
package/dist/index.js.map +1 -1
package/dist/langchain/createPDWRAG.js +30 -30
package/dist/pipeline/MemoryPipeline.d.ts.map +1 -1
package/dist/pipeline/MemoryPipeline.js +2 -1
package/dist/pipeline/MemoryPipeline.js.map +1 -1
package/dist/services/GeminiAIService.d.ts.map +1 -1
package/dist/services/GeminiAIService.js +311 -310
package/dist/services/GeminiAIService.js.map +1 -1
package/dist/services/StorageService.d.ts +4 -1
package/dist/services/StorageService.d.ts.map +1 -1
package/dist/services/StorageService.js.map +1 -1
package/dist/services/storage/QuiltBatchManager.d.ts +7 -0
package/dist/services/storage/QuiltBatchManager.d.ts.map +1 -1
package/dist/services/storage/QuiltBatchManager.js +24 -5
package/dist/services/storage/QuiltBatchManager.js.map +1 -1
package/dist/services/storage/WalrusStorageManager.d.ts +10 -1
package/dist/services/storage/WalrusStorageManager.d.ts.map +1 -1
package/dist/services/storage/WalrusStorageManager.js +53 -12
package/dist/services/storage/WalrusStorageManager.js.map +1 -1
package/dist/vector/BrowserHnswIndexService.js +2 -2
package/dist/vector/BrowserHnswIndexService.js.map +1 -1
package/dist/vector/NodeHnswService.js +4 -4
package/dist/vector/NodeHnswService.js.map +1 -1
package/dist/vector/createHnswService.d.ts +4 -0
package/dist/vector/createHnswService.d.ts.map +1 -1
package/dist/vector/createHnswService.js +15 -3
package/dist/vector/createHnswService.js.map +1 -1
package/package.json +1 -1
package/src/access/PermissionService.ts +635 -635
package/src/aggregation/AggregationService.ts +389 -389
package/src/ai-sdk/PDWVectorStore.ts +715 -715
package/src/ai-sdk/index.ts +65 -65
package/src/ai-sdk/tools.ts +460 -460
package/src/ai-sdk/types.ts +404 -404
package/src/batch/BatchManager.ts +597 -597
package/src/batch/BatchingService.ts +429 -429
package/src/batch/MemoryProcessingCache.ts +492 -492
package/src/batch/index.ts +30 -30
package/src/browser.ts +200 -200
package/src/client/ClientMemoryManager.ts +1004 -987
package/src/client/PersonalDataWallet.ts +345 -345
package/src/client/SimplePDWClient.ts +1387 -1369
package/src/client/factory.ts +154 -154
package/src/client/namespaces/AnalyticsNamespace.ts +377 -377
package/src/client/namespaces/BatchNamespace.ts +356 -356
package/src/client/namespaces/CacheNamespace.ts +123 -123
package/src/client/namespaces/CapabilityNamespace.ts +217 -217
package/src/client/namespaces/ClassifyNamespace.ts +169 -169
package/src/client/namespaces/ContextNamespace.ts +297 -297
package/src/client/namespaces/EncryptionNamespace.ts +221 -221
package/src/client/namespaces/GraphNamespace.ts +468 -468
package/src/client/namespaces/IndexNamespace.ts +364 -364
package/src/client/namespaces/MemoryNamespace.ts +1704 -1569
package/src/client/namespaces/PermissionsNamespace.ts +254 -254
package/src/client/namespaces/PipelineNamespace.ts +220 -220
package/src/client/namespaces/StorageNamespace.ts +458 -458
package/src/client/namespaces/TxNamespace.ts +260 -260
package/src/client/namespaces/WalletNamespace.ts +243 -243
package/src/client/namespaces/consolidated/BlockchainNamespace.ts +607 -607
package/src/client/namespaces/consolidated/SecurityNamespace.ts +648 -648
package/src/client/namespaces/consolidated/StorageNamespace.ts +1143 -1141
package/src/client/namespaces/consolidated/index.ts +41 -41
package/src/client/signers/KeypairSigner.ts +108 -108
package/src/client/signers/UnifiedSigner.ts +110 -110
package/src/client/signers/WalletAdapterSigner.ts +159 -159
package/src/client/signers/index.ts +26 -26
package/src/config/ConfigurationHelper.ts +412 -412
package/src/config/defaults.ts +56 -56
package/src/config/index.ts +16 -9
package/src/config/modelDefaults.ts +103 -0
package/src/config/validation.ts +70 -70
package/src/core/index.ts +14 -14
package/src/core/interfaces/IService.ts +307 -307
package/src/core/interfaces/index.ts +8 -8
package/src/core/types/capability.ts +297 -297
package/src/core/types/index.ts +874 -874
package/src/core/types/wallet.ts +270 -270
package/src/core/types.ts +9 -9
package/src/core/wallet.ts +222 -222
package/src/embedding/index.ts +19 -19
package/src/embedding/types.ts +357 -357
package/src/errors/index.ts +602 -602
package/src/errors/recovery.ts +461 -461
package/src/errors/validation.ts +567 -567
package/src/generated/pdw/capability.ts +319 -319
package/src/graph/GraphService.ts +888 -887
package/src/graph/KnowledgeGraphManager.ts +728 -728
package/src/graph/index.ts +25 -25
package/src/index.ts +498 -498
package/src/infrastructure/index.ts +22 -22
package/src/infrastructure/seal/EncryptionService.ts +628 -628
package/src/infrastructure/seal/SealService.ts +613 -613
package/src/infrastructure/seal/index.ts +9 -9
package/src/infrastructure/sui/BlockchainManager.ts +627 -627
package/src/infrastructure/sui/SuiService.ts +888 -888
package/src/infrastructure/sui/index.ts +9 -9
package/src/infrastructure/walrus/StorageManager.ts +604 -604
package/src/infrastructure/walrus/WalrusStorageService.ts +637 -637
package/src/infrastructure/walrus/index.ts +9 -9
package/src/langchain/createPDWRAG.ts +303 -303
package/src/langchain/index.ts +47 -47
package/src/permissions/ConsentRepository.browser.ts +249 -249
package/src/permissions/ConsentRepository.ts +364 -364
package/src/pipeline/MemoryPipeline.ts +863 -862
package/src/pipeline/PipelineManager.ts +683 -683
package/src/pipeline/index.ts +26 -26
package/src/retrieval/AdvancedSearchService.ts +629 -629
package/src/retrieval/MemoryAnalyticsService.ts +711 -711
package/src/retrieval/MemoryDecryptionPipeline.ts +825 -825
package/src/retrieval/index.ts +42 -42
package/src/services/BatchService.ts +352 -352
package/src/services/CapabilityService.ts +464 -464
package/src/services/ClassifierService.ts +465 -465
package/src/services/CrossContextPermissionService.ts +486 -486
package/src/services/EmbeddingService.ts +796 -796
package/src/services/EncryptionService.ts +712 -712
package/src/services/GeminiAIService.ts +754 -753
package/src/services/MemoryIndexService.ts +1009 -1009
package/src/services/MemoryService.ts +369 -369
package/src/services/QueryService.ts +890 -890
package/src/services/StorageService.ts +1185 -1182
package/src/services/TransactionService.ts +838 -838
package/src/services/VectorService.ts +462 -462
package/src/services/ViewService.ts +484 -484
package/src/services/index.ts +25 -25
package/src/services/storage/BlobAttributesManager.ts +333 -333
package/src/services/storage/KnowledgeGraphManager.ts +425 -425
package/src/services/storage/MemorySearchManager.ts +387 -387
package/src/services/storage/QuiltBatchManager.ts +1157 -1130
package/src/services/storage/WalrusMetadataManager.ts +268 -268
package/src/services/storage/WalrusStorageManager.ts +333 -287
package/src/services/storage/index.ts +57 -57
package/src/types/index.ts +13 -13
package/src/utils/index.ts +76 -76
package/src/utils/memoryIndexOnChain.ts +507 -507
package/src/vector/BrowserHnswIndexService.ts +758 -758
package/src/vector/HnswWasmService.ts +731 -731
package/src/vector/IHnswService.ts +233 -233
package/src/vector/NodeHnswService.ts +833 -833
package/src/vector/createHnswService.ts +147 -135
package/src/vector/index.ts +56 -56
package/src/wallet/ContextWalletService.ts +656 -656
package/src/wallet/MainWalletService.ts +317 -317

package/src/services/EmbeddingService.ts CHANGED Viewed

@@ -1,796 +1,796 @@
-/**
- * EmbeddingService - AI SDK Integration
- *
- * Refactored to use Vercel AI SDK as the underlying embedding provider.
- * Supports any AI SDK compatible provider (OpenAI, Google, Cohere, etc.)
- * while maintaining backward compatibility with existing PDW code.
- *
- * OpenRouter now uses the official @openrouter/sdk instead of raw fetch calls.
- *
- * Key features:
- * - Provider-agnostic: Accept any ai-sdk EmbeddingModel
- * - Backward compatible: Existing code continues to work
- * - Flexible configuration: Direct model OR provider config
- */
-import type { EmbeddingModelV2 } from '@ai-sdk/provider';
-import { embed, embedMany } from 'ai';
-import { createGoogleGenerativeAI } from '@ai-sdk/google';
-import { createOpenAI } from '@ai-sdk/openai';
-import { OpenRouter } from '@openrouter/sdk';
-// Type alias for embedding models - V2 is the default in AI SDK v5
-type EmbeddingModel<VALUE> = EmbeddingModelV2<VALUE>;
-// Provider instances (lazily initialized)
-let googleProvider: ReturnType<typeof createGoogleGenerativeAI> | null = null;
-let openaiProvider: ReturnType<typeof createOpenAI> | null = null;
-let openrouterProvider: ReturnType<typeof createOpenAI> | null = null;
-let cohereProvider: any = null;
-export interface EmbeddingConfig {
-  /**
-   * Option 1: Direct ai-sdk model (most flexible)
-   * User provides their own EmbeddingModel from any provider
-   *
-   * For backward compatibility, also accepts string (treated as modelName)
-   *
-   * @example
-   * ```typescript
-   * import { openai } from '@ai-sdk/openai';
-   * const service = new EmbeddingService({
-   *   model: openai.embedding('text-embedding-3-large')
-   * });
-   *
-   * // Backward compatible:
-   * const service = new EmbeddingService({
-   *   model: 'text-embedding-004', // Treated as modelName
-   *   apiKey: 'your-key'
-   * });
-   * ```
-   */
-  model?: EmbeddingModel<string> | string;
-  /**
-   * Option 2: Provider-based configuration
-   * PDW creates the model from provider settings
-   *
-   * - google: Direct Google AI API
-   * - openai: Direct OpenAI API
-   * - openrouter: OpenRouter API gateway (supports multiple models)
-   * - cohere: Direct Cohere API
-   */
-  provider?: 'google' | 'openai' | 'openrouter' | 'cohere';
-  /**
-   * API key for the provider
-   * Falls back to environment variables:
-   * - GEMINI_API_KEY or GOOGLE_AI_API_KEY (for google)
-   * - OPENAI_API_KEY (for openai)
-   * - OPENROUTER_API_KEY (for openrouter)
-   * - COHERE_API_KEY (for cohere)
-   */
-  apiKey?: string;
-  /**
-   * Model name to use
-   * - Google: 'text-embedding-004', 'gemini-embedding-001'
-   * - OpenAI: 'text-embedding-3-small', 'text-embedding-3-large'
-   * - OpenRouter: 'google/gemini-embedding-001', 'openai/text-embedding-3-small', etc.
-   * - Cohere: 'embed-english-v3.0', 'embed-multilingual-v3.0'
-   */
-  modelName?: string;
-  /**
-   * Embedding dimensions (optional, provider-dependent)
-   * - Google: Up to 3072
-   * - OpenAI: 256, 512, 1024, 1536, 3072 (depending on model)
-   * - OpenRouter: Depends on the underlying model
-   * - Cohere: Model-specific
-   */
-  dimensions?: number;
-  /**
-   * Rate limiting
-   */
-  requestsPerMinute?: number;
-}
-export interface EmbeddingOptions {
-  text: string;
-  type?: 'content' | 'metadata' | 'query';
-  taskType?: 'RETRIEVAL_QUERY' | 'RETRIEVAL_DOCUMENT' | 'SEMANTIC_SIMILARITY';
-}
-export interface EmbeddingResult {
-  vector: number[];
-  dimension: number;
-  model: string;
-  processingTime: number;
-  tokenCount?: number;
-}
-export interface BatchEmbeddingResult {
-  vectors: number[][];
-  dimension: number;
-  model: string;
-  totalProcessingTime: number;
-  averageProcessingTime: number;
-  successCount: number;
-  failedCount: number;
-}
-/**
- * Embedding service using Vercel AI SDK
- * Supports all AI SDK compatible providers
- * OpenRouter uses the official @openrouter/sdk for better type safety
- */
-export class EmbeddingService {
-  private embeddingModel: EmbeddingModel<string> | null = null;
-  private modelName: string;
-  private dimensions: number;
-  private requestCount = 0;
-  private lastReset = Date.now();
-  private readonly maxRequestsPerMinute: number;
-  private provider: 'google' | 'openai' | 'openrouter' | 'cohere' | 'custom';
-  private apiKey: string = '';
-  private openRouterClient: OpenRouter | null = null;
-  constructor(config: EmbeddingConfig = {}) {
-    this.maxRequestsPerMinute = config.requestsPerMinute || 1500;
-    // Case 1: Direct model provided (most flexible)
-    if (config.model) {
-      // Backward compatibility: If model is a string, treat as modelName
-      if (typeof config.model === 'string') {
-        const modelNameFromString = config.model;
-        console.log(`🔄 Backward compatibility: treating model string "${modelNameFromString}" as modelName`);
-        // Treat string as modelName and use provider config path
-        const provider = config.provider || 'google';
-        this.apiKey = this.resolveApiKey(provider, config.apiKey);
-        if (!this.apiKey) {
-          throw new Error(
-            `API key is required for ${provider} provider. ` +
-            `Provide it via config.apiKey or environment variable.`
-          );
-        }
-        this.provider = provider;
-        this.modelName = modelNameFromString;
-        this.dimensions = config.dimensions || this.getDefaultDimensions(provider);
-        // OpenRouter uses SDK, others use AI SDK
-        if (provider === 'openrouter') {
-          this.openRouterClient = new OpenRouter({ apiKey: this.apiKey });
-        } else {
-          this.embeddingModel = this.createModel(provider, this.apiKey, this.modelName);
-        }
-        console.log(`✅ EmbeddingService initialized with ${provider} provider (${this.modelName}) [backward compat mode]`);
-        return;
-      }
-      // New behavior: Direct EmbeddingModel from ai-sdk
-      this.embeddingModel = config.model;
-      this.modelName = 'custom';
-      this.dimensions = config.dimensions || 768; // Default 768 for speed (was 3072)
-      this.provider = 'custom';
-      console.log('✅ EmbeddingService initialized with custom ai-sdk model');
-      return;
-    }
-    // Case 2: Provider-based configuration
-    const provider = config.provider || 'google'; // Default to google for backward compat
-    this.apiKey = this.resolveApiKey(provider, config.apiKey);
-    if (!this.apiKey) {
-      throw new Error(
-        `API key is required for ${provider} provider. ` +
-        `Provide it via config.apiKey or environment variable.`
-      );
-    }
-    this.provider = provider;
-    this.modelName = config.modelName || this.getDefaultModelName(provider);
-    this.dimensions = config.dimensions || this.getDefaultDimensions(provider);
-    // OpenRouter uses SDK, others use AI SDK
-    if (provider === 'openrouter') {
-      this.openRouterClient = new OpenRouter({ apiKey: this.apiKey });
-    } else {
-      this.embeddingModel = this.createModel(provider, this.apiKey, this.modelName);
-    }
-    console.log(`✅ EmbeddingService initialized with ${provider} provider (${this.modelName})`);
-  }
-  /**
-   * Resolve API key from config or environment
-   */
-  private resolveApiKey(provider: string, configKey?: string): string {
-    if (configKey) return configKey;
-    switch (provider) {
-      case 'google':
-        return process.env.GEMINI_API_KEY || process.env.GOOGLE_AI_API_KEY || '';
-      case 'openai':
-        return process.env.OPENAI_API_KEY || '';
-      case 'openrouter':
-        return process.env.OPENROUTER_API_KEY || '';
-      case 'cohere':
-        return process.env.COHERE_API_KEY || '';
-      default:
-        return '';
-    }
-  }
-  /**
-   * Get default model name for provider
-   */
-  private getDefaultModelName(provider: string): string {
-    switch (provider) {
-      case 'google':
-        return 'text-embedding-004';
-      case 'openai':
-        return 'text-embedding-3-small';
-      case 'openrouter':
-        return 'google/gemini-embedding-001'; // Default OpenRouter embedding model
-      case 'cohere':
-        return 'embed-english-v3.0';
-      default:
-        return 'text-embedding-004';
-    }
-  }
-  /**
-   * Get default dimensions for provider
-   *
-   * Default is now 768 for faster performance:
-   * - 4x smaller vectors = faster indexing & search
-   * - ~4x less storage space
-   * - Minimal quality loss for most use cases
-   *
-   * Users can override via config.dimensions
-   */
-  private getDefaultDimensions(provider: string): number {
-    switch (provider) {
-      case 'google':
-        return 768; // text-embedding-004 supports output_dimensionality
-      case 'openai':
-        return 768; // text-embedding-3-small supports dimensions param
-      case 'openrouter':
-        return 768; // Most models support dimension truncation
-      case 'cohere':
-        return 768; // embed-english-v3.0 supports dimensions
-      default:
-        return 768; // Default to 768 for speed
-    }
-  }
-  /**
-   * Create embedding model from provider
-   */
-  private createModel(
-    provider: string,
-    apiKey: string,
-    modelName: string
-  ): EmbeddingModel<string> {
-    switch (provider) {
-      case 'google': {
-        if (!googleProvider) {
-          googleProvider = createGoogleGenerativeAI({ apiKey });
-        }
-        return googleProvider.textEmbeddingModel(modelName);
-      }
-      case 'openai': {
-        if (!openaiProvider) {
-          openaiProvider = createOpenAI({ apiKey });
-        }
-        // OpenAI returns EmbeddingModelV2 but is compatible with ai SDK
-        return openaiProvider.textEmbeddingModel(modelName) as unknown as EmbeddingModel<string>;
-      }
-      case 'openrouter': {
-        // OpenRouter uses OpenAI-compatible API with custom baseURL
-        if (!openrouterProvider) {
-          openrouterProvider = createOpenAI({
-            baseURL: 'https://openrouter.ai/api/v1',
-            apiKey,
-          });
-        }
-        // OpenRouter embedding models use the same interface as OpenAI
-        return openrouterProvider.textEmbeddingModel(modelName) as unknown as EmbeddingModel<string>;
-      }
-      case 'cohere': {
-        if (!cohereProvider) {
-          throw new Error(
-            'Cohere provider requires manual initialization. ' +
-            'Import createCohere from @ai-sdk/cohere and set cohereProvider before use.'
-          );
-        }
-        return cohereProvider.textEmbedding(modelName);
-      }
-      default:
-        throw new Error(`Unsupported provider: ${provider}`);
-    }
-  }
-  /**
-   * Generate embedding for a single text
-   */
-  async embedText(options: EmbeddingOptions): Promise<EmbeddingResult> {
-    const startTime = Date.now();
-    // Validate input
-    if (!options.text || typeof options.text !== 'string' || options.text.trim().length === 0) {
-      throw new Error('Invalid or empty text provided for embedding');
-    }
-    await this.checkRateLimit();
-    try {
-      // OpenRouter uses native fetch API for better compatibility
-      if (this.provider === 'openrouter') {
-        return await this.embedTextOpenRouter(options.text, startTime);
-      }
-      // Other providers use AI SDK
-      if (!this.embeddingModel) {
-        throw new Error('Embedding model not initialized');
-      }
-      const result = await embed({
-        model: this.embeddingModel,
-        value: options.text,
-        ...this.getProviderOptions(options),
-      });
-      this.requestCount++;
-      return {
-        vector: result.embedding,
-        dimension: result.embedding.length,
-        model: this.modelName,
-        processingTime: Date.now() - startTime,
-        tokenCount: result.usage?.tokens,
-      };
-    } catch (error) {
-      throw new Error(
-        `Embedding generation failed: ${error instanceof Error ? error.message : 'Unknown error'}`
-      );
-    }
-  }
-  /**
-   * Generate embedding using OpenRouter SDK
-   * Uses official @openrouter/sdk for embeddings
-   * Passes dimensions parameter to truncate output vectors
-   */
-  private async embedTextOpenRouter(text: string, startTime: number): Promise<EmbeddingResult> {
-    if (!this.openRouterClient) {
-      throw new Error('OpenRouter client not initialized');
-    }
-    // Build request with optional dimensions parameter
-    const request: any = {
-      model: this.modelName,
-      input: text
-    };
-    // Add dimensions if configured (enables output truncation)
-    if (this.dimensions && this.dimensions < 3072) {
-      request.dimensions = this.dimensions;
-    }
-    const result = await this.openRouterClient.embeddings.generate(request);
-    // Handle union type - result can be string or object
-    if (typeof result === 'string') {
-      throw new Error('Unexpected string response from OpenRouter embeddings API');
-    }
-    const data = (result as any).data;
-    if (!data || !data[0] || !data[0].embedding) {
-      throw new Error('Invalid response from OpenRouter embeddings API');
-    }
-    this.requestCount++;
-    // Handle embedding which can be string or number[]
-    const embedding = data[0].embedding;
-    const vector = typeof embedding === 'string'
-      ? JSON.parse(embedding) as number[]
-      : embedding as number[];
-    const usage = (result as any).usage;
-    return {
-      vector,
-      dimension: vector.length,
-      model: this.modelName,
-      processingTime: Date.now() - startTime,
-      tokenCount: usage?.totalTokens
-    };
-  }
-  /**
-   * Generate embeddings for multiple texts (batched)
-   */
-  async embedBatch(
-    texts: string[],
-    options: Omit<EmbeddingOptions, 'text'> = {}
-  ): Promise<BatchEmbeddingResult> {
-    const startTime = Date.now();
-    let successCount = 0;
-    let failedCount = 0;
-    try {
-      await this.checkRateLimit();
-      // OpenRouter uses native fetch API for better compatibility
-      if (this.provider === 'openrouter') {
-        return await this.embedBatchOpenRouter(texts, startTime);
-      }
-      // Other providers use AI SDK
-      if (!this.embeddingModel) {
-        throw new Error('Embedding model not initialized');
-      }
-      const result = await embedMany({
-        model: this.embeddingModel,
-        values: texts,
-        ...this.getProviderOptions(options as EmbeddingOptions),
-      });
-      successCount = result.embeddings.length;
-      const totalTime = Date.now() - startTime;
-      return {
-        vectors: result.embeddings,
-        dimension: result.embeddings[0]?.length || this.dimensions,
-        model: this.modelName,
-        totalProcessingTime: totalTime,
-        averageProcessingTime: totalTime / texts.length,
-        successCount,
-        failedCount,
-      };
-    } catch (error) {
-      throw new Error(
-        `Batch embedding failed: ${error instanceof Error ? error.message : 'Unknown error'}`
-      );
-    }
-  }
-  /**
-   * Generate batch embeddings using OpenRouter SDK
-   * Passes dimensions parameter to truncate output vectors
-   */
-  private async embedBatchOpenRouter(texts: string[], startTime: number): Promise<BatchEmbeddingResult> {
-    if (!this.openRouterClient) {
-      throw new Error('OpenRouter client not initialized');
-    }
-    // Build request with optional dimensions parameter
-    const request: any = {
-      model: this.modelName,
-      input: texts
-    };
-    // Add dimensions if configured (enables output truncation)
-    if (this.dimensions && this.dimensions < 3072) {
-      request.dimensions = this.dimensions;
-    }
-    const result = await this.openRouterClient.embeddings.generate(request);
-    // Handle union type - result can be string or object
-    if (typeof result === 'string') {
-      throw new Error('Unexpected string response from OpenRouter embeddings API');
-    }
-    const data = (result as any).data;
-    if (!data || !Array.isArray(data)) {
-      throw new Error('Invalid response from OpenRouter embeddings API');
-    }
-    // Sort by index to ensure correct order
-    const sortedData = [...data].sort((a: any, b: any) => (a.index || 0) - (b.index || 0));
-    const vectors = sortedData.map((item: any) => {
-      const embedding = item.embedding;
-      return typeof embedding === 'string'
-        ? JSON.parse(embedding) as number[]
-        : embedding as number[];
-    });
-    this.requestCount++;
-    const totalTime = Date.now() - startTime;
-    return {
-      vectors,
-      dimension: vectors[0]?.length || this.dimensions,
-      model: this.modelName,
-      totalProcessingTime: totalTime,
-      averageProcessingTime: totalTime / texts.length,
-      successCount: vectors.length,
-      failedCount: texts.length - vectors.length
-    };
-  }
-  /**
-   * Get provider-specific options
-   */
-  private getProviderOptions(options: EmbeddingOptions): any {
-    const providerOpts: any = {};
-    if (this.provider === 'google') {
-      providerOpts.providerOptions = {
-        google: {
-          outputDimensionality: this.dimensions,
-          taskType: this.getGoogleTaskType(options.type),
-        },
-      };
-    } else if (this.provider === 'openai') {
-      providerOpts.providerOptions = {
-        openai: {
-          dimensions: this.dimensions,
-        },
-      };
-    } else if (this.provider === 'openrouter') {
-      // OpenRouter uses OpenAI-compatible options
-      // Note: dimensions may not be supported for all models via OpenRouter
-      providerOpts.providerOptions = {
-        openai: {
-          dimensions: this.dimensions,
-        },
-      };
-    } else if (this.provider === 'cohere') {
-      providerOpts.providerOptions = {
-        cohere: {
-          inputType: this.getCohereInputType(options.type),
-        },
-      };
-    }
-    return providerOpts;
-  }
-  /**
-   * Map PDW type to Google task type
-   */
-  private getGoogleTaskType(type?: string): string {
-    switch (type) {
-      case 'query':
-        return 'RETRIEVAL_QUERY';
-      case 'content':
-        return 'RETRIEVAL_DOCUMENT';
-      case 'metadata':
-        return 'SEMANTIC_SIMILARITY';
-      default:
-        return 'RETRIEVAL_DOCUMENT';
-    }
-  }
-  /**
-   * Map PDW type to Cohere input type
-   */
-  private getCohereInputType(type?: string): string {
-    switch (type) {
-      case 'query':
-        return 'search_query';
-      case 'content':
-        return 'search_document';
-      default:
-        return 'search_document';
-    }
-  }
-  /**
-   * Calculate cosine similarity between two vectors
-   */
-  calculateCosineSimilarity(vectorA: number[], vectorB: number[]): number {
-    if (vectorA.length !== vectorB.length) {
-      throw new Error(`Vector dimension mismatch: ${vectorA.length} vs ${vectorB.length}`);
-    }
-    let dotProduct = 0;
-    let normA = 0;
-    let normB = 0;
-    for (let i = 0; i < vectorA.length; i++) {
-      dotProduct += vectorA[i] * vectorB[i];
-      normA += vectorA[i] * vectorA[i];
-      normB += vectorB[i] * vectorB[i];
-    }
-    const magnitude = Math.sqrt(normA) * Math.sqrt(normB);
-    if (magnitude === 0) {
-      return 0;
-    }
-    return dotProduct / magnitude;
-  }
-  /**
-   * Calculate Euclidean distance between two vectors
-   */
-  calculateEuclideanDistance(vectorA: number[], vectorB: number[]): number {
-    if (vectorA.length !== vectorB.length) {
-      throw new Error(`Vector dimension mismatch: ${vectorA.length} vs ${vectorB.length}`);
-    }
-    let sum = 0;
-    for (let i = 0; i < vectorA.length; i++) {
-      const diff = vectorA[i] - vectorB[i];
-      sum += diff * diff;
-    }
-    return Math.sqrt(sum);
-  }
-  /**
-   * Normalize a vector to unit length
-   */
-  normalizeVector(vector: number[]): number[] {
-    const magnitude = Math.sqrt(vector.reduce((sum, val) => sum + val * val, 0));
-    if (magnitude === 0) {
-      return vector;
-    }
-    return vector.map(val => val / magnitude);
-  }
-  /**
-   * Find the most similar vectors to a query vector
-   */
-  findMostSimilar(
-    queryVector: number[],
-    candidateVectors: number[][],
-    k: number = 5
-  ): Array<{ index: number; similarity: number; distance: number }> {
-    const similarities = candidateVectors.map((vector, index) => {
-      const similarity = this.calculateCosineSimilarity(queryVector, vector);
-      const distance = this.calculateEuclideanDistance(queryVector, vector);
-      return { index, similarity, distance };
-    });
-    similarities.sort((a, b) => b.similarity - a.similarity);
-    return similarities.slice(0, k);
-  }
-  /**
-   * Get embedding statistics
-   */
-  getStats(): {
-    totalRequests: number;
-    requestsThisMinute: number;
-    model: string;
-    dimensions: number;
-    rateLimit: number;
-    provider: string;
-  } {
-    const now = Date.now();
-    const requestsThisMinute = (now - this.lastReset) < 60000 ? this.requestCount : 0;
-    return {
-      totalRequests: this.requestCount,
-      requestsThisMinute,
-      model: this.modelName,
-      dimensions: this.dimensions,
-      rateLimit: this.maxRequestsPerMinute,
-      provider: this.provider,
-    };
-  }
-  /**
-   * Reset rate limiting counters
-   */
-  private resetRateLimit(): void {
-    const now = Date.now();
-    if (now - this.lastReset >= 60000) {
-      this.requestCount = 0;
-      this.lastReset = now;
-    }
-  }
-  /**
-   * Check rate limiting and wait if necessary
-   */
-  private async checkRateLimit(): Promise<void> {
-    this.resetRateLimit();
-    if (this.requestCount >= this.maxRequestsPerMinute) {
-      const waitTime = 60000 - (Date.now() - this.lastReset);
-      if (waitTime > 0) {
-        if (process.env.NODE_ENV === 'development') {
-          console.warn(`Rate limit reached, waiting ${waitTime}ms`);
-        }
-        await this.delay(waitTime);
-        this.resetRateLimit();
-      }
-    }
-  }
-  /**
-   * Utility delay function
-   */
-  private delay(ms: number): Promise<void> {
-    return new Promise(resolve => setTimeout(resolve, ms));
-  }
-}
-export default EmbeddingService;
-// ==================== Singleton Pattern ====================
-/**
- * Generate config key for singleton cache
- */
-function getConfigKey(config: EmbeddingConfig): string {
-  const provider = config.provider || 'google';
-  const modelName = typeof config.model === 'string'
-    ? config.model
-    : (config.modelName || 'default');
-  const dimensions = config.dimensions || 'default';
-  return `${provider}:${modelName}:${dimensions}`;
-}
-/** Singleton cache */
-const sharedInstances = new Map<string, EmbeddingService>();
-/**
- * Get or create a shared EmbeddingService instance (Singleton)
- *
- * All clients with same provider/model/dimensions share one instance.
- * Reduces memory usage and connection overhead.
- *
- * @example
- * ```typescript
- * // Instead of: new EmbeddingService({ apiKey, modelName })
- * const embedding = getSharedEmbeddingService({ apiKey, modelName });
- * ```
- */
-export function getSharedEmbeddingService(config: EmbeddingConfig): EmbeddingService {
-  const key = getConfigKey(config);
-  let instance = sharedInstances.get(key);
-  if (!instance) {
-    console.log(`🔧 [Singleton] Creating shared EmbeddingService: ${key}`);
-    instance = new EmbeddingService(config);
-    sharedInstances.set(key, instance);
-  }
-  return instance;
-}
-/**
- * Clear all shared instances (for testing)
- */
-export function clearSharedEmbeddingServices(): void {
-  sharedInstances.clear();
-}
-/**
- * Get singleton stats
- */
-export function getSharedEmbeddingStats(): {
-  instanceCount: number;
-  instances: Array<{ key: string; stats: ReturnType<EmbeddingService['getStats']> }>;
-} {
-  return {
-    instanceCount: sharedInstances.size,
-    instances: Array.from(sharedInstances.entries()).map(([key, svc]) => ({
-      key,
-      stats: svc.getStats(),
-    })),
-  };
-}
+/**
+ * EmbeddingService - AI SDK Integration
+ *
+ * Refactored to use Vercel AI SDK as the underlying embedding provider.
+ * Supports any AI SDK compatible provider (OpenAI, Google, Cohere, etc.)
+ * while maintaining backward compatibility with existing PDW code.
+ *
+ * OpenRouter now uses the official @openrouter/sdk instead of raw fetch calls.
+ *
+ * Key features:
+ * - Provider-agnostic: Accept any ai-sdk EmbeddingModel
+ * - Backward compatible: Existing code continues to work
+ * - Flexible configuration: Direct model OR provider config
+ */
+import type { EmbeddingModelV2 } from '@ai-sdk/provider';
+import { embed, embedMany } from 'ai';
+import { createGoogleGenerativeAI } from '@ai-sdk/google';
+import { createOpenAI } from '@ai-sdk/openai';
+import { OpenRouter } from '@openrouter/sdk';
+// Type alias for embedding models - V2 is the default in AI SDK v5
+type EmbeddingModel<VALUE> = EmbeddingModelV2<VALUE>;
+// Provider instances (lazily initialized)
+let googleProvider: ReturnType<typeof createGoogleGenerativeAI> | null = null;
+let openaiProvider: ReturnType<typeof createOpenAI> | null = null;
+let openrouterProvider: ReturnType<typeof createOpenAI> | null = null;
+let cohereProvider: any = null;
+export interface EmbeddingConfig {
+  /**
+   * Option 1: Direct ai-sdk model (most flexible)
+   * User provides their own EmbeddingModel from any provider
+   *
+   * For backward compatibility, also accepts string (treated as modelName)
+   *
+   * @example
+   * ```typescript
+   * import { openai } from '@ai-sdk/openai';
+   * const service = new EmbeddingService({
+   *   model: openai.embedding('text-embedding-3-large')
+   * });
+   *
+   * // Backward compatible:
+   * const service = new EmbeddingService({
+   *   model: 'text-embedding-004', // Treated as modelName
+   *   apiKey: 'your-key'
+   * });
+   * ```
+   */
+  model?: EmbeddingModel<string> | string;
+  /**
+   * Option 2: Provider-based configuration
+   * PDW creates the model from provider settings
+   *
+   * - google: Direct Google AI API
+   * - openai: Direct OpenAI API
+   * - openrouter: OpenRouter API gateway (supports multiple models)
+   * - cohere: Direct Cohere API
+   */
+  provider?: 'google' | 'openai' | 'openrouter' | 'cohere';
+  /**
+   * API key for the provider
+   * Falls back to environment variables:
+   * - GEMINI_API_KEY or GOOGLE_AI_API_KEY (for google)
+   * - OPENAI_API_KEY (for openai)
+   * - OPENROUTER_API_KEY (for openrouter)
+   * - COHERE_API_KEY (for cohere)
+   */
+  apiKey?: string;
+  /**
+   * Model name to use
+   * - Google: 'text-embedding-004', 'gemini-embedding-001'
+   * - OpenAI: 'text-embedding-3-small', 'text-embedding-3-large'
+   * - OpenRouter: 'google/gemini-embedding-001', 'openai/text-embedding-3-small', etc.
+   * - Cohere: 'embed-english-v3.0', 'embed-multilingual-v3.0'
+   */
+  modelName?: string;
+  /**
+   * Embedding dimensions (optional, provider-dependent)
+   * - Google: Up to 3072
+   * - OpenAI: 256, 512, 1024, 1536, 3072 (depending on model)
+   * - OpenRouter: Depends on the underlying model
+   * - Cohere: Model-specific
+   */
+  dimensions?: number;
+  /**
+   * Rate limiting
+   */
+  requestsPerMinute?: number;
+}
+export interface EmbeddingOptions {
+  text: string;
+  type?: 'content' | 'metadata' | 'query';
+  taskType?: 'RETRIEVAL_QUERY' | 'RETRIEVAL_DOCUMENT' | 'SEMANTIC_SIMILARITY';
+}
+export interface EmbeddingResult {
+  vector: number[];
+  dimension: number;
+  model: string;
+  processingTime: number;
+  tokenCount?: number;
+}
+export interface BatchEmbeddingResult {
+  vectors: number[][];
+  dimension: number;
+  model: string;
+  totalProcessingTime: number;
+  averageProcessingTime: number;
+  successCount: number;
+  failedCount: number;
+}
+/**
+ * Embedding service using Vercel AI SDK
+ * Supports all AI SDK compatible providers
+ * OpenRouter uses the official @openrouter/sdk for better type safety
+ */
+export class EmbeddingService {
+  private embeddingModel: EmbeddingModel<string> | null = null;
+  private modelName: string;
+  private dimensions: number;
+  private requestCount = 0;
+  private lastReset = Date.now();
+  private readonly maxRequestsPerMinute: number;
+  private provider: 'google' | 'openai' | 'openrouter' | 'cohere' | 'custom';
+  private apiKey: string = '';
+  private openRouterClient: OpenRouter | null = null;
+  constructor(config: EmbeddingConfig = {}) {
+    this.maxRequestsPerMinute = config.requestsPerMinute || 1500;
+    // Case 1: Direct model provided (most flexible)
+    if (config.model) {
+      // Backward compatibility: If model is a string, treat as modelName
+      if (typeof config.model === 'string') {
+        const modelNameFromString = config.model;
+        console.log(`🔄 Backward compatibility: treating model string "${modelNameFromString}" as modelName`);
+        // Treat string as modelName and use provider config path
+        const provider = config.provider || 'google';
+        this.apiKey = this.resolveApiKey(provider, config.apiKey);
+        if (!this.apiKey) {
+          throw new Error(
+            `API key is required for ${provider} provider. ` +
+            `Provide it via config.apiKey or environment variable.`
+          );
+        }
+        this.provider = provider;
+        this.modelName = modelNameFromString;
+        this.dimensions = config.dimensions || this.getDefaultDimensions(provider);
+        // OpenRouter uses SDK, others use AI SDK
+        if (provider === 'openrouter') {
+          this.openRouterClient = new OpenRouter({ apiKey: this.apiKey });
+        } else {
+          this.embeddingModel = this.createModel(provider, this.apiKey, this.modelName);
+        }
+        console.log(`✅ EmbeddingService initialized with ${provider} provider (${this.modelName}) [backward compat mode]`);
+        return;
+      }
+      // New behavior: Direct EmbeddingModel from ai-sdk
+      this.embeddingModel = config.model;
+      this.modelName = 'custom';
+      this.dimensions = config.dimensions || 768; // Default 768 for speed (was 3072)
+      this.provider = 'custom';
+      console.log('✅ EmbeddingService initialized with custom ai-sdk model');
+      return;
+    }
+    // Case 2: Provider-based configuration
+    const provider = config.provider || 'google'; // Default to google for backward compat
+    this.apiKey = this.resolveApiKey(provider, config.apiKey);
+    if (!this.apiKey) {
+      throw new Error(
+        `API key is required for ${provider} provider. ` +
+        `Provide it via config.apiKey or environment variable.`
+      );
+    }
+    this.provider = provider;
+    this.modelName = config.modelName || this.getDefaultModelName(provider);
+    this.dimensions = config.dimensions || this.getDefaultDimensions(provider);
+    // OpenRouter uses SDK, others use AI SDK
+    if (provider === 'openrouter') {
+      this.openRouterClient = new OpenRouter({ apiKey: this.apiKey });
+    } else {
+      this.embeddingModel = this.createModel(provider, this.apiKey, this.modelName);
+    }
+    console.log(`✅ EmbeddingService initialized with ${provider} provider (${this.modelName})`);
+  }
+  /**
+   * Resolve API key from config or environment
+   */
+  private resolveApiKey(provider: string, configKey?: string): string {
+    if (configKey) return configKey;
+    switch (provider) {
+      case 'google':
+        return process.env.GEMINI_API_KEY || process.env.GOOGLE_AI_API_KEY || '';
+      case 'openai':
+        return process.env.OPENAI_API_KEY || '';
+      case 'openrouter':
+        return process.env.OPENROUTER_API_KEY || '';
+      case 'cohere':
+        return process.env.COHERE_API_KEY || '';
+      default:
+        return '';
+    }
+  }
+  /**
+   * Get default model name for provider
+   */
+  private getDefaultModelName(provider: string): string {
+    switch (provider) {
+      case 'google':
+        return 'text-embedding-004';
+      case 'openai':
+        return 'text-embedding-3-small';
+      case 'openrouter':
+        return 'google/gemini-embedding-001'; // Default OpenRouter embedding model
+      case 'cohere':
+        return 'embed-english-v3.0';
+      default:
+        return 'text-embedding-004';
+    }
+  }
+  /**
+   * Get default dimensions for provider
+   *
+   * Default is now 768 for faster performance:
+   * - 4x smaller vectors = faster indexing & search
+   * - ~4x less storage space
+   * - Minimal quality loss for most use cases
+   *
+   * Users can override via config.dimensions
+   */
+  private getDefaultDimensions(provider: string): number {
+    switch (provider) {
+      case 'google':
+        return 768; // text-embedding-004 supports output_dimensionality
+      case 'openai':
+        return 768; // text-embedding-3-small supports dimensions param
+      case 'openrouter':
+        return 768; // Most models support dimension truncation
+      case 'cohere':
+        return 768; // embed-english-v3.0 supports dimensions
+      default:
+        return 768; // Default to 768 for speed
+    }
+  }
+  /**
+   * Create embedding model from provider
+   */
+  private createModel(
+    provider: string,
+    apiKey: string,
+    modelName: string
+  ): EmbeddingModel<string> {
+    switch (provider) {
+      case 'google': {
+        if (!googleProvider) {
+          googleProvider = createGoogleGenerativeAI({ apiKey });
+        }
+        return googleProvider.textEmbeddingModel(modelName);
+      }
+      case 'openai': {
+        if (!openaiProvider) {
+          openaiProvider = createOpenAI({ apiKey });
+        }
+        // OpenAI returns EmbeddingModelV2 but is compatible with ai SDK
+        return openaiProvider.textEmbeddingModel(modelName) as unknown as EmbeddingModel<string>;
+      }
+      case 'openrouter': {
+        // OpenRouter uses OpenAI-compatible API with custom baseURL
+        if (!openrouterProvider) {
+          openrouterProvider = createOpenAI({
+            baseURL: 'https://openrouter.ai/api/v1',
+            apiKey,
+          });
+        }
+        // OpenRouter embedding models use the same interface as OpenAI
+        return openrouterProvider.textEmbeddingModel(modelName) as unknown as EmbeddingModel<string>;
+      }
+      case 'cohere': {
+        if (!cohereProvider) {
+          throw new Error(
+            'Cohere provider requires manual initialization. ' +
+            'Import createCohere from @ai-sdk/cohere and set cohereProvider before use.'
+          );
+        }
+        return cohereProvider.textEmbedding(modelName);
+      }
+      default:
+        throw new Error(`Unsupported provider: ${provider}`);
+    }
+  }
+  /**
+   * Generate embedding for a single text
+   */
+  async embedText(options: EmbeddingOptions): Promise<EmbeddingResult> {
+    const startTime = Date.now();
+    // Validate input
+    if (!options.text || typeof options.text !== 'string' || options.text.trim().length === 0) {
+      throw new Error('Invalid or empty text provided for embedding');
+    }
+    await this.checkRateLimit();
+    try {
+      // OpenRouter uses native fetch API for better compatibility
+      if (this.provider === 'openrouter') {
+        return await this.embedTextOpenRouter(options.text, startTime);
+      }
+      // Other providers use AI SDK
+      if (!this.embeddingModel) {
+        throw new Error('Embedding model not initialized');
+      }
+      const result = await embed({
+        model: this.embeddingModel,
+        value: options.text,
+        ...this.getProviderOptions(options),
+      });
+      this.requestCount++;
+      return {
+        vector: result.embedding,
+        dimension: result.embedding.length,
+        model: this.modelName,
+        processingTime: Date.now() - startTime,
+        tokenCount: result.usage?.tokens,
+      };
+    } catch (error) {
+      throw new Error(
+        `Embedding generation failed: ${error instanceof Error ? error.message : 'Unknown error'}`
+      );
+    }
+  }
+  /**
+   * Generate embedding using OpenRouter SDK
+   * Uses official @openrouter/sdk for embeddings
+   * Passes dimensions parameter to truncate output vectors
+   */
+  private async embedTextOpenRouter(text: string, startTime: number): Promise<EmbeddingResult> {
+    if (!this.openRouterClient) {
+      throw new Error('OpenRouter client not initialized');
+    }
+    // Build request with optional dimensions parameter
+    const request: any = {
+      model: this.modelName,
+      input: text
+    };
+    // Add dimensions if configured (enables output truncation)
+    if (this.dimensions && this.dimensions < 3072) {
+      request.dimensions = this.dimensions;
+    }
+    const result = await this.openRouterClient.embeddings.generate(request);
+    // Handle union type - result can be string or object
+    if (typeof result === 'string') {
+      throw new Error('Unexpected string response from OpenRouter embeddings API');
+    }
+    const data = (result as any).data;
+    if (!data || !data[0] || !data[0].embedding) {
+      throw new Error('Invalid response from OpenRouter embeddings API');
+    }
+    this.requestCount++;
+    // Handle embedding which can be string or number[]
+    const embedding = data[0].embedding;
+    const vector = typeof embedding === 'string'
+      ? JSON.parse(embedding) as number[]
+      : embedding as number[];
+    const usage = (result as any).usage;
+    return {
+      vector,
+      dimension: vector.length,
+      model: this.modelName,
+      processingTime: Date.now() - startTime,
+      tokenCount: usage?.totalTokens
+    };
+  }
+  /**
+   * Generate embeddings for multiple texts (batched)
+   */
+  async embedBatch(
+    texts: string[],
+    options: Omit<EmbeddingOptions, 'text'> = {}
+  ): Promise<BatchEmbeddingResult> {
+    const startTime = Date.now();
+    let successCount = 0;
+    let failedCount = 0;
+    try {
+      await this.checkRateLimit();
+      // OpenRouter uses native fetch API for better compatibility
+      if (this.provider === 'openrouter') {
+        return await this.embedBatchOpenRouter(texts, startTime);
+      }
+      // Other providers use AI SDK
+      if (!this.embeddingModel) {
+        throw new Error('Embedding model not initialized');
+      }
+      const result = await embedMany({
+        model: this.embeddingModel,
+        values: texts,
+        ...this.getProviderOptions(options as EmbeddingOptions),
+      });
+      successCount = result.embeddings.length;
+      const totalTime = Date.now() - startTime;
+      return {
+        vectors: result.embeddings,
+        dimension: result.embeddings[0]?.length || this.dimensions,
+        model: this.modelName,
+        totalProcessingTime: totalTime,
+        averageProcessingTime: totalTime / texts.length,
+        successCount,
+        failedCount,
+      };
+    } catch (error) {
+      throw new Error(
+        `Batch embedding failed: ${error instanceof Error ? error.message : 'Unknown error'}`
+      );
+    }
+  }
+  /**
+   * Generate batch embeddings using OpenRouter SDK
+   * Passes dimensions parameter to truncate output vectors
+   */
+  private async embedBatchOpenRouter(texts: string[], startTime: number): Promise<BatchEmbeddingResult> {
+    if (!this.openRouterClient) {
+      throw new Error('OpenRouter client not initialized');
+    }
+    // Build request with optional dimensions parameter
+    const request: any = {
+      model: this.modelName,
+      input: texts
+    };
+    // Add dimensions if configured (enables output truncation)
+    if (this.dimensions && this.dimensions < 3072) {
+      request.dimensions = this.dimensions;
+    }
+    const result = await this.openRouterClient.embeddings.generate(request);
+    // Handle union type - result can be string or object
+    if (typeof result === 'string') {
+      throw new Error('Unexpected string response from OpenRouter embeddings API');
+    }
+    const data = (result as any).data;
+    if (!data || !Array.isArray(data)) {
+      throw new Error('Invalid response from OpenRouter embeddings API');
+    }
+    // Sort by index to ensure correct order
+    const sortedData = [...data].sort((a: any, b: any) => (a.index || 0) - (b.index || 0));
+    const vectors = sortedData.map((item: any) => {
+      const embedding = item.embedding;
+      return typeof embedding === 'string'
+        ? JSON.parse(embedding) as number[]
+        : embedding as number[];
+    });
+    this.requestCount++;
+    const totalTime = Date.now() - startTime;
+    return {
+      vectors,
+      dimension: vectors[0]?.length || this.dimensions,
+      model: this.modelName,
+      totalProcessingTime: totalTime,
+      averageProcessingTime: totalTime / texts.length,
+      successCount: vectors.length,
+      failedCount: texts.length - vectors.length
+    };
+  }
+  /**
+   * Get provider-specific options
+   */
+  private getProviderOptions(options: EmbeddingOptions): any {
+    const providerOpts: any = {};
+    if (this.provider === 'google') {
+      providerOpts.providerOptions = {
+        google: {
+          outputDimensionality: this.dimensions,
+          taskType: this.getGoogleTaskType(options.type),
+        },
+      };
+    } else if (this.provider === 'openai') {
+      providerOpts.providerOptions = {
+        openai: {
+          dimensions: this.dimensions,
+        },
+      };
+    } else if (this.provider === 'openrouter') {
+      // OpenRouter uses OpenAI-compatible options
+      // Note: dimensions may not be supported for all models via OpenRouter
+      providerOpts.providerOptions = {
+        openai: {
+          dimensions: this.dimensions,
+        },
+      };
+    } else if (this.provider === 'cohere') {
+      providerOpts.providerOptions = {
+        cohere: {
+          inputType: this.getCohereInputType(options.type),
+        },
+      };
+    }
+    return providerOpts;
+  }
+  /**
+   * Map PDW type to Google task type
+   */
+  private getGoogleTaskType(type?: string): string {
+    switch (type) {
+      case 'query':
+        return 'RETRIEVAL_QUERY';
+      case 'content':
+        return 'RETRIEVAL_DOCUMENT';
+      case 'metadata':
+        return 'SEMANTIC_SIMILARITY';
+      default:
+        return 'RETRIEVAL_DOCUMENT';
+    }
+  }
+  /**
+   * Map PDW type to Cohere input type
+   */
+  private getCohereInputType(type?: string): string {
+    switch (type) {
+      case 'query':
+        return 'search_query';
+      case 'content':
+        return 'search_document';
+      default:
+        return 'search_document';
+    }
+  }
+  /**
+   * Calculate cosine similarity between two vectors
+   */
+  calculateCosineSimilarity(vectorA: number[], vectorB: number[]): number {
+    if (vectorA.length !== vectorB.length) {
+      throw new Error(`Vector dimension mismatch: ${vectorA.length} vs ${vectorB.length}`);
+    }
+    let dotProduct = 0;
+    let normA = 0;
+    let normB = 0;
+    for (let i = 0; i < vectorA.length; i++) {
+      dotProduct += vectorA[i] * vectorB[i];
+      normA += vectorA[i] * vectorA[i];
+      normB += vectorB[i] * vectorB[i];
+    }
+    const magnitude = Math.sqrt(normA) * Math.sqrt(normB);
+    if (magnitude === 0) {
+      return 0;
+    }
+    return dotProduct / magnitude;
+  }
+  /**
+   * Calculate Euclidean distance between two vectors
+   */
+  calculateEuclideanDistance(vectorA: number[], vectorB: number[]): number {
+    if (vectorA.length !== vectorB.length) {
+      throw new Error(`Vector dimension mismatch: ${vectorA.length} vs ${vectorB.length}`);
+    }
+    let sum = 0;
+    for (let i = 0; i < vectorA.length; i++) {
+      const diff = vectorA[i] - vectorB[i];
+      sum += diff * diff;
+    }
+    return Math.sqrt(sum);
+  }
+  /**
+   * Normalize a vector to unit length
+   */
+  normalizeVector(vector: number[]): number[] {
+    const magnitude = Math.sqrt(vector.reduce((sum, val) => sum + val * val, 0));
+    if (magnitude === 0) {
+      return vector;
+    }
+    return vector.map(val => val / magnitude);
+  }
+  /**
+   * Find the most similar vectors to a query vector
+   */
+  findMostSimilar(
+    queryVector: number[],
+    candidateVectors: number[][],
+    k: number = 5
+  ): Array<{ index: number; similarity: number; distance: number }> {
+    const similarities = candidateVectors.map((vector, index) => {
+      const similarity = this.calculateCosineSimilarity(queryVector, vector);
+      const distance = this.calculateEuclideanDistance(queryVector, vector);
+      return { index, similarity, distance };
+    });
+    similarities.sort((a, b) => b.similarity - a.similarity);
+    return similarities.slice(0, k);
+  }
+  /**
+   * Get embedding statistics
+   */
+  getStats(): {
+    totalRequests: number;
+    requestsThisMinute: number;
+    model: string;
+    dimensions: number;
+    rateLimit: number;
+    provider: string;
+  } {
+    const now = Date.now();
+    const requestsThisMinute = (now - this.lastReset) < 60000 ? this.requestCount : 0;
+    return {
+      totalRequests: this.requestCount,
+      requestsThisMinute,
+      model: this.modelName,
+      dimensions: this.dimensions,
+      rateLimit: this.maxRequestsPerMinute,
+      provider: this.provider,
+    };
+  }
+  /**
+   * Reset rate limiting counters
+   */
+  private resetRateLimit(): void {
+    const now = Date.now();
+    if (now - this.lastReset >= 60000) {
+      this.requestCount = 0;
+      this.lastReset = now;
+    }
+  }
+  /**
+   * Check rate limiting and wait if necessary
+   */
+  private async checkRateLimit(): Promise<void> {
+    this.resetRateLimit();
+    if (this.requestCount >= this.maxRequestsPerMinute) {
+      const waitTime = 60000 - (Date.now() - this.lastReset);
+      if (waitTime > 0) {
+        if (process.env.NODE_ENV === 'development') {
+          console.warn(`Rate limit reached, waiting ${waitTime}ms`);
+        }
+        await this.delay(waitTime);
+        this.resetRateLimit();
+      }
+    }
+  }
+  /**
+   * Utility delay function
+   */
+  private delay(ms: number): Promise<void> {
+    return new Promise(resolve => setTimeout(resolve, ms));
+  }
+}
+export default EmbeddingService;
+// ==================== Singleton Pattern ====================
+/**
+ * Generate config key for singleton cache
+ */
+function getConfigKey(config: EmbeddingConfig): string {
+  const provider = config.provider || 'google';
+  const modelName = typeof config.model === 'string'
+    ? config.model
+    : (config.modelName || 'default');
+  const dimensions = config.dimensions || 'default';
+  return `${provider}:${modelName}:${dimensions}`;
+}
+/** Singleton cache */
+const sharedInstances = new Map<string, EmbeddingService>();
+/**
+ * Get or create a shared EmbeddingService instance (Singleton)
+ *
+ * All clients with same provider/model/dimensions share one instance.
+ * Reduces memory usage and connection overhead.
+ *
+ * @example
+ * ```typescript
+ * // Instead of: new EmbeddingService({ apiKey, modelName })
+ * const embedding = getSharedEmbeddingService({ apiKey, modelName });
+ * ```
+ */
+export function getSharedEmbeddingService(config: EmbeddingConfig): EmbeddingService {
+  const key = getConfigKey(config);
+  let instance = sharedInstances.get(key);
+  if (!instance) {
+    console.log(`🔧 [Singleton] Creating shared EmbeddingService: ${key}`);
+    instance = new EmbeddingService(config);
+    sharedInstances.set(key, instance);
+  }
+  return instance;
+}
+/**
+ * Clear all shared instances (for testing)
+ */
+export function clearSharedEmbeddingServices(): void {
+  sharedInstances.clear();
+}
+/**
+ * Get singleton stats
+ */
+export function getSharedEmbeddingStats(): {
+  instanceCount: number;
+  instances: Array<{ key: string; stats: ReturnType<EmbeddingService['getStats']> }>;
+} {
+  return {
+    instanceCount: sharedInstances.size,
+    instances: Array.from(sharedInstances.entries()).map(([key, svc]) => ({
+      key,
+      stats: svc.getStats(),
+    })),
+  };
+}