npm - @mhalder/qdrant-mcp-server - Versions diffs - 1.1.0 - Mend

@mhalder/qdrant-mcp-server 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (100) hide show

package/.env.example +92 -0
package/.github/workflows/ci.yml +61 -0
package/.github/workflows/claude-code-review.yml +57 -0
package/.github/workflows/claude.yml +50 -0
package/.github/workflows/release.yml +52 -0
package/.husky/commit-msg +1 -0
package/.husky/pre-commit +1 -0
package/.releaserc.json +59 -0
package/.yamlfmt +4 -0
package/CHANGELOG.md +73 -0
package/CONTRIBUTING.md +176 -0
package/LICENSE +21 -0
package/README.md +714 -0
package/build/embeddings/base.d.ts +23 -0
package/build/embeddings/base.d.ts.map +1 -0
package/build/embeddings/base.js +2 -0
package/build/embeddings/base.js.map +1 -0
package/build/embeddings/cohere.d.ts +17 -0
package/build/embeddings/cohere.d.ts.map +1 -0
package/build/embeddings/cohere.js +102 -0
package/build/embeddings/cohere.js.map +1 -0
package/build/embeddings/cohere.test.d.ts +2 -0
package/build/embeddings/cohere.test.d.ts.map +1 -0
package/build/embeddings/cohere.test.js +279 -0
package/build/embeddings/cohere.test.js.map +1 -0
package/build/embeddings/factory.d.ts +10 -0
package/build/embeddings/factory.d.ts.map +1 -0
package/build/embeddings/factory.js +98 -0
package/build/embeddings/factory.js.map +1 -0
package/build/embeddings/factory.test.d.ts +2 -0
package/build/embeddings/factory.test.d.ts.map +1 -0
package/build/embeddings/factory.test.js +329 -0
package/build/embeddings/factory.test.js.map +1 -0
package/build/embeddings/ollama.d.ts +18 -0
package/build/embeddings/ollama.d.ts.map +1 -0
package/build/embeddings/ollama.js +135 -0
package/build/embeddings/ollama.js.map +1 -0
package/build/embeddings/ollama.test.d.ts +2 -0
package/build/embeddings/ollama.test.d.ts.map +1 -0
package/build/embeddings/ollama.test.js +399 -0
package/build/embeddings/ollama.test.js.map +1 -0
package/build/embeddings/openai.d.ts +16 -0
package/build/embeddings/openai.d.ts.map +1 -0
package/build/embeddings/openai.js +108 -0
package/build/embeddings/openai.js.map +1 -0
package/build/embeddings/openai.test.d.ts +2 -0
package/build/embeddings/openai.test.d.ts.map +1 -0
package/build/embeddings/openai.test.js +283 -0
package/build/embeddings/openai.test.js.map +1 -0
package/build/embeddings/voyage.d.ts +19 -0
package/build/embeddings/voyage.d.ts.map +1 -0
package/build/embeddings/voyage.js +113 -0
package/build/embeddings/voyage.js.map +1 -0
package/build/embeddings/voyage.test.d.ts +2 -0
package/build/embeddings/voyage.test.d.ts.map +1 -0
package/build/embeddings/voyage.test.js +371 -0
package/build/embeddings/voyage.test.js.map +1 -0
package/build/index.d.ts +3 -0
package/build/index.d.ts.map +1 -0
package/build/index.js +534 -0
package/build/index.js.map +1 -0
package/build/index.test.d.ts +2 -0
package/build/index.test.d.ts.map +1 -0
package/build/index.test.js +241 -0
package/build/index.test.js.map +1 -0
package/build/qdrant/client.d.ts +37 -0
package/build/qdrant/client.d.ts.map +1 -0
package/build/qdrant/client.js +142 -0
package/build/qdrant/client.js.map +1 -0
package/build/qdrant/client.test.d.ts +2 -0
package/build/qdrant/client.test.d.ts.map +1 -0
package/build/qdrant/client.test.js +340 -0
package/build/qdrant/client.test.js.map +1 -0
package/commitlint.config.js +25 -0
package/docker-compose.yml +22 -0
package/docs/test_report.md +259 -0
package/examples/README.md +315 -0
package/examples/basic/README.md +111 -0
package/examples/filters/README.md +262 -0
package/examples/knowledge-base/README.md +207 -0
package/examples/rate-limiting/README.md +376 -0
package/package.json +59 -0
package/scripts/verify-providers.js +238 -0
package/src/embeddings/base.ts +25 -0
package/src/embeddings/cohere.test.ts +408 -0
package/src/embeddings/cohere.ts +152 -0
package/src/embeddings/factory.test.ts +453 -0
package/src/embeddings/factory.ts +163 -0
package/src/embeddings/ollama.test.ts +543 -0
package/src/embeddings/ollama.ts +196 -0
package/src/embeddings/openai.test.ts +402 -0
package/src/embeddings/openai.ts +158 -0
package/src/embeddings/voyage.test.ts +520 -0
package/src/embeddings/voyage.ts +168 -0
package/src/index.test.ts +304 -0
package/src/index.ts +614 -0
package/src/qdrant/client.test.ts +456 -0
package/src/qdrant/client.ts +195 -0
package/tsconfig.json +19 -0
package/vitest.config.ts +37 -0

package/src/embeddings/factory.ts ADDED Viewed

@@ -0,0 +1,163 @@
+import { EmbeddingProvider, ProviderConfig } from "./base.js";
+import { OpenAIEmbeddings } from "./openai.js";
+import { CohereEmbeddings } from "./cohere.js";
+import { VoyageEmbeddings } from "./voyage.js";
+import { OllamaEmbeddings } from "./ollama.js";
+export type EmbeddingProviderType = "openai" | "cohere" | "voyage" | "ollama";
+export interface FactoryConfig extends ProviderConfig {
+  provider: EmbeddingProviderType;
+}
+export class EmbeddingProviderFactory {
+  static create(config: FactoryConfig): EmbeddingProvider {
+    const { provider, model, dimensions, rateLimitConfig, apiKey, baseUrl } =
+      config;
+    switch (provider) {
+      case "openai":
+        if (!apiKey) {
+          throw new Error("API key is required for OpenAI provider");
+        }
+        return new OpenAIEmbeddings(
+          apiKey,
+          model || "text-embedding-3-small",
+          dimensions,
+          rateLimitConfig,
+        );
+      case "cohere":
+        if (!apiKey) {
+          throw new Error("API key is required for Cohere provider");
+        }
+        return new CohereEmbeddings(
+          apiKey,
+          model || "embed-english-v3.0",
+          dimensions,
+          rateLimitConfig,
+        );
+      case "voyage":
+        if (!apiKey) {
+          throw new Error("API key is required for Voyage AI provider");
+        }
+        return new VoyageEmbeddings(
+          apiKey,
+          model || "voyage-2",
+          dimensions,
+          rateLimitConfig,
+          baseUrl || "https://api.voyageai.com/v1",
+        );
+      case "ollama":
+        return new OllamaEmbeddings(
+          model || "nomic-embed-text",
+          dimensions,
+          rateLimitConfig,
+          baseUrl || "http://localhost:11434",
+        );
+      default:
+        throw new Error(
+          `Unknown embedding provider: ${provider}. Supported providers: openai, cohere, voyage, ollama`,
+        );
+    }
+  }
+  static createFromEnv(): EmbeddingProvider {
+    const provider = (
+      process.env.EMBEDDING_PROVIDER || "ollama"
+    ).toLowerCase() as EmbeddingProviderType;
+    // Select API key based on provider
+    let apiKey: string | undefined;
+    switch (provider) {
+      case "openai":
+        apiKey = process.env.OPENAI_API_KEY;
+        break;
+      case "cohere":
+        apiKey = process.env.COHERE_API_KEY;
+        break;
+      case "voyage":
+        apiKey = process.env.VOYAGE_API_KEY;
+        break;
+      case "ollama":
+        // No API key needed for local Ollama
+        break;
+    }
+    // Common configuration
+    const model = process.env.EMBEDDING_MODEL;
+    const dimensions = process.env.EMBEDDING_DIMENSIONS
+      ? parseInt(process.env.EMBEDDING_DIMENSIONS, 10)
+      : undefined;
+    // Validate dimensions
+    if (dimensions !== undefined && (isNaN(dimensions) || dimensions <= 0)) {
+      throw new Error(
+        `Invalid EMBEDDING_DIMENSIONS: must be a positive integer, got "${process.env.EMBEDDING_DIMENSIONS}"`,
+      );
+    }
+    const baseUrl = process.env.EMBEDDING_BASE_URL;
+    // Rate limiting configuration
+    const maxRequestsPerMinute = process.env.EMBEDDING_MAX_REQUESTS_PER_MINUTE
+      ? parseInt(process.env.EMBEDDING_MAX_REQUESTS_PER_MINUTE, 10)
+      : undefined;
+    // Validate maxRequestsPerMinute
+    if (
+      maxRequestsPerMinute !== undefined &&
+      (isNaN(maxRequestsPerMinute) || maxRequestsPerMinute <= 0)
+    ) {
+      throw new Error(
+        `Invalid EMBEDDING_MAX_REQUESTS_PER_MINUTE: must be a positive integer, got "${process.env.EMBEDDING_MAX_REQUESTS_PER_MINUTE}"`,
+      );
+    }
+    const retryAttempts = process.env.EMBEDDING_RETRY_ATTEMPTS
+      ? parseInt(process.env.EMBEDDING_RETRY_ATTEMPTS, 10)
+      : undefined;
+    // Validate retryAttempts
+    if (
+      retryAttempts !== undefined &&
+      (isNaN(retryAttempts) || retryAttempts < 0)
+    ) {
+      throw new Error(
+        `Invalid EMBEDDING_RETRY_ATTEMPTS: must be a non-negative integer, got "${process.env.EMBEDDING_RETRY_ATTEMPTS}"`,
+      );
+    }
+    const retryDelayMs = process.env.EMBEDDING_RETRY_DELAY
+      ? parseInt(process.env.EMBEDDING_RETRY_DELAY, 10)
+      : undefined;
+    // Validate retryDelayMs
+    if (
+      retryDelayMs !== undefined &&
+      (isNaN(retryDelayMs) || retryDelayMs < 0)
+    ) {
+      throw new Error(
+        `Invalid EMBEDDING_RETRY_DELAY: must be a non-negative integer, got "${process.env.EMBEDDING_RETRY_DELAY}"`,
+      );
+    }
+    const rateLimitConfig = {
+      maxRequestsPerMinute,
+      retryAttempts,
+      retryDelayMs,
+    };
+    return this.create({
+      provider,
+      model,
+      dimensions,
+      rateLimitConfig,
+      apiKey,
+      baseUrl,
+    });
+  }
+}

package/src/embeddings/ollama.test.ts ADDED Viewed

@@ -0,0 +1,543 @@
+import { describe, it, expect, vi, beforeEach } from "vitest";
+import { OllamaEmbeddings } from "./ollama.js";
+// Mock fetch globally
+global.fetch = vi.fn();
+describe("OllamaEmbeddings", () => {
+  let embeddings: OllamaEmbeddings;
+  let mockFetch: any;
+  beforeEach(() => {
+    mockFetch = global.fetch as any;
+    mockFetch.mockReset();
+    embeddings = new OllamaEmbeddings();
+  });
+  describe("constructor", () => {
+    it("should use default model and dimensions", () => {
+      expect(embeddings.getModel()).toBe("nomic-embed-text");
+      expect(embeddings.getDimensions()).toBe(768);
+    });
+    it("should use custom model", () => {
+      const customEmbeddings = new OllamaEmbeddings("mxbai-embed-large");
+      expect(customEmbeddings.getModel()).toBe("mxbai-embed-large");
+      expect(customEmbeddings.getDimensions()).toBe(1024);
+    });
+    it("should use custom dimensions", () => {
+      const customEmbeddings = new OllamaEmbeddings("nomic-embed-text", 512);
+      expect(customEmbeddings.getDimensions()).toBe(512);
+    });
+    it("should use default base URL", () => {
+      const defaultEmbeddings = new OllamaEmbeddings();
+      expect(defaultEmbeddings).toBeDefined();
+    });
+    it("should use custom base URL", () => {
+      const customEmbeddings = new OllamaEmbeddings(
+        "nomic-embed-text",
+        undefined,
+        undefined,
+        "http://custom:11434",
+      );
+      expect(customEmbeddings).toBeDefined();
+    });
+    it("should default to 768 for unknown models", () => {
+      const unknownEmbeddings = new OllamaEmbeddings("custom-model");
+      expect(unknownEmbeddings.getDimensions()).toBe(768);
+    });
+    it("should use all-minilm model with 384 dimensions", () => {
+      const miniEmbeddings = new OllamaEmbeddings("all-minilm");
+      expect(miniEmbeddings.getModel()).toBe("all-minilm");
+      expect(miniEmbeddings.getDimensions()).toBe(384);
+    });
+  });
+  describe("embed", () => {
+    it("should generate embedding for single text", async () => {
+      const mockEmbedding = Array(768)
+        .fill(0)
+        .map((_, i) => i * 0.001);
+      mockFetch.mockResolvedValue({
+        ok: true,
+        json: async () => ({
+          embedding: mockEmbedding,
+        }),
+      });
+      const result = await embeddings.embed("test text");
+      expect(result).toEqual({
+        embedding: mockEmbedding,
+        dimensions: 768,
+      });
+      expect(mockFetch).toHaveBeenCalledWith(
+        "http://localhost:11434/api/embeddings",
+        {
+          method: "POST",
+          headers: {
+            "Content-Type": "application/json",
+          },
+          body: JSON.stringify({
+            model: "nomic-embed-text",
+            prompt: "test text",
+          }),
+        },
+      );
+    });
+    it("should handle long text", async () => {
+      const longText = "word ".repeat(1000);
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch.mockResolvedValue({
+        ok: true,
+        json: async () => ({
+          embedding: mockEmbedding,
+        }),
+      });
+      const result = await embeddings.embed(longText);
+      expect(result.embedding).toEqual(mockEmbedding);
+    });
+    it("should use custom base URL", async () => {
+      const customEmbeddings = new OllamaEmbeddings(
+        "nomic-embed-text",
+        undefined,
+        undefined,
+        "http://custom:11434",
+      );
+      const mockEmbedding = Array(768).fill(0.1);
+      mockFetch.mockResolvedValue({
+        ok: true,
+        json: async () => ({
+          embedding: mockEmbedding,
+        }),
+      });
+      await customEmbeddings.embed("test");
+      expect(mockFetch).toHaveBeenCalledWith(
+        "http://custom:11434/api/embeddings",
+        expect.any(Object),
+      );
+    });
+    it("should throw error if no embedding returned", async () => {
+      mockFetch.mockResolvedValue({
+        ok: true,
+        json: async () => ({}),
+      });
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "No embedding returned from Ollama API",
+      );
+    });
+    it("should handle API errors", async () => {
+      mockFetch.mockResolvedValue({
+        ok: false,
+        status: 404,
+        text: async () => "Model not found",
+      });
+      await expect(embeddings.embed("test")).rejects.toThrow();
+    });
+    it("should propagate network errors", async () => {
+      mockFetch.mockRejectedValue(new Error("Network Error"));
+      await expect(embeddings.embed("test")).rejects.toThrow("Network Error");
+    });
+    it("should include text preview in API error for long text", async () => {
+      const longText = "a".repeat(150);
+      mockFetch.mockResolvedValue({
+        ok: false,
+        status: 500,
+        text: async () => "Server error",
+      });
+      await expect(embeddings.embed(longText)).rejects.toThrow(
+        expect.objectContaining({
+          message: expect.stringContaining("Text preview:"),
+        }),
+      );
+    });
+    it("should include model and URL in network error messages for non-Error objects", async () => {
+      mockFetch.mockRejectedValue("Connection refused");
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Failed to call Ollama API at http://localhost:11434 with model nomic-embed-text",
+      );
+    });
+    it("should handle errors with message property", async () => {
+      mockFetch.mockRejectedValue({
+        message: "Custom error message",
+      });
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Custom error message",
+      );
+    });
+    it("should handle non-Error objects in catch block", async () => {
+      mockFetch.mockRejectedValue({ code: "ERR_UNKNOWN", details: "info" });
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Failed to call Ollama API at http://localhost:11434 with model nomic-embed-text",
+      );
+    });
+  });
+  describe("embedBatch", () => {
+    it("should generate embeddings for multiple texts in parallel", async () => {
+      const mockEmbeddings = [
+        Array(768).fill(0.1),
+        Array(768).fill(0.2),
+        Array(768).fill(0.3),
+      ];
+      // Mock sequential calls for each text
+      mockEmbeddings.forEach((embedding) => {
+        mockFetch.mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding }),
+        });
+      });
+      const texts = ["text1", "text2", "text3"];
+      const results = await embeddings.embedBatch(texts);
+      expect(results).toEqual([
+        { embedding: mockEmbeddings[0], dimensions: 768 },
+        { embedding: mockEmbeddings[1], dimensions: 768 },
+        { embedding: mockEmbeddings[2], dimensions: 768 },
+      ]);
+      // Ollama processes each text individually
+      expect(mockFetch).toHaveBeenCalledTimes(3);
+    });
+    it("should handle empty batch", async () => {
+      const results = await embeddings.embedBatch([]);
+      expect(results).toEqual([]);
+      expect(mockFetch).not.toHaveBeenCalled();
+    });
+    it("should handle single item in batch", async () => {
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch.mockResolvedValue({
+        ok: true,
+        json: async () => ({ embedding: mockEmbedding }),
+      });
+      const results = await embeddings.embedBatch(["single text"]);
+      expect(results).toHaveLength(1);
+      expect(results[0].embedding).toEqual(mockEmbedding);
+    });
+    it("should handle large batches with parallel processing", async () => {
+      const batchSize = 20;
+      const mockEmbedding = Array(768).fill(0.5);
+      // Mock all responses
+      for (let i = 0; i < batchSize; i++) {
+        mockFetch.mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        });
+      }
+      const texts = Array(batchSize)
+        .fill(null)
+        .map((_, i) => `text ${i}`);
+      const results = await embeddings.embedBatch(texts);
+      expect(results).toHaveLength(batchSize);
+      expect(mockFetch).toHaveBeenCalledTimes(batchSize);
+    });
+    it("should propagate errors in batch", async () => {
+      mockFetch
+        .mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding: Array(768).fill(0.1) }),
+        })
+        .mockRejectedValueOnce(new Error("Batch API Error"));
+      await expect(embeddings.embedBatch(["text1", "text2"])).rejects.toThrow(
+        "Batch API Error",
+      );
+    });
+    it("should handle partial failures in batch", async () => {
+      mockFetch
+        .mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding: Array(768).fill(0.1) }),
+        })
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 500,
+          text: async () => "Internal error",
+        });
+      await expect(embeddings.embedBatch(["text1", "text2"])).rejects.toThrow();
+    });
+  });
+  describe("getDimensions", () => {
+    it("should return configured dimensions", () => {
+      expect(embeddings.getDimensions()).toBe(768);
+    });
+    it("should return custom dimensions", () => {
+      const customEmbeddings = new OllamaEmbeddings("nomic-embed-text", 512);
+      expect(customEmbeddings.getDimensions()).toBe(512);
+    });
+  });
+  describe("getModel", () => {
+    it("should return configured model", () => {
+      expect(embeddings.getModel()).toBe("nomic-embed-text");
+    });
+    it("should return custom model", () => {
+      const customEmbeddings = new OllamaEmbeddings("mxbai-embed-large");
+      expect(customEmbeddings.getModel()).toBe("mxbai-embed-large");
+    });
+  });
+  describe("rate limiting", () => {
+    it("should retry on rate limit error (429 status)", async () => {
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 429,
+          text: async () => "Rate limit exceeded",
+        })
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 429,
+          text: async () => "Rate limit exceeded",
+        })
+        .mockResolvedValue({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        });
+      const result = await embeddings.embed("test text");
+      expect(result.embedding).toEqual(mockEmbedding);
+      expect(mockFetch).toHaveBeenCalledTimes(3);
+    });
+    it("should retry on rate limit message", async () => {
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch
+        .mockRejectedValueOnce({
+          message: "You have exceeded the rate limit",
+        })
+        .mockResolvedValue({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        });
+      const result = await embeddings.embed("test text");
+      expect(result.embedding).toEqual(mockEmbedding);
+      expect(mockFetch).toHaveBeenCalledTimes(2);
+    });
+    it("should use exponential backoff with faster default delay", async () => {
+      const rateLimitEmbeddings = new OllamaEmbeddings(
+        "nomic-embed-text",
+        undefined,
+        {
+          retryAttempts: 3,
+          retryDelayMs: 100,
+        },
+      );
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 429,
+          text: async () => "Rate limit",
+        })
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 429,
+          text: async () => "Rate limit",
+        })
+        .mockResolvedValue({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        });
+      const startTime = Date.now();
+      await rateLimitEmbeddings.embed("test text");
+      const duration = Date.now() - startTime;
+      // Should wait: 100ms (first retry) + 200ms (second retry) = 300ms
+      expect(duration).toBeGreaterThanOrEqual(250);
+    });
+    it("should throw error after max retries exceeded", async () => {
+      const rateLimitEmbeddings = new OllamaEmbeddings(
+        "nomic-embed-text",
+        undefined,
+        {
+          retryAttempts: 2,
+          retryDelayMs: 100,
+        },
+      );
+      mockFetch.mockResolvedValue({
+        ok: false,
+        status: 429,
+        text: async () => "Rate limit exceeded",
+      });
+      await expect(rateLimitEmbeddings.embed("test text")).rejects.toThrow(
+        "Ollama API rate limit exceeded after 2 retry attempts",
+      );
+      expect(mockFetch).toHaveBeenCalledTimes(3);
+    });
+    it("should handle rate limit errors in batch operations", async () => {
+      const mockEmbedding = Array(768).fill(0.5);
+      mockFetch
+        .mockResolvedValueOnce({
+          ok: false,
+          status: 429,
+          text: async () => "Rate limit",
+        })
+        .mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        })
+        .mockResolvedValueOnce({
+          ok: true,
+          json: async () => ({ embedding: mockEmbedding }),
+        });
+      const results = await embeddings.embedBatch(["text1", "text2"]);
+      expect(results).toHaveLength(2);
+      // First call fails and retries, then succeeds. Second call succeeds immediately.
+      expect(mockFetch).toHaveBeenCalledTimes(3);
+    });
+    it("should not retry on non-rate-limit errors", async () => {
+      mockFetch.mockResolvedValue({
+        ok: false,
+        status: 404,
+        text: async () => "Model not found",
+      });
+      await expect(embeddings.embed("test text")).rejects.toThrow();
+      expect(mockFetch).toHaveBeenCalledTimes(1);
+    });
+    it("should accept custom rate limit configuration", () => {
+      const customEmbeddings = new OllamaEmbeddings(
+        "nomic-embed-text",
+        undefined,
+        {
+          maxRequestsPerMinute: 2000,
+          retryAttempts: 5,
+          retryDelayMs: 1000,
+        },
+      );
+      expect(customEmbeddings).toBeDefined();
+    });
+    it("should have higher default rate limit for local deployment", () => {
+      // Ollama defaults to 1000 requests/minute (more lenient than cloud providers)
+      const defaultEmbeddings = new OllamaEmbeddings();
+      expect(defaultEmbeddings).toBeDefined();
+    });
+    it("should handle primitive error values in retry logic", async () => {
+      // This tests line 69: when error is not an OllamaError, convert to { status: 0, message: String(error) }
+      mockFetch.mockRejectedValue(null);
+      await expect(embeddings.embed("test")).rejects.toThrow();
+      expect(mockFetch).toHaveBeenCalledTimes(1);
+    });
+    it("should handle string primitive errors", async () => {
+      mockFetch.mockRejectedValue("Network unreachable");
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Network unreachable",
+      );
+    });
+    it("should handle error objects with non-string message property", async () => {
+      mockFetch.mockRejectedValue({
+        message: 404, // Non-string message
+        code: "NOT_FOUND",
+      });
+      // Should not treat this as a rate limit error even though it has a message property
+      await expect(embeddings.embed("test")).rejects.toThrow();
+      expect(mockFetch).toHaveBeenCalledTimes(1); // No retries
+    });
+    it("should handle Error instance in retry logic", async () => {
+      const testError = new Error("Connection timeout");
+      mockFetch.mockRejectedValue(testError);
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Connection timeout",
+      );
+    });
+    it("should handle Error instance from network error with enhanced message", async () => {
+      // This tests error instanceof Error path for network errors
+      const networkError = new Error("ECONNREFUSED");
+      mockFetch.mockRejectedValue(networkError);
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Failed to call Ollama API at http://localhost:11434 with model nomic-embed-text: ECONNREFUSED. Text preview:",
+      );
+    });
+    it("should handle object with string message property", async () => {
+      // This tests lines 143-144: object with message property that is a string
+      const customError = {
+        code: "API_ERROR",
+        message: "Custom API failure",
+        details: "Something went wrong",
+      };
+      mockFetch.mockRejectedValue(customError);
+      await expect(embeddings.embed("test")).rejects.toThrow(
+        "Custom API failure",
+      );
+    });
+  });
+});