npm - vecbox - Versions diffs - 0.1.0 → 0.2.1 - Mend

vecbox 0.1.0 → 0.2.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

package/README.md +100 -46
package/dist/index.cjs +164 -204
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +26 -36
package/dist/index.d.ts +26 -36
package/dist/index.js +171 -205
package/dist/index.js.map +1 -1
package/dist/llama_embedding-EC3MWSUZ.node +0 -0
package/native/README.md +67 -0
package/native/binding.gyp +65 -0
package/native/index.js +39 -0
package/native/llama_embedding.cpp +179 -0
package/native/llama_embedding_simple.cpp +111 -0
package/native/package-lock.json +1277 -0
package/native/package.json +26 -0
package/package.json +7 -6
package/src/factory/EmbeddingFactory.ts +0 -4
package/src/images/vecbox.png +0 -0
package/src/providers/gemini.ts +2 -2
package/src/providers/llamacpp.ts +84 -6
package/src/types/index.ts +0 -2
package/src/images/embed-kit.png +0 -0
package/src/providers/claude.ts +0 -78
package/src/providers/deepseek.ts +0 -115
package/src/types/deepseek.d.ts +0 -15
package/src/types/index.d.ts +0 -43
package/src/types/transformers.d.ts +0 -7

package/dist/index.js CHANGED Viewed

@@ -1,6 +1,75 @@
-var __defProp = Object.defineProperty;
-var __defNormalProp = (obj, key, value) => key in obj ? __defProp(obj, key, { enumerable: true, configurable: true, writable: true, value }) : obj[key] = value;
-var __publicField = (obj, key, value) => __defNormalProp(obj, typeof key !== "symbol" ? key + "" : key, value);
+var __getOwnPropNames = Object.getOwnPropertyNames;
+var __require = /* @__PURE__ */ ((x) => typeof require !== "undefined" ? require : typeof Proxy !== "undefined" ? new Proxy(x, {
+  get: (a, b) => (typeof require !== "undefined" ? require : a)[b]
+}) : x)(function(x) {
+  if (typeof require !== "undefined") return require.apply(this, arguments);
+  throw Error('Dynamic require of "' + x + '" is not supported');
+});
+var __esm = (fn, res) => function __init() {
+  return fn && (res = (0, fn[__getOwnPropNames(fn)[0]])(fn = 0)), res;
+};
+var __commonJS = (cb, mod) => function __require2() {
+  return mod || (0, cb[__getOwnPropNames(cb)[0]])((mod = { exports: {} }).exports, mod), mod.exports;
+};
+// native/build/Release/llama_embedding.node
+var llama_embedding_default;
+var init_llama_embedding = __esm({
+  "native/build/Release/llama_embedding.node"() {
+    llama_embedding_default = "./llama_embedding-EC3MWSUZ.node";
+  }
+});
+// node-file:/home/inky/Development/vecbox/native/build/Release/llama_embedding.node
+var require_llama_embedding = __commonJS({
+  "node-file:/home/inky/Development/vecbox/native/build/Release/llama_embedding.node"(exports, module) {
+    "use strict";
+    init_llama_embedding();
+    try {
+      module.exports = __require(llama_embedding_default);
+    } catch {
+    }
+  }
+});
+// native/index.js
+var require_native = __commonJS({
+  "native/index.js"(exports, module) {
+    "use strict";
+    var binding = require_llama_embedding();
+    var LlamaEmbedding = class {
+      constructor(modelPath) {
+        this.modelPtr = binding.createModel(modelPath);
+        if (!this.modelPtr) {
+          throw new Error("Failed to load model");
+        }
+      }
+      embed(text) {
+        if (typeof text !== "string") {
+          throw new Error("Text must be a string");
+        }
+        const embedding = binding.getEmbedding(this.modelPtr, text);
+        if (!embedding) {
+          throw new Error("Failed to generate embedding");
+        }
+        return embedding;
+      }
+      close() {
+        if (this.modelPtr) {
+          binding.destroyModel(this.modelPtr);
+          this.modelPtr = null;
+        }
+      }
+    };
+    function create(modelPath) {
+      return new LlamaEmbedding(modelPath);
+    }
+    module.exports = {
+      create,
+      LlamaEmbedding
+    };
+  }
+});
 // main.ts
 import * as dotenv from "dotenv";
@@ -11,7 +80,6 @@ import OpenAI from "openai";
 // src/providers/base/EmbeddingProvider.ts
 var EmbeddingProvider = class {
   constructor(config2) {
-    __publicField(this, "config");
     this.config = config2;
   }
   getModel() {
@@ -32,8 +100,6 @@ var EmbeddingProvider = class {
 // src/util/logger.ts
 var _Logger = class _Logger {
   constructor(moduleName = "embedbox", level = 1 /* INFO */) {
-    __publicField(this, "currentLevel");
-    __publicField(this, "moduleName");
     this.moduleName = moduleName;
     this.currentLevel = level;
   }
@@ -78,29 +144,28 @@ var _Logger = class _Logger {
   }
   // Static methods for quick access
   static debug(message, moduleName) {
-    const logger9 = new _Logger(moduleName || "embedbox");
-    logger9.debug(message);
+    const logger7 = new _Logger(moduleName || "embedbox");
+    logger7.debug(message);
   }
   static info(message, moduleName) {
-    const logger9 = new _Logger(moduleName || "embedbox");
-    logger9.info(message);
+    const logger7 = new _Logger(moduleName || "embedbox");
+    logger7.info(message);
   }
   static warn(message, moduleName) {
-    const logger9 = new _Logger(moduleName || "embedbox");
-    logger9.warn(message);
+    const logger7 = new _Logger(moduleName || "embedbox");
+    logger7.warn(message);
   }
   static error(message, moduleName) {
-    const logger9 = new _Logger(moduleName || "embedbox");
-    logger9.error(message);
+    const logger7 = new _Logger(moduleName || "embedbox");
+    logger7.error(message);
   }
   // Method to create a logger instance for a specific module
   static createModuleLogger(moduleName, level) {
     return new _Logger(`embedbox:${moduleName}`, level);
   }
 };
-__publicField(_Logger, "instance");
 // ANSI color codes - simplified for better readability
-__publicField(_Logger, "COLORS", {
+_Logger.COLORS = {
   RESET: "\x1B[0m",
   DEBUG: "\x1B[36m",
   // Cyan
@@ -110,13 +175,13 @@ __publicField(_Logger, "COLORS", {
   // Yellow
   ERROR: "\x1B[31m"
   // Red
-});
-__publicField(_Logger, "LEVEL_NAMES", {
+};
+_Logger.LEVEL_NAMES = {
   [0 /* DEBUG */]: "DEBUG",
   [1 /* INFO */]: "INFO",
   [2 /* WARN */]: "WARN",
   [3 /* ERROR */]: "ERROR"
-});
+};
 var Logger = _Logger;
 var logger = Logger.getInstance();
@@ -125,7 +190,6 @@ var logger2 = Logger.createModuleLogger("openai");
 var OpenAIProvider = class extends EmbeddingProvider {
   constructor(config2) {
     super(config2);
-    __publicField(this, "client");
     if (!config2.apiKey) {
       throw new Error("OpenAI API key is required");
     }
@@ -214,7 +278,6 @@ var logger3 = Logger.createModuleLogger("gemini");
 var GeminiProvider = class extends EmbeddingProvider {
   constructor(config2) {
     super(config2);
-    __publicField(this, "client");
     if (!config2.apiKey) {
       throw new Error("Google API key is required");
     }
@@ -265,11 +328,11 @@ var GeminiProvider = class extends EmbeddingProvider {
   }
   getDimensions() {
     const model = this.getModel();
-    if (model.includes("gemini-embedding-001")) return 768;
+    if (model.includes("gemini-embedding-001")) return 3072;
     if (model.includes("text-embedding-004")) return 768;
     if (model.includes("embedding-001")) return 768;
     if (model.includes("multimodalembedding")) return 768;
-    return 768;
+    return 3072;
   }
   getProviderName() {
     return "Google Gemini";
@@ -291,71 +354,12 @@ var GeminiProvider = class extends EmbeddingProvider {
   }
 };
-// src/providers/claude.ts
-import Anthropic from "@anthropic-ai/sdk";
-var logger4 = Logger.createModuleLogger("claude");
-var ClaudeProvider = class extends EmbeddingProvider {
-  constructor(config2) {
-    super(config2);
-    __publicField(this, "client");
-    if (!config2.apiKey) {
-      throw new Error("Anthropic API key is required");
-    }
-    this.client = new Anthropic({
-      apiKey: config2.apiKey,
-      baseURL: config2.baseUrl,
-      timeout: config2.timeout || 3e4
-    });
-    logger4.info("Claude provider initialized");
-  }
-  async embed() {
-    try {
-      logger4.debug(`Embedding text with model: ${this.getModel()}`);
-      throw new Error("Claude embeddings API not yet available. Please use another provider.");
-    } catch (error) {
-      const errorMessage = error instanceof Error ? error instanceof Error ? error.message : String(error) : "Unknown error";
-      logger4.error(`Claude embedding failed: ${errorMessage}`);
-      throw error;
-    }
-  }
-  async embedBatch() {
-    try {
-      throw new Error("Claude embeddings API not yet available. Please use another provider.");
-    } catch (error) {
-      const errorMessage = error instanceof Error ? error instanceof Error ? error.message : String(error) : "Unknown error";
-      logger4.error(`Claude batch embedding failed: ${errorMessage}`);
-      throw error;
-    }
-  }
-  getDimensions() {
-    return 0;
-  }
-  getProviderName() {
-    return "Anthropic Claude";
-  }
-  async isReady() {
-    try {
-      await this.client.messages.create({
-        model: "claude-3-haiku-20240307",
-        max_tokens: 10,
-        messages: [{ role: "user", content: "test" }]
-      });
-      return true;
-    } catch (error) {
-      const errorMessage = error instanceof Error ? error instanceof Error ? error.message : String(error) : "Unknown error";
-      logger4.error(`Claude readiness check failed: ${errorMessage}`);
-      return false;
-    }
-  }
-};
 // src/providers/mistral.ts
 import { Mistral } from "@mistralai/mistralai";
-var logger5 = Logger.createModuleLogger("mistral");
+var logger4 = Logger.createModuleLogger("mistral");
 var MistralProvider = class extends EmbeddingProvider {
   constructor(config2) {
     super(config2);
-    __publicField(this, "client");
     if (!config2.apiKey) {
       throw new Error("Mistral API key is required");
     }
@@ -364,12 +368,12 @@ var MistralProvider = class extends EmbeddingProvider {
       serverURL: config2.baseUrl,
       timeoutMs: config2.timeout || 3e4
     });
-    logger5.info("Mistral provider initialized");
+    logger4.info("Mistral provider initialized");
   }
   async embed(input) {
     try {
       const text = await this.readInput(input);
-      logger5.debug(`Embedding text with model: ${this.getModel()}`);
+      logger4.debug(`Embedding text with model: ${this.getModel()}`);
       const response = await this.client.embeddings.create({
         model: this.getModel(),
         inputs: [text]
@@ -389,14 +393,14 @@ var MistralProvider = class extends EmbeddingProvider {
         } : void 0
       };
     } catch (error) {
-      logger5.error(`Mistral embedding failed: ${error instanceof Error ? error.message : String(error)}`);
+      logger4.error(`Mistral embedding failed: ${error instanceof Error ? error.message : String(error)}`);
       throw error;
     }
   }
   async embedBatch(inputs) {
     try {
       const texts = await Promise.all(inputs.map((input) => this.readInput(input)));
-      logger5.debug(`Batch embedding ${texts.length} texts with model: ${this.getModel()}`);
+      logger4.debug(`Batch embedding ${texts.length} texts with model: ${this.getModel()}`);
       const response = await this.client.embeddings.create({
         model: this.getModel(),
         inputs: texts
@@ -416,7 +420,7 @@ var MistralProvider = class extends EmbeddingProvider {
         } : void 0
       };
     } catch (error) {
-      logger5.error(`Mistral batch embedding failed: ${error instanceof Error ? error.message : String(error)}`);
+      logger4.error(`Mistral batch embedding failed: ${error instanceof Error ? error.message : String(error)}`);
       throw error;
     }
   }
@@ -436,100 +440,7 @@ var MistralProvider = class extends EmbeddingProvider {
       });
       return response.data.length > 0;
     } catch (error) {
-      logger5.error(`Mistral readiness check failed: ${error instanceof Error ? error.message : String(error)}`);
-      return false;
-    }
-  }
-};
-// src/providers/deepseek.ts
-import { DeepSeek } from "deepseek";
-var logger6 = Logger.createModuleLogger("deepseek");
-var DeepSeekProvider = class extends EmbeddingProvider {
-  constructor(config2) {
-    super(config2);
-    __publicField(this, "client");
-    if (!config2.apiKey) {
-      throw new Error("DeepSeek API key is required");
-    }
-    const clientOptions = {
-      apiKey: config2.apiKey,
-      timeout: config2.timeout || 3e4
-    };
-    if (config2.baseUrl) {
-      clientOptions.baseURL = config2.baseUrl;
-    }
-    this.client = new DeepSeek(clientOptions);
-    logger6.info("DeepSeek provider initialized");
-  }
-  async embed(input) {
-    try {
-      const text = await this.readInput(input);
-      logger6.debug(`Embedding text with model: ${this.getModel()}`);
-      const response = await this.client.embeddings.create({
-        model: this.getModel(),
-        input: text
-      });
-      const embedding = response.data[0];
-      if (!embedding) {
-        throw new Error("No embedding returned from DeepSeek API");
-      }
-      return {
-        embedding: embedding.embedding || [],
-        dimensions: embedding.embedding?.length || 0,
-        model: embedding.model || this.getModel(),
-        provider: "deepseek",
-        usage: response.usage ? {
-          promptTokens: response.usage.prompt_tokens,
-          totalTokens: response.usage.total_tokens
-        } : void 0
-      };
-    } catch (error) {
-      logger6.error(`DeepSeek embedding failed: ${error instanceof Error ? error.message : String(error)}`);
-      throw error;
-    }
-  }
-  async embedBatch(inputs) {
-    try {
-      const texts = await Promise.all(inputs.map((input) => this.readInput(input)));
-      logger6.debug(`Batch embedding ${texts.length} texts with model: ${this.getModel()}`);
-      const response = await this.client.embeddings.create({
-        model: this.getModel(),
-        input: texts
-      });
-      const embeddings = response.data.map((item) => item.embedding);
-      return {
-        embeddings,
-        dimensions: embeddings[0]?.length || 0,
-        model: response.model,
-        provider: "deepseek",
-        usage: response.usage ? {
-          promptTokens: response.usage.prompt_tokens,
-          totalTokens: response.usage.total_tokens
-        } : void 0
-      };
-    } catch (error) {
-      logger6.error(`DeepSeek batch embedding failed: ${error instanceof Error ? error.message : String(error)}`);
-      throw error;
-    }
-  }
-  getDimensions() {
-    const model = this.getModel();
-    if (model.includes("deepseek-chat")) return 4096;
-    return 4096;
-  }
-  getProviderName() {
-    return "DeepSeek";
-  }
-  async isReady() {
-    try {
-      await this.client.embeddings.create({
-        model: this.getModel(),
-        input: "test"
-      });
-      return true;
-    } catch (error) {
-      logger6.error(`DeepSeek readiness check failed: ${error instanceof Error ? error.message : String(error)}`);
+      logger4.error(`Mistral readiness check failed: ${error instanceof Error ? error.message : String(error)}`);
       return false;
     }
   }
@@ -539,14 +450,31 @@ var DeepSeekProvider = class extends EmbeddingProvider {
 import { access, constants } from "fs/promises";
 import { join, resolve } from "path";
 import * as http from "http";
+var nativeModule = null;
+try {
+  nativeModule = require_native();
+  logger.info("Using native Llama.cpp module");
+} catch (error) {
+  logger.warn("Native module not available, falling back to HTTP");
+}
 var LlamaCppProvider = class extends EmbeddingProvider {
   constructor(config2) {
     super({ ...config2, provider: "llamacpp" });
-    __publicField(this, "llamaPath");
-    __publicField(this, "modelPath");
+    this.nativeModel = null;
     this.modelPath = config2.model || "nomic-embed-text-v1.5.Q4_K_M.gguf";
     this.llamaPath = config2.llamaPath || "./llama.cpp/build/bin/llama-embedding";
-    logger.info(`Llama.cpp provider initialized with model: ${this.modelPath}`);
+    this.useNative = !!nativeModule;
+    if (this.useNative) {
+      try {
+        this.nativeModel = nativeModule.create(this.modelPath);
+        logger.info(`Llama.cpp provider initialized with native module: ${this.modelPath}`);
+      } catch (error) {
+        logger.error(`Failed to initialize native module: ${error}`);
+        this.useNative = false;
+      }
+    } else {
+      logger.info(`Llama.cpp provider initialized with HTTP fallback: ${this.modelPath}`);
+    }
   }
   // Public API methods
   getProviderName() {
@@ -563,6 +491,9 @@ var LlamaCppProvider = class extends EmbeddingProvider {
   }
   async isReady() {
     try {
+      if (this.useNative && this.nativeModel) {
+        return true;
+      }
       await access(this.llamaPath, constants.F_OK);
       await access(this.llamaPath, constants.X_OK);
       const modelPath = await this.getModelPath();
@@ -581,6 +512,15 @@ var LlamaCppProvider = class extends EmbeddingProvider {
       if (!text.trim()) {
         throw new Error("Text input cannot be empty");
       }
+      if (this.useNative && this.nativeModel) {
+        const embedding2 = this.nativeModel.embed(text);
+        return {
+          embedding: embedding2,
+          dimensions: embedding2.length,
+          model: this.getModel(),
+          provider: "llamacpp"
+        };
+      }
       const requestBody = {
         input: text,
         model: await this.getModelPath(),
@@ -603,6 +543,25 @@ var LlamaCppProvider = class extends EmbeddingProvider {
   async embedBatch(inputs) {
     try {
       logger.debug(`Batch embedding ${inputs.length} texts with llama.cpp`);
+      if (this.useNative && this.nativeModel) {
+        const embeddings2 = [];
+        for (const input of inputs) {
+          const text = await this.readInput(input);
+          if (text.trim()) {
+            const embedding = this.nativeModel.embed(text);
+            embeddings2.push(embedding);
+          }
+        }
+        if (embeddings2.length === 0) {
+          throw new Error("No valid texts to embed");
+        }
+        return {
+          embeddings: embeddings2,
+          dimensions: embeddings2[0]?.length || 0,
+          model: this.getModel(),
+          provider: "llamacpp"
+        };
+      }
       const texts = [];
       for (const input of inputs) {
         const text = await this.readInput(input);
@@ -637,6 +596,18 @@ var LlamaCppProvider = class extends EmbeddingProvider {
       throw error;
     }
   }
+  // Cleanup method
+  async cleanup() {
+    if (this.useNative && this.nativeModel) {
+      try {
+        this.nativeModel.close();
+        this.nativeModel = null;
+        logger.info("Native Llama.cpp model closed");
+      } catch (error) {
+        logger.error(`Error closing native model: ${error}`);
+      }
+    }
+  }
   // Protected methods
   getModel() {
     return this.modelPath;
@@ -735,8 +706,8 @@ var LlamaCppProvider = class extends EmbeddingProvider {
       }
       throw new Error(`Unexpected format: ${JSON.stringify(Object.keys(response))}`);
     } catch (error) {
-      const errorMessage = error instanceof Error ? error instanceof Error ? error.message : String(error) : "Unknown error";
-      throw new Error(`Parse failed: ${errorMessage}`, { cause: error });
+      const errorMessage = error instanceof Error ? error.message : String(error);
+      throw new Error(`Parse failed: ${errorMessage}`);
     }
   }
   parseArrayOutput(output) {
@@ -754,10 +725,10 @@ var LlamaCppProvider = class extends EmbeddingProvider {
 };
 // src/factory/EmbeddingFactory.ts
-var logger7 = Logger.createModuleLogger("factory");
+var logger5 = Logger.createModuleLogger("factory");
 var EmbeddingFactory = class {
   static create(config2) {
-    logger7.info(`Creating provider: ${config2.provider}`);
+    logger5.info(`Creating provider: ${config2.provider}`);
     const ProviderClass = this.providers.get(config2.provider);
     if (!ProviderClass) {
       throw new Error(`Unsupported provider: ${config2.provider}`);
@@ -768,54 +739,51 @@ var EmbeddingFactory = class {
     return Array.from(this.providers.keys());
   }
 };
-__publicField(EmbeddingFactory, "providers", /* @__PURE__ */ new Map([
+EmbeddingFactory.providers = /* @__PURE__ */ new Map([
   ["openai", OpenAIProvider],
   ["gemini", GeminiProvider],
-  ["claude", ClaudeProvider],
   ["mistral", MistralProvider],
-  ["deepseek", DeepSeekProvider],
   ["llamacpp", LlamaCppProvider]
   // Local embeddings with llama.cpp
-]));
+]);
 // main.ts
 dotenv.config();
-var logger8 = Logger.createModuleLogger("main");
+var logger6 = Logger.createModuleLogger("main");
 async function embed(config2, input) {
   try {
-    logger8.info(`Starting embedding with provider: ${config2.provider}`);
+    logger6.info(`Starting embedding with provider: ${config2.provider}`);
     const provider = EmbeddingFactory.create(config2);
     const isReady = await provider.isReady();
     if (!isReady) {
       throw new Error(`Provider ${config2.provider} is not ready`);
     }
     if (Array.isArray(input)) {
-      logger8.debug(`Processing batch of ${input.length} items`);
+      logger6.debug(`Processing batch of ${input.length} items`);
       return await provider.embedBatch(input);
     } else {
-      logger8.debug(`Processing single item`);
+      logger6.debug(`Processing single item`);
       return await provider.embed(input);
     }
   } catch (error) {
     const errorMessage = error instanceof Error ? error.message : String(error);
-    logger8.error(`Embedding failed: ${errorMessage}`);
+    logger6.error(`Embedding failed: ${errorMessage}`);
     throw error;
   }
 }
 async function autoEmbed(input) {
-  logger8.info("Auto-detecting best provider...");
+  logger6.info("Auto-detecting best provider...");
   const providers = [
     { provider: "llamacpp", model: "nomic-embed-text-v1.5.Q4_K_M.gguf" },
     // Local & free (llama.cpp)
     { provider: "openai", model: "text-embedding-3-small", apiKey: process.env.OPENAI_API_KEY || void 0 },
     { provider: "gemini", model: "gemini-embedding-001", apiKey: process.env.GOOGLE_GENERATIVE_AI_API_KEY || void 0 },
-    { provider: "mistral", model: "mistral-embed", apiKey: process.env.MISTRAL_API_KEY || void 0 },
-    { provider: "deepseek", model: "deepseek-chat", apiKey: process.env.DEEPSEEK_API_KEY || void 0 }
+    { provider: "mistral", model: "mistral-embed", apiKey: process.env.MISTRAL_API_KEY || void 0 }
   ];
   for (const config2 of providers) {
     try {
       if (config2.provider === "llamacpp" || config2.apiKey) {
-        logger8.info(`Trying provider: ${config2.provider}`);
+        logger6.info(`Trying provider: ${config2.provider}`);
         const cleanConfig = {
           provider: config2.provider,
           model: config2.model
@@ -827,7 +795,7 @@ async function autoEmbed(input) {
       }
     } catch (error) {
       const errorMessage = error instanceof Error ? error.message : String(error);
-      logger8.warn(`Provider ${config2.provider} failed: ${errorMessage}`);
+      logger6.warn(`Provider ${config2.provider} failed: ${errorMessage}`);
       continue;
     }
   }
@@ -854,9 +822,7 @@ var LIB_INFO = {
   supportedProviders: [
     "openai",
     "gemini",
-    "claude",
     "mistral",
-    "deepseek",
     "llamacpp"
   ]
 };