npm - rust-kgdb - Versions diffs - 0.3.1 → 0.3.2 - Mend

rust-kgdb 0.3.1 → 0.3.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/README.md +92 -0
package/package.json +1 -1

package/README.md CHANGED Viewed

@@ -16,6 +16,8 @@
 | **GraphDB** | Core RDF/SPARQL database with 100% W3C compliance |
 | **GraphFrames** | Spark-compatible graph analytics (PageRank, triangles, motifs) |
 | **EmbeddingService** | Vector similarity search, text search, multi-provider embeddings |
+| **Embedding Triggers** | Automatic embedding generation on INSERT/UPDATE/DELETE |
+| **Embedding Providers** | OpenAI, Voyage, Cohere, Anthropic, Mistral, Jina, Ollama, HF-TEI |
 | **DatalogProgram** | Rule-based reasoning with transitive closure |
 | **Pregel** | Bulk Synchronous Parallel graph processing |
 | **Hypergraph** | Native hyperedge support beyond RDF triples |
@@ -178,6 +180,11 @@ console.log('Composite embedding:', composite ? 'stored' : 'not found')
 // Count composite embeddings
 console.log('Total composites:', service.countComposites())
+// === Composite Similarity Search (RRF Aggregation) ===
+// Find similar using Reciprocal Rank Fusion across multiple providers
+const compositeSimilar = JSON.parse(service.findSimilarComposite('product_123', 10, 0.5, 'rrf'))
+console.log('Similar (composite RRF):', compositeSimilar)
 // === Use Case: Semantic Product Search ===
 // Store product embeddings
 const products = ['laptop', 'phone', 'tablet', 'keyboard', 'mouse']
@@ -192,6 +199,91 @@ const relatedToLaptop = JSON.parse(service.findSimilar('laptop', 5, 0.0))
 console.log('Products similar to laptop:', relatedToLaptop)
 ```
+### 3b. Embedding Triggers (Automatic Embedding Generation)
+```javascript
+// Triggers automatically generate embeddings when data changes
+// Configure triggers to fire on INSERT/UPDATE/DELETE events
+// Example: Auto-embed new entities on insert
+const triggerConfig = {
+  name: 'auto_embed_on_insert',
+  event: 'AfterInsert',
+  action: {
+    type: 'GenerateEmbedding',
+    source: 'Subject',       // Embed the subject of the triple
+    provider: 'openai'       // Use OpenAI provider
+  }
+}
+// Multiple triggers for different providers
+const triggers = [
+  { name: 'embed_openai', provider: 'openai' },
+  { name: 'embed_voyage', provider: 'voyage' },
+  { name: 'embed_cohere', provider: 'cohere' }
+]
+// Each trigger fires independently, creating composite embeddings
+```
+### 3c. Embedding Providers (Multi-Provider Architecture)
+```javascript
+// rust-kgdb supports multiple embedding providers:
+//
+// Built-in Providers:
+// - 'openai'    → text-embedding-3-small (1536 or 384 dim)
+// - 'voyage'    → voyage-2, voyage-lite-02-instruct
+// - 'cohere'    → embed-v3
+// - 'anthropic' → Via Voyage partnership
+// - 'mistral'   → mistral-embed
+// - 'jina'      → jina-embeddings-v2
+// - 'ollama'    → Local models (llama, mistral, etc.)
+// - 'hf-tei'    → HuggingFace Text Embedding Inference
+//
+// Provider Configuration (Rust-side):
+const providerConfig = {
+  providers: {
+    openai: {
+      api_key: process.env.OPENAI_API_KEY,
+      model: 'text-embedding-3-small',
+      dimensions: 384
+    },
+    voyage: {
+      api_key: process.env.VOYAGE_API_KEY,
+      model: 'voyage-2',
+      dimensions: 1024
+    },
+    cohere: {
+      api_key: process.env.COHERE_API_KEY,
+      model: 'embed-english-v3.0',
+      dimensions: 384
+    },
+    ollama: {
+      base_url: 'http://localhost:11434',
+      model: 'nomic-embed-text',
+      dimensions: 768
+    }
+  },
+  default_provider: 'openai'
+}
+// Why Multi-Provider?
+// Google Research (arxiv.org/abs/2508.21038) shows single embeddings hit
+// a "recall ceiling" - different providers capture different semantic aspects:
+// - OpenAI: General semantic understanding
+// - Voyage: Domain-specific (legal, financial, code)
+// - Cohere: Multilingual support
+// - Ollama: Privacy-preserving local inference
+// Aggregation Strategies for composite search:
+// - 'rrf'     → Reciprocal Rank Fusion (recommended)
+// - 'max'     → Maximum score across providers
+// - 'avg'     → Weighted average
+// - 'voting'  → Consensus (entity must appear in N providers)
+```
 ### 4. DatalogProgram (Rule-Based Reasoning)
 ```javascript

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "rust-kgdb",
-  "version": "0.3.1",
+  "version": "0.3.2",
   "description": "High-performance RDF/SPARQL database with GraphFrames analytics, vector embeddings, Datalog reasoning, and Pregel BSP processing",
   "main": "index.js",
   "types": "index.d.ts",