npm - @revealui/ai - Versions diffs - 0.1.2 → 0.2.0 - Mend

@revealui/ai 0.1.2 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (44) hide show

package/README.md +3 -0
package/dist/ingestion/pipeline.d.ts +2 -1
package/dist/ingestion/pipeline.d.ts.map +1 -1
package/dist/ingestion/pipeline.js +10 -5
package/dist/llm/client.d.ts +12 -2
package/dist/llm/client.d.ts.map +1 -1
package/dist/llm/client.js +46 -6
package/dist/llm/providers/anthropic.d.ts.map +1 -1
package/dist/llm/providers/anthropic.js +17 -3
package/dist/llm/providers/base.d.ts +28 -1
package/dist/llm/providers/base.d.ts.map +1 -1
package/dist/llm/providers/bitnet.d.ts +28 -0
package/dist/llm/providers/bitnet.d.ts.map +1 -0
package/dist/llm/providers/bitnet.js +36 -0
package/dist/llm/providers/inference-snaps.d.ts +44 -0
package/dist/llm/providers/inference-snaps.d.ts.map +1 -0
package/dist/llm/providers/inference-snaps.js +65 -0
package/dist/llm/providers/openai.d.ts.map +1 -1
package/dist/llm/providers/openai.js +2 -0
package/dist/llm/semantic-cache.d.ts.map +1 -1
package/dist/llm/semantic-cache.js +13 -5
package/dist/llm/server.d.ts +2 -0
package/dist/llm/server.d.ts.map +1 -1
package/dist/llm/server.js +2 -0
package/dist/memory/persistence/crdt-persistence.d.ts.map +1 -1
package/dist/memory/persistence/crdt-persistence.js +2 -1
package/dist/memory/preferences/user-preferences-manager.d.ts.map +1 -1
package/dist/memory/preferences/user-preferences-manager.js +10 -9
package/dist/memory/stores/episodic-memory.d.ts.map +1 -1
package/dist/memory/stores/episodic-memory.js +2 -1
package/dist/memory/utils/index.d.ts +0 -1
package/dist/memory/utils/index.d.ts.map +1 -1
package/dist/memory/utils/index.js +0 -1
package/dist/memory/vector/vector-memory-service.d.ts +3 -0
package/dist/memory/vector/vector-memory-service.d.ts.map +1 -1
package/dist/memory/vector/vector-memory-service.js +18 -5
package/dist/skills/loader/github-loader.d.ts.map +1 -1
package/dist/skills/loader/github-loader.js +27 -16
package/dist/skills/loader/vercel-loader.d.ts.map +1 -1
package/dist/skills/loader/vercel-loader.js +26 -16
package/package.json +16 -9
package/dist/memory/utils/logger.d.ts +0 -21
package/dist/memory/utils/logger.d.ts.map +0 -1
package/dist/memory/utils/logger.js +0 -62

package/README.md CHANGED Viewed

@@ -1,5 +1,8 @@
 # @revealui/ai
+> **Commercial package** — requires a [RevealUI Pro license](https://revealui.com/pro). Free to install and evaluate; a license key is required for production use.
 AI system for RevealUI - memory, LLM, orchestration, and tools.
 ## Features

package/dist/ingestion/pipeline.d.ts CHANGED Viewed

@@ -24,9 +24,10 @@ export interface IngestResult {
 }
 export declare class IngestionPipeline {
     private db;
+    private restDb;
     private embeddingFn;
     private splitter;
-    constructor(db: Database, embeddingFn: (text: string) => Promise<number[]>);
+    constructor(db: Database, restDb: Database, embeddingFn: (text: string) => Promise<number[]>);
     ingest(req: IngestRequest): Promise<IngestResult>;
     ingestBatch(docs: IngestRequest[]): Promise<IngestResult[]>;
     deleteDocument(documentId: string): Promise<void>;

package/dist/ingestion/pipeline.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"pipeline.d.ts","sourceRoot":"","sources":["../../src/ingestion/pipeline.ts"],"names":[],"mappings":"AAAA;;;;;GAKG;AAEH,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qBAAqB,CAAA;~~AAMnD~~,MAAM,WAAW,aAAa;IAC5B,WAAW,EAAE,MAAM,CAAA;IACnB,UAAU,EAAE,gBAAgB,GAAG,KAAK,GAAG,MAAM,GAAG,MAAM,CAAA;IACtD,QAAQ,CAAC,EAAE,MAAM,CAAA;IACjB,gBAAgB,CAAC,EAAE,MAAM,CAAA;IACzB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,QAAQ,CAAC,EAAE,MAAM,CAAA;IACjB,UAAU,EAAE,MAAM,CAAA;IAClB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,YAAY,CAAC,EAAE,MAAM,CAAA;CACtB;AAED,MAAM,WAAW,YAAY;IAC3B,UAAU,EAAE,MAAM,CAAA;IAClB,UAAU,EAAE,MAAM,CAAA;IAClB,MAAM,EAAE,SAAS,GAAG,QAAQ,CAAA;IAC5B,KAAK,CAAC,EAAE,MAAM,CAAA;CACf;AAcD,qBAAa,iBAAiB;IAC5B,OAAO,CAAC,EAAE,CAAU;IACpB,OAAO,CAAC,WAAW,CAAqC;IACxD,OAAO,CAAC,QAAQ,CAA4B;gBAEhC,EAAE,EAAE,QAAQ,EAAE,WAAW,EAAE,CAAC,IAAI,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,EAAE,CAAC;~~IAMpE~~,MAAM,CAAC,GAAG,EAAE,aAAa,GAAG,OAAO,CAAC,YAAY,CAAC;~~IAsEjD~~,WAAW,CAAC,IAAI,EAAE,aAAa,EAAE,GAAG,OAAO,CAAC,YAAY,EAAE,CAAC;IAa3D,cAAc,CAAC,UAAU,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC;IAKjD,cAAc,CAClB,WAAW,EAAE,MAAM,EACnB,gBAAgB,EAAE,MAAM,EACxB,QAAQ,EAAE,MAAM,GACf,OAAO,CAAC,IAAI,CAAC;CAiBjB"}
1	+ {"version":3,"file":"pipeline.d.ts","sourceRoot":"","sources":["../../src/ingestion/pipeline.ts"],"names":[],"mappings":"AAAA;;;;;GAKG;AAEH,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qBAAqB,CAAA;AAOnD,MAAM,WAAW,aAAa;IAC5B,WAAW,EAAE,MAAM,CAAA;IACnB,UAAU,EAAE,gBAAgB,GAAG,KAAK,GAAG,MAAM,GAAG,MAAM,CAAA;IACtD,QAAQ,CAAC,EAAE,MAAM,CAAA;IACjB,gBAAgB,CAAC,EAAE,MAAM,CAAA;IACzB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,QAAQ,CAAC,EAAE,MAAM,CAAA;IACjB,UAAU,EAAE,MAAM,CAAA;IAClB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,YAAY,CAAC,EAAE,MAAM,CAAA;CACtB;AAED,MAAM,WAAW,YAAY;IAC3B,UAAU,EAAE,MAAM,CAAA;IAClB,UAAU,EAAE,MAAM,CAAA;IAClB,MAAM,EAAE,SAAS,GAAG,QAAQ,CAAA;IAC5B,KAAK,CAAC,EAAE,MAAM,CAAA;CACf;AAcD,qBAAa,iBAAiB;IAC5B,OAAO,CAAC,EAAE,CAAU;IACpB,OAAO,CAAC,MAAM,CAAU;IACxB,OAAO,CAAC,WAAW,CAAqC;IACxD,OAAO,CAAC,QAAQ,CAA4B;gBAEhC,EAAE,EAAE,QAAQ,EAAE,MAAM,EAAE,QAAQ,EAAE,WAAW,EAAE,CAAC,IAAI,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,EAAE,CAAC;IAOtF,MAAM,CAAC,GAAG,EAAE,aAAa,GAAG,OAAO,CAAC,YAAY,CAAC;IA6EjD,WAAW,CAAC,IAAI,EAAE,aAAa,EAAE,GAAG,OAAO,CAAC,YAAY,EAAE,CAAC;IAa3D,cAAc,CAAC,UAAU,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC;IAKjD,cAAc,CAClB,WAAW,EAAE,MAAM,EACnB,gBAAgB,EAAE,MAAM,EACxB,QAAQ,EAAE,MAAM,GACf,OAAO,CAAC,IAAI,CAAC;CAiBjB"}

package/dist/ingestion/pipeline.js CHANGED Viewed

@@ -4,12 +4,13 @@
  * Orchestrates: parse → split → embed → store.
  * One document produces N chunks, each with a 768-dim embedding.
  */
+import { safeVectorInsert } from '@revealui/db/validation';
 import { ragChunks, ragDocuments } from '@revealui/db/schema/rag';
 import { and, eq } from 'drizzle-orm';
 import { createParser } from './file-parsers.js';
 import { RecursiveCharacterSplitter } from './text-splitter.js';
 function generateId(prefix) {
-    return `${prefix}-${Date.now()}-${Math.random().toString(36).slice(2, 9)}`;
+    return `${prefix}-${crypto.randomUUID()}`;
 }
 function estimateWordCount(text) {
     return text.split(/\s+/).filter((w) => w.length > 0).length;
@@ -19,18 +20,22 @@ function estimateTokens(text) {
 }
 export class IngestionPipeline {
     db;
+    restDb;
     embeddingFn;
     splitter;
-    constructor(db, embeddingFn) {
+    constructor(db, restDb, embeddingFn) {
         this.db = db;
+        this.restDb = restDb;
         this.embeddingFn = embeddingFn;
         this.splitter = new RecursiveCharacterSplitter();
     }
     async ingest(req) {
         const docId = generateId('rdoc');
         const now = new Date();
-        // 1. Insert document row with status='processing'
-        await this.db.insert(ragDocuments).values({
+        // 1. Insert document row with status='processing', guarded by cross-DB ref check.
+        // safeVectorInsert validates that workspaceId (= site ID) exists in NeonDB before
+        // writing to the Supabase vector store, preventing orphaned RAG documents.
+        await safeVectorInsert(this.restDb, async () => this.db.insert(ragDocuments).values({
             id: docId,
             workspaceId: req.workspaceId,
             sourceType: req.sourceType,
@@ -44,7 +49,7 @@ export class IngestionPipeline {
             status: 'processing',
             createdAt: now,
             updatedAt: now,
-        });
+        }), { siteId: req.workspaceId });
         try {
             // 2. Parse
             const parser = createParser(req.mimeType ?? 'text/plain');

package/dist/llm/client.d.ts CHANGED Viewed

@@ -12,10 +12,10 @@ export declare function redactSensitiveFields(obj: Record<string, unknown>): Rec
 import type { Database } from '@revealui/db/client';
 import type { AuditStore } from '../audit/store.js';
 import type { ProviderHealthMonitor } from './provider-health.js';
-import type { Embedding, LLMChatOptions, LLMChunk, LLMEmbedOptions, LLMResponse, LLMStreamOptions, Message } from './providers/base.js';
+import type { Embedding, LLMChatOptions, LLMChunk, LLMEmbedOptions, LLMProvider, LLMResponse, LLMStreamOptions, Message } from './providers/base.js';
 import { type CacheStats, type ResponseCacheOptions } from './response-cache.js';
 import { type SemanticCacheOptions, type SemanticCacheStats } from './semantic-cache.js';
-export type LLMProviderType = 'openai' | 'anthropic' | 'vultr' | 'groq' | 'ollama' | 'huggingface';
+export type LLMProviderType = 'openai' | 'anthropic' | 'vultr' | 'groq' | 'ollama' | 'bitnet' | 'huggingface' | 'inference-snaps';
 export interface LLMClientConfig {
     provider: LLMProviderType;
     apiKey: string;
@@ -27,6 +27,15 @@ export interface LLMClientConfig {
     apiKeyFn?: () => Promise<string>;
     baseURL?: string;
     model?: string;
+    /**
+     * Dedicated embedding provider. When set, all embed() calls are routed here
+     * instead of the primary provider. Required when the primary provider does not
+     * support embeddings (e.g. BitNet).
+     *
+     * Auto-wired by createLLMClientFromEnv() when BITNET_BASE_URL + OLLAMA_BASE_URL
+     * are both set.
+     */
+    embedProvider?: LLMProvider;
     temperature?: number;
     maxTokens?: number;
     fallbackProvider?: LLMProviderType;
@@ -50,6 +59,7 @@ export interface LLMClientConfig {
 export declare class LLMClient {
     private provider;
     private fallbackProvider?;
+    private embedProviderOverride?;
     private config;
     private rateLimitState;
     private responseCache?;

package/dist/llm/client.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"client.d.ts","sourceRoot":"","sources":["../../src/llm/client.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAoBH;;;;GAIG;AACH,wBAAgB,qBAAqB,CAAC,GAAG,EAAE,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,GAAG,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,CAY3F;AAID,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qBAAqB,CAAA;AAInD,OAAO,KAAK,EAAE,UAAU,EAAE,MAAM,mBAAmB,CAAA;AACnD,OAAO,KAAK,EAAE,qBAAqB,EAAE,MAAM,sBAAsB,CAAA;~~AAEjE~~,OAAO,KAAK,EACV,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,~~EAEf~~,WAAW,EACX,gBAAgB,EAChB,OAAO,EACR,MAAM,qBAAqB,CAAA;~~AAK5B~~,OAAO,EAAE,KAAK,UAAU,EAAiB,KAAK,oBAAoB,EAAE,MAAM,qBAAqB,CAAA;AAC/F,OAAO,EAEL,KAAK,oBAAoB,EACzB,KAAK,kBAAkB,EACxB,MAAM,qBAAqB,CAAA;AAG5B,MAAM,MAAM,eAAe,~~GAAG~~,QAAQ,~~GAAG~~,WAAW,~~GAAG~~,OAAO,~~GAAG~~,MAAM,~~GAAG~~,QAAQ,~~GAAG~~,aAAa,CAAA;~~AAElG~~,MAAM,WAAW,eAAe;IAC9B,QAAQ,EAAE,eAAe,CAAA;IACzB,MAAM,EAAE,MAAM,CAAA;IACd;;;;OAIG;IACH,QAAQ,CAAC,EAAE,MAAM,OAAO,CAAC,MAAM,CAAC,CAAA;IAChC,OAAO,CAAC,EAAE,MAAM,CAAA;IAChB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,gBAAgB,CAAC,EAAE,eAAe,CAAA;IAClC,SAAS,CAAC,EAAE;QACV,iBAAiB,CAAC,EAAE,MAAM,CAAA;QAC1B,cAAc,CAAC,EAAE,MAAM,CAAA;KACxB,CAAA;IACD,oFAAoF;IACpF,oBAAoB,CAAC,EAAE,OAAO,CAAA;IAC9B,wEAAwE;IACxE,mBAAmB,CAAC,EAAE,OAAO,CAAA;IAC7B,6BAA6B;IAC7B,oBAAoB,CAAC,EAAE,oBAAoB,CAAA;IAC3C,iEAAiE;IACjE,mBAAmB,CAAC,EAAE,OAAO,CAAA;IAC7B,6BAA6B;IAC7B,oBAAoB,CAAC,EAAE,oBAAoB,CAAA;IAC3C,0EAA0E;IAC1E,aAAa,CAAC,EAAE,qBAAqB,CAAA;CACtC;AAQD,qBAAa,SAAS;IACpB,OAAO,CAAC,QAAQ,CAAa;IAC7B,OAAO,CAAC,gBAAgB,CAAC,CAAa;IACtC,OAAO,CAAC,MAAM,CAAiB;IAC/B,OAAO,CAAC,cAAc,CAAgB;IACtC,OAAO,CAAC,aAAa,CAAC,CAAe;IACrC,OAAO,CAAC,aAAa,CAAC,CAAe;IACrC,OAAO,CAAC,aAAa,CAAC,CAAuB;IAC7C,wFAAwF;IACxF,OAAO,CAAC,aAAa,CAAQ;gBAEjB,MAAM,EAAE,eAAe;~~IA2CnC~~,OAAO,CAAC,cAAc;~~IA4BtB~~;;;OAGG;YACW,uBAAuB;IAmBrC,OAAO,CAAC,cAAc;IAoCtB,OAAO,CAAC,aAAa;IAMf,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAmHzE,KAAK,CACT,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EACvB,OAAO,CAAC,EAAE,eAAe,GACxB,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;~~IAwB5B~~,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IA0BvF;;;OAGG;IACH,eAAe,CAAC,QAAQ,EAAE,OAAO,EAAE,GAAG;QAAE,MAAM,EAAE,MAAM,CAAC;QAAC,gBAAgB,EAAE,MAAM,CAAA;KAAE;IAIlF;;OAEG;IACH,gBAAgB,IAAI,qBAAqB,GAAG,SAAS;IAIrD;;;;OAIG;IACH,qBAAqB,IAAI,UAAU,GAAG,SAAS;IAI/C;;OAEG;IACH,kBAAkB,IAAI,IAAI;IAI1B;;;;OAIG;IACH,qBAAqB,IAAI,kBAAkB,GAAG,SAAS;IAIvD;;OAEG;IACH,kBAAkB,IAAI,IAAI;CAG3B;AAED;;;;;;;;;;;;;GAaG;AACH,wBAAgB,sBAAsB,IAAI,SAAS,~~CAsElD~~;AAED;;;;;;;;;;;;GAYG;AACH,wBAAsB,sBAAsB,CAC1C,MAAM,EAAE,MAAM,EACd,EAAE,EAAE,QAAQ,EACZ,UAAU,CAAC,EAAE,UAAU,GACtB,OAAO,CAAC,SAAS,GAAG,IAAI,CAAC,CAiD3B"}
1	+ {"version":3,"file":"client.d.ts","sourceRoot":"","sources":["../../src/llm/client.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAoBH;;;;GAIG;AACH,wBAAgB,qBAAqB,CAAC,GAAG,EAAE,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,GAAG,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,CAY3F;AAID,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qBAAqB,CAAA;AAInD,OAAO,KAAK,EAAE,UAAU,EAAE,MAAM,mBAAmB,CAAA;AACnD,OAAO,KAAK,EAAE,qBAAqB,EAAE,MAAM,sBAAsB,CAAA;AAGjE,OAAO,KAAK,EACV,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,WAAW,EACX,gBAAgB,EAChB,OAAO,EACR,MAAM,qBAAqB,CAAA;AAS5B,OAAO,EAAE,KAAK,UAAU,EAAiB,KAAK,oBAAoB,EAAE,MAAM,qBAAqB,CAAA;AAC/F,OAAO,EAEL,KAAK,oBAAoB,EACzB,KAAK,kBAAkB,EACxB,MAAM,qBAAqB,CAAA;AAG5B,MAAM,MAAM,eAAe,GACvB,QAAQ,GACR,WAAW,GACX,OAAO,GACP,MAAM,GACN,QAAQ,GACR,QAAQ,GACR,aAAa,GACb,iBAAiB,CAAA;AAErB,MAAM,WAAW,eAAe;IAC9B,QAAQ,EAAE,eAAe,CAAA;IACzB,MAAM,EAAE,MAAM,CAAA;IACd;;;;OAIG;IACH,QAAQ,CAAC,EAAE,MAAM,OAAO,CAAC,MAAM,CAAC,CAAA;IAChC,OAAO,CAAC,EAAE,MAAM,CAAA;IAChB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd;;;;;;;OAOG;IACH,aAAa,CAAC,EAAE,WAAW,CAAA;IAC3B,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,gBAAgB,CAAC,EAAE,eAAe,CAAA;IAClC,SAAS,CAAC,EAAE;QACV,iBAAiB,CAAC,EAAE,MAAM,CAAA;QAC1B,cAAc,CAAC,EAAE,MAAM,CAAA;KACxB,CAAA;IACD,oFAAoF;IACpF,oBAAoB,CAAC,EAAE,OAAO,CAAA;IAC9B,wEAAwE;IACxE,mBAAmB,CAAC,EAAE,OAAO,CAAA;IAC7B,6BAA6B;IAC7B,oBAAoB,CAAC,EAAE,oBAAoB,CAAA;IAC3C,iEAAiE;IACjE,mBAAmB,CAAC,EAAE,OAAO,CAAA;IAC7B,6BAA6B;IAC7B,oBAAoB,CAAC,EAAE,oBAAoB,CAAA;IAC3C,0EAA0E;IAC1E,aAAa,CAAC,EAAE,qBAAqB,CAAA;CACtC;AAQD,qBAAa,SAAS;IACpB,OAAO,CAAC,QAAQ,CAAa;IAC7B,OAAO,CAAC,gBAAgB,CAAC,CAAa;IACtC,OAAO,CAAC,qBAAqB,CAAC,CAAa;IAC3C,OAAO,CAAC,MAAM,CAAiB;IAC/B,OAAO,CAAC,cAAc,CAAgB;IACtC,OAAO,CAAC,aAAa,CAAC,CAAe;IACrC,OAAO,CAAC,aAAa,CAAC,CAAe;IACrC,OAAO,CAAC,aAAa,CAAC,CAAuB;IAC7C,wFAAwF;IACxF,OAAO,CAAC,aAAa,CAAQ;gBAEjB,MAAM,EAAE,eAAe;IA8CnC,OAAO,CAAC,cAAc;IAkCtB;;;OAGG;YACW,uBAAuB;IAmBrC,OAAO,CAAC,cAAc;IAoCtB,OAAO,CAAC,aAAa;IAMf,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAmHzE,KAAK,CACT,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EACvB,OAAO,CAAC,EAAE,eAAe,GACxB,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;IA2B5B,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IA0BvF;;;OAGG;IACH,eAAe,CAAC,QAAQ,EAAE,OAAO,EAAE,GAAG;QAAE,MAAM,EAAE,MAAM,CAAC;QAAC,gBAAgB,EAAE,MAAM,CAAA;KAAE;IAIlF;;OAEG;IACH,gBAAgB,IAAI,qBAAqB,GAAG,SAAS;IAIrD;;;;OAIG;IACH,qBAAqB,IAAI,UAAU,GAAG,SAAS;IAI/C;;OAEG;IACH,kBAAkB,IAAI,IAAI;IAI1B;;;;OAIG;IACH,qBAAqB,IAAI,kBAAkB,GAAG,SAAS;IAIvD;;OAEG;IACH,kBAAkB,IAAI,IAAI;CAG3B;AAED;;;;;;;;;;;;;GAaG;AACH,wBAAgB,sBAAsB,IAAI,SAAS,CAgGlD;AAED;;;;;;;;;;;;GAYG;AACH,wBAAsB,sBAAsB,CAC1C,MAAM,EAAE,MAAM,EACd,EAAE,EAAE,QAAQ,EACZ,UAAU,CAAC,EAAE,UAAU,GACtB,OAAO,CAAC,SAAS,GAAG,IAAI,CAAC,CAiD3B"}

package/dist/llm/client.js CHANGED Viewed

@@ -43,7 +43,9 @@ import { decryptApiKey } from '@revealui/db/crypto';
 import { tenantProviderConfigs, userApiKeys } from '@revealui/db/schema';
 import { and, eq } from 'drizzle-orm';
 import { AnthropicProvider } from './providers/anthropic.js';
+import { BitnetProvider } from './providers/bitnet.js';
 import { GroqProvider } from './providers/groq.js';
+import { InferenceSnapsProvider, } from './providers/inference-snaps.js';
 import { OllamaProvider } from './providers/ollama.js';
 import { OpenAIProvider } from './providers/openai.js';
 import { VultrProvider } from './providers/vultr.js';
@@ -53,6 +55,7 @@ import { estimateRequest as _estimateRequestTokens } from './token-counter.js';
 export class LLMClient {
     provider;
     fallbackProvider;
+    embedProviderOverride;
     config;
     rateLimitState;
     responseCache;
@@ -78,6 +81,8 @@ export class LLMClient {
         }
         // Wire health monitor if provided
         this.healthMonitor = config.healthMonitor;
+        // Wire dedicated embed provider if supplied (e.g. Ollama when BitNet is primary)
+        this.embedProviderOverride = config.embedProvider;
         // Create primary provider
         this.provider = this.createProvider(config.provider, {
             apiKey: config.apiKey,
@@ -112,6 +117,10 @@ export class LLMClient {
                 return new GroqProvider(config);
             case 'ollama':
                 return new OllamaProvider(config);
+            case 'bitnet':
+                return new BitnetProvider(config);
+            case 'inference-snaps':
+                return new InferenceSnapsProvider(config);
             default:
                 throw new Error(`Unknown provider type: ${String(type)}`);
         }
@@ -273,13 +282,15 @@ export class LLMClient {
         if (!this.checkRateLimit()) {
             throw new Error('Rate limit exceeded');
         }
+        // Use dedicated embed provider if one was configured (e.g. Ollama when BitNet is primary)
+        const embedProvider = this.embedProviderOverride ?? this.provider;
         try {
             this.recordRequest();
-            return await this.provider.embed(text, options);
+            return await embedProvider.embed(text, options);
         }
         catch (error) {
-            // Try fallback if available
-            if (this.fallbackProvider) {
+            // Try fallback if available (only when using the primary provider path)
+            if (!this.embedProviderOverride && this.fallbackProvider) {
                 try {
                     return await this.fallbackProvider.embed(text, options);
                 }
@@ -377,6 +388,12 @@ export function createLLMClientFromEnv() {
     if (process.env.LLM_PROVIDER) {
         provider = process.env.LLM_PROVIDER;
     }
+    else if (process.env.INFERENCE_SNAPS_BASE_URL) {
+        provider = 'inference-snaps';
+    }
+    else if (process.env.BITNET_BASE_URL) {
+        provider = 'bitnet';
+    }
     else if (process.env.GROQ_API_KEY) {
         provider = 'groq';
     }
@@ -389,8 +406,9 @@ export function createLLMClientFromEnv() {
     else {
         // No provider configured — throw a clear error. OpenAI is intentionally excluded from
         // auto-detection (no revenue yet). Set LLM_PROVIDER=openai explicitly if needed.
-        throw new Error('No LLM provider configured. Set one of: GROQ_API_KEY (recommended), ' +
-            'OLLAMA_BASE_URL (local), or ANTHROPIC_API_KEY. ' +
+        throw new Error('No LLM provider configured. Set one of: BITNET_BASE_URL (local BitNet), ' +
+            'INFERENCE_SNAPS_BASE_URL (local snap), GROQ_API_KEY (recommended cloud), ' +
+            'OLLAMA_BASE_URL (local Ollama), or ANTHROPIC_API_KEY. ' +
             'Alternatively, set LLM_PROVIDER explicitly.');
     }
     let apiKey;
@@ -422,9 +440,30 @@ export function createLLMClientFromEnv() {
         baseURL = process.env.OLLAMA_BASE_URL;
         defaultModel = 'llama3.2:3b';
     }
+    else if (provider === 'bitnet') {
+        apiKey = 'bitnet'; // llama-server ignores the API key
+        baseURL = process.env.BITNET_BASE_URL;
+        defaultModel = 'bitnet-b1.58-2B-4T';
+    }
+    else if (provider === 'inference-snaps') {
+        apiKey = 'inference-snaps'; // inference-snaps ignores the API key
+        baseURL = process.env.INFERENCE_SNAPS_BASE_URL;
+        defaultModel = 'gemma3';
+    }
     if (!apiKey) {
         throw new Error(`API key not found for provider "${provider}". Set the corresponding env var ` +
-            `(GROQ_API_KEY, OLLAMA_BASE_URL, ANTHROPIC_API_KEY, or OPENAI_API_KEY).`);
+            `(INFERENCE_SNAPS_BASE_URL, GROQ_API_KEY, OLLAMA_BASE_URL, ANTHROPIC_API_KEY, or OPENAI_API_KEY).`);
+    }
+    // When BitNet is the chat provider, auto-wire Ollama as the embed backend.
+    // BitNet does not support /v1/embeddings; Ollama (nomic-embed-text) fills that role.
+    // If OLLAMA_BASE_URL is not set, embed() will throw with a helpful message.
+    let embedProvider;
+    if (provider === 'bitnet' && process.env.OLLAMA_BASE_URL) {
+        embedProvider = new OllamaProvider({
+            apiKey: 'ollama',
+            baseURL: process.env.OLLAMA_BASE_URL,
+            embedModel: process.env.OLLAMA_EMBED_MODEL ?? 'nomic-embed-text',
+        });
     }
     return new LLMClient({
         provider,
@@ -438,6 +477,7 @@ export function createLLMClientFromEnv() {
             process.env.RESPONSE_CACHE_ENABLED === 'true',
         enableSemanticCache: process.env.LLM_ENABLE_SEMANTIC_CACHE === 'true' ||
             process.env.SEMANTIC_CACHE_ENABLED === 'true',
+        embedProvider,
     });
 }
 /**

package/dist/llm/providers/anthropic.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"anthropic.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/anthropic.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,OAAO,KAAK,~~EACV~~,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EAER,MAAM,WAAW,CAAA;~~AAElB~~,MAAM,WAAW,uBAAwB,SAAQ,iBAAiB;IAChE,UAAU,CAAC,EAAE,MAAM,CAAA;IACnB,oFAAoF;IACpF,oBAAoB,CAAC,EAAE,OAAO,CAAA;CAC/B;AAqDD,qBAAa,iBAAkB,YAAW,WAAW;IACnD,OAAO,CAAC,MAAM,CAAyB;IACvC,OAAO,CAAC,OAAO,CAAQ;gBAEX,MAAM,EAAE,uBAAuB;IAKrC,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IA6F/E,KAAK,CAAC,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EAAE,OAAO,CAAC,EAAE,eAAe,GAAG,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;IAUpF,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IAoGvF;;;OAGG;IACH,OAAO,CAAC,oBAAoB;IA0B5B;;;OAGG;IACH,OAAO,CAAC,WAAW;IAmBnB,OAAO,CAAC,cAAc;~~CAiBvB~~"}
1	+ {"version":3,"file":"anthropic.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/anthropic.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,OAAO,KAAK,EAEV,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EAER,MAAM,WAAW,CAAA;AAelB,MAAM,WAAW,uBAAwB,SAAQ,iBAAiB;IAChE,UAAU,CAAC,EAAE,MAAM,CAAA;IACnB,oFAAoF;IACpF,oBAAoB,CAAC,EAAE,OAAO,CAAA;CAC/B;AAqDD,qBAAa,iBAAkB,YAAW,WAAW;IACnD,OAAO,CAAC,MAAM,CAAyB;IACvC,OAAO,CAAC,OAAO,CAAQ;gBAEX,MAAM,EAAE,uBAAuB;IAKrC,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IA6F/E,KAAK,CAAC,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EAAE,OAAO,CAAC,EAAE,eAAe,GAAG,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;IAUpF,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IAoGvF;;;OAGG;IACH,OAAO,CAAC,oBAAoB;IA0B5B;;;OAGG;IACH,OAAO,CAAC,WAAW;IAmBnB,OAAO,CAAC,cAAc;CAkBvB"}

package/dist/llm/providers/anthropic.js CHANGED Viewed

@@ -3,6 +3,19 @@
  *
  * Implementation of LLMProvider for Anthropic Claude API
  */
+/**
+ * Extract plain text from a message content value.
+ * Anthropic has its own image format — for now, image parts are silently skipped
+ * and only text parts are forwarded. Vision via Anthropic is out of scope.
+ */
+function toTextContent(content) {
+    if (typeof content === 'string')
+        return content;
+    return content
+        .filter((p) => p.type === 'text')
+        .map((p) => p.text)
+        .join('\n');
+}
 const isRecord = (value) => typeof value === 'object' && value !== null && !Array.isArray(value);
 const isTextBlock = (block) => block.type === 'text' && typeof block.text === 'string';
 const isToolUseBlock = (block) => block.type === 'tool_use';
@@ -198,12 +211,12 @@ export class AnthropicProvider {
         }
         // If caching disabled, use simple string format
         if (!enableCache) {
-            return systemMessages.map((m) => m.content).join('\n');
+            return systemMessages.map((m) => toTextContent(m.content)).join('\n');
         }
         // With caching, use structured format and cache the last block
         return systemMessages.map((msg, index) => ({
             type: 'text',
-            text: msg.content,
+            text: toTextContent(msg.content),
             // Cache the last system message (most likely to be reused)
             ...(index === systemMessages.length - 1 && msg.cacheControl
                 ? { cache_control: msg.cacheControl }
@@ -239,7 +252,8 @@ export class AnthropicProvider {
             }
             const formatted = {
                 role: msg.role === 'assistant' ? 'assistant' : 'user',
-                content: msg.content,
+                // Anthropic uses a different image format; extract text only for now.
+                content: toTextContent(msg.content),
             };
             return formatted;
         })

package/dist/llm/providers/base.d.ts CHANGED Viewed

@@ -3,9 +3,36 @@
  *
  * Abstract interface for all LLM providers (OpenAI, Anthropic, etc.)
  */
+/**
+ * A plain text content part — used in multipart messages.
+ */
+export interface TextPart {
+    type: 'text';
+    text: string;
+}
+/**
+ * An image content part — base64 data URL or HTTPS URL.
+ * Supported by OpenAI-compatible providers (inference-snaps, Ollama vision, GPT-4o).
+ *
+ * @example
+ * { type: 'image_url', image_url: { url: 'data:image/jpeg;base64,...' } }
+ */
+export interface ImagePart {
+    type: 'image_url';
+    image_url: {
+        /** Base64 data URL (data:image/jpeg;base64,...) or HTTPS image URL */
+        url: string;
+        /** Resolution hint for the model. Defaults to 'auto'. */
+        detail?: 'low' | 'high' | 'auto';
+    };
+}
+/** Union of all content part types for multipart messages. */
+export type ContentPart = TextPart | ImagePart;
 export interface Message {
     role: 'system' | 'user' | 'assistant' | 'tool';
-    content: string;
+    /** Plain text or multipart content (text + images). Arrays are passed through
+     *  to OpenAI-compatible providers as-is; other providers receive text parts only. */
+    content: string | ContentPart[];
     name?: string;
     toolCalls?: ToolCall[];
     toolCallId?: string;

package/dist/llm/providers/base.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"base.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/base.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,MAAM,WAAW,OAAO;IACtB,IAAI,EAAE,QAAQ,GAAG,MAAM,GAAG,WAAW,GAAG,MAAM,CAAA;IAC9C,OAAO,EAAE,MAAM,CAAA;~~IACf~~,IAAI,CAAC,EAAE,MAAM,CAAA;IACb,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;IACtB,UAAU,CAAC,EAAE,MAAM,CAAA;IACnB,0FAA0F;IAC1F,YAAY,CAAC,EAAE;QAAE,IAAI,EAAE,WAAW,CAAA;KAAE,CAAA;CACrC;AAED,MAAM,WAAW,QAAQ;IACvB,EAAE,EAAE,MAAM,CAAA;IACV,IAAI,EAAE,UAAU,CAAA;IAChB,QAAQ,EAAE;QACR,IAAI,EAAE,MAAM,CAAA;QACZ,SAAS,EAAE,MAAM,CAAA;KAClB,CAAA;CACF;AAED,MAAM,WAAW,WAAW;IAC1B,OAAO,EAAE,MAAM,CAAA;IACf,IAAI,EAAE,WAAW,CAAA;IACjB,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;IACtB,YAAY,CAAC,EAAE,MAAM,GAAG,QAAQ,GAAG,YAAY,GAAG,gBAAgB,CAAA;IAClE,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;QACnB,4BAA4B;QAC5B,mBAAmB,CAAC,EAAE,MAAM,CAAA;QAC5B,eAAe,CAAC,EAAE,MAAM,CAAA;KACzB,CAAA;CACF;AAED,MAAM,WAAW,SAAS;IACxB,MAAM,EAAE,MAAM,EAAE,CAAA;IAChB,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;CACd;AAED,MAAM,WAAW,QAAQ;IACvB,OAAO,EAAE,MAAM,CAAA;IACf,IAAI,EAAE,OAAO,CAAA;IACb,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;CACvB;AAED,MAAM,WAAW,iBAAiB;IAChC,MAAM,EAAE,MAAM,CAAA;IACd,OAAO,CAAC,EAAE,MAAM,CAAA;IAChB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;CACnB;AAED;;GAEG;AACH,MAAM,WAAW,WAAW;IAC1B;;OAEG;IACH,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC,CAAA;IAEzE;;OAEG;IACH,KAAK,CAAC,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EAAE,OAAO,CAAC,EAAE,eAAe,GAAG,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC,CAAA;IAE3F;;OAEG;IACH,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC,CAAA;CACjF;AAED,MAAM,WAAW,cAAc;IAC7B,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,KAAK,CAAC,EAAE,cAAc,EAAE,CAAA;IACxB,UAAU,CAAC,EAAE,MAAM,GAAG,MAAM,GAAG;QAAE,IAAI,EAAE,UAAU,CAAC;QAAC,QAAQ,EAAE;YAAE,IAAI,EAAE,MAAM,CAAA;SAAE,CAAA;KAAE,CAAA;IAC/E,+EAA+E;IAC/E,WAAW,CAAC,EAAE,OAAO,CAAA;IACrB;;;;OAIG;IACH,cAAc,CAAC,EAAE,MAAM,CAAA;CACxB;AAED,MAAM,WAAW,eAAe;IAC9B,KAAK,CAAC,EAAE,MAAM,CAAA;CACf;AAED,MAAM,WAAW,gBAAgB;IAC/B,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,KAAK,CAAC,EAAE,cAAc,EAAE,CAAA;IACxB,+EAA+E;IAC/E,WAAW,CAAC,EAAE,OAAO,CAAA;CACtB;AAED,MAAM,WAAW,cAAc;IAC7B,IAAI,EAAE,UAAU,CAAA;IAChB,QAAQ,EAAE;QACR,IAAI,EAAE,MAAM,CAAA;QACZ,WAAW,EAAE,MAAM,CAAA;QACnB,UAAU,EAAE,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,CAAA;KACpC,CAAA;CACF;AAED,MAAM,MAAM,YAAY,GAAG,MAAM,GAAG,QAAQ,GAAG,YAAY,GAAG,gBAAgB,CAAA"}
1	+ {"version":3,"file":"base.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/base.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH;;GAEG;AACH,MAAM,WAAW,QAAQ;IACvB,IAAI,EAAE,MAAM,CAAA;IACZ,IAAI,EAAE,MAAM,CAAA;CACb;AAED;;;;;;GAMG;AACH,MAAM,WAAW,SAAS;IACxB,IAAI,EAAE,WAAW,CAAA;IACjB,SAAS,EAAE;QACT,sEAAsE;QACtE,GAAG,EAAE,MAAM,CAAA;QACX,yDAAyD;QACzD,MAAM,CAAC,EAAE,KAAK,GAAG,MAAM,GAAG,MAAM,CAAA;KACjC,CAAA;CACF;AAED,8DAA8D;AAC9D,MAAM,MAAM,WAAW,GAAG,QAAQ,GAAG,SAAS,CAAA;AAE9C,MAAM,WAAW,OAAO;IACtB,IAAI,EAAE,QAAQ,GAAG,MAAM,GAAG,WAAW,GAAG,MAAM,CAAA;IAC9C;yFACqF;IACrF,OAAO,EAAE,MAAM,GAAG,WAAW,EAAE,CAAA;IAC/B,IAAI,CAAC,EAAE,MAAM,CAAA;IACb,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;IACtB,UAAU,CAAC,EAAE,MAAM,CAAA;IACnB,0FAA0F;IAC1F,YAAY,CAAC,EAAE;QAAE,IAAI,EAAE,WAAW,CAAA;KAAE,CAAA;CACrC;AAED,MAAM,WAAW,QAAQ;IACvB,EAAE,EAAE,MAAM,CAAA;IACV,IAAI,EAAE,UAAU,CAAA;IAChB,QAAQ,EAAE;QACR,IAAI,EAAE,MAAM,CAAA;QACZ,SAAS,EAAE,MAAM,CAAA;KAClB,CAAA;CACF;AAED,MAAM,WAAW,WAAW;IAC1B,OAAO,EAAE,MAAM,CAAA;IACf,IAAI,EAAE,WAAW,CAAA;IACjB,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;IACtB,YAAY,CAAC,EAAE,MAAM,GAAG,QAAQ,GAAG,YAAY,GAAG,gBAAgB,CAAA;IAClE,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;QACnB,4BAA4B;QAC5B,mBAAmB,CAAC,EAAE,MAAM,CAAA;QAC5B,eAAe,CAAC,EAAE,MAAM,CAAA;KACzB,CAAA;CACF;AAED,MAAM,WAAW,SAAS;IACxB,MAAM,EAAE,MAAM,EAAE,CAAA;IAChB,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;CACd;AAED,MAAM,WAAW,QAAQ;IACvB,OAAO,EAAE,MAAM,CAAA;IACf,IAAI,EAAE,OAAO,CAAA;IACb,SAAS,CAAC,EAAE,QAAQ,EAAE,CAAA;CACvB;AAED,MAAM,WAAW,iBAAiB;IAChC,MAAM,EAAE,MAAM,CAAA;IACd,OAAO,CAAC,EAAE,MAAM,CAAA;IAChB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;CACnB;AAED;;GAEG;AACH,MAAM,WAAW,WAAW;IAC1B;;OAEG;IACH,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC,CAAA;IAEzE;;OAEG;IACH,KAAK,CAAC,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EAAE,OAAO,CAAC,EAAE,eAAe,GAAG,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC,CAAA;IAE3F;;OAEG;IACH,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC,CAAA;CACjF;AAED,MAAM,WAAW,cAAc;IAC7B,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,KAAK,CAAC,EAAE,cAAc,EAAE,CAAA;IACxB,UAAU,CAAC,EAAE,MAAM,GAAG,MAAM,GAAG;QAAE,IAAI,EAAE,UAAU,CAAC;QAAC,QAAQ,EAAE;YAAE,IAAI,EAAE,MAAM,CAAA;SAAE,CAAA;KAAE,CAAA;IAC/E,+EAA+E;IAC/E,WAAW,CAAC,EAAE,OAAO,CAAA;IACrB;;;;OAIG;IACH,cAAc,CAAC,EAAE,MAAM,CAAA;CACxB;AAED,MAAM,WAAW,eAAe;IAC9B,KAAK,CAAC,EAAE,MAAM,CAAA;CACf;AAED,MAAM,WAAW,gBAAgB;IAC/B,WAAW,CAAC,EAAE,MAAM,CAAA;IACpB,SAAS,CAAC,EAAE,MAAM,CAAA;IAClB,KAAK,CAAC,EAAE,cAAc,EAAE,CAAA;IACxB,+EAA+E;IAC/E,WAAW,CAAC,EAAE,OAAO,CAAA;CACtB;AAED,MAAM,WAAW,cAAc;IAC7B,IAAI,EAAE,UAAU,CAAA;IAChB,QAAQ,EAAE;QACR,IAAI,EAAE,MAAM,CAAA;QACZ,WAAW,EAAE,MAAM,CAAA;QACnB,UAAU,EAAE,MAAM,CAAC,MAAM,EAAE,OAAO,CAAC,CAAA;KACpC,CAAA;CACF;AAED,MAAM,MAAM,YAAY,GAAG,MAAM,GAAG,QAAQ,GAAG,YAAY,GAAG,gBAAgB,CAAA"}

package/dist/llm/providers/bitnet.d.ts ADDED Viewed

@@ -0,0 +1,28 @@
+/**
+ * BitNet Provider
+ *
+ * Local inference via BitNet's OpenAI-compatible llama-server (http://localhost:8080/v1).
+ * No API key required. Runs entirely on CPU (AVX2). Zero cost, fully offline.
+ *
+ * Setup: pnpm bitnet:install  (clone + compile + download model)
+ * Start: pnpm bitnet:serve    (start inference server on :8080)
+ *
+ * Note: BitNet is a generative model only. It does not expose /v1/embeddings.
+ * For vector search, use Ollama (nomic-embed-text) or @xenova/transformers.
+ */
+import type { Embedding, LLMChatOptions, LLMChunk, LLMEmbedOptions, LLMProvider, LLMProviderConfig, LLMResponse, LLMStreamOptions, Message } from './base.js';
+export interface BitnetProviderConfig extends Omit<LLMProviderConfig, 'apiKey'> {
+    apiKey?: string;
+    /** Defaults to http://localhost:8080/v1 */
+    baseURL?: string;
+    /** Chat model. Defaults to bitnet-b1.58-2B-4T — installed by pnpm bitnet:install */
+    model?: string;
+}
+export declare class BitnetProvider implements LLMProvider {
+    private inner;
+    constructor(config: BitnetProviderConfig);
+    chat(messages: Message[], options?: LLMChatOptions): Promise<LLMResponse>;
+    stream(messages: Message[], options?: LLMStreamOptions): AsyncIterable<LLMChunk>;
+    embed(_text: string | string[], _options?: LLMEmbedOptions): Promise<Embedding | Embedding[]>;
+}
+//# sourceMappingURL=bitnet.d.ts.map

package/dist/llm/providers/bitnet.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"bitnet.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/bitnet.ts"],"names":[],"mappings":"AAAA;;;;;;;;;;;GAWG;AAEH,OAAO,KAAK,EACV,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EACR,MAAM,WAAW,CAAA;AAGlB,MAAM,WAAW,oBAAqB,SAAQ,IAAI,CAAC,iBAAiB,EAAE,QAAQ,CAAC;IAC7E,MAAM,CAAC,EAAE,MAAM,CAAA;IACf,2CAA2C;IAC3C,OAAO,CAAC,EAAE,MAAM,CAAA;IAChB,oFAAoF;IACpF,KAAK,CAAC,EAAE,MAAM,CAAA;CACf;AAED,qBAAa,cAAe,YAAW,WAAW;IAChD,OAAO,CAAC,KAAK,CAAgB;gBAEjB,MAAM,EAAE,oBAAoB;IAUxC,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAIzE,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IAIhF,KAAK,CAAC,KAAK,EAAE,MAAM,GAAG,MAAM,EAAE,EAAE,QAAQ,CAAC,EAAE,eAAe,GAAG,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;CAO9F"}

package/dist/llm/providers/bitnet.js ADDED Viewed

@@ -0,0 +1,36 @@
+/**
+ * BitNet Provider
+ *
+ * Local inference via BitNet's OpenAI-compatible llama-server (http://localhost:8080/v1).
+ * No API key required. Runs entirely on CPU (AVX2). Zero cost, fully offline.
+ *
+ * Setup: pnpm bitnet:install  (clone + compile + download model)
+ * Start: pnpm bitnet:serve    (start inference server on :8080)
+ *
+ * Note: BitNet is a generative model only. It does not expose /v1/embeddings.
+ * For vector search, use Ollama (nomic-embed-text) or @xenova/transformers.
+ */
+import { OpenAIProvider } from './openai.js';
+export class BitnetProvider {
+    inner;
+    constructor(config) {
+        this.inner = new OpenAIProvider({
+            ...config,
+            // llama-server ignores the API key but the OpenAI client requires a non-empty value
+            apiKey: config.apiKey ?? 'bitnet',
+            baseURL: config.baseURL ?? 'http://localhost:8080/v1',
+            model: config.model ?? 'bitnet-b1.58-2B-4T',
+        });
+    }
+    chat(messages, options) {
+        return this.inner.chat(messages, options);
+    }
+    stream(messages, options) {
+        return this.inner.stream(messages, options);
+    }
+    embed(_text, _options) {
+        throw new Error('BitNet does not support embeddings. Set OLLAMA_BASE_URL to auto-wire Ollama ' +
+            '(nomic-embed-text) as the embed backend, or use @xenova/transformers for ' +
+            'fully offline embedding generation.');
+    }
+}

package/dist/llm/providers/inference-snaps.d.ts ADDED Viewed

@@ -0,0 +1,44 @@
+/**
+ * Canonical Inference Snaps Provider
+ *
+ * Local inference via Canonical's inference-snaps OpenAI-compatible API.
+ * No API key required. Zero cost, fully offline, hardware-optimized.
+ *
+ * Supported models (snaps):
+ *   gemma3         — general LLM + vision (text/image in, text out)
+ *   deepseek-r1    — reasoning LLM
+ *   qwen-vl        — vision-language model (image + text)
+ *   nemotron-nano  — general LLM (reasoning + non-reasoning)
+ *
+ * Install a model:
+ *   sudo snap install gemma3
+ *   gemma3 set http.port=9090   # optional: change port (default varies)
+ *   gemma3 status               # shows base URL and available models
+ *
+ * Set env vars:
+ *   INFERENCE_SNAPS_BASE_URL=http://localhost:9090/v1
+ *   LLM_MODEL=gemma3            # must match the snap name / model ID
+ *   LLM_EMBED_MODEL=gemma3      # optional: model for embeddings
+ *
+ * Docs: https://documentation.ubuntu.com/inference-snaps
+ */
+import type { Embedding, LLMChatOptions, LLMChunk, LLMEmbedOptions, LLMProvider, LLMProviderConfig, LLMResponse, LLMStreamOptions, Message } from './base.js';
+export interface InferenceSnapsProviderConfig extends Omit<LLMProviderConfig, 'apiKey'> {
+    apiKey?: string;
+    /** Base URL of the inference-snaps service, e.g. http://localhost:9090/v1 */
+    baseURL: string;
+    /** Chat/vision model name — must match the snap's model ID (e.g. 'gemma3', 'deepseek-r1') */
+    model?: string;
+    /** Embedding model name. Defaults to the chat model when omitted. */
+    embedModel?: string;
+}
+export declare class InferenceSnapsProvider implements LLMProvider {
+    private inner;
+    private embedModel;
+    private baseURL;
+    constructor(config: InferenceSnapsProviderConfig);
+    chat(messages: Message[], options?: LLMChatOptions): Promise<LLMResponse>;
+    stream(messages: Message[], options?: LLMStreamOptions): AsyncIterable<LLMChunk>;
+    embed(text: string | string[], _options?: LLMEmbedOptions): Promise<Embedding | Embedding[]>;
+}
+//# sourceMappingURL=inference-snaps.d.ts.map

package/dist/llm/providers/inference-snaps.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"inference-snaps.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/inference-snaps.ts"],"names":[],"mappings":"AAAA;;;;;;;;;;;;;;;;;;;;;;;GAuBG;AAEH,OAAO,KAAK,EACV,SAAS,EACT,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EACR,MAAM,WAAW,CAAA;AAGlB,MAAM,WAAW,4BAA6B,SAAQ,IAAI,CAAC,iBAAiB,EAAE,QAAQ,CAAC;IACrF,MAAM,CAAC,EAAE,MAAM,CAAA;IACf,6EAA6E;IAC7E,OAAO,EAAE,MAAM,CAAA;IACf,6FAA6F;IAC7F,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,qEAAqE;IACrE,UAAU,CAAC,EAAE,MAAM,CAAA;CACpB;AAED,qBAAa,sBAAuB,YAAW,WAAW;IACxD,OAAO,CAAC,KAAK,CAAgB;IAC7B,OAAO,CAAC,UAAU,CAAQ;IAC1B,OAAO,CAAC,OAAO,CAAQ;gBAEX,MAAM,EAAE,4BAA4B;IAahD,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAIzE,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IAI1E,KAAK,CACT,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EACvB,QAAQ,CAAC,EAAE,eAAe,GACzB,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;CAsBpC"}

package/dist/llm/providers/inference-snaps.js ADDED Viewed

@@ -0,0 +1,65 @@
+/**
+ * Canonical Inference Snaps Provider
+ *
+ * Local inference via Canonical's inference-snaps OpenAI-compatible API.
+ * No API key required. Zero cost, fully offline, hardware-optimized.
+ *
+ * Supported models (snaps):
+ *   gemma3         — general LLM + vision (text/image in, text out)
+ *   deepseek-r1    — reasoning LLM
+ *   qwen-vl        — vision-language model (image + text)
+ *   nemotron-nano  — general LLM (reasoning + non-reasoning)
+ *
+ * Install a model:
+ *   sudo snap install gemma3
+ *   gemma3 set http.port=9090   # optional: change port (default varies)
+ *   gemma3 status               # shows base URL and available models
+ *
+ * Set env vars:
+ *   INFERENCE_SNAPS_BASE_URL=http://localhost:9090/v1
+ *   LLM_MODEL=gemma3            # must match the snap name / model ID
+ *   LLM_EMBED_MODEL=gemma3      # optional: model for embeddings
+ *
+ * Docs: https://documentation.ubuntu.com/inference-snaps
+ */
+import { OpenAIProvider } from './openai.js';
+export class InferenceSnapsProvider {
+    inner;
+    embedModel;
+    baseURL;
+    constructor(config) {
+        this.baseURL = config.baseURL;
+        // Use the same model for embeddings unless explicitly overridden
+        this.embedModel = config.embedModel ?? config.model ?? 'gemma3';
+        this.inner = new OpenAIProvider({
+            ...config,
+            // inference-snaps ignores the API key; OpenAI client requires a non-empty value
+            apiKey: config.apiKey ?? 'inference-snaps',
+            baseURL: config.baseURL,
+            model: config.model ?? 'gemma3',
+        });
+    }
+    chat(messages, options) {
+        return this.inner.chat(messages, options);
+    }
+    stream(messages, options) {
+        return this.inner.stream(messages, options);
+    }
+    async embed(text, _options) {
+        const texts = Array.isArray(text) ? text : [text];
+        const response = await fetch(`${this.baseURL}/embeddings`, {
+            method: 'POST',
+            headers: { 'Content-Type': 'application/json' },
+            body: JSON.stringify({ model: this.embedModel, input: texts }),
+        });
+        if (!response.ok) {
+            throw new Error(`inference-snaps embeddings error: ${response.statusText}`);
+        }
+        const data = (await response.json());
+        const embeddings = (data.data ?? []).map((item) => {
+            const vector = item.embedding ?? [];
+            return { vector, dimension: vector.length, model: this.embedModel };
+        });
+        return Array.isArray(text) ? embeddings : embeddings[0];
+    }
+}

package/dist/llm/providers/openai.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"openai.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/openai.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,OAAO,KAAK,EACV,SAAS,EAET,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EAER,MAAM,WAAW,CAAA;AAElB,MAAM,WAAW,oBAAqB,SAAQ,iBAAiB;IAC7D,YAAY,CAAC,EAAE,MAAM,CAAA;CACtB;AAsDD,qBAAa,cAAe,YAAW,WAAW;IAChD,OAAO,CAAC,MAAM,CAAsB;IACpC,OAAO,CAAC,OAAO,CAAQ;gBAEX,MAAM,EAAE,oBAAoB;IAKlC,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAgFzE,KAAK,CACT,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EACvB,OAAO,CAAC,EAAE,eAAe,GACxB,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;IA2C5B,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IA0FvF,OAAO,CAAC,cAAc;~~CA0BvB~~"}
1	+ {"version":3,"file":"openai.d.ts","sourceRoot":"","sources":["../../../src/llm/providers/openai.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,OAAO,KAAK,EACV,SAAS,EAET,cAAc,EACd,QAAQ,EACR,eAAe,EACf,WAAW,EACX,iBAAiB,EACjB,WAAW,EACX,gBAAgB,EAChB,OAAO,EAER,MAAM,WAAW,CAAA;AAElB,MAAM,WAAW,oBAAqB,SAAQ,iBAAiB;IAC7D,YAAY,CAAC,EAAE,MAAM,CAAA;CACtB;AAsDD,qBAAa,cAAe,YAAW,WAAW;IAChD,OAAO,CAAC,MAAM,CAAsB;IACpC,OAAO,CAAC,OAAO,CAAQ;gBAEX,MAAM,EAAE,oBAAoB;IAKlC,IAAI,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,cAAc,GAAG,OAAO,CAAC,WAAW,CAAC;IAgFzE,KAAK,CACT,IAAI,EAAE,MAAM,GAAG,MAAM,EAAE,EACvB,OAAO,CAAC,EAAE,eAAe,GACxB,OAAO,CAAC,SAAS,GAAG,SAAS,EAAE,CAAC;IA2C5B,MAAM,CAAC,QAAQ,EAAE,OAAO,EAAE,EAAE,OAAO,CAAC,EAAE,gBAAgB,GAAG,aAAa,CAAC,QAAQ,CAAC;IA0FvF,OAAO,CAAC,cAAc;CA4BvB"}

package/dist/llm/providers/openai.js CHANGED Viewed

@@ -224,6 +224,8 @@ export class OpenAIProvider {
         return messages.map((msg) => {
             const formatted = {
                 role: msg.role,
+                // Pass array content through as-is — OpenAI-compatible APIs (including
+                // inference-snaps vision models) accept the same multipart format natively.
                 content: msg.content,
             };
             if (msg.name) {

package/dist/llm/semantic-cache.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"semantic-cache.d.ts","sourceRoot":"","sources":["../../src/llm/semantic-cache.ts"],"names":[],"mappings":"AAAA;;;;;;;;;;;;;;;;;;;;;;;;GAwBG;AAKH,OAAO,KAAK,EAAE,OAAO,EAAE,MAAM,qBAAqB,CAAA;AAElD,MAAM,WAAW,oBAAoB;IACnC,+DAA+D;IAC/D,mBAAmB,CAAC,EAAE,MAAM,CAAA;IAC5B,qDAAqD;IACrD,GAAG,CAAC,EAAE,MAAM,CAAA;IACZ,iDAAiD;IACjD,WAAW,CAAC,EAAE,OAAO,CAAA;IACrB,uCAAuC;IACvC,MAAM,CAAC,EAAE,MAAM,CAAA;IACf,uCAAuC;IACvC,MAAM,CAAC,EAAE,MAAM,CAAA;CAChB;AAED,MAAM,WAAW,kBAAkB;IACjC,IAAI,EAAE,MAAM,CAAA;IACZ,MAAM,EAAE,MAAM,CAAA;IACd,OAAO,EAAE,MAAM,CAAA;IACf,aAAa,EAAE,MAAM,CAAA;IACrB,YAAY,EAAE,MAAM,CAAA;CACrB;AAED,MAAM,WAAW,sBAAsB;IACrC,KAAK,EAAE,MAAM,CAAA;IACb,QAAQ,EAAE,MAAM,CAAA;IAChB,SAAS,EAAE,MAAM,EAAE,CAAA;IACnB,UAAU,EAAE,MAAM,CAAA;IAClB,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;KACpB,CAAA;CACF;AAED;;;;;;;;;;;;;;;;;;;GAmBG;AACH,qBAAa,aAAa;IACxB,OAAO,CAAC,aAAa,CAAqB;IAC1C,OAAO,CAAC,OAAO,CAAgC;IAC/C,OAAO,CAAC,KAAK,CAIZ;IACD,OAAO,CAAC,MAAM,~~CAAkC~~;~~gBAEpC~~,OAAO,GAAE,oBAAyB;IAiB9C;;;;;OAKG;IACG,GAAG,CAAC,KAAK,EAAE,MAAM,GAAG,OAAO,CAAC,sBAAsB,GAAG,SAAS,CAAC;IAwFrE;;;;;;OAMG;IACG,GAAG,CACP,KAAK,EAAE,MAAM,EACb,QAAQ,EAAE,MAAM,EAChB,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;KACpB,GACA,OAAO,CAAC,IAAI,CAAC;IAqChB;;;;OAIG;IACH,YAAY,CAAC,QAAQ,EAAE,OAAO,EAAE,GAAG,MAAM;~~IAOzC~~;;OAEG;IACH,QAAQ,IAAI,kBAAkB;IAmB9B;;OAEG;IACH,UAAU,IAAI,IAAI;IAQlB;;;;OAIG;IACG,YAAY,IAAI,OAAO,CAAC,MAAM,CAAC;IAMrC;;;;;;;;;;;;OAYG;IACG,SAAS,CAAC,OAAO,EAAE,KAAK,CAAC;QAAE,KAAK,EAAE,MAAM,CAAC;QAAC,QAAQ,EAAE,MAAM,CAAA;KAAE,CAAC,GAAG,OAAO,CAAC,IAAI,CAAC;CAKpF;AAED;;;;;;;;;;;;;;GAcG;AACH,wBAAgB,6BAA6B,CAC3C,KAAK,EAAE,kBAAkB,EACzB,OAAO,EAAE;IACP,iBAAiB,EAAE,MAAM,CAAA;IACzB,cAAc,EAAE,MAAM,CAAA;CACvB,GACA;IACD,UAAU,EAAE,MAAM,CAAA;IAClB,cAAc,EAAE,MAAM,CAAA;IACtB,aAAa,EAAE,MAAM,CAAA;CACtB,CAUA;AAQD;;;;;;;;;GASG;AACH,wBAAgB,sBAAsB,CAAC,OAAO,CAAC,EAAE,oBAAoB,GAAG,aAAa,CAKpF;AAED;;GAEG;AACH,wBAAgB,wBAAwB,IAAI,IAAI,CAE/C"}
1	+ {"version":3,"file":"semantic-cache.d.ts","sourceRoot":"","sources":["../../src/llm/semantic-cache.ts"],"names":[],"mappings":"AAAA;;;;;;;;;;;;;;;;;;;;;;;;GAwBG;AAKH,OAAO,KAAK,EAAE,OAAO,EAAE,MAAM,qBAAqB,CAAA;AAElD,MAAM,WAAW,oBAAoB;IACnC,+DAA+D;IAC/D,mBAAmB,CAAC,EAAE,MAAM,CAAA;IAC5B,qDAAqD;IACrD,GAAG,CAAC,EAAE,MAAM,CAAA;IACZ,iDAAiD;IACjD,WAAW,CAAC,EAAE,OAAO,CAAA;IACrB,uCAAuC;IACvC,MAAM,CAAC,EAAE,MAAM,CAAA;IACf,uCAAuC;IACvC,MAAM,CAAC,EAAE,MAAM,CAAA;CAChB;AAED,MAAM,WAAW,kBAAkB;IACjC,IAAI,EAAE,MAAM,CAAA;IACZ,MAAM,EAAE,MAAM,CAAA;IACd,OAAO,EAAE,MAAM,CAAA;IACf,aAAa,EAAE,MAAM,CAAA;IACrB,YAAY,EAAE,MAAM,CAAA;CACrB;AAED,MAAM,WAAW,sBAAsB;IACrC,KAAK,EAAE,MAAM,CAAA;IACb,QAAQ,EAAE,MAAM,CAAA;IAChB,SAAS,EAAE,MAAM,EAAE,CAAA;IACnB,UAAU,EAAE,MAAM,CAAA;IAClB,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;KACpB,CAAA;CACF;AAED;;;;;;;;;;;;;;;;;;;GAmBG;AACH,qBAAa,aAAa;IACxB,OAAO,CAAC,aAAa,CAAqB;IAC1C,OAAO,CAAC,OAAO,CAAgC;IAC/C,OAAO,CAAC,KAAK,CAIZ;IACD,OAAO,CAAC,MAAM,CAA+C;gBAEjD,OAAO,GAAE,oBAAyB;IAiB9C;;;;;OAKG;IACG,GAAG,CAAC,KAAK,EAAE,MAAM,GAAG,OAAO,CAAC,sBAAsB,GAAG,SAAS,CAAC;IAwFrE;;;;;;OAMG;IACG,GAAG,CACP,KAAK,EAAE,MAAM,EACb,QAAQ,EAAE,MAAM,EAChB,KAAK,CAAC,EAAE;QACN,YAAY,EAAE,MAAM,CAAA;QACpB,gBAAgB,EAAE,MAAM,CAAA;QACxB,WAAW,EAAE,MAAM,CAAA;KACpB,GACA,OAAO,CAAC,IAAI,CAAC;IAqChB;;;;OAIG;IACH,YAAY,CAAC,QAAQ,EAAE,OAAO,EAAE,GAAG,MAAM;IAczC;;OAEG;IACH,QAAQ,IAAI,kBAAkB;IAmB9B;;OAEG;IACH,UAAU,IAAI,IAAI;IAQlB;;;;OAIG;IACG,YAAY,IAAI,OAAO,CAAC,MAAM,CAAC;IAMrC;;;;;;;;;;;;OAYG;IACG,SAAS,CAAC,OAAO,EAAE,KAAK,CAAC;QAAE,KAAK,EAAE,MAAM,CAAC;QAAC,QAAQ,EAAE,MAAM,CAAA;KAAE,CAAC,GAAG,OAAO,CAAC,IAAI,CAAC;CAKpF;AAED;;;;;;;;;;;;;;GAcG;AACH,wBAAgB,6BAA6B,CAC3C,KAAK,EAAE,kBAAkB,EACzB,OAAO,EAAE;IACP,iBAAiB,EAAE,MAAM,CAAA;IACzB,cAAc,EAAE,MAAM,CAAA;CACvB,GACA;IACD,UAAU,EAAE,MAAM,CAAA;IAClB,cAAc,EAAE,MAAM,CAAA;IACtB,aAAa,EAAE,MAAM,CAAA;CACtB,CAUA;AAQD;;;;;;;;;GASG;AACH,wBAAgB,sBAAsB,CAAC,OAAO,CAAC,EAAE,oBAAoB,GAAG,aAAa,CAKpF;AAED;;GAEG;AACH,wBAAgB,wBAAwB,IAAI,IAAI,CAE/C"}

package/dist/llm/semantic-cache.js CHANGED Viewed

@@ -24,7 +24,7 @@
  * @see https://redis.io/blog/what-is-semantic-caching/
  */
 import { generateEmbedding } from '../embeddings/index.js';
-import { createLogger } from '../memory/utils/logger.js';
+import { createLogger } from '@revealui/core/observability/logger';
 import { VectorMemoryService } from '../memory/vector/vector-memory-service.js';
 /**
  * Semantic cache that uses vector similarity for intelligent caching
@@ -50,7 +50,7 @@ export class SemanticCache {
     vectorService;
     options;
     stats;
-    logger = createLogger('[SemanticCache]');
+    logger = createLogger({ component: 'SemanticCache' });
     constructor(options = {}) {
         this.vectorService = new VectorMemoryService();
         this.options = {
@@ -134,7 +134,7 @@ export class SemanticCache {
         }
         catch (error) {
             // Fail gracefully - return undefined on error
-            this.logger.error('Semantic cache error:', error);
+            this.logger.error('Semantic cache error', error instanceof Error ? error : new Error(String(error)));
             if (this.options.enableStats) {
                 this.stats.misses++;
             }
@@ -181,7 +181,7 @@ export class SemanticCache {
         }
         catch (error) {
             // Fail gracefully - log error but don't throw
-            this.logger.error('Failed to store in semantic cache:', error);
+            this.logger.error('Failed to store in semantic cache', error instanceof Error ? error : new Error(String(error)));
         }
     }
     /**
@@ -192,7 +192,15 @@ export class SemanticCache {
     extractQuery(messages) {
         return messages
             .filter((m) => m.role === 'user')
-            .map((m) => m.content)
+            .map((m) => {
+            if (typeof m.content === 'string')
+                return m.content;
+            // Multipart: extract text parts only for cache key generation
+            return m.content
+                .filter((p) => p.type === 'text')
+                .map((p) => p.text)
+                .join(' ');
+        })
             .join(' ');
     }
     /**

package/dist/llm/server.d.ts CHANGED Viewed

@@ -7,7 +7,9 @@
 export * from './client.js';
 export * from './providers/anthropic.js';
 export * from './providers/base.js';
+export * from './providers/bitnet.js';
 export * from './providers/groq.js';
+export * from './providers/inference-snaps.js';
 export * from './providers/ollama.js';
 export * from './providers/openai.js';
 export * from './providers/vultr.js';