npm - @xdarkicex/openclaw-memory-libravdb - Versions diffs - 1.3.5 - Mend

@xdarkicex/openclaw-memory-libravdb 1.3.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (80) hide show

package/README.md +46 -0
package/docs/README.md +14 -0
package/docs/architecture-decisions/README.md +6 -0
package/docs/architecture-decisions/adr-001-onnx-over-ollama.md +21 -0
package/docs/architecture-decisions/adr-002-libravdb-over-lancedb.md +19 -0
package/docs/architecture-decisions/adr-003-convex-gating-over-threshold.md +27 -0
package/docs/architecture-decisions/adr-004-sidecar-over-native-ts.md +21 -0
package/docs/architecture.md +188 -0
package/docs/contributing.md +76 -0
package/docs/dependencies.md +38 -0
package/docs/embedding-profiles.md +42 -0
package/docs/gating.md +329 -0
package/docs/implementation.md +381 -0
package/docs/installation.md +272 -0
package/docs/mathematics.md +695 -0
package/docs/models.md +63 -0
package/docs/problem.md +64 -0
package/docs/security.md +86 -0
package/openclaw.plugin.json +84 -0
package/package.json +41 -0
package/scripts/build-sidecar.sh +30 -0
package/scripts/postinstall.js +169 -0
package/scripts/setup.sh +20 -0
package/scripts/setup.ts +505 -0
package/scripts/sidecar-release.d.ts +4 -0
package/scripts/sidecar-release.js +17 -0
package/sidecar/cmd/inspect_onnx/main.go +105 -0
package/sidecar/compact/gate.go +273 -0
package/sidecar/compact/gate_test.go +85 -0
package/sidecar/compact/summarize.go +345 -0
package/sidecar/compact/summarize_test.go +319 -0
package/sidecar/compact/tokens.go +11 -0
package/sidecar/config/config.go +119 -0
package/sidecar/config/config_test.go +75 -0
package/sidecar/embed/engine.go +696 -0
package/sidecar/embed/engine_test.go +349 -0
package/sidecar/embed/matryoshka.go +93 -0
package/sidecar/embed/matryoshka_test.go +150 -0
package/sidecar/embed/onnx_local.go +319 -0
package/sidecar/embed/onnx_local_test.go +159 -0
package/sidecar/embed/profile_contract_test.go +71 -0
package/sidecar/embed/profile_eval_test.go +923 -0
package/sidecar/embed/profiles.go +39 -0
package/sidecar/go.mod +21 -0
package/sidecar/go.sum +30 -0
package/sidecar/health/check.go +33 -0
package/sidecar/health/check_test.go +55 -0
package/sidecar/main.go +151 -0
package/sidecar/model/encoder.go +222 -0
package/sidecar/model/registry.go +262 -0
package/sidecar/model/registry_test.go +102 -0
package/sidecar/model/seq2seq.go +133 -0
package/sidecar/server/rpc.go +343 -0
package/sidecar/server/rpc_test.go +350 -0
package/sidecar/server/transport.go +160 -0
package/sidecar/store/libravdb.go +676 -0
package/sidecar/store/libravdb_test.go +472 -0
package/sidecar/summarize/engine.go +360 -0
package/sidecar/summarize/engine_test.go +148 -0
package/sidecar/summarize/onnx_local.go +494 -0
package/sidecar/summarize/onnx_local_test.go +48 -0
package/sidecar/summarize/profiles.go +52 -0
package/sidecar/summarize/tokenizer.go +13 -0
package/sidecar/summarize/tokenizer_hf.go +76 -0
package/sidecar/summarize/util.go +13 -0
package/src/cli.ts +205 -0
package/src/context-engine.ts +195 -0
package/src/index.ts +27 -0
package/src/memory-provider.ts +24 -0
package/src/openclaw-plugin-sdk.d.ts +53 -0
package/src/plugin-runtime.ts +67 -0
package/src/recall-cache.ts +34 -0
package/src/recall-utils.ts +22 -0
package/src/rpc.ts +84 -0
package/src/scoring.ts +58 -0
package/src/sidecar.ts +506 -0
package/src/tokens.ts +36 -0
package/src/types.ts +146 -0
package/tsconfig.json +20 -0
package/tsconfig.tests.json +12 -0

package/sidecar/compact/summarize_test.go ADDED Viewed

@@ -0,0 +1,319 @@
+package compact
+import (
+	"bytes"
+	"context"
+	"errors"
+	"log"
+	"testing"
+	"github.com/xDarkicex/openclaw-memory-libravdb/sidecar/store"
+	"github.com/xDarkicex/openclaw-memory-libravdb/sidecar/summarize"
+)
+type fakeStore struct {
+	results       []store.SearchResult
+	insertCalls   []insertCall
+	deleteCalls   []deleteCall
+	deleteErr     error
+	listErr       error
+	insertErr     error
+}
+type insertCall struct {
+	collection string
+	id         string
+	text       string
+	meta       map[string]any
+}
+type deleteCall struct {
+	collection string
+	ids        []string
+}
+type fakeSummarizer struct {
+	summaries []summarize.Summary
+	err       error
+	calls     [][]summarize.Turn
+	mode      string
+}
+func (f *fakeStore) ListByMeta(_ context.Context, collection, key, value string) ([]store.SearchResult, error) {
+	if f.listErr != nil {
+		return nil, f.listErr
+	}
+	return append([]store.SearchResult(nil), f.results...), nil
+}
+func (f *fakeStore) InsertText(_ context.Context, collection, id, text string, meta map[string]any) error {
+	if f.insertErr != nil {
+		return f.insertErr
+	}
+	f.insertCalls = append(f.insertCalls, insertCall{
+		collection: collection,
+		id:         id,
+		text:       text,
+		meta:       cloneMeta(meta),
+	})
+	return nil
+}
+func (f *fakeStore) DeleteBatch(_ context.Context, collection string, ids []string) error {
+	f.deleteCalls = append(f.deleteCalls, deleteCall{
+		collection: collection,
+		ids:        append([]string(nil), ids...),
+	})
+	return f.deleteErr
+}
+func (f *fakeSummarizer) Summarize(_ context.Context, turns []summarize.Turn, _ summarize.SummaryOpts) (summarize.Summary, error) {
+	f.calls = append(f.calls, append([]summarize.Turn(nil), turns...))
+	if f.err != nil {
+		return summarize.Summary{}, f.err
+	}
+	index := len(f.calls) - 1
+	if index < len(f.summaries) {
+		return f.summaries[index], nil
+	}
+	sourceIDs := make([]string, 0, len(turns))
+	for _, turn := range turns {
+		sourceIDs = append(sourceIDs, turn.ID)
+	}
+	return summarize.Summary{
+		Text:       "summary",
+		SourceIDs:  sourceIDs,
+		Method:     "extractive",
+		TokenCount: 3,
+		Confidence: 0.8,
+	}, nil
+}
+func (f *fakeSummarizer) Profile() summarize.Profile               { return summarize.Profile{Backend: "extractive"} }
+func (f *fakeSummarizer) Warmup(context.Context) error             { return nil }
+func (f *fakeSummarizer) Unload()                                  {}
+func (f *fakeSummarizer) Close() error                             { return nil }
+func (f *fakeSummarizer) Ready() bool                              { return true }
+func (f *fakeSummarizer) Reason() string                           { return "" }
+func (f *fakeSummarizer) Mode() string {
+	if f.mode != "" {
+		return f.mode
+	}
+	return "extractive"
+}
+func TestCompactSessionSkipsBelowThresholdWithoutForce(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "a", Text: "alpha", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10)}},
+			{ID: "b", Text: "beta", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20)}},
+		},
+	}
+	sum := &fakeSummarizer{}
+	got, err := CompactSession(context.Background(), st, sum, nil, "s1", false, 20)
+	if err != nil {
+		t.Fatalf("CompactSession() error = %v", err)
+	}
+	if got.DidCompact {
+		t.Fatalf("expected no compaction below threshold, got %+v", got)
+	}
+	if len(sum.calls) != 0 || len(st.insertCalls) != 0 || len(st.deleteCalls) != 0 {
+		t.Fatalf("expected no summarizer/store writes, got calls=%d inserts=%d deletes=%d", len(sum.calls), len(st.insertCalls), len(st.deleteCalls))
+	}
+}
+func TestCompactSessionPartitionsDeterministicallyByTimestamp(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "c", Text: "third", Metadata: map[string]any{"sessionId": "s1", "ts": int64(30)}},
+			{ID: "a", Text: "first", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10)}},
+			{ID: "d", Text: "fourth", Metadata: map[string]any{"sessionId": "s1", "ts": int64(40)}},
+			{ID: "b", Text: "second", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20)}},
+		},
+	}
+	sum := &fakeSummarizer{
+		summaries: []summarize.Summary{
+			{Text: "summary-1", SourceIDs: []string{"a", "b"}, Method: "extractive", TokenCount: 2, Confidence: 0.6},
+			{Text: "summary-2", SourceIDs: []string{"c", "d"}, Method: "extractive", TokenCount: 2, Confidence: 0.8},
+		},
+	}
+	got, err := CompactSession(context.Background(), st, sum, nil, "s1", true, 2)
+	if err != nil {
+		t.Fatalf("CompactSession() error = %v", err)
+	}
+	if !got.DidCompact || got.ClustersFormed != 2 || got.TurnsRemoved != 4 {
+		t.Fatalf("unexpected result: %+v", got)
+	}
+	if got.SummaryMethod != "extractive" {
+		t.Fatalf("unexpected summary method: %+v", got)
+	}
+	if got.MeanConfidence != 0.7 {
+		t.Fatalf("expected mean confidence 0.7, got %f", got.MeanConfidence)
+	}
+	if len(sum.calls) != 2 {
+		t.Fatalf("expected 2 summarize calls, got %d", len(sum.calls))
+	}
+	assertTurnIDs(t, sum.calls[0], []string{"a", "b"})
+	assertTurnIDs(t, sum.calls[1], []string{"c", "d"})
+}
+func TestCompactSessionInsertsBeforeDeleteAndPreservesDataOnDeleteFailure(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "a", Text: "alpha", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10), "userId": "u1"}},
+			{ID: "b", Text: "beta", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20), "userId": "u1"}},
+		},
+		deleteErr: errors.New("boom"),
+	}
+	sum := &fakeSummarizer{
+		summaries: []summarize.Summary{
+			{Text: "summary-1", SourceIDs: []string{"a", "b"}, Method: "extractive", TokenCount: 5, Confidence: 0.75},
+		},
+	}
+	got, err := CompactSession(context.Background(), st, sum, nil, "s1", true, 20)
+	if err != nil {
+		t.Fatalf("CompactSession() error = %v", err)
+	}
+	if len(st.insertCalls) != 1 {
+		t.Fatalf("expected summary insert before delete, got %d insert calls", len(st.insertCalls))
+	}
+	if len(st.deleteCalls) != 1 {
+		t.Fatalf("expected delete attempt after insert, got %d delete calls", len(st.deleteCalls))
+	}
+	if got.TurnsRemoved != 0 {
+		t.Fatalf("expected no removed turns when delete fails, got %+v", got)
+	}
+	meta := st.insertCalls[0].meta
+	if meta["type"] != "summary" {
+		t.Fatalf("expected summary metadata type, got %+v", meta)
+	}
+	if meta["method"] != "extractive" {
+		t.Fatalf("expected method metadata, got %+v", meta)
+	}
+	if meta["confidence"] != 0.75 {
+		t.Fatalf("expected confidence metadata, got %+v", meta)
+	}
+	if meta["decay_rate"] != 0.25 {
+		t.Fatalf("expected decay rate metadata, got %+v", meta)
+	}
+	if meta["userId"] != "u1" {
+		t.Fatalf("expected userId carried forward, got %+v", meta)
+	}
+	sourceIDs, ok := meta["source_ids"].([]string)
+	if !ok {
+		t.Fatalf("expected source_ids to be []string, got %T", meta["source_ids"])
+	}
+	if len(sourceIDs) != 2 || sourceIDs[0] != "a" || sourceIDs[1] != "b" {
+		t.Fatalf("unexpected source_ids: %+v", sourceIDs)
+	}
+}
+func TestCompactSessionPreservesSourceTurnsWhenInsertFails(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "a", Text: "alpha", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10)}},
+			{ID: "b", Text: "beta", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20)}},
+		},
+		insertErr: errors.New("insert failed"),
+	}
+	sum := &fakeSummarizer{}
+	_, err := CompactSession(context.Background(), st, sum, nil, "s1", true, 20)
+	if err == nil {
+		t.Fatalf("expected insert failure")
+	}
+	if len(st.deleteCalls) != 0 {
+		t.Fatalf("expected no delete call when insert fails, got %d", len(st.deleteCalls))
+	}
+}
+func TestCompactSessionRoutesHighGatingClustersToAbstractive(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "a", Text: "alpha", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10), "gating_score": 0.8}},
+			{ID: "b", Text: "beta", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20), "gating_score": 0.7}},
+		},
+	}
+	extractive := &fakeSummarizer{
+		summaries: []summarize.Summary{{Text: "extractive-summary", Method: "extractive", TokenCount: 2, Confidence: 0.5}},
+		mode:      "extractive",
+	}
+	abstractive := &fakeSummarizer{
+		summaries: []summarize.Summary{{Text: "abstractive-summary", Method: "onnx-t5", TokenCount: 3, Confidence: 0.9}},
+		mode:      "onnx-local",
+	}
+	got, err := CompactSession(context.Background(), st, extractive, abstractive, "s1", true, 20)
+	if err != nil {
+		t.Fatalf("CompactSession() error = %v", err)
+	}
+	if !got.DidCompact {
+		t.Fatalf("expected compaction, got %+v", got)
+	}
+	if len(abstractive.calls) != 1 {
+		t.Fatalf("expected abstractive summarizer to be used, got %d calls", len(abstractive.calls))
+	}
+	if len(extractive.calls) != 0 {
+		t.Fatalf("expected extractive summarizer to be skipped, got %d calls", len(extractive.calls))
+	}
+	if got.SummaryMethod != "onnx-t5" {
+		t.Fatalf("expected onnx-t5 method, got %+v", got)
+	}
+}
+func TestCompactSessionRoutesMissingGatingScoreToExtractiveAndLogsDecision(t *testing.T) {
+	st := &fakeStore{
+		results: []store.SearchResult{
+			{ID: "a", Text: "alpha", Metadata: map[string]any{"sessionId": "s1", "ts": int64(10)}},
+			{ID: "b", Text: "beta", Metadata: map[string]any{"sessionId": "s1", "ts": int64(20)}},
+		},
+	}
+	extractive := &fakeSummarizer{
+		summaries: []summarize.Summary{{Text: "extractive-summary", Method: "extractive", TokenCount: 2, Confidence: 0.5}},
+		mode:      "extractive",
+	}
+	abstractive := &fakeSummarizer{
+		summaries: []summarize.Summary{{Text: "abstractive-summary", Method: "onnx-t5", TokenCount: 3, Confidence: 0.9}},
+		mode:      "onnx-local",
+	}
+	var buf bytes.Buffer
+	prevWriter := log.Writer()
+	log.SetOutput(&buf)
+	defer log.SetOutput(prevWriter)
+	got, err := CompactSession(context.Background(), st, extractive, abstractive, "s1", true, 20)
+	if err != nil {
+		t.Fatalf("CompactSession() error = %v", err)
+	}
+	if !got.DidCompact {
+		t.Fatalf("expected compaction, got %+v", got)
+	}
+	if len(extractive.calls) != 1 {
+		t.Fatalf("expected extractive summarizer to be used, got %d calls", len(extractive.calls))
+	}
+	if len(abstractive.calls) != 0 {
+		t.Fatalf("expected abstractive summarizer to be skipped, got %d calls", len(abstractive.calls))
+	}
+	logged := buf.String()
+	if !bytes.Contains([]byte(logged), []byte("cluster_id=0")) || !bytes.Contains([]byte(logged), []byte("mean_gating_score=0.000")) || !bytes.Contains([]byte(logged), []byte("summarizer_used=extractive")) {
+		t.Fatalf("expected routing telemetry log, got %q", logged)
+	}
+}
+func assertTurnIDs(t *testing.T, turns []summarize.Turn, want []string) {
+	t.Helper()
+	if len(turns) != len(want) {
+		t.Fatalf("unexpected turns length: got %d want %d", len(turns), len(want))
+	}
+	for i, turn := range turns {
+		if turn.ID != want[i] {
+			t.Fatalf("unexpected turn order at %d: got %q want %q", i, turn.ID, want[i])
+		}
+	}
+}

package/sidecar/compact/tokens.go ADDED Viewed

@@ -0,0 +1,11 @@
+package compact
+// EstimateTokens returns a stable token count approximation.
+// Contract: one token is approximated as four bytes of UTF-8 text.
+func EstimateTokens(t string) int {
+	n := len(t) / 4
+	if n < 1 {
+		return 1
+	}
+	return n
+}

package/sidecar/config/config.go ADDED Viewed

@@ -0,0 +1,119 @@
+package config
+import (
+	"os"
+	"os/user"
+	"path/filepath"
+	"strconv"
+	"strings"
+)
+type Config struct {
+	DBPath                  string
+	ONNXRuntimePath         string
+	EmbeddingBackend        string
+	EmbeddingProfile        string
+	FallbackProfile         string
+	EmbeddingModelPath      string
+	EmbeddingTokenizerPath  string
+	EmbeddingDimensions     int
+	EmbeddingNormalize      bool
+	SummarizerBackend       string
+	SummarizerProfile       string
+	SummarizerRuntimePath   string
+	SummarizerModelPath     string
+	SummarizerTokenizerPath string
+	SummarizerModel         string
+	SummarizerEndpoint      string
+	GatingW1c               float64
+	GatingW2c               float64
+	GatingW3c               float64
+	GatingW1t               float64
+	GatingW2t               float64
+	GatingW3t               float64
+	GatingTechNorm          float64
+	GatingThreshold         float64
+	GatingCentroidK         int
+}
+func FromEnv() Config {
+	return Config{
+		DBPath:                  envOrDefault("LIBRAVDB_DB_PATH", defaultDBPath()),
+		ONNXRuntimePath:         os.Getenv("LIBRAVDB_ONNX_RUNTIME"),
+		EmbeddingBackend:        envOrDefault("LIBRAVDB_EMBEDDING_BACKEND", "bundled"),
+		EmbeddingProfile:        envOrDefault("LIBRAVDB_EMBEDDING_PROFILE", "nomic-embed-text-v1.5"),
+		FallbackProfile:         envOrDefault("LIBRAVDB_FALLBACK_PROFILE", "all-minilm-l6-v2"),
+		EmbeddingModelPath:      os.Getenv("LIBRAVDB_EMBEDDING_MODEL"),
+		EmbeddingTokenizerPath:  os.Getenv("LIBRAVDB_EMBEDDING_TOKENIZER"),
+		EmbeddingDimensions:     envIntOrDefault("LIBRAVDB_EMBEDDING_DIMENSIONS", 0),
+		EmbeddingNormalize:      envBoolOrDefault("LIBRAVDB_EMBEDDING_NORMALIZE", true),
+		SummarizerBackend:       envOrDefault("LIBRAVDB_SUMMARIZER_BACKEND", "bundled"),
+		SummarizerProfile:       strings.TrimSpace(os.Getenv("LIBRAVDB_SUMMARIZER_PROFILE")),
+		SummarizerRuntimePath:   os.Getenv("LIBRAVDB_SUMMARIZER_RUNTIME"),
+		SummarizerModelPath:     os.Getenv("LIBRAVDB_SUMMARIZER_MODEL_PATH"),
+		SummarizerTokenizerPath: os.Getenv("LIBRAVDB_SUMMARIZER_TOKENIZER"),
+		SummarizerModel:         os.Getenv("LIBRAVDB_SUMMARIZER_MODEL"),
+		SummarizerEndpoint:      os.Getenv("LIBRAVDB_SUMMARIZER_ENDPOINT"),
+		GatingW1c:               envFloatOrDefault("LIBRAVDB_GATING_W1C", 0.35),
+		GatingW2c:               envFloatOrDefault("LIBRAVDB_GATING_W2C", 0.40),
+		GatingW3c:               envFloatOrDefault("LIBRAVDB_GATING_W3C", 0.25),
+		GatingW1t:               envFloatOrDefault("LIBRAVDB_GATING_W1T", 0.40),
+		GatingW2t:               envFloatOrDefault("LIBRAVDB_GATING_W2T", 0.35),
+		GatingW3t:               envFloatOrDefault("LIBRAVDB_GATING_W3T", 0.25),
+		GatingTechNorm:          envFloatOrDefault("LIBRAVDB_GATING_TECH_NORM", 1.5),
+		GatingThreshold:         envFloatOrDefault("LIBRAVDB_GATING_THRESHOLD", 0.35),
+		GatingCentroidK:         envIntOrDefault("LIBRAVDB_GATING_CENTROID_K", 10),
+	}
+}
+func envOrDefault(key, fallback string) string {
+	value := strings.TrimSpace(os.Getenv(key))
+	if value == "" {
+		return fallback
+	}
+	return value
+}
+func envIntOrDefault(key string, fallback int) int {
+	raw := strings.TrimSpace(os.Getenv(key))
+	if raw == "" {
+		return fallback
+	}
+	value, err := strconv.Atoi(raw)
+	if err != nil || value <= 0 {
+		return fallback
+	}
+	return value
+}
+func envBoolOrDefault(key string, fallback bool) bool {
+	raw := strings.TrimSpace(os.Getenv(key))
+	if raw == "" {
+		return fallback
+	}
+	value, err := strconv.ParseBool(raw)
+	if err != nil {
+		return fallback
+	}
+	return value
+}
+func envFloatOrDefault(key string, fallback float64) float64 {
+	raw := strings.TrimSpace(os.Getenv(key))
+	if raw == "" {
+		return fallback
+	}
+	value, err := strconv.ParseFloat(raw, 64)
+	if err != nil {
+		return fallback
+	}
+	return value
+}
+func defaultDBPath() string {
+	currentUser, err := user.Current()
+	if err != nil || strings.TrimSpace(currentUser.HomeDir) == "" {
+		return "./libravdb-data"
+	}
+	return filepath.Join(currentUser.HomeDir, ".clawdb", "data")
+}

package/sidecar/config/config_test.go ADDED Viewed

@@ -0,0 +1,75 @@
+package config
+import "testing"
+func TestFromEnvDefaults(t *testing.T) {
+	t.Setenv("LIBRAVDB_DB_PATH", "")
+	t.Setenv("LIBRAVDB_ONNX_RUNTIME", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_BACKEND", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_PROFILE", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_MODEL", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_TOKENIZER", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_DIMENSIONS", "")
+	t.Setenv("LIBRAVDB_EMBEDDING_NORMALIZE", "")
+	cfg := FromEnv()
+	if cfg.DBPath == "" {
+		t.Fatalf("expected non-empty default db path")
+	}
+	if cfg.EmbeddingBackend != "bundled" {
+		t.Fatalf("expected bundled backend, got %q", cfg.EmbeddingBackend)
+	}
+	if cfg.EmbeddingProfile != "nomic-embed-text-v1.5" {
+		t.Fatalf("expected Nomic default profile, got %q", cfg.EmbeddingProfile)
+	}
+	if cfg.FallbackProfile != "all-minilm-l6-v2" {
+		t.Fatalf("expected MiniLM fallback profile, got %q", cfg.FallbackProfile)
+	}
+	if cfg.EmbeddingDimensions != 0 {
+		t.Fatalf("expected unspecified dimensions to default to 0, got %d", cfg.EmbeddingDimensions)
+	}
+	if !cfg.EmbeddingNormalize {
+		t.Fatalf("expected normalize=true by default")
+	}
+}
+func TestFromEnvReadsPowerUserEmbeddingSettings(t *testing.T) {
+	t.Setenv("LIBRAVDB_DB_PATH", "/tmp/libravdb")
+	t.Setenv("LIBRAVDB_ONNX_RUNTIME", "/opt/onnx/libonnxruntime.so")
+	t.Setenv("LIBRAVDB_EMBEDDING_BACKEND", "custom-local")
+	t.Setenv("LIBRAVDB_EMBEDDING_PROFILE", "nomic-embed-text-v1.5")
+	t.Setenv("LIBRAVDB_FALLBACK_PROFILE", "all-minilm-l6-v2")
+	t.Setenv("LIBRAVDB_EMBEDDING_MODEL", "/models/custom.onnx")
+	t.Setenv("LIBRAVDB_EMBEDDING_TOKENIZER", "/models/tokenizer.json")
+	t.Setenv("LIBRAVDB_EMBEDDING_DIMENSIONS", "768")
+	t.Setenv("LIBRAVDB_EMBEDDING_NORMALIZE", "false")
+	cfg := FromEnv()
+	if cfg.DBPath != "/tmp/libravdb" {
+		t.Fatalf("unexpected db path %q", cfg.DBPath)
+	}
+	if cfg.ONNXRuntimePath != "/opt/onnx/libonnxruntime.so" {
+		t.Fatalf("unexpected runtime path %q", cfg.ONNXRuntimePath)
+	}
+	if cfg.EmbeddingBackend != "custom-local" {
+		t.Fatalf("unexpected backend %q", cfg.EmbeddingBackend)
+	}
+	if cfg.EmbeddingProfile != "nomic-embed-text-v1.5" {
+		t.Fatalf("unexpected profile %q", cfg.EmbeddingProfile)
+	}
+	if cfg.FallbackProfile != "all-minilm-l6-v2" {
+		t.Fatalf("unexpected fallback profile %q", cfg.FallbackProfile)
+	}
+	if cfg.EmbeddingModelPath != "/models/custom.onnx" {
+		t.Fatalf("unexpected model path %q", cfg.EmbeddingModelPath)
+	}
+	if cfg.EmbeddingTokenizerPath != "/models/tokenizer.json" {
+		t.Fatalf("unexpected tokenizer path %q", cfg.EmbeddingTokenizerPath)
+	}
+	if cfg.EmbeddingDimensions != 768 {
+		t.Fatalf("unexpected dimensions %d", cfg.EmbeddingDimensions)
+	}
+	if cfg.EmbeddingNormalize {
+		t.Fatalf("expected normalize=false")
+	}
+}