npm - superlocalmemory - Versions diffs - 3.2.1 → 3.2.2 - Mend

superlocalmemory 3.2.1 → 3.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

package/CHANGELOG.md +23 -1
package/README.md +61 -1
package/package.json +1 -1
package/pyproject.toml +26 -1
package/src/superlocalmemory/attribution/signer.py +6 -1
package/src/superlocalmemory/core/config.py +114 -1
package/src/superlocalmemory/core/consolidation_engine.py +595 -0
package/src/superlocalmemory/core/embeddings.py +0 -1
package/src/superlocalmemory/core/engine.py +164 -674
package/src/superlocalmemory/core/engine_wiring.py +474 -0
package/src/superlocalmemory/core/graph_analyzer.py +199 -0
package/src/superlocalmemory/core/recall_pipeline.py +247 -0
package/src/superlocalmemory/core/store_pipeline.py +483 -0
package/src/superlocalmemory/core/worker_pool.py +35 -12
package/src/superlocalmemory/encoding/auto_linker.py +308 -0
package/src/superlocalmemory/encoding/context_generator.py +175 -0
package/src/superlocalmemory/encoding/temporal_validator.py +513 -0
package/src/superlocalmemory/hooks/auto_invoker.py +484 -0
package/src/superlocalmemory/retrieval/channel_registry.py +154 -0
package/src/superlocalmemory/retrieval/engine.py +12 -0
package/src/superlocalmemory/retrieval/semantic_channel.py +87 -3
package/src/superlocalmemory/retrieval/spreading_activation.py +311 -0
package/src/superlocalmemory/retrieval/strategy.py +6 -6
package/src/superlocalmemory/retrieval/vector_store.py +386 -0
package/src/superlocalmemory/server/routes/v3_api.py +576 -0
package/src/superlocalmemory/storage/access_log.py +169 -0
package/src/superlocalmemory/storage/database.py +288 -0
package/src/superlocalmemory/storage/schema.py +10 -0
package/src/superlocalmemory/storage/schema_v32.py +252 -0
package/src/superlocalmemory/storage/v2_migrator.py +24 -2

package/src/superlocalmemory/core/store_pipeline.py ADDED Viewed

@@ -0,0 +1,483 @@
+# Copyright (c) 2026 Varun Pratap Bhardwaj / Qualixar
+# Licensed under the MIT License - see LICENSE file
+# Part of SuperLocalMemory V3 | https://qualixar.com | https://varunpratap.com
+"""Store pipeline — extracted free functions for MemoryEngine.store().
+Direction: engine.py imports this module. This module NEVER imports engine.py.
+Part of Qualixar | Author: Varun Pratap Bhardwaj
+"""
+from __future__ import annotations
+import logging
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    from superlocalmemory.core.config import SLMConfig
+    from superlocalmemory.core.hooks import HookRegistry
+    from superlocalmemory.storage.database import DatabaseManager
+from superlocalmemory.storage.models import (
+    AtomicFact, FactType, MemoryRecord,
+)
+logger = logging.getLogger(__name__)
+# ---------------------------------------------------------------------------
+# enrich_fact  (was MemoryEngine._enrich_fact)
+# ---------------------------------------------------------------------------
+def enrich_fact(
+    fact: AtomicFact,
+    record: MemoryRecord,
+    profile_id: str,
+    *,
+    embedder: Any,
+    entity_resolver: Any,
+    temporal_parser: Any,
+) -> AtomicFact:
+    """Enrich fact with embeddings, entities, temporal, emotional data."""
+    from superlocalmemory.encoding.emotional import tag_emotion, emotional_importance_boost
+    from superlocalmemory.encoding.signal_inference import infer_signal
+    embedding = embedder.embed(fact.content) if embedder else None
+    fisher_mean, fisher_variance = (None, None)
+    if embedder and embedding:
+        fisher_mean, fisher_variance = embedder.compute_fisher_params(embedding)
+    canonical = {}
+    if entity_resolver and fact.entities:
+        canonical = entity_resolver.resolve(fact.entities, profile_id)
+    temporal = {}
+    if temporal_parser:
+        temporal = temporal_parser.extract_dates_from_text(fact.content)
+    emotion = tag_emotion(fact.content)
+    signal = infer_signal(fact.content)
+    return AtomicFact(
+        fact_id=fact.fact_id, memory_id=record.memory_id,
+        profile_id=profile_id, content=fact.content,
+        fact_type=fact.fact_type, entities=fact.entities,
+        canonical_entities=list(canonical.values()),
+        observation_date=fact.observation_date or record.session_date,
+        referenced_date=fact.referenced_date or temporal.get("referenced_date"),
+        interval_start=fact.interval_start or temporal.get("interval_start"),
+        interval_end=fact.interval_end or temporal.get("interval_end"),
+        confidence=fact.confidence,
+        importance=min(1.0, fact.importance + emotional_importance_boost(emotion)),
+        evidence_count=fact.evidence_count,
+        source_turn_ids=fact.source_turn_ids, session_id=record.session_id,
+        embedding=embedding, fisher_mean=fisher_mean, fisher_variance=fisher_variance,
+        emotional_valence=emotion.valence, emotional_arousal=emotion.arousal,
+        signal_type=signal, created_at=fact.created_at,
+    )
+# ---------------------------------------------------------------------------
+# run_store  (was MemoryEngine.store)
+# ---------------------------------------------------------------------------
+def run_store(
+    content: str,
+    profile_id: str,
+    session_id: str = "",
+    session_date: str | None = None,
+    speaker: str = "",
+    role: str = "user",
+    metadata: dict[str, Any] | None = None,
+    *,
+    config: SLMConfig,
+    db: DatabaseManager,
+    embedder: Any,
+    fact_extractor: Any,
+    entity_resolver: Any,
+    temporal_parser: Any,
+    type_router: Any,
+    graph_builder: Any,
+    consolidator: Any,
+    observation_builder: Any,
+    scene_builder: Any,
+    entropy_gate: Any,
+    ann_index: Any,
+    sheaf_checker: Any,
+    retrieval_engine: Any,
+    provenance: Any,
+    hooks: HookRegistry,
+    vector_store: Any = None,
+    temporal_validator: Any = None,
+    auto_linker: Any = None,
+    context_generator: Any = None,
+    consolidation_engine: Any = None,
+) -> list[str]:
+    """Store content and extract structured facts. Returns fact_ids."""
+    # Pre-operation hooks (trust gate, ABAC, rate limiter)
+    hook_ctx = {
+        "operation": "store",
+        "agent_id": metadata.get("agent_id", "unknown") if metadata else "unknown",
+        "profile_id": profile_id,
+        "content_preview": content[:100],
+    }
+    hooks.run_pre("store", hook_ctx)
+    if entropy_gate and not entropy_gate.should_pass(content):
+        return []
+    from superlocalmemory.encoding.temporal_parser import TemporalParser
+    parser = temporal_parser or TemporalParser()
+    parsed_date = parser.parse_session_date(session_date) if session_date else None
+    record = MemoryRecord(
+        profile_id=profile_id, content=content,
+        session_id=session_id, speaker=speaker, role=role,
+        session_date=parsed_date, metadata=metadata or {},
+    )
+    db.store_memory(record)
+    facts = fact_extractor.extract_facts(
+        turns=[content], session_id=session_id,
+        session_date=parsed_date, speaker_a=speaker,
+    )
+    if not facts:
+        return []
+    if type_router:
+        facts = type_router.route_facts(facts)
+    stored_ids: list[str] = []
+    for fact in facts:
+        fact = enrich_fact(
+            fact, record, profile_id,
+            embedder=embedder,
+            entity_resolver=entity_resolver,
+            temporal_parser=temporal_parser,
+        )
+        if consolidator:
+            action = consolidator.consolidate(fact, profile_id)
+            if action.action_type.value == "noop":
+                continue
+            # Opinion confidence tracking: reinforce or decay
+            if fact.fact_type == FactType.OPINION and action.action_type.value == "update":
+                try:
+                    existing = db.get_fact(action.new_fact_id)
+                    if existing and existing.fact_type == FactType.OPINION:
+                        new_conf = min(1.0, existing.confidence + 0.1)
+                        db.update_fact(action.new_fact_id, {"confidence": new_conf})
+                except Exception:
+                    pass
+            elif fact.fact_type == FactType.OPINION and action.action_type.value == "supersede":
+                try:
+                    old_id = getattr(action, "old_fact_id", None)
+                    if old_id:
+                        old_fact = db.get_fact(old_id)
+                        if old_fact:
+                            new_conf = max(0.0, old_fact.confidence - 0.2)
+                            db.update_fact(old_id, {"confidence": new_conf})
+                except Exception:
+                    pass
+            if action.action_type.value in ("update", "supersede"):
+                updated_fact = db.get_fact(action.new_fact_id)
+                if updated_fact:
+                    if graph_builder:
+                        graph_builder.build_edges(updated_fact, profile_id)
+                    if observation_builder:
+                        for eid in updated_fact.canonical_entities:
+                            observation_builder.update_profile(
+                                eid, updated_fact, profile_id,
+                            )
+                stored_ids.append(action.new_fact_id)
+                continue
+            # ADD case: consolidator already stored the fact (F8 fix)
+            # Fall through to post-processing below
+        else:
+            db.store_fact(fact)
+        stored_ids.append(fact.fact_id)
+        if fact.embedding and ann_index:
+            ann_index.add(fact.fact_id, fact.embedding)
+        # V3.2: VectorStore upsert (sqlite-vec) -- dual-write (Rule 12)
+        if fact.embedding and vector_store and vector_store.available:
+            vector_store.upsert(
+                fact_id=fact.fact_id,
+                profile_id=profile_id,
+                embedding=fact.embedding,
+            )
+        # Phase 2: Generate contextual description (after consolidator, before graph_builder)
+        if context_generator:
+            try:
+                import json as _json
+                ctx_result = context_generator.generate(fact, config.mode.value)
+                db.store_fact_context(
+                    fact_id=fact.fact_id,
+                    profile_id=profile_id,
+                    contextual_description=ctx_result.description,
+                    keywords=_json.dumps(ctx_result.keywords),
+                    generated_by=ctx_result.generated_by,
+                )
+            except Exception as _ctx_exc:
+                logger.debug("Context generation skipped for %s: %s", fact.fact_id, _ctx_exc)
+        if graph_builder:
+            graph_builder.build_edges(fact, profile_id)
+        # Phase 3: AutoLinker creates association_edges (AFTER GraphBuilder)
+        if auto_linker is not None:
+            try:
+                auto_linker.link_new_fact(fact, profile_id)
+            except Exception as exc:
+                logger.debug("AutoLinker.link_new_fact: %s", exc)
+        # Sheaf consistency check (runs after edges exist)
+        if (sheaf_checker
+                and fact.embedding
+                and fact.canonical_entities):
+            from superlocalmemory.storage.models import EdgeType, GraphEdge
+            try:
+                edges_for_fact = db.get_edges_for_node(
+                    fact.fact_id, profile_id,
+                )
+                if len(edges_for_fact) < config.math.sheaf_max_edges_per_check:
+                    contradictions = sheaf_checker.check_consistency(
+                        fact, profile_id,
+                    )
+                    for c in contradictions:
+                        if c.severity > 0.45:
+                            edge = GraphEdge(
+                                profile_id=profile_id,
+                                source_id=fact.fact_id,
+                                target_id=c.fact_id_b,
+                                edge_type=EdgeType.SUPERSEDES,
+                                weight=c.severity,
+                            )
+                            db.store_edge(edge)
+            except Exception as exc:
+                logger.debug("Sheaf check skipped: %s", exc)
+        # Phase 4: Temporal validation and contradiction detection
+        if temporal_validator:
+            try:
+                db.store_temporal_validity(
+                    fact_id=fact.fact_id,
+                    profile_id=profile_id,
+                    valid_from=fact.observation_date,
+                    valid_until=None,
+                )
+                invalidations = temporal_validator.validate_and_invalidate(
+                    new_fact=fact,
+                    profile_id=profile_id,
+                )
+                if invalidations:
+                    logger.info(
+                        "Temporal: %d facts invalidated by new fact %s",
+                        len(invalidations), fact.fact_id,
+                    )
+            except Exception as exc:
+                logger.debug(
+                    "Temporal validation skipped for fact %s: %s",
+                    fact.fact_id, exc,
+                )
+        if observation_builder:
+            for eid in fact.canonical_entities:
+                observation_builder.update_profile(eid, fact, profile_id)
+        # Increment fact_count for each linked canonical entity
+        for eid in fact.canonical_entities:
+            try:
+                db.increment_entity_fact_count(eid)
+            except Exception:
+                pass  # Non-critical — entity may have been deleted
+        if scene_builder:
+            scene_builder.assign_to_scene(fact, profile_id)
+        # Populate temporal_events for temporal retrieval
+        has_dates = (fact.observation_date or fact.referenced_date
+                     or fact.interval_start)
+        if fact.canonical_entities and has_dates:
+            from superlocalmemory.storage.models import TemporalEvent
+            for eid in fact.canonical_entities:
+                event = TemporalEvent(
+                    profile_id=profile_id, entity_id=eid,
+                    fact_id=fact.fact_id,
+                    observation_date=fact.observation_date,
+                    referenced_date=fact.referenced_date,
+                    interval_start=fact.interval_start,
+                    interval_end=fact.interval_end,
+                    description=fact.content[:200],
+                )
+                db.store_temporal_event(event)
+        # Foresight: extract time-bounded predictions
+        try:
+            from superlocalmemory.encoding.foresight import extract_foresight_signals
+            from superlocalmemory.storage.models import TemporalEvent as _TE
+            foresight_signals = extract_foresight_signals(fact)
+            for sig in foresight_signals:
+                f_event = _TE(
+                    profile_id=profile_id,
+                    entity_id=sig.get("entity_id", ""),
+                    fact_id=fact.fact_id,
+                    interval_start=sig.get("start_time"),
+                    interval_end=sig.get("end_time"),
+                    description=sig.get("description", ""),
+                )
+                db.store_temporal_event(f_event)
+        except Exception as exc:
+            logger.debug("Foresight extraction: %s", exc)
+        # Persist BM25 tokens at ingestion
+        bm25 = getattr(retrieval_engine, '_bm25', None) if retrieval_engine else None
+        if bm25:
+            bm25.add(fact.fact_id, fact.content, profile_id)
+        # Record provenance for data lineage (EU AI Act Art. 10)
+        if provenance:
+            try:
+                provenance.record(
+                    fact_id=fact.fact_id,
+                    profile_id=profile_id,
+                    source_type="store",
+                    source_id=session_id,
+                    created_by=speaker or "unknown",
+                )
+            except Exception:
+                pass
+    logger.info("Stored %d facts (session=%s)", len(stored_ids), session_id)
+    # Post-operation hooks (audit, trust signal, event bus)
+    hook_ctx["fact_ids"] = stored_ids
+    hook_ctx["fact_count"] = len(stored_ids)
+    hooks.run_post("store", hook_ctx)
+    # Phase 5: Step-count trigger for lightweight consolidation (L7)
+    if consolidation_engine is not None:
+        try:
+            consolidation_engine.increment_store_count(profile_id)
+        except Exception as _cons_exc:
+            logger.debug("Consolidation step-count trigger: %s", _cons_exc)
+    return stored_ids
+# ---------------------------------------------------------------------------
+# run_store_fact_direct  (was MemoryEngine.store_fact_direct)
+# ---------------------------------------------------------------------------
+def run_store_fact_direct(
+    fact: AtomicFact,
+    profile_id: str,
+    *,
+    db: DatabaseManager,
+    embedder: Any,
+    entity_resolver: Any,
+    ann_index: Any,
+    graph_builder: Any,
+    retrieval_engine: Any,
+    vector_store: Any = None,
+) -> str:
+    """Store a pre-built fact with full enrichment.
+    Ensures embedding, Fisher params, canonical entities, BM25 tokens,
+    and graph edges are all populated — even for auxiliary data.
+    Creates a parent memory record to satisfy FK constraint.
+    """
+    # Create parent memory record (FK: atomic_facts.memory_id → memories.memory_id)
+    if not fact.memory_id:
+        record = MemoryRecord(
+            profile_id=profile_id,
+            content=fact.content[:500],
+            session_id=fact.session_id,
+        )
+        db.store_memory(record)
+        fact.memory_id = record.memory_id
+    if not fact.embedding and embedder:
+        fact.embedding = embedder.embed(fact.content)
+        if fact.embedding:
+            fact.fisher_mean, fact.fisher_variance = (
+                embedder.compute_fisher_params(fact.embedding)
+            )
+    if entity_resolver and fact.entities:
+        canonical = entity_resolver.resolve(
+            fact.entities, profile_id,
+        )
+        fact.canonical_entities = list(canonical.values())
+    db.store_fact(fact)
+    if fact.embedding and ann_index:
+        ann_index.add(fact.fact_id, fact.embedding)
+    # V3.2: VectorStore upsert (dual-write)
+    if fact.embedding and vector_store and vector_store.available:
+        vector_store.upsert(
+            fact_id=fact.fact_id,
+            profile_id=profile_id,
+            embedding=fact.embedding,
+        )
+    if graph_builder:
+        graph_builder.build_edges(fact, profile_id)
+    # BM25 indexing
+    bm25 = getattr(retrieval_engine, '_bm25', None) if retrieval_engine else None
+    if bm25:
+        bm25.add(fact.fact_id, fact.content, profile_id)
+    return fact.fact_id
+# ---------------------------------------------------------------------------
+# run_close_session  (was MemoryEngine.close_session)
+# ---------------------------------------------------------------------------
+def run_close_session(
+    session_id: str,
+    profile_id: str,
+    *,
+    db: DatabaseManager,
+) -> int:
+    """Create session-level temporal summary for session-level retrieval.
+    Aggregates facts from a completed session into temporal_events
+    with session scope. Enables temporal queries like "What happened
+    in session 3?"
+    Returns number of session summary events created.
+    """
+    from superlocalmemory.storage.models import TemporalEvent
+    facts = db.get_all_facts(profile_id)
+    session_facts = [f for f in facts if f.session_id == session_id]
+    if not session_facts:
+        return 0
+    # Group by entity for session-level summaries
+    entity_facts: dict[str, list[AtomicFact]] = {}
+    for f in session_facts:
+        for eid in f.canonical_entities:
+            entity_facts.setdefault(eid, []).append(f)
+    count = 0
+    session_date = session_facts[0].observation_date or ""
+    for eid, efacts in entity_facts.items():
+        summary_parts = [f.content[:80] for f in efacts[:5]]
+        summary = f"Session {session_id}: " + "; ".join(summary_parts)
+        event = TemporalEvent(
+            profile_id=profile_id,
+            entity_id=eid,
+            fact_id=efacts[0].fact_id,
+            observation_date=session_date,
+            description=summary[:500],
+        )
+        db.store_temporal_event(event)
+        count += 1
+    logger.info(
+        "Session %s closed: %d summary events for %d facts",
+        session_id, count, len(session_facts),
+    )
+    return count

package/src/superlocalmemory/core/worker_pool.py CHANGED Viewed

@@ -155,19 +155,13 @@ class WorkerPool:
                 self._proc.stdin.write(req_line)
                 self._proc.stdin.flush()
-                # Read response with timeout
-                import selectors
-                sel = selectors.DefaultSelector()
-                sel.register(self._proc.stdout, selectors.EVENT_READ)
-                ready = sel.select(timeout=timeout)
-                sel.close()
-                if not ready:
-                    logger.error("Worker timed out after %ds", _REQUEST_TIMEOUT)
-                    self._kill()
-                    return {"ok": False, "error": "Worker timed out"}
+                # Read response with timeout using a thread.
+                # selectors/select do NOT work with pipes on Windows,
+                # so we use the same thread-based approach as EmbeddingService.
+                resp_line = self._readline_with_timeout(
+                    self._proc.stdout, timeout,
+                )
-                resp_line = self._proc.stdout.readline()
                 if not resp_line:
                     logger.warning("Worker returned empty, restarting. Run 'slm doctor' to diagnose.")
                     self._kill()
@@ -181,6 +175,35 @@ class WorkerPool:
                 self._kill()
                 return {"ok": False, "error": str(exc)}
+    @staticmethod
+    def _readline_with_timeout(stream, timeout_seconds: float) -> str:
+        """Read one line from *stream* with a timeout.
+        Uses a daemon thread so the call never blocks the main thread
+        indefinitely. This is the cross-platform replacement for
+        ``selectors`` which fails on Windows pipes.
+        Returns the line read, or ``""`` on timeout / error.
+        """
+        result_container: list[str] = []
+        error_container: list[Exception] = []
+        def _read() -> None:
+            try:
+                result_container.append(stream.readline())
+            except Exception as exc:
+                error_container.append(exc)
+        reader = threading.Thread(target=_read, daemon=True)
+        reader.start()
+        reader.join(timeout=timeout_seconds)
+        if reader.is_alive():
+            return ""
+        if error_container:
+            raise error_container[0]
+        return result_container[0] if result_container else ""
     def _ensure_worker(self) -> None:
         """Spawn worker if not running."""
         if self._proc is not None and self._proc.poll() is None: