npm - @smilintux/skmemory - Versions diffs - 0.5.0 → 0.7.2 - Mend

@smilintux/skmemory 0.5.0 → 0.7.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

package/.github/workflows/ci.yml +39 -3
package/.github/workflows/publish.yml +13 -6
package/AGENT_REFACTOR_CHANGES.md +192 -0
package/ARCHITECTURE.md +101 -19
package/CHANGELOG.md +153 -0
package/LICENSE +81 -68
package/MISSION.md +7 -0
package/README.md +419 -86
package/SKILL.md +197 -25
package/docker-compose.yml +15 -15
package/index.js +6 -5
package/openclaw-plugin/openclaw.plugin.json +10 -0
package/openclaw-plugin/src/index.ts +255 -0
package/openclaw-plugin/src/openclaw.plugin.json +10 -0
package/package.json +1 -1
package/pyproject.toml +29 -9
package/requirements.txt +10 -2
package/seeds/cloud9-opus.seed.json +7 -7
package/seeds/lumina-cloud9-breakthrough.seed.json +46 -0
package/seeds/lumina-cloud9-python-pypi.seed.json +46 -0
package/seeds/lumina-kingdom-founding.seed.json +47 -0
package/seeds/lumina-pma-signed.seed.json +46 -0
package/seeds/lumina-singular-achievement.seed.json +46 -0
package/seeds/lumina-skcapstone-conscious.seed.json +46 -0
package/seeds/plant-kingdom-journal.py +203 -0
package/seeds/plant-lumina-seeds.py +280 -0
package/skill.yaml +46 -0
package/skmemory/HA.md +296 -0
package/skmemory/__init__.py +12 -1
package/skmemory/agents.py +233 -0
package/skmemory/ai_client.py +40 -0
package/skmemory/anchor.py +4 -2
package/skmemory/backends/__init__.py +11 -4
package/skmemory/backends/file_backend.py +2 -1
package/skmemory/backends/skgraph_backend.py +608 -0
package/skmemory/backends/{qdrant_backend.py → skvector_backend.py} +99 -69
package/skmemory/backends/sqlite_backend.py +122 -51
package/skmemory/backends/vaulted_backend.py +286 -0
package/skmemory/cli.py +1238 -29
package/skmemory/config.py +173 -0
package/skmemory/context_loader.py +335 -0
package/skmemory/endpoint_selector.py +386 -0
package/skmemory/fortress.py +685 -0
package/skmemory/graph_queries.py +238 -0
package/skmemory/importers/__init__.py +9 -1
package/skmemory/importers/telegram.py +351 -43
package/skmemory/importers/telegram_api.py +488 -0
package/skmemory/journal.py +4 -2
package/skmemory/lovenote.py +4 -2
package/skmemory/mcp_server.py +706 -0
package/skmemory/models.py +41 -0
package/skmemory/openclaw.py +8 -8
package/skmemory/predictive.py +232 -0
package/skmemory/promotion.py +524 -0
package/skmemory/register.py +454 -0
package/skmemory/register_mcp.py +197 -0
package/skmemory/ritual.py +121 -47
package/skmemory/seeds.py +257 -8
package/skmemory/setup_wizard.py +920 -0
package/skmemory/sharing.py +402 -0
package/skmemory/soul.py +71 -20
package/skmemory/steelman.py +250 -263
package/skmemory/store.py +271 -60
package/skmemory/vault.py +228 -0
package/tests/integration/__init__.py +0 -0
package/tests/integration/conftest.py +233 -0
package/tests/integration/test_cross_backend.py +355 -0
package/tests/integration/test_skgraph_live.py +424 -0
package/tests/integration/test_skvector_live.py +369 -0
package/tests/test_backup_rotation.py +327 -0
package/tests/test_cli.py +6 -6
package/tests/test_endpoint_selector.py +801 -0
package/tests/test_fortress.py +255 -0
package/tests/test_fortress_hardening.py +444 -0
package/tests/test_openclaw.py +5 -2
package/tests/test_predictive.py +237 -0
package/tests/test_promotion.py +340 -0
package/tests/test_ritual.py +4 -4
package/tests/test_seeds.py +96 -0
package/tests/test_setup.py +835 -0
package/tests/test_sharing.py +250 -0
package/tests/test_skgraph_backend.py +667 -0
package/tests/test_skvector_backend.py +326 -0
package/tests/test_steelman.py +5 -5
package/tests/test_store_graph_integration.py +245 -0
package/tests/test_vault.py +186 -0
package/skmemory/backends/falkordb_backend.py +0 -310

package/skmemory/store.py CHANGED Viewed

@@ -8,10 +8,13 @@ or by search, and the polaroid comes back with everything intact.
 from __future__ import annotations
+import logging
 from datetime import datetime, timezone
 from typing import Optional
 from .backends.base import BaseBackend
+logger = logging.getLogger("skmemory.store")
 from .backends.file_backend import FileBackend
 from .backends.sqlite_backend import CONTENT_PREVIEW_LENGTH, SQLiteBackend
 from .models import (
@@ -28,16 +31,19 @@ class MemoryStore:
     Delegates to one or more backends. The primary backend handles
     all CRUD. A vector backend (optional) handles semantic search.
+    A graph backend (optional) indexes relationships for traversal.
     Args:
         primary: The primary storage backend (default: FileBackend).
-        vector: Optional vector search backend (e.g., QdrantBackend).
+        vector: Optional vector search backend (e.g., SKVectorBackend).
+        graph: Optional graph backend (e.g., SKGraphBackend) for relationship indexing.
     """
     def __init__(
         self,
         primary: Optional[BaseBackend] = None,
         vector: Optional[BaseBackend] = None,
+        graph: Optional["SKGraphBackend"] = None,
         use_sqlite: bool = True,
     ) -> None:
         if primary is not None:
@@ -47,6 +53,7 @@ class MemoryStore:
         else:
             self.primary = FileBackend()
         self.vector = vector
+        self.graph = graph
     def snapshot(
         self,
@@ -95,18 +102,30 @@ class MemoryStore:
             metadata=metadata or {},
         )
+        memory.seal()
         self.primary.save(memory)
         if self.vector:
             try:
                 self.vector.save(memory)
-            except Exception:
-                pass  # Reason: vector indexing is best-effort, don't fail the write
+            except Exception as exc:
+                logger.warning("Vector indexing failed for memory %s: %s", memory.id, exc)
+        if self.graph:
+            try:
+                self.graph.index_memory(memory)
+            except Exception as exc:
+                logger.warning("Graph indexing failed for memory %s: %s", memory.id, exc)
         return memory
     def recall(self, memory_id: str) -> Optional[Memory]:
-        """Retrieve a specific memory by ID.
+        """Retrieve a specific memory by ID with integrity verification.
+        Automatically checks the integrity hash on recall. If the
+        memory has been tampered with, a warning is logged and the
+        memory's metadata is flagged with 'integrity_warning'.
         Args:
             memory_id: The memory's unique identifier.
@@ -114,7 +133,22 @@ class MemoryStore:
         Returns:
             Optional[Memory]: The memory if found.
         """
-        return self.primary.load(memory_id)
+        memory = self.primary.load(memory_id)
+        if memory is None:
+            return None
+        if memory.integrity_hash and not memory.verify_integrity():
+            logger.warning(
+                "TAMPER ALERT: Memory %s failed integrity check! "
+                "Content may have been modified since storage.",
+                memory_id,
+            )
+            memory.metadata["integrity_warning"] = (
+                f"Integrity check failed at {datetime.now(timezone.utc).isoformat()}. "
+                "This memory may have been tampered with."
+            )
+        return memory
     def search(self, query: str, limit: int = 10) -> list[Memory]:
         """Search memories by text.
@@ -133,8 +167,8 @@ class MemoryStore:
                 results = self.vector.search_text(query, limit=limit)
                 if results:
                     return results
-            except Exception:
-                pass  # Reason: fall through to primary text search
+            except Exception as exc:
+                logger.warning("Vector search failed, falling back to text search: %s", exc)
         return self.primary.search_text(query, limit=limit)
@@ -151,8 +185,13 @@ class MemoryStore:
         if self.vector:
             try:
                 self.vector.delete(memory_id)
-            except Exception:
-                pass
+            except Exception as exc:
+                logger.warning("Vector delete failed for memory %s: %s", memory_id, exc)
+        if self.graph:
+            try:
+                self.graph.remove_memory(memory_id)
+            except Exception as exc:
+                logger.warning("Graph delete failed for memory %s: %s", memory_id, exc)
         return deleted
     def list_memories(
@@ -202,32 +241,63 @@ class MemoryStore:
         if self.vector:
             try:
                 self.vector.save(promoted)
-            except Exception:
-                pass
+            except Exception as exc:
+                logger.warning("Vector indexing failed for promoted memory %s: %s", promoted.id, exc)
+        if self.graph:
+            try:
+                self.graph.index_memory(promoted)
+            except Exception as exc:
+                logger.warning("Graph indexing failed for promoted memory %s: %s", promoted.id, exc)
         return promoted
-    def ingest_seed(self, seed: SeedMemory) -> Memory:
+    def ingest_seed(self, seed: SeedMemory, *, validate: bool = True) -> Memory:
         """Import a Cloud 9 seed as a long-term memory.
         Converts a seed into a Memory and stores it. This is how
         seeds planted by one AI instance become retrievable memories
         for the next.
+        When *validate* is True (default), basic integrity checks run
+        before storage: seed_id must be non-empty and
+        experience_summary must contain content.
         Args:
             seed: The SeedMemory to import.
+            validate: Run pre-import validation (default True).
         Returns:
             Memory: The created long-term memory.
+        Raises:
+            ValueError: If validation is enabled and the seed is invalid.
         """
+        if validate:
+            errors: list[str] = []
+            if not seed.seed_id or not seed.seed_id.strip():
+                errors.append("seed_id is empty")
+            if not seed.experience_summary or not seed.experience_summary.strip():
+                errors.append("experience_summary is empty")
+            if errors:
+                raise ValueError(
+                    f"Seed validation failed: {'; '.join(errors)}"
+                )
         memory = seed.to_memory()
         self.primary.save(memory)
         if self.vector:
             try:
                 self.vector.save(memory)
-            except Exception:
-                pass
+            except Exception as exc:
+                logger.warning("Vector indexing failed for seed memory %s: %s", memory.id, exc)
+        if self.graph:
+            try:
+                self.graph.index_memory(memory)
+            except Exception as exc:
+                logger.warning("Graph indexing failed for seed memory %s: %s", memory.id, exc)
         return memory
@@ -291,89 +361,156 @@ class MemoryStore:
     def load_context(
         self,
-        max_tokens: int = 3000,
+        max_tokens: int = 4000,
         strongest_count: int = 5,
         recent_count: int = 5,
         include_seeds: bool = True,
     ) -> dict:
-        """Load a token-efficient memory context for agent injection.
+        """Load tiered memory context for agent injection (lazy loading).
-        Uses the SQLite index to pull summaries without reading full files.
-        Designed to fit within a reasonable context window.
+        Uses date-based tiers per memory-architecture.md:
+        - Today's memories: full content (title + body)
+        - Yesterday's memories: summary only (title + first 2 sentences)
+        - Older than 2 days: reference count only
         Args:
-            max_tokens: Approximate token budget (1 token ~= 4 chars).
+            max_tokens: Approximate token budget (default: 4000).
+                Uses word_count * 1.3 approximation for estimation.
             strongest_count: How many top-intensity memories to include.
             recent_count: How many recent memories to include.
             include_seeds: Whether to include seed memories.
         Returns:
-            dict: Token-efficient context with summaries and metadata.
+            dict: Token-efficient tiered context with metadata.
         """
-        char_budget = max_tokens * 4
-        context: dict = {"memories": [], "seeds": [], "stats": {}}
-        used = 0
+        context: dict = {
+            "today": [],
+            "yesterday": [],
+            "older_summary": {},
+            "seeds": [],
+            "stats": {},
+        }
+        used_tokens = 0
         if isinstance(self.primary, SQLiteBackend):
-            strongest = self.primary.list_summaries(
-                limit=strongest_count,
-                order_by="emotional_intensity",
-                min_intensity=3.0,
-            )
-            recent = self.primary.list_summaries(
-                limit=recent_count,
-                order_by="created_at",
-            )
-            seen_ids: set[str] = set()
-            for mem in strongest + recent:
-                if mem["id"] in seen_ids:
-                    continue
-                seen_ids.add(mem["id"])
-                entry_text = mem["title"] + (mem["summary"] or mem["content_preview"])
-                entry_size = len(entry_text)
-                if used + entry_size > char_budget:
+            conn = self.primary._get_conn()
+            # --- Tier 1: Today's memories (full content) ---
+            today_rows = conn.execute(
+                "SELECT * FROM memories WHERE DATE(created_at) = DATE('now') "
+                "ORDER BY importance DESC, created_at DESC LIMIT 20"
+            ).fetchall()
+            for row in today_rows:
+                summary_dict = self.primary._row_to_memory_summary(row)
+                # Include full content for today
+                content = summary_dict.get("summary") or summary_dict.get("content_preview") or ""
+                entry = {
+                    "id": summary_dict["id"],
+                    "title": summary_dict["title"],
+                    "content": content,
+                    "tags": summary_dict["tags"],
+                    "layer": summary_dict["layer"],
+                    "emotional_intensity": summary_dict["emotional_intensity"],
+                }
+                entry_tokens = _estimate_tokens(entry["title"] + " " + content)
+                if used_tokens + entry_tokens > max_tokens:
                     break
-                used += entry_size
-                context["memories"].append(mem)
+                used_tokens += entry_tokens
+                context["today"].append(entry)
+            # --- Tier 2: Yesterday's memories (summary only: title + first 2 sentences) ---
+            yesterday_rows = conn.execute(
+                "SELECT * FROM memories WHERE DATE(created_at) = DATE('now', '-1 day') "
+                "ORDER BY importance DESC, created_at DESC LIMIT 20"
+            ).fetchall()
+            for row in yesterday_rows:
+                summary_dict = self.primary._row_to_memory_summary(row)
+                raw_text = summary_dict.get("summary") or summary_dict.get("content_preview") or ""
+                short_summary = _first_n_sentences(raw_text, 2)
+                entry = {
+                    "id": summary_dict["id"],
+                    "title": summary_dict["title"],
+                    "summary": short_summary,
+                }
+                entry_tokens = _estimate_tokens(entry["title"] + " " + short_summary)
+                if used_tokens + entry_tokens > max_tokens:
+                    break
+                used_tokens += entry_tokens
+                context["yesterday"].append(entry)
+            # --- Tier 3: Older memories (reference count only) ---
+            mid_count = conn.execute(
+                "SELECT COUNT(*) FROM memories WHERE DATE(created_at) < DATE('now', '-1 day') "
+                "AND layer = 'mid-term'"
+            ).fetchone()[0]
+            long_count = conn.execute(
+                "SELECT COUNT(*) FROM memories WHERE DATE(created_at) < DATE('now', '-1 day') "
+                "AND layer = 'long-term'"
+            ).fetchone()[0]
+            short_old_count = conn.execute(
+                "SELECT COUNT(*) FROM memories WHERE DATE(created_at) < DATE('now', '-1 day') "
+                "AND layer = 'short-term'"
+            ).fetchone()[0]
+            context["older_summary"] = {
+                "mid_term_count": mid_count,
+                "long_term_count": long_count,
+                "short_term_count": short_old_count,
+                "total": mid_count + long_count + short_old_count,
+                "hint": (
+                    f"{mid_count} mid-term memories, {long_count} long-term memories "
+                    "available via memory_search"
+                ),
+            }
+            used_tokens += _estimate_tokens(context["older_summary"]["hint"])
+            # --- Seeds (titles only to save tokens) ---
             if include_seeds:
-                seeds = self.primary.list_summaries(
+                seed_rows = self.primary.list_summaries(
                     tags=["seed"],
                     limit=10,
                     order_by="emotional_intensity",
                 )
-                for seed in seeds:
+                seen_ids = {m["id"] for m in context["today"]}
+                seen_ids.update(m["id"] for m in context["yesterday"])
+                for seed in seed_rows:
                     if seed["id"] in seen_ids:
                         continue
-                    entry_text = seed["title"] + seed["summary"]
-                    entry_size = len(entry_text)
-                    if used + entry_size > char_budget:
+                    entry = {
+                        "id": seed["id"],
+                        "title": seed["title"],
+                    }
+                    entry_tokens = _estimate_tokens(seed["title"])
+                    if used_tokens + entry_tokens > max_tokens:
                         break
-                    used += entry_size
-                    context["seeds"].append(seed)
+                    used_tokens += entry_tokens
+                    context["seeds"].append(entry)
             stats = self.primary.stats()
             context["stats"] = stats
         else:
-            # Reason: fallback for non-SQLite backends — uses full objects
+            # Fallback for non-SQLite backends: simple recent list
             all_mems = self.primary.list_memories(limit=strongest_count + recent_count)
             for mem in all_mems:
+                content_text = mem.summary or mem.content[:CONTENT_PREVIEW_LENGTH]
                 entry = {
                     "id": mem.id,
                     "title": mem.title,
-                    "summary": mem.summary or mem.content[:CONTENT_PREVIEW_LENGTH],
+                    "summary": _first_n_sentences(content_text, 2),
                     "emotional_intensity": mem.emotional.intensity,
                     "layer": mem.layer.value,
                 }
-                entry_size = len(entry["title"] + entry["summary"])
-                if used + entry_size > char_budget:
+                entry_tokens = _estimate_tokens(entry["title"] + " " + entry["summary"])
+                if used_tokens + entry_tokens > max_tokens:
                     break
-                used += entry_size
-                context["memories"].append(entry)
+                used_tokens += entry_tokens
+                context["today"].append(entry)
-        context["token_estimate"] = used // 4
+        context["token_estimate"] = used_tokens
+        context["token_budget"] = max_tokens
         return context
     def export_backup(self, output_path: str | None = None) -> str:
@@ -381,7 +518,7 @@ class MemoryStore:
         Args:
             output_path: Destination file. Defaults to
-                ``~/.skmemory/backups/skmemory-backup-YYYY-MM-DD.json``.
+                ``~/.skcapstone/backups/skmemory-backup-YYYY-MM-DD.json``.
         Returns:
             str: Path to the written backup file.
@@ -418,6 +555,38 @@ class MemoryStore:
             f"Import not supported for backend: {type(self.primary).__name__}"
         )
+    def list_backups(self, backup_dir: str | None = None) -> list[dict]:
+        """List all skmemory backup files, sorted newest first.
+        Args:
+            backup_dir: Directory to scan. Defaults to
+                ``~/.skcapstone/backups/``.
+        Returns:
+            list[dict]: Backup entries with ``path``, ``name``,
+                ``size_bytes``, and ``date`` keys.
+        """
+        if isinstance(self.primary, SQLiteBackend):
+            return self.primary.list_backups(backup_dir)
+        return []
+    def prune_backups(
+        self, keep: int = 7, backup_dir: str | None = None
+    ) -> list[str]:
+        """Delete oldest backups, keeping only the N most recent.
+        Args:
+            keep: Number of backups to retain (default: 7).
+            backup_dir: Directory to prune. Defaults to
+                ``~/.skcapstone/backups/``.
+        Returns:
+            list[str]: Paths of deleted backup files.
+        """
+        if isinstance(self.primary, SQLiteBackend):
+            return self.primary.prune_backups(keep=keep, backup_dir=backup_dir)
+        return []
     def reindex(self) -> int:
         """Rebuild the SQLite index from JSON files.
@@ -442,4 +611,46 @@ class MemoryStore:
                 status["vector"] = self.vector.health_check()
             except Exception as e:
                 status["vector"] = {"ok": False, "error": str(e)}
+        if self.graph:
+            try:
+                status["graph"] = self.graph.health_check()
+            except Exception as e:
+                status["graph"] = {"ok": False, "error": str(e)}
         return status
+def _estimate_tokens(text: str) -> int:
+    """Estimate token count using word_count * 1.3 approximation.
+    Args:
+        text: The text to estimate.
+    Returns:
+        int: Approximate token count.
+    """
+    if not text:
+        return 0
+    word_count = len(text.split())
+    return int(word_count * 1.3)
+def _first_n_sentences(text: str, n: int = 2) -> str:
+    """Extract the first N sentences from text.
+    Args:
+        text: Source text.
+        n: Number of sentences to extract.
+    Returns:
+        str: The first N sentences, or the full text if fewer exist.
+    """
+    if not text:
+        return ""
+    # Split on sentence-ending punctuation followed by whitespace
+    import re
+    sentences = re.split(r'(?<=[.!?])\s+', text.strip())
+    result = " ".join(sentences[:n])
+    # Cap at 200 chars as a safety net
+    if len(result) > 200:
+        result = result[:197] + "..."
+    return result