npm - @simbimbo/memory-ocmemog - Versions diffs - 0.1.11 → 0.1.12 - Mend

@simbimbo/memory-ocmemog 0.1.11 → 0.1.12

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (102) hide show

package/CHANGELOG.md +16 -0
package/README.md +83 -18
package/brain/runtime/__init__.py +2 -12
package/brain/runtime/config.py +1 -24
package/brain/runtime/inference.py +1 -151
package/brain/runtime/instrumentation.py +1 -15
package/brain/runtime/memory/__init__.py +3 -13
package/brain/runtime/memory/api.py +1 -1219
package/brain/runtime/memory/candidate.py +1 -185
package/brain/runtime/memory/conversation_state.py +1 -1823
package/brain/runtime/memory/distill.py +1 -344
package/brain/runtime/memory/embedding_engine.py +1 -92
package/brain/runtime/memory/freshness.py +1 -112
package/brain/runtime/memory/health.py +1 -40
package/brain/runtime/memory/integrity.py +1 -186
package/brain/runtime/memory/memory_consolidation.py +1 -58
package/brain/runtime/memory/memory_links.py +1 -107
package/brain/runtime/memory/memory_salience.py +1 -233
package/brain/runtime/memory/memory_synthesis.py +1 -31
package/brain/runtime/memory/memory_taxonomy.py +1 -33
package/brain/runtime/memory/pondering_engine.py +1 -654
package/brain/runtime/memory/promote.py +1 -277
package/brain/runtime/memory/provenance.py +1 -406
package/brain/runtime/memory/reinforcement.py +1 -71
package/brain/runtime/memory/retrieval.py +1 -210
package/brain/runtime/memory/semantic_search.py +1 -64
package/brain/runtime/memory/store.py +1 -429
package/brain/runtime/memory/unresolved_state.py +1 -91
package/brain/runtime/memory/vector_index.py +1 -323
package/brain/runtime/model_roles.py +1 -9
package/brain/runtime/model_router.py +1 -22
package/brain/runtime/providers.py +1 -66
package/brain/runtime/security/redaction.py +1 -12
package/brain/runtime/state_store.py +1 -23
package/brain/runtime/storage_paths.py +1 -39
package/docs/architecture/memory.md +20 -24
package/docs/release-checklist.md +19 -6
package/docs/usage.md +33 -17
package/index.ts +8 -1
package/ocmemog/__init__.py +11 -0
package/ocmemog/doctor.py +1255 -0
package/ocmemog/runtime/__init__.py +18 -0
package/ocmemog/runtime/_compat_bridge.py +28 -0
package/ocmemog/runtime/config.py +35 -0
package/ocmemog/runtime/identity.py +115 -0
package/ocmemog/runtime/inference.py +164 -0
package/ocmemog/runtime/instrumentation.py +20 -0
package/ocmemog/runtime/memory/__init__.py +91 -0
package/ocmemog/runtime/memory/api.py +1431 -0
package/ocmemog/runtime/memory/candidate.py +192 -0
package/ocmemog/runtime/memory/conversation_state.py +1831 -0
package/ocmemog/runtime/memory/distill.py +282 -0
package/ocmemog/runtime/memory/embedding_engine.py +151 -0
package/ocmemog/runtime/memory/freshness.py +114 -0
package/ocmemog/runtime/memory/health.py +57 -0
package/ocmemog/runtime/memory/integrity.py +208 -0
package/ocmemog/runtime/memory/memory_consolidation.py +60 -0
package/ocmemog/runtime/memory/memory_links.py +109 -0
package/ocmemog/runtime/memory/memory_salience.py +235 -0
package/ocmemog/runtime/memory/memory_synthesis.py +33 -0
package/ocmemog/runtime/memory/memory_taxonomy.py +35 -0
package/ocmemog/runtime/memory/pondering_engine.py +681 -0
package/ocmemog/runtime/memory/promote.py +279 -0
package/ocmemog/runtime/memory/provenance.py +408 -0
package/ocmemog/runtime/memory/reinforcement.py +73 -0
package/ocmemog/runtime/memory/retrieval.py +224 -0
package/ocmemog/runtime/memory/semantic_search.py +66 -0
package/ocmemog/runtime/memory/store.py +433 -0
package/ocmemog/runtime/memory/unresolved_state.py +93 -0
package/ocmemog/runtime/memory/vector_index.py +411 -0
package/ocmemog/runtime/model_roles.py +16 -0
package/ocmemog/runtime/model_router.py +29 -0
package/ocmemog/runtime/providers.py +79 -0
package/ocmemog/runtime/roles.py +92 -0
package/ocmemog/runtime/security/__init__.py +8 -0
package/ocmemog/runtime/security/redaction.py +17 -0
package/ocmemog/runtime/state_store.py +34 -0
package/ocmemog/runtime/storage_paths.py +70 -0
package/ocmemog/sidecar/app.py +310 -23
package/ocmemog/sidecar/compat.py +50 -13
package/ocmemog/sidecar/transcript_watcher.py +318 -240
package/openclaw.plugin.json +4 -0
package/package.json +1 -1
package/scripts/ocmemog-backfill-vectors.py +5 -3
package/scripts/ocmemog-continuity-benchmark.py +1 -1
package/scripts/ocmemog-demo.py +1 -1
package/scripts/ocmemog-doctor.py +15 -0
package/scripts/ocmemog-install.sh +29 -7
package/scripts/ocmemog-integrated-proof.py +373 -0
package/scripts/ocmemog-reindex-vectors.py +5 -3
package/scripts/ocmemog-release-check.sh +330 -0
package/scripts/ocmemog-sidecar.sh +4 -2
package/scripts/ocmemog-test-rig.py +5 -3
package/brain/runtime/memory/artifacts.py +0 -33
package/brain/runtime/memory/context_builder.py +0 -112
package/brain/runtime/memory/interaction_memory.py +0 -57
package/brain/runtime/memory/memory_gate.py +0 -38
package/brain/runtime/memory/memory_graph.py +0 -54
package/brain/runtime/memory/person_identity.py +0 -83
package/brain/runtime/memory/person_memory.py +0 -138
package/brain/runtime/memory/sentiment_memory.py +0 -67
package/brain/runtime/memory/tool_catalog.py +0 -68

package/ocmemog/runtime/memory/reinforcement.py ADDED Viewed

@@ -0,0 +1,73 @@
+from __future__ import annotations
+from typing import Dict, Any
+from ocmemog.runtime.instrumentation import emit_event
+from ocmemog.runtime import state_store
+from ocmemog.runtime.memory import store
+def log_experience(
+    task_id: str,
+    outcome: str,
+    confidence: float,
+    reward_score: float,
+    memory_reference: str,
+    experience_type: str,
+    source_module: str,
+) -> Dict[str, Any]:
+    conn = store.connect()
+    row = conn.execute(
+        "SELECT id FROM experiences WHERE task_id=? AND memory_reference=? AND outcome=?",
+        (task_id, memory_reference, outcome),
+    ).fetchone()
+    if row:
+        conn.close()
+        emit_event(state_store.report_log_path(), "brain_memory_experience_duplicate", status="ok")
+        return {"experience_id": row[0], "duplicate": True}
+    cur = conn.execute(
+        "INSERT INTO experiences (task_id, outcome, reward_score, confidence, memory_reference, experience_type, source_module, schema_version) VALUES (?, ?, ?, ?, ?, ?, ?, ?)",
+        (task_id, outcome, reward_score, confidence, memory_reference, experience_type, source_module, store.SCHEMA_VERSION),
+    )
+    conn.commit()
+    conn.close()
+    emit_event(state_store.report_log_path(), "brain_memory_experience_logged", status="ok")
+    return {"experience_id": cur.lastrowid, "duplicate": False, "experience_type": experience_type, "source_module": source_module}
+def log_task_execution(
+    *,
+    task_id: str,
+    task_type: str,
+    agent_id: str,
+    tool_used: str,
+    success: bool,
+    duration_ms: int,
+) -> Dict[str, Any]:
+    outcome_payload = {
+        "task_type": task_type,
+        "agent_id": agent_id,
+        "tool_used": tool_used,
+        "success": bool(success),
+        "duration_ms": duration_ms,
+    }
+    return log_experience(
+        task_id=task_id,
+        outcome=str(outcome_payload),
+        confidence=1.0,
+        reward_score=1.0 if success else 0.0,
+        memory_reference=f"tool:{tool_used}",
+        experience_type="task_execution",
+        source_module="task_engine",
+    )
+def list_recent_experiences(limit: int = 20) -> Dict[str, int]:
+    conn = store.connect()
+    rows = conn.execute(
+        "SELECT experience_type, COUNT(*) as count FROM experiences GROUP BY experience_type ORDER BY count DESC LIMIT ?",
+        (limit,),
+    ).fetchall()
+    conn.close()
+    return {row[0]: int(row[1]) for row in rows}

package/ocmemog/runtime/memory/retrieval.py ADDED Viewed

@@ -0,0 +1,224 @@
+from __future__ import annotations
+from datetime import datetime, timezone
+from typing import Dict, List, Any, Iterable, Tuple
+import json
+from ocmemog.runtime import state_store
+from ocmemog.runtime.instrumentation import emit_event
+from . import memory_links, provenance, store, vector_index
+def _tokenize(text: str) -> List[str]:
+    return [token for token in "".join(ch.lower() if ch.isalnum() else " " for ch in (text or "")).split() if token]
+def _match_score(text: str, query: str) -> float:
+    if not text or not query:
+        return 0.0
+    text_l = text.lower()
+    query_l = query.lower()
+    if query_l in text_l:
+        return 1.0
+    query_tokens = set(_tokenize(query_l))
+    if not query_tokens:
+        return 0.0
+    text_tokens = set(_tokenize(text_l))
+    if not text_tokens:
+        return 0.0
+    overlap = len(query_tokens & text_tokens) / max(1, len(query_tokens))
+    return round(min(0.95, overlap * 0.85), 3)
+def _recency_score(timestamp: str | None) -> float:
+    if not timestamp:
+        return 0.0
+    parsed = None
+    for fmt in ("%Y-%m-%d %H:%M:%S", "%Y-%m-%dT%H:%M:%S", "%Y-%m-%dT%H:%M:%S.%f"):
+        try:
+            parsed = datetime.strptime(timestamp, fmt).replace(tzinfo=timezone.utc)
+            break
+        except ValueError:
+            continue
+    if parsed is None:
+        return 0.0
+    age_days = max(0.0, (datetime.now(timezone.utc) - parsed).total_seconds() / 86400.0)
+    if age_days <= 1:
+        return 0.2
+    if age_days <= 7:
+        return 0.15
+    if age_days <= 30:
+        return 0.08
+    if age_days <= 180:
+        return 0.03
+    return 0.0
+MEMORY_BUCKETS: Tuple[str, ...] = tuple(store.MEMORY_TABLES)
+def _empty_results() -> Dict[str, List[Dict[str, Any]]]:
+    return {bucket: [] for bucket in MEMORY_BUCKETS}
+def _parse_metadata(raw: Any) -> Dict[str, Any]:
+    if isinstance(raw, dict):
+        return raw
+    try:
+        return json.loads(raw or "{}")
+    except Exception:
+        return {}
+def _governance_state(metadata: Dict[str, Any]) -> tuple[str, Dict[str, Any]]:
+    preview = provenance.preview_from_metadata(metadata)
+    prov = metadata.get("provenance") if isinstance(metadata.get("provenance"), dict) else {}
+    state = {
+        "memory_status": prov.get("memory_status") or metadata.get("memory_status") or "active",
+        "superseded_by": prov.get("superseded_by") or metadata.get("superseded_by"),
+        "supersedes": prov.get("supersedes") or metadata.get("supersedes"),
+        "duplicate_of": prov.get("duplicate_of") or metadata.get("duplicate_of"),
+        "contradicts": prov.get("contradicts") or metadata.get("contradicts") or [],
+        "contradiction_status": prov.get("contradiction_status") or metadata.get("contradiction_status"),
+        "canonical_reference": prov.get("canonical_reference") or metadata.get("canonical_reference"),
+        "provenance_preview": preview,
+    }
+    return str(state["memory_status"] or "active"), state
+def retrieve(
+    prompt: str,
+    limit: int = 5,
+    categories: Iterable[str] | None = None,
+    *,
+    skip_vector_provider: bool = False,
+) -> Dict[str, List[Dict[str, Any]]]:
+    emit_event(state_store.report_log_path(), "brain_memory_retrieval_start", status="ok")
+    emit_event(state_store.report_log_path(), "brain_memory_retrieval_rank_start", status="ok")
+    conn = store.connect()
+    results = _empty_results()
+    selected_categories = tuple(dict.fromkeys(category for category in (categories or MEMORY_BUCKETS) if category in MEMORY_BUCKETS))
+    reinf_rows = conn.execute("SELECT memory_reference, reward_score, confidence FROM experiences").fetchall()
+    reinforcement: Dict[str, Dict[str, float]] = {}
+    for row in reinf_rows:
+        reference = str(row[0] or "")
+        if not reference:
+            continue
+        current = reinforcement.setdefault(reference, {"reward_score": 0.0, "confidence": 0.0, "count": 0.0})
+        current["reward_score"] += float(row[1] or 0.0)
+        current["confidence"] += float(row[2] or 0.0)
+        current["count"] += 1.0
+    for current in reinforcement.values():
+        count = max(1.0, float(current.get("count") or 1.0))
+        current["reward_score"] = float(current.get("reward_score") or 0.0) / count
+        current["confidence"] = float(current.get("confidence") or 0.0) / count
+    semantic_scores: Dict[str, float] = {}
+    if prompt.strip():
+        for item in vector_index.search_memory(
+            prompt,
+            limit=max(limit * 6, 20),
+            skip_provider=skip_vector_provider,
+            source_types=selected_categories,
+        ):
+            source_type = item.get("source_type") or "knowledge"
+            source_id = str(item.get("source_id") or "")
+            if source_type in selected_categories and source_id:
+                semantic_scores[f"{source_type}:{source_id}"] = float(item.get("score") or 0.0)
+    def score_record(*, content: str, memory_ref: str, promo_conf: float, timestamp: str | None) -> tuple[float, Dict[str, float]]:
+        keyword = _match_score(content, prompt)
+        semantic = float(semantic_scores.get(memory_ref, 0.0))
+        reinf = reinforcement.get(memory_ref, {})
+        reinf_score = float(reinf.get("reward_score", 0.0)) * 0.35
+        promo_score = float(promo_conf) * 0.2
+        recency = _recency_score(timestamp)
+        score = round((keyword * 0.45) + (semantic * 0.35) + reinf_score + promo_score + recency, 3)
+        return score, {
+            "keyword": round(keyword, 3),
+            "semantic": round(semantic, 3),
+            "reinforcement": round(reinf_score, 3),
+            "promotion": round(promo_score, 3),
+            "recency": round(recency, 3),
+        }
+    for table in selected_categories:
+        candidates: Dict[str, Dict[str, Any]] = {}
+        try:
+            rows = conn.execute(
+                f"SELECT id, timestamp, content, confidence, metadata_json FROM {table} ORDER BY id DESC LIMIT ?",
+                (max(limit * 20, 50),),
+            ).fetchall()
+        except Exception:
+            continue
+        for row in rows:
+            content = row["content"] if isinstance(row, dict) else row[2]
+            mem_ref = f"{table}:{row[0]}"
+            keyword = _match_score(content, prompt)
+            semantic = float(semantic_scores.get(mem_ref, 0.0))
+            if prompt.strip() and keyword <= 0.0 and semantic <= 0.0:
+                continue
+            promo_conf = row["confidence"] if isinstance(row, dict) else row[3]
+            timestamp = row["timestamp"] if isinstance(row, dict) else row[1]
+            raw_metadata = row["metadata_json"] if isinstance(row, dict) else row[4]
+            metadata_payload = _parse_metadata(raw_metadata)
+            memory_status, governance = _governance_state(metadata_payload)
+            if memory_status in {"superseded", "duplicate"}:
+                continue
+            metadata = provenance.fetch_reference(mem_ref)
+            score, signals = score_record(content=content, memory_ref=mem_ref, promo_conf=promo_conf, timestamp=timestamp)
+            if memory_status == "contested":
+                score = round(max(0.0, score - 0.15), 3)
+                signals["contradiction_penalty"] = 0.15
+            selected_because = max(signals, key=signals.get) if signals else "keyword"
+            candidates[mem_ref] = {
+                "content": content,
+                "score": score,
+                "memory_reference": mem_ref,
+                "links": memory_links.get_memory_links(mem_ref),
+                "provenance_preview": (metadata or {}).get("provenance_preview") or governance.get("provenance_preview") or provenance.preview_from_metadata((metadata or {}).get("metadata")),
+                "retrieval_signals": signals,
+                "selected_because": selected_because,
+                "timestamp": timestamp,
+                "memory_status": memory_status,
+                "governance": governance,
+            }
+        results[table] = sorted(candidates.values(), key=lambda x: x["score"], reverse=True)[:limit]
+    conn.close()
+    emit_event(state_store.report_log_path(), "brain_memory_retrieval_rank_complete", status="ok")
+    emit_event(state_store.report_log_path(), "brain_memory_retrieval_complete", status="ok")
+    return results
+def retrieve_for_queries(
+    queries: Iterable[str],
+    *,
+    limit: int = 5,
+    categories: Iterable[str] | None = None,
+    skip_vector_provider: bool = False,
+) -> Dict[str, List[Dict[str, Any]]]:
+    merged = _empty_results()
+    seen_refs = {bucket: set() for bucket in MEMORY_BUCKETS}
+    selected_categories = tuple(dict.fromkeys(category for category in (categories or MEMORY_BUCKETS) if category in MEMORY_BUCKETS))
+    normalized_queries = [query.strip() for query in queries if isinstance(query, str) and query.strip()]
+    if not normalized_queries:
+        return retrieve("", limit=limit, categories=selected_categories)
+    for query in normalized_queries:
+        partial = retrieve(query, limit=limit, categories=selected_categories, skip_vector_provider=skip_vector_provider)
+        for bucket in selected_categories:
+            for item in partial.get(bucket, []):
+                ref = item.get("memory_reference")
+                if ref in seen_refs[bucket]:
+                    continue
+                seen_refs[bucket].add(ref)
+                merged[bucket].append(item)
+    for bucket in selected_categories:
+        merged[bucket] = sorted(merged[bucket], key=lambda x: x["score"], reverse=True)[:limit]
+    return merged

package/ocmemog/runtime/memory/semantic_search.py ADDED Viewed

@@ -0,0 +1,66 @@
+from __future__ import annotations
+from typing import Any, Dict, List
+from ocmemog.runtime import state_store
+from ocmemog.runtime.instrumentation import emit_event
+from ocmemog.runtime.memory import embedding_engine, store, retrieval, freshness
+LOGFILE = state_store.report_log_path()
+def _cosine_similarity(a: List[float], b: List[float]) -> float:
+    if not a or not b:
+        return 0.0
+    size = min(len(a), len(b))
+    if size == 0:
+        return 0.0
+    dot = sum(x * y for x, y in zip(a[:size], b[:size]))
+    mag_a = sum(x * x for x in a[:size]) ** 0.5
+    mag_b = sum(x * x for x in b[:size]) ** 0.5
+    if mag_a == 0 or mag_b == 0:
+        return 0.0
+    return dot / (mag_a * mag_b)
+def semantic_search(query: str, limit: int = 5) -> List[Dict[str, Any]]:
+    emit_event(LOGFILE, "brain_semantic_search_start", status="ok")
+    query_embedding = embedding_engine.generate_embedding(query)
+    conn = store.connect()
+    rows = conn.execute(
+        "SELECT id, source_type, source_id, embedding FROM vector_embeddings"
+    ).fetchall()
+    conn.close()
+    reinforcement = retrieval.retrieve(query, limit=limit * 2)
+    freshness_info = {item["memory_id"]: item for item in freshness.scan_freshness(limit=limit).get("advisories", [])}
+    results: List[Dict[str, Any]] = []
+    for row in rows:
+        try:
+            embedding = [float(x) for x in __import__("json").loads(row["embedding"])]
+        except Exception:
+            continue
+        similarity = _cosine_similarity(query_embedding or [], embedding)
+        memory_ref = f"{row['source_type']}:{row['source_id']}"
+        reinforcement_weight = 0.0
+        for bucket in reinforcement.values():
+            for item in bucket:
+                if item.get("memory_reference") == memory_ref:
+                    reinforcement_weight = item.get("score", 0.0)
+        freshness_score = freshness_info.get(int(row["source_id"],), {}).get("freshness_score", 0.0) if str(row["source_id"]).isdigit() else 0.0
+        combined = similarity + reinforcement_weight + freshness_score
+        results.append(
+            {
+                "memory_reference": memory_ref,
+                "score": round(combined, 6),
+                "similarity": round(similarity, 6),
+                "freshness": freshness_score,
+                "reinforcement_weight": reinforcement_weight,
+                "promotion_confidence": 0.0,
+            }
+        )
+    results.sort(key=lambda item: item["score"], reverse=True)
+    emit_event(LOGFILE, "brain_semantic_search_complete", status="ok", result_count=len(results[:limit]))
+    return results[:limit]