PyPI - alma-memory - Versions diffs - 0.5.0__py3-none-any.whl → 0.7.0__py3-none-any.whl - Mend

alma-memory 0.5.0py3-none-any.whl → 0.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (111) hide show

alma/__init__.py +296 -194
alma/compression/__init__.py +33 -0
alma/compression/pipeline.py +980 -0
alma/confidence/__init__.py +47 -47
alma/confidence/engine.py +540 -540
alma/confidence/types.py +351 -351
alma/config/loader.py +157 -157
alma/consolidation/__init__.py +23 -23
alma/consolidation/engine.py +678 -678
alma/consolidation/prompts.py +84 -84
alma/core.py +1189 -322
alma/domains/__init__.py +30 -30
alma/domains/factory.py +359 -359
alma/domains/schemas.py +448 -448
alma/domains/types.py +272 -272
alma/events/__init__.py +75 -75
alma/events/emitter.py +285 -284
alma/events/storage_mixin.py +246 -246
alma/events/types.py +126 -126
alma/events/webhook.py +425 -425
alma/exceptions.py +49 -49
alma/extraction/__init__.py +31 -31
alma/extraction/auto_learner.py +265 -264
alma/extraction/extractor.py +420 -420
alma/graph/__init__.py +106 -81
alma/graph/backends/__init__.py +32 -18
alma/graph/backends/kuzu.py +624 -0
alma/graph/backends/memgraph.py +432 -0
alma/graph/backends/memory.py +236 -236
alma/graph/backends/neo4j.py +417 -417
alma/graph/base.py +159 -159
alma/graph/extraction.py +198 -198
alma/graph/store.py +860 -860
alma/harness/__init__.py +35 -35
alma/harness/base.py +386 -386
alma/harness/domains.py +705 -705
alma/initializer/__init__.py +37 -37
alma/initializer/initializer.py +418 -418
alma/initializer/types.py +250 -250
alma/integration/__init__.py +62 -62
alma/integration/claude_agents.py +444 -432
alma/integration/helena.py +423 -423
alma/integration/victor.py +471 -471
alma/learning/__init__.py +101 -86
alma/learning/decay.py +878 -0
alma/learning/forgetting.py +1446 -1446
alma/learning/heuristic_extractor.py +390 -390
alma/learning/protocols.py +374 -374
alma/learning/validation.py +346 -346
alma/mcp/__init__.py +123 -45
alma/mcp/__main__.py +156 -156
alma/mcp/resources.py +122 -122
alma/mcp/server.py +955 -591
alma/mcp/tools.py +3254 -511
alma/observability/__init__.py +91 -0
alma/observability/config.py +302 -0
alma/observability/guidelines.py +170 -0
alma/observability/logging.py +424 -0
alma/observability/metrics.py +583 -0
alma/observability/tracing.py +440 -0
alma/progress/__init__.py +21 -21
alma/progress/tracker.py +607 -607
alma/progress/types.py +250 -250
alma/retrieval/__init__.py +134 -53
alma/retrieval/budget.py +525 -0
alma/retrieval/cache.py +1304 -1061
alma/retrieval/embeddings.py +202 -202
alma/retrieval/engine.py +850 -366
alma/retrieval/modes.py +365 -0
alma/retrieval/progressive.py +560 -0
alma/retrieval/scoring.py +344 -344
alma/retrieval/trust_scoring.py +637 -0
alma/retrieval/verification.py +797 -0
alma/session/__init__.py +19 -19
alma/session/manager.py +442 -399
alma/session/types.py +288 -288
alma/storage/__init__.py +101 -61
alma/storage/archive.py +233 -0
alma/storage/azure_cosmos.py +1259 -1048
alma/storage/base.py +1083 -525
alma/storage/chroma.py +1443 -1443
alma/storage/constants.py +103 -0
alma/storage/file_based.py +614 -619
alma/storage/migrations/__init__.py +21 -0
alma/storage/migrations/base.py +321 -0
alma/storage/migrations/runner.py +323 -0
alma/storage/migrations/version_stores.py +337 -0
alma/storage/migrations/versions/__init__.py +11 -0
alma/storage/migrations/versions/v1_0_0.py +373 -0
alma/storage/migrations/versions/v1_1_0_workflow_context.py +551 -0
alma/storage/pinecone.py +1080 -1080
alma/storage/postgresql.py +1948 -1452
alma/storage/qdrant.py +1306 -1306
alma/storage/sqlite_local.py +3041 -1358
alma/testing/__init__.py +46 -0
alma/testing/factories.py +301 -0
alma/testing/mocks.py +389 -0
alma/types.py +292 -264
alma/utils/__init__.py +19 -0
alma/utils/tokenizer.py +521 -0
alma/workflow/__init__.py +83 -0
alma/workflow/artifacts.py +170 -0
alma/workflow/checkpoint.py +311 -0
alma/workflow/context.py +228 -0
alma/workflow/outcomes.py +189 -0
alma/workflow/reducers.py +393 -0
{alma_memory-0.5.0.dist-info → alma_memory-0.7.0.dist-info}/METADATA +244 -72
alma_memory-0.7.0.dist-info/RECORD +112 -0
alma_memory-0.5.0.dist-info/RECORD +0 -76
{alma_memory-0.5.0.dist-info → alma_memory-0.7.0.dist-info}/WHEEL +0 -0
{alma_memory-0.5.0.dist-info → alma_memory-0.7.0.dist-info}/top_level.txt +0 -0

alma/retrieval/scoring.py CHANGED Viewed

@@ -1,344 +1,344 @@
-"""
-ALMA Memory Scoring.
-Combines semantic similarity, recency, and success rate for optimal retrieval.
-"""
-import math
-from dataclasses import dataclass
-from datetime import datetime, timezone
-from typing import Any, List, Optional
-from alma.types import AntiPattern, DomainKnowledge, Heuristic, Outcome
-@dataclass
-class ScoringWeights:
-    """
-    Configurable weights for memory scoring.
-    All weights should sum to 1.0 for normalized scores.
-    """
-    similarity: float = 0.4  # Semantic relevance to query
-    recency: float = 0.3  # How recently the memory was validated/used
-    success_rate: float = 0.2  # Historical success rate
-    confidence: float = 0.1  # Stored confidence score
-    def __post_init__(self):
-        """Validate weights sum to approximately 1.0."""
-        total = self.similarity + self.recency + self.success_rate + self.confidence
-        if not (0.99 <= total <= 1.01):
-            # Normalize if not summing to 1
-            self.similarity /= total
-            self.recency /= total
-            self.success_rate /= total
-            self.confidence /= total
-@dataclass
-class ScoredItem:
-    """A memory item with its computed score."""
-    item: Any
-    score: float
-    similarity_score: float
-    recency_score: float
-    success_score: float
-    confidence_score: float
-class MemoryScorer:
-    """
-    Scores memories based on multiple factors for optimal retrieval.
-    Factors:
-    - Semantic similarity (from vector search)
-    - Recency (newer memories preferred, with decay)
-    - Success rate (for heuristics and outcomes)
-    - Confidence (stored confidence values)
-    """
-    def __init__(
-        self,
-        weights: Optional[ScoringWeights] = None,
-        recency_half_life_days: float = 30.0,
-    ):
-        """
-        Initialize scorer.
-        Args:
-            weights: Scoring weights for each factor
-            recency_half_life_days: Days after which recency score is halved
-        """
-        self.weights = weights or ScoringWeights()
-        self.recency_half_life = recency_half_life_days
-    def score_heuristics(
-        self,
-        heuristics: List[Heuristic],
-        similarities: Optional[List[float]] = None,
-    ) -> List[ScoredItem]:
-        """
-        Score and rank heuristics.
-        Args:
-            heuristics: List of heuristics to score
-            similarities: Optional pre-computed similarity scores (0-1)
-        Returns:
-            Sorted list of ScoredItems (highest first)
-        """
-        if not heuristics:
-            return []
-        similarities = similarities or [1.0] * len(heuristics)
-        scored = []
-        for h, sim in zip(heuristics, similarities, strict=False):
-            recency = self._compute_recency_score(h.last_validated)
-            success = h.success_rate
-            confidence = h.confidence
-            total = (
-                self.weights.similarity * sim
-                + self.weights.recency * recency
-                + self.weights.success_rate * success
-                + self.weights.confidence * confidence
-            )
-            scored.append(
-                ScoredItem(
-                    item=h,
-                    score=total,
-                    similarity_score=sim,
-                    recency_score=recency,
-                    success_score=success,
-                    confidence_score=confidence,
-                )
-            )
-        return sorted(scored, key=lambda x: -x.score)
-    def score_outcomes(
-        self,
-        outcomes: List[Outcome],
-        similarities: Optional[List[float]] = None,
-    ) -> List[ScoredItem]:
-        """
-        Score and rank outcomes.
-        Successful outcomes score higher, but failures are still included
-        for learning purposes.
-        Args:
-            outcomes: List of outcomes to score
-            similarities: Optional pre-computed similarity scores (0-1)
-        Returns:
-            Sorted list of ScoredItems (highest first)
-        """
-        if not outcomes:
-            return []
-        similarities = similarities or [1.0] * len(outcomes)
-        scored = []
-        for o, sim in zip(outcomes, similarities, strict=False):
-            recency = self._compute_recency_score(o.timestamp)
-            # Success gets full score, failure gets partial (still useful to learn from)
-            success = 1.0 if o.success else 0.3
-            # Outcomes don't have stored confidence, default to 1.0
-            confidence = 1.0
-            total = (
-                self.weights.similarity * sim
-                + self.weights.recency * recency
-                + self.weights.success_rate * success
-                + self.weights.confidence * confidence
-            )
-            scored.append(
-                ScoredItem(
-                    item=o,
-                    score=total,
-                    similarity_score=sim,
-                    recency_score=recency,
-                    success_score=success,
-                    confidence_score=confidence,
-                )
-            )
-        return sorted(scored, key=lambda x: -x.score)
-    def score_domain_knowledge(
-        self,
-        knowledge: List[DomainKnowledge],
-        similarities: Optional[List[float]] = None,
-    ) -> List[ScoredItem]:
-        """
-        Score and rank domain knowledge.
-        Args:
-            knowledge: List of domain knowledge to score
-            similarities: Optional pre-computed similarity scores (0-1)
-        Returns:
-            Sorted list of ScoredItems (highest first)
-        """
-        if not knowledge:
-            return []
-        similarities = similarities or [1.0] * len(knowledge)
-        scored = []
-        for dk, sim in zip(knowledge, similarities, strict=False):
-            recency = self._compute_recency_score(dk.last_verified)
-            # Knowledge doesn't have success rate, use 1.0
-            success = 1.0
-            confidence = dk.confidence
-            total = (
-                self.weights.similarity * sim
-                + self.weights.recency * recency
-                + self.weights.success_rate * success
-                + self.weights.confidence * confidence
-            )
-            scored.append(
-                ScoredItem(
-                    item=dk,
-                    score=total,
-                    similarity_score=sim,
-                    recency_score=recency,
-                    success_score=success,
-                    confidence_score=confidence,
-                )
-            )
-        return sorted(scored, key=lambda x: -x.score)
-    def score_anti_patterns(
-        self,
-        anti_patterns: List[AntiPattern],
-        similarities: Optional[List[float]] = None,
-    ) -> List[ScoredItem]:
-        """
-        Score and rank anti-patterns.
-        Anti-patterns that were seen recently are more relevant.
-        Args:
-            anti_patterns: List of anti-patterns to score
-            similarities: Optional pre-computed similarity scores (0-1)
-        Returns:
-            Sorted list of ScoredItems (highest first)
-        """
-        if not anti_patterns:
-            return []
-        similarities = similarities or [1.0] * len(anti_patterns)
-        scored = []
-        for ap, sim in zip(anti_patterns, similarities, strict=False):
-            recency = self._compute_recency_score(ap.last_seen)
-            # More occurrences = more important to avoid
-            # Normalize occurrence count (cap at 10 for scoring)
-            success = min(ap.occurrence_count / 10.0, 1.0)
-            confidence = 1.0
-            total = (
-                self.weights.similarity * sim
-                + self.weights.recency * recency
-                + self.weights.success_rate * success
-                + self.weights.confidence * confidence
-            )
-            scored.append(
-                ScoredItem(
-                    item=ap,
-                    score=total,
-                    similarity_score=sim,
-                    recency_score=recency,
-                    success_score=success,
-                    confidence_score=confidence,
-                )
-            )
-        return sorted(scored, key=lambda x: -x.score)
-    def _compute_recency_score(self, timestamp: datetime) -> float:
-        """
-        Compute recency score using exponential decay.
-        Score = 0.5 ^ (days_ago / half_life)
-        Args:
-            timestamp: When the memory was last validated/used
-        Returns:
-            Score between 0 and 1 (1 = now, decays over time)
-        """
-        now = datetime.now(timezone.utc)
-        # Handle naive datetimes
-        if timestamp.tzinfo is None:
-            timestamp = timestamp.replace(tzinfo=timezone.utc)
-        delta = now - timestamp
-        days_ago = delta.total_seconds() / (24 * 60 * 60)
-        # Exponential decay: score halves every half_life days
-        return math.pow(0.5, days_ago / self.recency_half_life)
-    def apply_score_threshold(
-        self,
-        scored_items: List[ScoredItem],
-        min_score: float = 0.2,
-    ) -> List[ScoredItem]:
-        """
-        Filter out items below a minimum score threshold.
-        Args:
-            scored_items: List of scored items
-            min_score: Minimum score to keep (0-1)
-        Returns:
-            Filtered list
-        """
-        return [item for item in scored_items if item.score >= min_score]
-def compute_composite_score(
-    similarity: float,
-    recency_days: float,
-    success_rate: float,
-    confidence: float,
-    weights: Optional[ScoringWeights] = None,
-    recency_half_life: float = 30.0,
-) -> float:
-    """
-    Convenience function to compute a single composite score.
-    Args:
-        similarity: Semantic similarity (0-1)
-        recency_days: Days since last validation
-        success_rate: Historical success rate (0-1)
-        confidence: Stored confidence (0-1)
-        weights: Optional scoring weights
-        recency_half_life: Days after which recency score halves
-    Returns:
-        Composite score (0-1)
-    """
-    weights = weights or ScoringWeights()
-    recency_score = math.pow(0.5, recency_days / recency_half_life)
-    return (
-        weights.similarity * similarity
-        + weights.recency * recency_score
-        + weights.success_rate * success_rate
-        + weights.confidence * confidence
-    )
+"""
+ALMA Memory Scoring.
+Combines semantic similarity, recency, and success rate for optimal retrieval.
+"""
+import math
+from dataclasses import dataclass
+from datetime import datetime, timezone
+from typing import Any, List, Optional
+from alma.types import AntiPattern, DomainKnowledge, Heuristic, Outcome
+@dataclass
+class ScoringWeights:
+    """
+    Configurable weights for memory scoring.
+    All weights should sum to 1.0 for normalized scores.
+    """
+    similarity: float = 0.4  # Semantic relevance to query
+    recency: float = 0.3  # How recently the memory was validated/used
+    success_rate: float = 0.2  # Historical success rate
+    confidence: float = 0.1  # Stored confidence score
+    def __post_init__(self):
+        """Validate weights sum to approximately 1.0."""
+        total = self.similarity + self.recency + self.success_rate + self.confidence
+        if not (0.99 <= total <= 1.01):
+            # Normalize if not summing to 1
+            self.similarity /= total
+            self.recency /= total
+            self.success_rate /= total
+            self.confidence /= total
+@dataclass
+class ScoredItem:
+    """A memory item with its computed score."""
+    item: Any
+    score: float
+    similarity_score: float
+    recency_score: float
+    success_score: float
+    confidence_score: float
+class MemoryScorer:
+    """
+    Scores memories based on multiple factors for optimal retrieval.
+    Factors:
+    - Semantic similarity (from vector search)
+    - Recency (newer memories preferred, with decay)
+    - Success rate (for heuristics and outcomes)
+    - Confidence (stored confidence values)
+    """
+    def __init__(
+        self,
+        weights: Optional[ScoringWeights] = None,
+        recency_half_life_days: float = 30.0,
+    ):
+        """
+        Initialize scorer.
+        Args:
+            weights: Scoring weights for each factor
+            recency_half_life_days: Days after which recency score is halved
+        """
+        self.weights = weights or ScoringWeights()
+        self.recency_half_life = recency_half_life_days
+    def score_heuristics(
+        self,
+        heuristics: List[Heuristic],
+        similarities: Optional[List[float]] = None,
+    ) -> List[ScoredItem]:
+        """
+        Score and rank heuristics.
+        Args:
+            heuristics: List of heuristics to score
+            similarities: Optional pre-computed similarity scores (0-1)
+        Returns:
+            Sorted list of ScoredItems (highest first)
+        """
+        if not heuristics:
+            return []
+        similarities = similarities or [1.0] * len(heuristics)
+        scored = []
+        for h, sim in zip(heuristics, similarities, strict=False):
+            recency = self._compute_recency_score(h.last_validated)
+            success = h.success_rate
+            confidence = h.confidence
+            total = (
+                self.weights.similarity * sim
+                + self.weights.recency * recency
+                + self.weights.success_rate * success
+                + self.weights.confidence * confidence
+            )
+            scored.append(
+                ScoredItem(
+                    item=h,
+                    score=total,
+                    similarity_score=sim,
+                    recency_score=recency,
+                    success_score=success,
+                    confidence_score=confidence,
+                )
+            )
+        return sorted(scored, key=lambda x: -x.score)
+    def score_outcomes(
+        self,
+        outcomes: List[Outcome],
+        similarities: Optional[List[float]] = None,
+    ) -> List[ScoredItem]:
+        """
+        Score and rank outcomes.
+        Successful outcomes score higher, but failures are still included
+        for learning purposes.
+        Args:
+            outcomes: List of outcomes to score
+            similarities: Optional pre-computed similarity scores (0-1)
+        Returns:
+            Sorted list of ScoredItems (highest first)
+        """
+        if not outcomes:
+            return []
+        similarities = similarities or [1.0] * len(outcomes)
+        scored = []
+        for o, sim in zip(outcomes, similarities, strict=False):
+            recency = self._compute_recency_score(o.timestamp)
+            # Success gets full score, failure gets partial (still useful to learn from)
+            success = 1.0 if o.success else 0.3
+            # Outcomes don't have stored confidence, default to 1.0
+            confidence = 1.0
+            total = (
+                self.weights.similarity * sim
+                + self.weights.recency * recency
+                + self.weights.success_rate * success
+                + self.weights.confidence * confidence
+            )
+            scored.append(
+                ScoredItem(
+                    item=o,
+                    score=total,
+                    similarity_score=sim,
+                    recency_score=recency,
+                    success_score=success,
+                    confidence_score=confidence,
+                )
+            )
+        return sorted(scored, key=lambda x: -x.score)
+    def score_domain_knowledge(
+        self,
+        knowledge: List[DomainKnowledge],
+        similarities: Optional[List[float]] = None,
+    ) -> List[ScoredItem]:
+        """
+        Score and rank domain knowledge.
+        Args:
+            knowledge: List of domain knowledge to score
+            similarities: Optional pre-computed similarity scores (0-1)
+        Returns:
+            Sorted list of ScoredItems (highest first)
+        """
+        if not knowledge:
+            return []
+        similarities = similarities or [1.0] * len(knowledge)
+        scored = []
+        for dk, sim in zip(knowledge, similarities, strict=False):
+            recency = self._compute_recency_score(dk.last_verified)
+            # Knowledge doesn't have success rate, use 1.0
+            success = 1.0
+            confidence = dk.confidence
+            total = (
+                self.weights.similarity * sim
+                + self.weights.recency * recency
+                + self.weights.success_rate * success
+                + self.weights.confidence * confidence
+            )
+            scored.append(
+                ScoredItem(
+                    item=dk,
+                    score=total,
+                    similarity_score=sim,
+                    recency_score=recency,
+                    success_score=success,
+                    confidence_score=confidence,
+                )
+            )
+        return sorted(scored, key=lambda x: -x.score)
+    def score_anti_patterns(
+        self,
+        anti_patterns: List[AntiPattern],
+        similarities: Optional[List[float]] = None,
+    ) -> List[ScoredItem]:
+        """
+        Score and rank anti-patterns.
+        Anti-patterns that were seen recently are more relevant.
+        Args:
+            anti_patterns: List of anti-patterns to score
+            similarities: Optional pre-computed similarity scores (0-1)
+        Returns:
+            Sorted list of ScoredItems (highest first)
+        """
+        if not anti_patterns:
+            return []
+        similarities = similarities or [1.0] * len(anti_patterns)
+        scored = []
+        for ap, sim in zip(anti_patterns, similarities, strict=False):
+            recency = self._compute_recency_score(ap.last_seen)
+            # More occurrences = more important to avoid
+            # Normalize occurrence count (cap at 10 for scoring)
+            success = min(ap.occurrence_count / 10.0, 1.0)
+            confidence = 1.0
+            total = (
+                self.weights.similarity * sim
+                + self.weights.recency * recency
+                + self.weights.success_rate * success
+                + self.weights.confidence * confidence
+            )
+            scored.append(
+                ScoredItem(
+                    item=ap,
+                    score=total,
+                    similarity_score=sim,
+                    recency_score=recency,
+                    success_score=success,
+                    confidence_score=confidence,
+                )
+            )
+        return sorted(scored, key=lambda x: -x.score)
+    def _compute_recency_score(self, timestamp: datetime) -> float:
+        """
+        Compute recency score using exponential decay.
+        Score = 0.5 ^ (days_ago / half_life)
+        Args:
+            timestamp: When the memory was last validated/used
+        Returns:
+            Score between 0 and 1 (1 = now, decays over time)
+        """
+        now = datetime.now(timezone.utc)
+        # Handle naive datetimes
+        if timestamp.tzinfo is None:
+            timestamp = timestamp.replace(tzinfo=timezone.utc)
+        delta = now - timestamp
+        days_ago = delta.total_seconds() / (24 * 60 * 60)
+        # Exponential decay: score halves every half_life days
+        return math.pow(0.5, days_ago / self.recency_half_life)
+    def apply_score_threshold(
+        self,
+        scored_items: List[ScoredItem],
+        min_score: float = 0.2,
+    ) -> List[ScoredItem]:
+        """
+        Filter out items below a minimum score threshold.
+        Args:
+            scored_items: List of scored items
+            min_score: Minimum score to keep (0-1)
+        Returns:
+            Filtered list
+        """
+        return [item for item in scored_items if item.score >= min_score]
+def compute_composite_score(
+    similarity: float,
+    recency_days: float,
+    success_rate: float,
+    confidence: float,
+    weights: Optional[ScoringWeights] = None,
+    recency_half_life: float = 30.0,
+) -> float:
+    """
+    Convenience function to compute a single composite score.
+    Args:
+        similarity: Semantic similarity (0-1)
+        recency_days: Days since last validation
+        success_rate: Historical success rate (0-1)
+        confidence: Stored confidence (0-1)
+        weights: Optional scoring weights
+        recency_half_life: Days after which recency score halves
+    Returns:
+        Composite score (0-1)
+    """
+    weights = weights or ScoringWeights()
+    recency_score = math.pow(0.5, recency_days / recency_half_life)
+    return (
+        weights.similarity * similarity
+        + weights.recency * recency_score
+        + weights.success_rate * success_rate
+        + weights.confidence * confidence
+    )

alma-memory 0.5.0__py3-none-any.whl → 0.7.0__py3-none-any.whl

alma-memory 0.5.0py3-none-any.whl → 0.7.0py3-none-any.whl