PyPI - alma-memory - Versions diffs - 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl - Mend

alma-memory 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (111) hide show

alma/__init__.py +296 -226
alma/compression/__init__.py +33 -0
alma/compression/pipeline.py +980 -0
alma/confidence/__init__.py +47 -47
alma/confidence/engine.py +540 -540
alma/confidence/types.py +351 -351
alma/config/loader.py +157 -157
alma/consolidation/__init__.py +23 -23
alma/consolidation/engine.py +678 -678
alma/consolidation/prompts.py +84 -84
alma/core.py +1189 -430
alma/domains/__init__.py +30 -30
alma/domains/factory.py +359 -359
alma/domains/schemas.py +448 -448
alma/domains/types.py +272 -272
alma/events/__init__.py +75 -75
alma/events/emitter.py +285 -284
alma/events/storage_mixin.py +246 -246
alma/events/types.py +126 -126
alma/events/webhook.py +425 -425
alma/exceptions.py +49 -49
alma/extraction/__init__.py +31 -31
alma/extraction/auto_learner.py +265 -265
alma/extraction/extractor.py +420 -420
alma/graph/__init__.py +106 -106
alma/graph/backends/__init__.py +32 -32
alma/graph/backends/kuzu.py +624 -624
alma/graph/backends/memgraph.py +432 -432
alma/graph/backends/memory.py +236 -236
alma/graph/backends/neo4j.py +417 -417
alma/graph/base.py +159 -159
alma/graph/extraction.py +198 -198
alma/graph/store.py +860 -860
alma/harness/__init__.py +35 -35
alma/harness/base.py +386 -386
alma/harness/domains.py +705 -705
alma/initializer/__init__.py +37 -37
alma/initializer/initializer.py +418 -418
alma/initializer/types.py +250 -250
alma/integration/__init__.py +62 -62
alma/integration/claude_agents.py +444 -444
alma/integration/helena.py +423 -423
alma/integration/victor.py +471 -471
alma/learning/__init__.py +101 -86
alma/learning/decay.py +878 -0
alma/learning/forgetting.py +1446 -1446
alma/learning/heuristic_extractor.py +390 -390
alma/learning/protocols.py +374 -374
alma/learning/validation.py +346 -346
alma/mcp/__init__.py +123 -45
alma/mcp/__main__.py +156 -156
alma/mcp/resources.py +122 -122
alma/mcp/server.py +955 -591
alma/mcp/tools.py +3254 -509
alma/observability/__init__.py +91 -84
alma/observability/config.py +302 -302
alma/observability/guidelines.py +170 -0
alma/observability/logging.py +424 -424
alma/observability/metrics.py +583 -583
alma/observability/tracing.py +440 -440
alma/progress/__init__.py +21 -21
alma/progress/tracker.py +607 -607
alma/progress/types.py +250 -250
alma/retrieval/__init__.py +134 -53
alma/retrieval/budget.py +525 -0
alma/retrieval/cache.py +1304 -1061
alma/retrieval/embeddings.py +202 -202
alma/retrieval/engine.py +850 -427
alma/retrieval/modes.py +365 -0
alma/retrieval/progressive.py +560 -0
alma/retrieval/scoring.py +344 -344
alma/retrieval/trust_scoring.py +637 -0
alma/retrieval/verification.py +797 -0
alma/session/__init__.py +19 -19
alma/session/manager.py +442 -399
alma/session/types.py +288 -288
alma/storage/__init__.py +101 -90
alma/storage/archive.py +233 -0
alma/storage/azure_cosmos.py +1259 -1259
alma/storage/base.py +1083 -583
alma/storage/chroma.py +1443 -1443
alma/storage/constants.py +103 -103
alma/storage/file_based.py +614 -614
alma/storage/migrations/__init__.py +21 -21
alma/storage/migrations/base.py +321 -321
alma/storage/migrations/runner.py +323 -323
alma/storage/migrations/version_stores.py +337 -337
alma/storage/migrations/versions/__init__.py +11 -11
alma/storage/migrations/versions/v1_0_0.py +373 -373
alma/storage/migrations/versions/v1_1_0_workflow_context.py +551 -0
alma/storage/pinecone.py +1080 -1080
alma/storage/postgresql.py +1948 -1559
alma/storage/qdrant.py +1306 -1306
alma/storage/sqlite_local.py +3041 -1457
alma/testing/__init__.py +46 -46
alma/testing/factories.py +301 -301
alma/testing/mocks.py +389 -389
alma/types.py +292 -264
alma/utils/__init__.py +19 -0
alma/utils/tokenizer.py +521 -0
alma/workflow/__init__.py +83 -0
alma/workflow/artifacts.py +170 -0
alma/workflow/checkpoint.py +311 -0
alma/workflow/context.py +228 -0
alma/workflow/outcomes.py +189 -0
alma/workflow/reducers.py +393 -0
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/METADATA +210 -72
alma_memory-0.7.0.dist-info/RECORD +112 -0
alma_memory-0.5.1.dist-info/RECORD +0 -93
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/WHEEL +0 -0
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/top_level.txt +0 -0

alma/retrieval/progressive.py ADDED Viewed

@@ -0,0 +1,560 @@
+"""
+ALMA Progressive Disclosure.
+Implements summary → detail retrieval pattern to optimize context usage.
+Based on context engineering principle: "Must know exists" before "must see."
+Features:
+- Summary extraction for memory items
+- Lazy-loading of full details on demand
+- Reference IDs for fetch-on-demand pattern
+- Tiered disclosure (summary → key details → full content)
+"""
+import logging
+from dataclasses import dataclass, field
+from enum import Enum
+from typing import Any, Dict, List, Optional
+from alma.types import (
+    AntiPattern,
+    DomainKnowledge,
+    Heuristic,
+    Outcome,
+    UserPreference,
+)
+logger = logging.getLogger(__name__)
+class DisclosureLevel(Enum):
+    """Levels of detail for progressive disclosure."""
+    REFERENCE = 1  # Just ID and type - agent knows it exists
+    SUMMARY = 2  # Brief summary - enough to decide if needed
+    KEY_DETAILS = 3  # Important fields only
+    FULL = 4  # Complete memory with all details
+@dataclass
+class MemorySummary:
+    """Compact summary of a memory item."""
+    id: str
+    memory_type: str
+    summary: str
+    relevance_hint: str  # Why this might be relevant
+    estimated_tokens: int
+    disclosure_level: DisclosureLevel = DisclosureLevel.SUMMARY
+    # Optional key details (for KEY_DETAILS level)
+    key_fields: Dict[str, Any] = field(default_factory=dict)
+    # Reference to full item (for lazy loading)
+    _full_item: Optional[Any] = field(default=None, repr=False)
+    def get_full(self) -> Optional[Any]:
+        """Get full item if available."""
+        return self._full_item
+@dataclass
+class ProgressiveSlice:
+    """
+    Memory slice with progressive disclosure support.
+    Contains summaries by default, with ability to fetch full details
+    on demand.
+    """
+    # Summaries by type
+    heuristic_summaries: List[MemorySummary] = field(default_factory=list)
+    outcome_summaries: List[MemorySummary] = field(default_factory=list)
+    knowledge_summaries: List[MemorySummary] = field(default_factory=list)
+    anti_pattern_summaries: List[MemorySummary] = field(default_factory=list)
+    preference_summaries: List[MemorySummary] = field(default_factory=list)
+    # Full items (populated on demand)
+    _full_items: Dict[str, Any] = field(default_factory=dict, repr=False)
+    # Metadata
+    query: str = ""
+    agent: str = ""
+    total_available: int = 0
+    summaries_included: int = 0
+    estimated_summary_tokens: int = 0
+    @property
+    def all_summaries(self) -> List[MemorySummary]:
+        """Get all summaries across types."""
+        return (
+            self.heuristic_summaries
+            + self.outcome_summaries
+            + self.knowledge_summaries
+            + self.anti_pattern_summaries
+            + self.preference_summaries
+        )
+    def get_full_item(self, memory_id: str) -> Optional[Any]:
+        """Get full item by ID (lazy load if needed)."""
+        # Check cache first
+        if memory_id in self._full_items:
+            return self._full_items[memory_id]
+        # Check summaries for attached full items
+        for summary in self.all_summaries:
+            if summary.id == memory_id and summary._full_item:
+                self._full_items[memory_id] = summary._full_item
+                return summary._full_item
+        return None
+    def get_ids_by_type(self, memory_type: str) -> List[str]:
+        """Get all IDs for a memory type."""
+        type_map = {
+            "heuristic": self.heuristic_summaries,
+            "outcome": self.outcome_summaries,
+            "domain_knowledge": self.knowledge_summaries,
+            "anti_pattern": self.anti_pattern_summaries,
+            "preference": self.preference_summaries,
+        }
+        summaries = type_map.get(memory_type, [])
+        return [s.id for s in summaries]
+class SummaryExtractor:
+    """Extracts summaries from memory items."""
+    def __init__(
+        self,
+        max_summary_length: int = 100,
+        chars_per_token: int = 4,
+    ):
+        self.max_summary_length = max_summary_length
+        self.chars_per_token = chars_per_token
+    def extract_heuristic_summary(
+        self,
+        h: Heuristic,
+        level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ) -> MemorySummary:
+        """Extract summary from a heuristic."""
+        if level == DisclosureLevel.REFERENCE:
+            summary = f"Heuristic: {h.condition[:30]}..."
+            relevance = "Learned pattern"
+        elif level == DisclosureLevel.SUMMARY:
+            summary = self._truncate(
+                f"When {h.condition}, {h.strategy}",
+                self.max_summary_length,
+            )
+            relevance = (
+                f"Success rate: {h.success_rate:.0%}, Confidence: {h.confidence:.0%}"
+            )
+        else:  # KEY_DETAILS or FULL
+            summary = f"When {h.condition}, {h.strategy}"
+            relevance = f"Used {h.occurrence_count}x, {h.success_rate:.0%} success"
+        key_fields = {}
+        if level >= DisclosureLevel.KEY_DETAILS:
+            key_fields = {
+                "confidence": h.confidence,
+                "success_rate": h.success_rate,
+                "occurrence_count": h.occurrence_count,
+            }
+        return MemorySummary(
+            id=h.id,
+            memory_type="heuristic",
+            summary=summary,
+            relevance_hint=relevance,
+            estimated_tokens=len(summary) // self.chars_per_token + 10,
+            disclosure_level=level,
+            key_fields=key_fields,
+            _full_item=h if level == DisclosureLevel.FULL else None,
+        )
+    def extract_outcome_summary(
+        self,
+        o: Outcome,
+        level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ) -> MemorySummary:
+        """Extract summary from an outcome."""
+        status = "Success" if o.success else "Failed"
+        if level == DisclosureLevel.REFERENCE:
+            summary = f"Outcome: {o.task_type} ({status})"
+            relevance = f"{o.task_type} task"
+        elif level == DisclosureLevel.SUMMARY:
+            summary = self._truncate(
+                f"{status}: {o.task_description} using {o.strategy_used}",
+                self.max_summary_length,
+            )
+            relevance = f"{o.task_type} - {status}"
+        else:
+            summary = f"{status}: {o.task_description}\nStrategy: {o.strategy_used}"
+            if o.error_message:
+                summary += f"\nError: {o.error_message}"
+            relevance = f"{o.task_type} task outcome"
+        key_fields = {}
+        if level >= DisclosureLevel.KEY_DETAILS:
+            key_fields = {
+                "success": o.success,
+                "task_type": o.task_type,
+                "strategy_used": o.strategy_used,
+            }
+            if o.error_message:
+                key_fields["error"] = o.error_message[:100]
+        return MemorySummary(
+            id=o.id,
+            memory_type="outcome",
+            summary=summary,
+            relevance_hint=relevance,
+            estimated_tokens=len(summary) // self.chars_per_token + 10,
+            disclosure_level=level,
+            key_fields=key_fields,
+            _full_item=o if level == DisclosureLevel.FULL else None,
+        )
+    def extract_knowledge_summary(
+        self,
+        k: DomainKnowledge,
+        level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ) -> MemorySummary:
+        """Extract summary from domain knowledge."""
+        fact_str = str(k.fact)[:100] if k.fact else "N/A"
+        if level == DisclosureLevel.REFERENCE:
+            summary = f"Knowledge: {k.domain}"
+            relevance = f"Domain: {k.domain}"
+        elif level == DisclosureLevel.SUMMARY:
+            summary = self._truncate(
+                f"[{k.domain}] {fact_str}",
+                self.max_summary_length,
+            )
+            relevance = f"Confidence: {k.confidence:.0%}"
+        else:
+            summary = f"Domain: {k.domain}\nFact: {fact_str}\nSource: {k.source}"
+            relevance = f"Domain knowledge, {k.confidence:.0%} confidence"
+        key_fields = {}
+        if level >= DisclosureLevel.KEY_DETAILS:
+            key_fields = {
+                "domain": k.domain,
+                "confidence": k.confidence,
+                "source": k.source,
+            }
+        return MemorySummary(
+            id=k.id,
+            memory_type="domain_knowledge",
+            summary=summary,
+            relevance_hint=relevance,
+            estimated_tokens=len(summary) // self.chars_per_token + 10,
+            disclosure_level=level,
+            key_fields=key_fields,
+            _full_item=k if level == DisclosureLevel.FULL else None,
+        )
+    def extract_anti_pattern_summary(
+        self,
+        ap: AntiPattern,
+        level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ) -> MemorySummary:
+        """Extract summary from an anti-pattern."""
+        if level == DisclosureLevel.REFERENCE:
+            summary = f"Warning: {ap.pattern[:30]}..."
+            relevance = "Known pitfall"
+        elif level == DisclosureLevel.SUMMARY:
+            summary = self._truncate(
+                f"Avoid: {ap.pattern}. {ap.why_bad}",
+                self.max_summary_length,
+            )
+            relevance = f"Seen {ap.occurrence_count}x"
+        else:
+            summary = (
+                f"Pattern to avoid: {ap.pattern}\n"
+                f"Why bad: {ap.why_bad}\n"
+                f"Instead: {ap.better_alternative}"
+            )
+            relevance = f"Occurred {ap.occurrence_count}x"
+        key_fields = {}
+        if level >= DisclosureLevel.KEY_DETAILS:
+            key_fields = {
+                "pattern": ap.pattern,
+                "occurrence_count": ap.occurrence_count,
+                "alternative": ap.better_alternative,
+            }
+        return MemorySummary(
+            id=ap.id,
+            memory_type="anti_pattern",
+            summary=summary,
+            relevance_hint=relevance,
+            estimated_tokens=len(summary) // self.chars_per_token + 10,
+            disclosure_level=level,
+            key_fields=key_fields,
+            _full_item=ap if level == DisclosureLevel.FULL else None,
+        )
+    def extract_preference_summary(
+        self,
+        p: UserPreference,
+        level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ) -> MemorySummary:
+        """Extract summary from a user preference."""
+        if level == DisclosureLevel.REFERENCE:
+            summary = f"Preference: {p.category}"
+            relevance = "User constraint"
+        elif level == DisclosureLevel.SUMMARY:
+            summary = self._truncate(
+                f"[{p.category}] {p.preference}",
+                self.max_summary_length,
+            )
+            relevance = f"Priority: {p.priority}"
+        else:
+            summary = (
+                f"Category: {p.category}\n"
+                f"Preference: {p.preference}\n"
+                f"Context: {p.context or 'General'}"
+            )
+            relevance = f"User preference, priority {p.priority}"
+        key_fields = {}
+        if level >= DisclosureLevel.KEY_DETAILS:
+            key_fields = {
+                "category": p.category,
+                "priority": p.priority,
+            }
+        return MemorySummary(
+            id=p.id,
+            memory_type="preference",
+            summary=summary,
+            relevance_hint=relevance,
+            estimated_tokens=len(summary) // self.chars_per_token + 10,
+            disclosure_level=level,
+            key_fields=key_fields,
+            _full_item=p if level == DisclosureLevel.FULL else None,
+        )
+    def _truncate(self, text: str, max_length: int) -> str:
+        """Truncate text to max length."""
+        if len(text) <= max_length:
+            return text
+        return text[: max_length - 3] + "..."
+class ProgressiveRetrieval:
+    """
+    Retrieval with progressive disclosure support.
+    Returns summaries first, allowing agents to request full details
+    only for items they need.
+    Usage:
+        progressive = ProgressiveRetrieval(retrieval_engine, storage)
+        # Get summaries
+        slice = progressive.retrieve_summaries(query, agent, project_id)
+        # Get full details for specific items
+        full_heuristic = progressive.get_full_item("heuristic-123", "heuristic")
+    """
+    def __init__(
+        self,
+        retrieval_engine: Any,  # RetrievalEngine
+        storage: Any,  # StorageBackend
+        default_level: DisclosureLevel = DisclosureLevel.SUMMARY,
+    ):
+        self.engine = retrieval_engine
+        self.storage = storage
+        self.default_level = default_level
+        self.extractor = SummaryExtractor()
+        # Cache for fetched full items
+        self._item_cache: Dict[str, Any] = {}
+    def retrieve_summaries(
+        self,
+        query: str,
+        agent: str,
+        project_id: str,
+        user_id: Optional[str] = None,
+        top_k: int = 10,
+        level: Optional[DisclosureLevel] = None,
+        **kwargs,
+    ) -> ProgressiveSlice:
+        """
+        Retrieve memory summaries (not full content).
+        Returns compact summaries that fit more items in context.
+        Use get_full_item() to fetch complete details when needed.
+        """
+        level = level or self.default_level
+        # Get full results from engine
+        raw_slice = self.engine.retrieve(
+            query=query,
+            agent=agent,
+            project_id=project_id,
+            user_id=user_id,
+            top_k=top_k,
+            **kwargs,
+        )
+        # Extract summaries
+        heuristic_summaries = [
+            self.extractor.extract_heuristic_summary(h, level)
+            for h in raw_slice.heuristics
+        ]
+        outcome_summaries = [
+            self.extractor.extract_outcome_summary(o, level) for o in raw_slice.outcomes
+        ]
+        knowledge_summaries = [
+            self.extractor.extract_knowledge_summary(k, level)
+            for k in raw_slice.domain_knowledge
+        ]
+        anti_pattern_summaries = [
+            self.extractor.extract_anti_pattern_summary(ap, level)
+            for ap in raw_slice.anti_patterns
+        ]
+        preference_summaries = [
+            self.extractor.extract_preference_summary(p, level)
+            for p in raw_slice.preferences
+        ]
+        # Calculate totals
+        all_summaries = (
+            heuristic_summaries
+            + outcome_summaries
+            + knowledge_summaries
+            + anti_pattern_summaries
+            + preference_summaries
+        )
+        total_tokens = sum(s.estimated_tokens for s in all_summaries)
+        # Cache full items for lazy loading
+        for h in raw_slice.heuristics:
+            self._item_cache[h.id] = h
+        for o in raw_slice.outcomes:
+            self._item_cache[o.id] = o
+        for k in raw_slice.domain_knowledge:
+            self._item_cache[k.id] = k
+        for ap in raw_slice.anti_patterns:
+            self._item_cache[ap.id] = ap
+        for p in raw_slice.preferences:
+            self._item_cache[p.id] = p
+        return ProgressiveSlice(
+            heuristic_summaries=heuristic_summaries,
+            outcome_summaries=outcome_summaries,
+            knowledge_summaries=knowledge_summaries,
+            anti_pattern_summaries=anti_pattern_summaries,
+            preference_summaries=preference_summaries,
+            query=query,
+            agent=agent,
+            total_available=raw_slice.total_items,
+            summaries_included=len(all_summaries),
+            estimated_summary_tokens=total_tokens,
+        )
+    def get_full_item(
+        self,
+        memory_id: str,
+        memory_type: str,
+    ) -> Optional[Any]:
+        """
+        Get full details for a specific memory item.
+        This is the "fetch on demand" part of progressive disclosure.
+        """
+        # Check cache first
+        if memory_id in self._item_cache:
+            logger.debug(f"Cache hit for {memory_type}:{memory_id}")
+            return self._item_cache[memory_id]
+        # Fetch from storage
+        logger.debug(f"Fetching {memory_type}:{memory_id} from storage")
+        item = None
+        if memory_type == "heuristic":
+            item = self.storage.get_heuristic_by_id(memory_id)
+        elif memory_type == "outcome":
+            item = self.storage.get_outcome_by_id(memory_id)
+        elif memory_type == "domain_knowledge":
+            item = self.storage.get_domain_knowledge_by_id(memory_id)
+        elif memory_type == "anti_pattern":
+            item = self.storage.get_anti_pattern_by_id(memory_id)
+        elif memory_type == "preference":
+            item = self.storage.get_preference_by_id(memory_id)
+        if item:
+            self._item_cache[memory_id] = item
+        return item
+    def get_multiple_full_items(
+        self,
+        memory_ids: List[str],
+        memory_type: str,
+    ) -> List[Any]:
+        """Get full details for multiple items."""
+        return [
+            item
+            for item in (self.get_full_item(mid, memory_type) for mid in memory_ids)
+            if item is not None
+        ]
+    def clear_cache(self) -> None:
+        """Clear the item cache."""
+        self._item_cache.clear()
+    def format_summaries_for_context(
+        self,
+        progressive_slice: ProgressiveSlice,
+        include_fetch_hint: bool = True,
+    ) -> str:
+        """
+        Format summaries for inclusion in agent context.
+        Returns a compact string representation suitable for prompts.
+        """
+        lines = []
+        if progressive_slice.heuristic_summaries:
+            lines.append("## Relevant Patterns")
+            for s in progressive_slice.heuristic_summaries:
+                lines.append(f"- [{s.id}] {s.summary} ({s.relevance_hint})")
+        if progressive_slice.anti_pattern_summaries:
+            lines.append("\n## Warnings")
+            for s in progressive_slice.anti_pattern_summaries:
+                lines.append(f"- [{s.id}] {s.summary} ({s.relevance_hint})")
+        if progressive_slice.outcome_summaries:
+            lines.append("\n## Recent Outcomes")
+            for s in progressive_slice.outcome_summaries:
+                lines.append(f"- [{s.id}] {s.summary}")
+        if progressive_slice.preference_summaries:
+            lines.append("\n## User Preferences")
+            for s in progressive_slice.preference_summaries:
+                lines.append(f"- [{s.id}] {s.summary}")
+        if progressive_slice.knowledge_summaries:
+            lines.append("\n## Domain Knowledge")
+            for s in progressive_slice.knowledge_summaries:
+                lines.append(f"- [{s.id}] {s.summary}")
+        if include_fetch_hint:
+            lines.append(
+                f"\n_({progressive_slice.summaries_included} summaries shown, "
+                f"~{progressive_slice.estimated_summary_tokens} tokens. "
+                f"Request full details by ID if needed.)_"
+            )
+        return "\n".join(lines)

alma-memory 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl

alma-memory 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl