PyPI - alma-memory - Versions diffs - 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl - Mend

alma-memory 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (111) hide show

alma/__init__.py +296 -226
alma/compression/__init__.py +33 -0
alma/compression/pipeline.py +980 -0
alma/confidence/__init__.py +47 -47
alma/confidence/engine.py +540 -540
alma/confidence/types.py +351 -351
alma/config/loader.py +157 -157
alma/consolidation/__init__.py +23 -23
alma/consolidation/engine.py +678 -678
alma/consolidation/prompts.py +84 -84
alma/core.py +1189 -430
alma/domains/__init__.py +30 -30
alma/domains/factory.py +359 -359
alma/domains/schemas.py +448 -448
alma/domains/types.py +272 -272
alma/events/__init__.py +75 -75
alma/events/emitter.py +285 -284
alma/events/storage_mixin.py +246 -246
alma/events/types.py +126 -126
alma/events/webhook.py +425 -425
alma/exceptions.py +49 -49
alma/extraction/__init__.py +31 -31
alma/extraction/auto_learner.py +265 -265
alma/extraction/extractor.py +420 -420
alma/graph/__init__.py +106 -106
alma/graph/backends/__init__.py +32 -32
alma/graph/backends/kuzu.py +624 -624
alma/graph/backends/memgraph.py +432 -432
alma/graph/backends/memory.py +236 -236
alma/graph/backends/neo4j.py +417 -417
alma/graph/base.py +159 -159
alma/graph/extraction.py +198 -198
alma/graph/store.py +860 -860
alma/harness/__init__.py +35 -35
alma/harness/base.py +386 -386
alma/harness/domains.py +705 -705
alma/initializer/__init__.py +37 -37
alma/initializer/initializer.py +418 -418
alma/initializer/types.py +250 -250
alma/integration/__init__.py +62 -62
alma/integration/claude_agents.py +444 -444
alma/integration/helena.py +423 -423
alma/integration/victor.py +471 -471
alma/learning/__init__.py +101 -86
alma/learning/decay.py +878 -0
alma/learning/forgetting.py +1446 -1446
alma/learning/heuristic_extractor.py +390 -390
alma/learning/protocols.py +374 -374
alma/learning/validation.py +346 -346
alma/mcp/__init__.py +123 -45
alma/mcp/__main__.py +156 -156
alma/mcp/resources.py +122 -122
alma/mcp/server.py +955 -591
alma/mcp/tools.py +3254 -509
alma/observability/__init__.py +91 -84
alma/observability/config.py +302 -302
alma/observability/guidelines.py +170 -0
alma/observability/logging.py +424 -424
alma/observability/metrics.py +583 -583
alma/observability/tracing.py +440 -440
alma/progress/__init__.py +21 -21
alma/progress/tracker.py +607 -607
alma/progress/types.py +250 -250
alma/retrieval/__init__.py +134 -53
alma/retrieval/budget.py +525 -0
alma/retrieval/cache.py +1304 -1061
alma/retrieval/embeddings.py +202 -202
alma/retrieval/engine.py +850 -427
alma/retrieval/modes.py +365 -0
alma/retrieval/progressive.py +560 -0
alma/retrieval/scoring.py +344 -344
alma/retrieval/trust_scoring.py +637 -0
alma/retrieval/verification.py +797 -0
alma/session/__init__.py +19 -19
alma/session/manager.py +442 -399
alma/session/types.py +288 -288
alma/storage/__init__.py +101 -90
alma/storage/archive.py +233 -0
alma/storage/azure_cosmos.py +1259 -1259
alma/storage/base.py +1083 -583
alma/storage/chroma.py +1443 -1443
alma/storage/constants.py +103 -103
alma/storage/file_based.py +614 -614
alma/storage/migrations/__init__.py +21 -21
alma/storage/migrations/base.py +321 -321
alma/storage/migrations/runner.py +323 -323
alma/storage/migrations/version_stores.py +337 -337
alma/storage/migrations/versions/__init__.py +11 -11
alma/storage/migrations/versions/v1_0_0.py +373 -373
alma/storage/migrations/versions/v1_1_0_workflow_context.py +551 -0
alma/storage/pinecone.py +1080 -1080
alma/storage/postgresql.py +1948 -1559
alma/storage/qdrant.py +1306 -1306
alma/storage/sqlite_local.py +3041 -1457
alma/testing/__init__.py +46 -46
alma/testing/factories.py +301 -301
alma/testing/mocks.py +389 -389
alma/types.py +292 -264
alma/utils/__init__.py +19 -0
alma/utils/tokenizer.py +521 -0
alma/workflow/__init__.py +83 -0
alma/workflow/artifacts.py +170 -0
alma/workflow/checkpoint.py +311 -0
alma/workflow/context.py +228 -0
alma/workflow/outcomes.py +189 -0
alma/workflow/reducers.py +393 -0
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/METADATA +210 -72
alma_memory-0.7.0.dist-info/RECORD +112 -0
alma_memory-0.5.1.dist-info/RECORD +0 -93
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/WHEEL +0 -0
{alma_memory-0.5.1.dist-info → alma_memory-0.7.0.dist-info}/top_level.txt +0 -0

alma/retrieval/embeddings.py CHANGED Viewed

@@ -1,202 +1,202 @@
-"""
-ALMA Embedding Providers.
-Supports local (sentence-transformers) and Azure OpenAI embeddings.
-"""
-import logging
-from abc import ABC, abstractmethod
-from typing import List, Optional
-logger = logging.getLogger(__name__)
-class EmbeddingProvider(ABC):
-    """Abstract base class for embedding providers."""
-    @abstractmethod
-    def encode(self, text: str) -> List[float]:
-        """Generate embedding for text."""
-        pass
-    @abstractmethod
-    def encode_batch(self, texts: List[str]) -> List[List[float]]:
-        """Generate embeddings for multiple texts."""
-        pass
-    @property
-    @abstractmethod
-    def dimension(self) -> int:
-        """Return embedding dimension."""
-        pass
-class LocalEmbedder(EmbeddingProvider):
-    """
-    Local embeddings using sentence-transformers.
-    Default model: all-MiniLM-L6-v2 (384 dimensions, fast, good quality)
-    """
-    def __init__(self, model_name: str = "all-MiniLM-L6-v2"):
-        """
-        Initialize local embedder.
-        Args:
-            model_name: Sentence-transformers model name
-        """
-        self.model_name = model_name
-        self._model = None
-        self._dimension: Optional[int] = None
-    def _load_model(self):
-        """Lazy load the model."""
-        if self._model is None:
-            try:
-                from sentence_transformers import SentenceTransformer
-                logger.info(f"Loading embedding model: {self.model_name}")
-                self._model = SentenceTransformer(self.model_name)
-                self._dimension = self._model.get_sentence_embedding_dimension()
-                logger.info(f"Model loaded, dimension: {self._dimension}")
-            except ImportError as err:
-                raise ImportError(
-                    "sentence-transformers is required for local embeddings. "
-                    "Install with: pip install sentence-transformers"
-                ) from err
-    def encode(self, text: str) -> List[float]:
-        """Generate embedding for text."""
-        self._load_model()
-        embedding = self._model.encode(text, normalize_embeddings=True)
-        return embedding.tolist()
-    def encode_batch(self, texts: List[str]) -> List[List[float]]:
-        """Generate embeddings for multiple texts."""
-        self._load_model()
-        embeddings = self._model.encode(texts, normalize_embeddings=True)
-        return [emb.tolist() for emb in embeddings]
-    @property
-    def dimension(self) -> int:
-        """Return embedding dimension."""
-        if self._dimension is None:
-            self._load_model()
-        return self._dimension or 384  # Default for all-MiniLM-L6-v2
-class AzureEmbedder(EmbeddingProvider):
-    """
-    Azure OpenAI embeddings.
-    Uses text-embedding-3-small by default (1536 dimensions).
-    """
-    def __init__(
-        self,
-        endpoint: Optional[str] = None,
-        api_key: Optional[str] = None,
-        deployment: str = "text-embedding-3-small",
-        api_version: str = "2024-02-01",
-    ):
-        """
-        Initialize Azure OpenAI embedder.
-        Args:
-            endpoint: Azure OpenAI endpoint (or use AZURE_OPENAI_ENDPOINT env var)
-            api_key: Azure OpenAI API key (or use AZURE_OPENAI_KEY env var)
-            deployment: Deployment name for embedding model
-            api_version: API version
-        """
-        import os
-        self.endpoint = endpoint or os.environ.get("AZURE_OPENAI_ENDPOINT")
-        self.api_key = api_key or os.environ.get("AZURE_OPENAI_KEY")
-        self.deployment = deployment
-        self.api_version = api_version
-        self._client = None
-        self._dimension = 1536  # Default for text-embedding-3-small
-        if not self.endpoint:
-            raise ValueError(
-                "Azure OpenAI endpoint required. Set AZURE_OPENAI_ENDPOINT env var "
-                "or pass endpoint parameter."
-            )
-    def _get_client(self):
-        """Get or create Azure OpenAI client."""
-        if self._client is None:
-            try:
-                from openai import AzureOpenAI
-                self._client = AzureOpenAI(
-                    azure_endpoint=self.endpoint,
-                    api_key=self.api_key,
-                    api_version=self.api_version,
-                )
-            except ImportError as err:
-                raise ImportError(
-                    "openai is required for Azure embeddings. "
-                    "Install with: pip install openai"
-                ) from err
-        return self._client
-    def encode(self, text: str) -> List[float]:
-        """Generate embedding for text."""
-        client = self._get_client()
-        response = client.embeddings.create(
-            input=text,
-            model=self.deployment,
-        )
-        return response.data[0].embedding
-    def encode_batch(self, texts: List[str]) -> List[List[float]]:
-        """Generate embeddings for multiple texts."""
-        client = self._get_client()
-        response = client.embeddings.create(
-            input=texts,
-            model=self.deployment,
-        )
-        # Sort by index to ensure order matches input
-        sorted_data = sorted(response.data, key=lambda x: x.index)
-        return [item.embedding for item in sorted_data]
-    @property
-    def dimension(self) -> int:
-        """Return embedding dimension."""
-        return self._dimension
-class MockEmbedder(EmbeddingProvider):
-    """
-    Mock embedder for testing.
-    Generates deterministic fake embeddings based on text hash.
-    """
-    def __init__(self, dimension: int = 384):
-        """Initialize mock embedder."""
-        self._dimension = dimension
-    def encode(self, text: str) -> List[float]:
-        """Generate fake embedding based on text hash."""
-        import hashlib
-        # Create deterministic embedding from text hash
-        hash_bytes = hashlib.sha256(text.encode()).digest()
-        # Use first N bytes to create float values
-        embedding = []
-        for i in range(self._dimension):
-            byte_val = hash_bytes[i % len(hash_bytes)]
-            # Normalize to [-1, 1] range
-            embedding.append((byte_val / 127.5) - 1.0)
-        return embedding
-    def encode_batch(self, texts: List[str]) -> List[List[float]]:
-        """Generate fake embeddings for multiple texts."""
-        return [self.encode(text) for text in texts]
-    @property
-    def dimension(self) -> int:
-        """Return embedding dimension."""
-        return self._dimension
+"""
+ALMA Embedding Providers.
+Supports local (sentence-transformers) and Azure OpenAI embeddings.
+"""
+import logging
+from abc import ABC, abstractmethod
+from typing import List, Optional
+logger = logging.getLogger(__name__)
+class EmbeddingProvider(ABC):
+    """Abstract base class for embedding providers."""
+    @abstractmethod
+    def encode(self, text: str) -> List[float]:
+        """Generate embedding for text."""
+        pass
+    @abstractmethod
+    def encode_batch(self, texts: List[str]) -> List[List[float]]:
+        """Generate embeddings for multiple texts."""
+        pass
+    @property
+    @abstractmethod
+    def dimension(self) -> int:
+        """Return embedding dimension."""
+        pass
+class LocalEmbedder(EmbeddingProvider):
+    """
+    Local embeddings using sentence-transformers.
+    Default model: all-MiniLM-L6-v2 (384 dimensions, fast, good quality)
+    """
+    def __init__(self, model_name: str = "all-MiniLM-L6-v2"):
+        """
+        Initialize local embedder.
+        Args:
+            model_name: Sentence-transformers model name
+        """
+        self.model_name = model_name
+        self._model = None
+        self._dimension: Optional[int] = None
+    def _load_model(self):
+        """Lazy load the model."""
+        if self._model is None:
+            try:
+                from sentence_transformers import SentenceTransformer
+                logger.info(f"Loading embedding model: {self.model_name}")
+                self._model = SentenceTransformer(self.model_name)
+                self._dimension = self._model.get_sentence_embedding_dimension()
+                logger.info(f"Model loaded, dimension: {self._dimension}")
+            except ImportError as err:
+                raise ImportError(
+                    "sentence-transformers is required for local embeddings. "
+                    "Install with: pip install sentence-transformers"
+                ) from err
+    def encode(self, text: str) -> List[float]:
+        """Generate embedding for text."""
+        self._load_model()
+        embedding = self._model.encode(text, normalize_embeddings=True)
+        return embedding.tolist()
+    def encode_batch(self, texts: List[str]) -> List[List[float]]:
+        """Generate embeddings for multiple texts."""
+        self._load_model()
+        embeddings = self._model.encode(texts, normalize_embeddings=True)
+        return [emb.tolist() for emb in embeddings]
+    @property
+    def dimension(self) -> int:
+        """Return embedding dimension."""
+        if self._dimension is None:
+            self._load_model()
+        return self._dimension or 384  # Default for all-MiniLM-L6-v2
+class AzureEmbedder(EmbeddingProvider):
+    """
+    Azure OpenAI embeddings.
+    Uses text-embedding-3-small by default (1536 dimensions).
+    """
+    def __init__(
+        self,
+        endpoint: Optional[str] = None,
+        api_key: Optional[str] = None,
+        deployment: str = "text-embedding-3-small",
+        api_version: str = "2024-02-01",
+    ):
+        """
+        Initialize Azure OpenAI embedder.
+        Args:
+            endpoint: Azure OpenAI endpoint (or use AZURE_OPENAI_ENDPOINT env var)
+            api_key: Azure OpenAI API key (or use AZURE_OPENAI_KEY env var)
+            deployment: Deployment name for embedding model
+            api_version: API version
+        """
+        import os
+        self.endpoint = endpoint or os.environ.get("AZURE_OPENAI_ENDPOINT")
+        self.api_key = api_key or os.environ.get("AZURE_OPENAI_KEY")
+        self.deployment = deployment
+        self.api_version = api_version
+        self._client = None
+        self._dimension = 1536  # Default for text-embedding-3-small
+        if not self.endpoint:
+            raise ValueError(
+                "Azure OpenAI endpoint required. Set AZURE_OPENAI_ENDPOINT env var "
+                "or pass endpoint parameter."
+            )
+    def _get_client(self):
+        """Get or create Azure OpenAI client."""
+        if self._client is None:
+            try:
+                from openai import AzureOpenAI
+                self._client = AzureOpenAI(
+                    azure_endpoint=self.endpoint,
+                    api_key=self.api_key,
+                    api_version=self.api_version,
+                )
+            except ImportError as err:
+                raise ImportError(
+                    "openai is required for Azure embeddings. "
+                    "Install with: pip install openai"
+                ) from err
+        return self._client
+    def encode(self, text: str) -> List[float]:
+        """Generate embedding for text."""
+        client = self._get_client()
+        response = client.embeddings.create(
+            input=text,
+            model=self.deployment,
+        )
+        return response.data[0].embedding
+    def encode_batch(self, texts: List[str]) -> List[List[float]]:
+        """Generate embeddings for multiple texts."""
+        client = self._get_client()
+        response = client.embeddings.create(
+            input=texts,
+            model=self.deployment,
+        )
+        # Sort by index to ensure order matches input
+        sorted_data = sorted(response.data, key=lambda x: x.index)
+        return [item.embedding for item in sorted_data]
+    @property
+    def dimension(self) -> int:
+        """Return embedding dimension."""
+        return self._dimension
+class MockEmbedder(EmbeddingProvider):
+    """
+    Mock embedder for testing.
+    Generates deterministic fake embeddings based on text hash.
+    """
+    def __init__(self, dimension: int = 384):
+        """Initialize mock embedder."""
+        self._dimension = dimension
+    def encode(self, text: str) -> List[float]:
+        """Generate fake embedding based on text hash."""
+        import hashlib
+        # Create deterministic embedding from text hash
+        hash_bytes = hashlib.sha256(text.encode()).digest()
+        # Use first N bytes to create float values
+        embedding = []
+        for i in range(self._dimension):
+            byte_val = hash_bytes[i % len(hash_bytes)]
+            # Normalize to [-1, 1] range
+            embedding.append((byte_val / 127.5) - 1.0)
+        return embedding
+    def encode_batch(self, texts: List[str]) -> List[List[float]]:
+        """Generate fake embeddings for multiple texts."""
+        return [self.encode(text) for text in texts]
+    @property
+    def dimension(self) -> int:
+        """Return embedding dimension."""
+        return self._dimension

alma-memory 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl

alma-memory 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl