PyPI - tribalmemory - Versions diffs - 0.1.0__py3-none-any.whl - Mend

tribalmemory 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (51) hide show

tribalmemory/__init__.py +3 -0
tribalmemory/a21/__init__.py +38 -0
tribalmemory/a21/config/__init__.py +20 -0
tribalmemory/a21/config/providers.py +104 -0
tribalmemory/a21/config/system.py +184 -0
tribalmemory/a21/container/__init__.py +8 -0
tribalmemory/a21/container/container.py +212 -0
tribalmemory/a21/providers/__init__.py +32 -0
tribalmemory/a21/providers/base.py +241 -0
tribalmemory/a21/providers/deduplication.py +99 -0
tribalmemory/a21/providers/lancedb.py +232 -0
tribalmemory/a21/providers/memory.py +128 -0
tribalmemory/a21/providers/mock.py +54 -0
tribalmemory/a21/providers/openai.py +151 -0
tribalmemory/a21/providers/timestamp.py +88 -0
tribalmemory/a21/system.py +293 -0
tribalmemory/cli.py +298 -0
tribalmemory/interfaces.py +306 -0
tribalmemory/mcp/__init__.py +9 -0
tribalmemory/mcp/__main__.py +6 -0
tribalmemory/mcp/server.py +484 -0
tribalmemory/performance/__init__.py +1 -0
tribalmemory/performance/benchmarks.py +285 -0
tribalmemory/performance/corpus_generator.py +171 -0
tribalmemory/portability/__init__.py +1 -0
tribalmemory/portability/embedding_metadata.py +320 -0
tribalmemory/server/__init__.py +9 -0
tribalmemory/server/__main__.py +6 -0
tribalmemory/server/app.py +187 -0
tribalmemory/server/config.py +115 -0
tribalmemory/server/models.py +206 -0
tribalmemory/server/routes.py +378 -0
tribalmemory/services/__init__.py +15 -0
tribalmemory/services/deduplication.py +115 -0
tribalmemory/services/embeddings.py +273 -0
tribalmemory/services/import_export.py +506 -0
tribalmemory/services/memory.py +275 -0
tribalmemory/services/vector_store.py +360 -0
tribalmemory/testing/__init__.py +22 -0
tribalmemory/testing/embedding_utils.py +110 -0
tribalmemory/testing/fixtures.py +123 -0
tribalmemory/testing/metrics.py +256 -0
tribalmemory/testing/mocks.py +560 -0
tribalmemory/testing/semantic_expansions.py +91 -0
tribalmemory/utils.py +23 -0
tribalmemory-0.1.0.dist-info/METADATA +275 -0
tribalmemory-0.1.0.dist-info/RECORD +51 -0
tribalmemory-0.1.0.dist-info/WHEEL +5 -0
tribalmemory-0.1.0.dist-info/entry_points.txt +3 -0
tribalmemory-0.1.0.dist-info/licenses/LICENSE +190 -0
tribalmemory-0.1.0.dist-info/top_level.txt +1 -0

tribalmemory/performance/benchmarks.py ADDED Viewed

@@ -0,0 +1,285 @@
+"""Performance benchmarks for Tribal Memory.
+Provides functions to measure retrieval latency, embedding throughput,
+and cache effectiveness using mock services for CI-friendly execution.
+"""
+import random
+import statistics
+import time
+from dataclasses import dataclass
+from ..testing.mocks import MockEmbeddingService, MockVectorStore
+from .corpus_generator import CorpusConfig, generate_corpus
+@dataclass
+class LatencyStats:
+    """Latency percentile statistics in milliseconds."""
+    p50: float
+    p95: float
+    p99: float
+    mean: float
+    min: float
+    max: float
+@dataclass
+class BenchmarkResult:
+    """Result of a retrieval latency benchmark."""
+    corpus_size: int
+    num_queries: int
+    stats: LatencyStats
+@dataclass
+class ThroughputResult:
+    """Result of an embedding throughput benchmark."""
+    total_embeddings: int
+    total_time_ms: float
+    embeddings_per_second: float
+    batch_size: int
+@dataclass
+class CacheResult:
+    """Result of a cache effectiveness benchmark.
+    'Cache hits' here means queries that were repeats of previously
+    seen queries (simulating a query cache). 'Cache misses' are
+    first-time queries that would require full embedding + retrieval.
+    """
+    total_queries: int
+    cache_hits: int     # Repeated queries (would be served from cache)
+    cache_misses: int   # First-seen queries (require full retrieval)
+    hit_rate: float
+    avg_hit_latency_ms: float
+    avg_miss_latency_ms: float
+async def benchmark_retrieval_latency(
+    corpus_size: int = 1000,
+    num_queries: int = 50,
+    seed: int = 42,
+) -> BenchmarkResult:
+    """Benchmark retrieval latency at a given corpus size.
+    Populates a mock store with `corpus_size` entries, then
+    measures latency of `num_queries` random recall operations.
+    Args:
+        corpus_size: Number of memories to populate.
+        num_queries: Number of recall queries to measure.
+        seed: Random seed for reproducibility.
+    Returns:
+        BenchmarkResult with p50/p95/p99 latency stats.
+    """
+    rng = random.Random(seed)
+    # Use small embedding dimension for benchmark speed (the dimension
+    # doesn't affect retrieval algorithm complexity, just constant factors)
+    embedding_dim = 64
+    embedding_service = MockEmbeddingService(
+        embedding_dim=embedding_dim, skip_latency=True
+    )
+    vector_store = MockVectorStore(embedding_service)
+    # Populate corpus
+    corpus = generate_corpus(CorpusConfig(size=corpus_size, seed=seed))
+    for entry in corpus:
+        entry.embedding = await embedding_service.embed(entry.content)
+        await vector_store.store(entry)
+    # Generate query texts
+    queries = [
+        rng.choice(corpus).content[:50]  # Use prefix of random entry
+        for _ in range(num_queries)
+    ]
+    # Pre-compute query embeddings (not part of latency measurement)
+    query_embeddings = [
+        await embedding_service.embed(q) for q in queries
+    ]
+    # Measure retrieval latencies (vector store only — the core path)
+    latencies: list[float] = []
+    for qe in query_embeddings:
+        start = time.perf_counter()
+        await vector_store.recall(qe, limit=5, min_similarity=0.1)
+        elapsed_ms = (time.perf_counter() - start) * 1000
+        latencies.append(elapsed_ms)
+    latencies.sort()
+    stats = LatencyStats(
+        p50=_percentile(latencies, 50),
+        p95=_percentile(latencies, 95),
+        p99=_percentile(latencies, 99),
+        mean=statistics.mean(latencies),
+        min=min(latencies),
+        max=max(latencies),
+    )
+    return BenchmarkResult(
+        corpus_size=corpus_size,
+        num_queries=num_queries,
+        stats=stats,
+    )
+async def benchmark_batch_embedding_throughput(
+    num_texts: int = 500,
+    batch_size: int = 50,
+    seed: int = 42,
+) -> ThroughputResult:
+    """Benchmark embedding generation throughput.
+    Measures how many embeddings per second the service can produce,
+    comparing single vs batch modes.
+    Args:
+        num_texts: Total number of texts to embed.
+        batch_size: Size of each batch (1 for single mode).
+        seed: Random seed for reproducibility.
+    Returns:
+        ThroughputResult with throughput metrics.
+    """
+    service = MockEmbeddingService(embedding_dim=64, skip_latency=True)
+    # Generate texts
+    corpus = generate_corpus(CorpusConfig(size=num_texts, seed=seed))
+    texts = [entry.content for entry in corpus]
+    # Embed in batches
+    start = time.perf_counter()
+    for i in range(0, len(texts), batch_size):
+        batch = texts[i:i + batch_size]
+        await service.embed_batch(batch)
+    total_ms = (time.perf_counter() - start) * 1000
+    return ThroughputResult(
+        total_embeddings=num_texts,
+        total_time_ms=total_ms,
+        embeddings_per_second=num_texts / (total_ms / 1000) if total_ms > 0 else 0,
+        batch_size=batch_size,
+    )
+async def benchmark_cache_effectiveness(
+    corpus_size: int = 500,
+    num_queries: int = 100,
+    repeat_ratio: float = 0.5,
+    seed: int = 42,
+) -> CacheResult:
+    """Benchmark query cache effectiveness.
+    Simulates a realistic workload with a mix of repeated and unique
+    queries, measuring cache hit rates and latency impact.
+    Args:
+        corpus_size: Number of memories in the store.
+        num_queries: Total number of queries to run.
+        repeat_ratio: Fraction of queries that are repeats (0.0-1.0).
+        seed: Random seed for reproducibility.
+    Returns:
+        CacheResult with hit rate and latency metrics.
+    """
+    rng = random.Random(seed)
+    # Use small embedding dimension for benchmark speed
+    embedding_dim = 64
+    embedding_service = MockEmbeddingService(
+        embedding_dim=embedding_dim, skip_latency=True
+    )
+    vector_store = MockVectorStore(embedding_service)
+    # Populate corpus
+    corpus = generate_corpus(CorpusConfig(size=corpus_size, seed=seed))
+    for entry in corpus:
+        entry.embedding = await embedding_service.embed(entry.content)
+        await vector_store.store(entry)
+    # Generate a pool of truly unique queries (sample without replacement)
+    pool_size = min(len(corpus), num_queries * 2)
+    unique_pool = rng.sample(corpus, k=pool_size)
+    unique_queries = list(dict.fromkeys(
+        entry.content[:50] for entry in unique_pool
+    ))  # Deduplicate while preserving order
+    seen_queries: list[str] = []  # Ordered list for repeat selection
+    seen_set: set[str] = set()
+    cache_hits = 0
+    cache_misses = 0
+    hit_latencies: list[float] = []
+    miss_latencies: list[float] = []
+    unique_idx = 0  # Track position in unique pool (no replacement)
+    # Cache of embeddings to simulate cache behavior
+    embedding_cache: dict[str, list[float]] = {}
+    for i in range(num_queries):
+        if rng.random() < repeat_ratio and seen_queries:
+            # Pick a previously seen query (repeat)
+            query = rng.choice(seen_queries)
+            is_repeat = True
+        else:
+            # Pick next unique query (sequential, no replacement)
+            if unique_idx < len(unique_queries):
+                query = unique_queries[unique_idx]
+                unique_idx += 1
+            else:
+                # Exhausted unique pool, fall back to random
+                query = rng.choice(unique_queries)
+            is_repeat = query in seen_set
+        # Simulate cache: reuse embedding if seen before
+        if query in embedding_cache:
+            query_embedding = embedding_cache[query]
+        else:
+            query_embedding = await embedding_service.embed(query)
+            embedding_cache[query] = query_embedding
+        start = time.perf_counter()
+        await vector_store.recall(query_embedding, limit=5, min_similarity=0.3)
+        elapsed_ms = (time.perf_counter() - start) * 1000
+        if is_repeat:
+            cache_hits += 1
+            hit_latencies.append(elapsed_ms)
+        else:
+            cache_misses += 1
+            miss_latencies.append(elapsed_ms)
+        if query not in seen_set:
+            seen_queries.append(query)
+            seen_set.add(query)
+    hit_rate = cache_hits / num_queries if num_queries > 0 else 0.0
+    return CacheResult(
+        total_queries=num_queries,
+        cache_hits=cache_hits,
+        cache_misses=cache_misses,
+        hit_rate=hit_rate,
+        avg_hit_latency_ms=(
+            statistics.mean(hit_latencies) if hit_latencies else 0.0
+        ),
+        avg_miss_latency_ms=(
+            statistics.mean(miss_latencies) if miss_latencies else 0.0
+        ),
+    )
+def _percentile(sorted_data: list[float], pct: int) -> float:
+    """Calculate percentile from sorted data using nearest-rank method.
+    Uses simple index-based lookup without interpolation. Sufficient
+    for benchmark reporting where exact percentile precision isn't critical.
+    """
+    if not sorted_data:
+        return 0.0
+    idx = int(len(sorted_data) * pct / 100)
+    idx = min(idx, len(sorted_data) - 1)
+    return sorted_data[idx]

tribalmemory/performance/corpus_generator.py ADDED Viewed

@@ -0,0 +1,171 @@
+"""Synthetic corpus generator for scale/performance testing.
+Generates realistic memory entries with varied content, tags,
+and source types for benchmarking retrieval and storage.
+"""
+import random
+from dataclasses import dataclass
+from typing import Optional
+from ..interfaces import MemoryEntry, MemorySource
+@dataclass
+class CorpusConfig:
+    """Configuration for corpus generation."""
+    size: int = 1000
+    seed: Optional[int] = None
+    min_content_words: int = 5
+    max_content_words: int = 30
+# Realistic memory content templates
+_TEMPLATES = [
+    "User prefers {preference} for {domain}",
+    "Meeting with {person} scheduled for {time}",
+    "{person} mentioned they like {preference}",
+    "Project {project} uses {technology} for {purpose}",
+    "Important: {fact} about {topic}",
+    "User's {attribute} is {value}",
+    "{person} works at {company} on {project}",
+    "Reminder: {task} is due {time}",
+    "The {tool} configuration uses {setting}",
+    "Conversation about {topic} with {person}",
+    "{person} prefers {preference} over {alternative}",
+    "Bug in {project}: {description}",
+    "Decision: use {technology} for {purpose}",
+    "User asked about {topic} in the context of {domain}",
+    "Note: {fact} regarding {topic}",
+]
+_PERSONS = [
+    "Joe", "Alice", "Bob", "Charlie", "Diana", "Eve",
+    "Frank", "Grace", "Hank", "Iris", "Jake", "Karen",
+]
+_PREFERENCES = [
+    "dark mode", "TypeScript", "Python", "concise responses",
+    "morning meetings", "async communication", "vim", "VS Code",
+    "functional programming", "microservices", "monorepos",
+    "test-driven development", "pair programming", "remote work",
+]
+_DOMAINS = [
+    "web development", "machine learning", "DevOps", "UI design",
+    "backend services", "data engineering", "mobile apps",
+    "cloud infrastructure", "security", "performance optimization",
+]
+_PROJECTS = [
+    "Wally", "TribalMemory", "OpenClaw", "Dashboard",
+    "API Gateway", "Auth Service", "Analytics", "Notifications",
+]
+_TECHNOLOGIES = [
+    "React", "FastAPI", "PostgreSQL", "Redis", "Docker",
+    "Kubernetes", "LanceDB", "OpenAI", "Tailscale", "Synapse",
+]
+_TOPICS = [
+    "embedding models", "vector search", "memory portability",
+    "performance tuning", "caching strategies", "deduplication",
+    "schema migrations", "API versioning", "error handling",
+    "security best practices", "testing strategies", "CI/CD",
+]
+_TAGS_POOL = [
+    "preferences", "meetings", "projects", "technical",
+    "personal", "work", "urgent", "low-priority",
+    "architecture", "bugs", "decisions", "reminders",
+]
+_SOURCES = [
+    MemorySource.USER_EXPLICIT,
+    MemorySource.AUTO_CAPTURE,
+    MemorySource.CROSS_INSTANCE,
+]
+def generate_corpus(config: Optional[CorpusConfig] = None) -> list[MemoryEntry]:
+    """Generate a synthetic corpus of memory entries.
+    Args:
+        config: Corpus generation configuration. Uses defaults if None.
+    Returns:
+        List of MemoryEntry objects with varied content and metadata.
+    """
+    config = config or CorpusConfig()
+    rng = random.Random(config.seed)
+    entries: list[MemoryEntry] = []
+    for _ in range(config.size):
+        template = rng.choice(_TEMPLATES)
+        content = _fill_template(template, rng)
+        tags = rng.sample(_TAGS_POOL, k=rng.randint(1, 3))
+        source = rng.choice(_SOURCES)
+        entry = MemoryEntry(
+            content=content,
+            tags=tags,
+            source_type=source,
+            source_instance=f"instance-{rng.randint(1, 5)}",
+        )
+        entries.append(entry)
+    return entries
+def _fill_template(template: str, rng: random.Random) -> str:
+    """Fill a template with random realistic values."""
+    replacements = {
+        "{preference}": rng.choice(_PREFERENCES),
+        "{domain}": rng.choice(_DOMAINS),
+        "{person}": rng.choice(_PERSONS),
+        "{time}": rng.choice([
+            "next Monday", "tomorrow", "Friday afternoon",
+            "end of sprint", "Q2", "next week",
+        ]),
+        "{project}": rng.choice(_PROJECTS),
+        "{technology}": rng.choice(_TECHNOLOGIES),
+        "{purpose}": rng.choice([
+            "the backend", "testing", "deployment", "monitoring",
+            "data storage", "real-time updates", "authentication",
+        ]),
+        "{topic}": rng.choice(_TOPICS),
+        "{attribute}": rng.choice([
+            "timezone", "favorite language", "team", "role",
+            "preferred editor", "working hours",
+        ]),
+        "{value}": rng.choice([
+            "Mountain Time", "Python", "engineering", "senior dev",
+            "VS Code", "9am-5pm", "night owl hours",
+        ]),
+        "{company}": rng.choice([
+            "Google", "a startup", "Anthropic", "OpenAI",
+            "Meta", "a consulting firm",
+        ]),
+        "{tool}": rng.choice([
+            "Docker", "Kubernetes", "Nginx", "Redis",
+            "PostgreSQL", "LanceDB",
+        ]),
+        "{setting}": rng.choice([
+            "port 8080", "max_connections=100", "debug=false",
+            "cache_ttl=3600", "workers=4",
+        ]),
+        "{fact}": rng.choice([
+            "embeddings need normalization", "cache invalidation is hard",
+            "deadline was moved", "requirements changed",
+            "API rate limit is 100/min", "tests must pass before merge",
+        ]),
+        "{task}": rng.choice([
+            "code review", "deploy to staging", "update docs",
+            "run benchmarks", "fix flaky test", "merge PR",
+        ]),
+        "{alternative}": rng.choice(_PREFERENCES),
+        "{description}": rng.choice([
+            "query timeout under load", "missing error handler",
+            "incorrect cache key", "race condition in startup",
+            "memory leak in long sessions",
+        ]),
+    }
+    result = template
+    for key, value in replacements.items():
+        result = result.replace(key, value)
+    return result

tribalmemory/portability/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ """Portability module for embedding model metadata and bundle import/export."""