PyPI - remdb - Versions diffs - 0.3.0__py3-none-any.whl - Mend

remdb 0.3.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of remdb might be problematic. Click here for more details.

Files changed (187) hide show

rem/__init__.py +2 -0
rem/agentic/README.md +650 -0
rem/agentic/__init__.py +39 -0
rem/agentic/agents/README.md +155 -0
rem/agentic/agents/__init__.py +8 -0
rem/agentic/context.py +148 -0
rem/agentic/context_builder.py +329 -0
rem/agentic/mcp/__init__.py +0 -0
rem/agentic/mcp/tool_wrapper.py +107 -0
rem/agentic/otel/__init__.py +5 -0
rem/agentic/otel/setup.py +151 -0
rem/agentic/providers/phoenix.py +674 -0
rem/agentic/providers/pydantic_ai.py +572 -0
rem/agentic/query.py +117 -0
rem/agentic/query_helper.py +89 -0
rem/agentic/schema.py +396 -0
rem/agentic/serialization.py +245 -0
rem/agentic/tools/__init__.py +5 -0
rem/agentic/tools/rem_tools.py +231 -0
rem/api/README.md +420 -0
rem/api/main.py +324 -0
rem/api/mcp_router/prompts.py +182 -0
rem/api/mcp_router/resources.py +536 -0
rem/api/mcp_router/server.py +213 -0
rem/api/mcp_router/tools.py +584 -0
rem/api/routers/auth.py +229 -0
rem/api/routers/chat/__init__.py +5 -0
rem/api/routers/chat/completions.py +281 -0
rem/api/routers/chat/json_utils.py +76 -0
rem/api/routers/chat/models.py +124 -0
rem/api/routers/chat/streaming.py +185 -0
rem/auth/README.md +258 -0
rem/auth/__init__.py +26 -0
rem/auth/middleware.py +100 -0
rem/auth/providers/__init__.py +13 -0
rem/auth/providers/base.py +376 -0
rem/auth/providers/google.py +163 -0
rem/auth/providers/microsoft.py +237 -0
rem/cli/README.md +455 -0
rem/cli/__init__.py +8 -0
rem/cli/commands/README.md +126 -0
rem/cli/commands/__init__.py +3 -0
rem/cli/commands/ask.py +566 -0
rem/cli/commands/configure.py +497 -0
rem/cli/commands/db.py +493 -0
rem/cli/commands/dreaming.py +324 -0
rem/cli/commands/experiments.py +1302 -0
rem/cli/commands/mcp.py +66 -0
rem/cli/commands/process.py +245 -0
rem/cli/commands/schema.py +183 -0
rem/cli/commands/serve.py +106 -0
rem/cli/dreaming.py +363 -0
rem/cli/main.py +96 -0
rem/config.py +237 -0
rem/mcp_server.py +41 -0
rem/models/core/__init__.py +49 -0
rem/models/core/core_model.py +64 -0
rem/models/core/engram.py +333 -0
rem/models/core/experiment.py +628 -0
rem/models/core/inline_edge.py +132 -0
rem/models/core/rem_query.py +243 -0
rem/models/entities/__init__.py +43 -0
rem/models/entities/file.py +57 -0
rem/models/entities/image_resource.py +88 -0
rem/models/entities/message.py +35 -0
rem/models/entities/moment.py +123 -0
rem/models/entities/ontology.py +191 -0
rem/models/entities/ontology_config.py +131 -0
rem/models/entities/resource.py +95 -0
rem/models/entities/schema.py +87 -0
rem/models/entities/user.py +85 -0
rem/py.typed +0 -0
rem/schemas/README.md +507 -0
rem/schemas/__init__.py +6 -0
rem/schemas/agents/README.md +92 -0
rem/schemas/agents/core/moment-builder.yaml +178 -0
rem/schemas/agents/core/rem-query-agent.yaml +226 -0
rem/schemas/agents/core/resource-affinity-assessor.yaml +99 -0
rem/schemas/agents/core/simple-assistant.yaml +19 -0
rem/schemas/agents/core/user-profile-builder.yaml +163 -0
rem/schemas/agents/examples/contract-analyzer.yaml +317 -0
rem/schemas/agents/examples/contract-extractor.yaml +134 -0
rem/schemas/agents/examples/cv-parser.yaml +263 -0
rem/schemas/agents/examples/hello-world.yaml +37 -0
rem/schemas/agents/examples/query.yaml +54 -0
rem/schemas/agents/examples/simple.yaml +21 -0
rem/schemas/agents/examples/test.yaml +29 -0
rem/schemas/agents/rem.yaml +128 -0
rem/schemas/evaluators/hello-world/default.yaml +77 -0
rem/schemas/evaluators/rem/faithfulness.yaml +219 -0
rem/schemas/evaluators/rem/lookup-correctness.yaml +182 -0
rem/schemas/evaluators/rem/retrieval-precision.yaml +199 -0
rem/schemas/evaluators/rem/retrieval-recall.yaml +211 -0
rem/schemas/evaluators/rem/search-correctness.yaml +192 -0
rem/services/__init__.py +16 -0
rem/services/audio/INTEGRATION.md +308 -0
rem/services/audio/README.md +376 -0
rem/services/audio/__init__.py +15 -0
rem/services/audio/chunker.py +354 -0
rem/services/audio/transcriber.py +259 -0
rem/services/content/README.md +1269 -0
rem/services/content/__init__.py +5 -0
rem/services/content/providers.py +806 -0
rem/services/content/service.py +676 -0
rem/services/dreaming/README.md +230 -0
rem/services/dreaming/__init__.py +53 -0
rem/services/dreaming/affinity_service.py +336 -0
rem/services/dreaming/moment_service.py +264 -0
rem/services/dreaming/ontology_service.py +54 -0
rem/services/dreaming/user_model_service.py +297 -0
rem/services/dreaming/utils.py +39 -0
rem/services/embeddings/__init__.py +11 -0
rem/services/embeddings/api.py +120 -0
rem/services/embeddings/worker.py +421 -0
rem/services/fs/README.md +662 -0
rem/services/fs/__init__.py +62 -0
rem/services/fs/examples.py +206 -0
rem/services/fs/examples_paths.py +204 -0
rem/services/fs/git_provider.py +935 -0
rem/services/fs/local_provider.py +760 -0
rem/services/fs/parsing-hooks-examples.md +172 -0
rem/services/fs/paths.py +276 -0
rem/services/fs/provider.py +460 -0
rem/services/fs/s3_provider.py +1042 -0
rem/services/fs/service.py +186 -0
rem/services/git/README.md +1075 -0
rem/services/git/__init__.py +17 -0
rem/services/git/service.py +469 -0
rem/services/phoenix/EXPERIMENT_DESIGN.md +1146 -0
rem/services/phoenix/README.md +453 -0
rem/services/phoenix/__init__.py +46 -0
rem/services/phoenix/client.py +686 -0
rem/services/phoenix/config.py +88 -0
rem/services/phoenix/prompt_labels.py +477 -0
rem/services/postgres/README.md +575 -0
rem/services/postgres/__init__.py +23 -0
rem/services/postgres/migration_service.py +427 -0
rem/services/postgres/pydantic_to_sqlalchemy.py +232 -0
rem/services/postgres/register_type.py +352 -0
rem/services/postgres/repository.py +337 -0
rem/services/postgres/schema_generator.py +379 -0
rem/services/postgres/service.py +802 -0
rem/services/postgres/sql_builder.py +354 -0
rem/services/rem/README.md +304 -0
rem/services/rem/__init__.py +23 -0
rem/services/rem/exceptions.py +71 -0
rem/services/rem/executor.py +293 -0
rem/services/rem/parser.py +145 -0
rem/services/rem/queries.py +196 -0
rem/services/rem/query.py +371 -0
rem/services/rem/service.py +527 -0
rem/services/session/README.md +374 -0
rem/services/session/__init__.py +6 -0
rem/services/session/compression.py +360 -0
rem/services/session/reload.py +77 -0
rem/settings.py +1235 -0
rem/sql/002_install_models.sql +1068 -0
rem/sql/background_indexes.sql +42 -0
rem/sql/install_models.sql +1038 -0
rem/sql/migrations/001_install.sql +503 -0
rem/sql/migrations/002_install_models.sql +1202 -0
rem/utils/AGENTIC_CHUNKING.md +597 -0
rem/utils/README.md +583 -0
rem/utils/__init__.py +43 -0
rem/utils/agentic_chunking.py +622 -0
rem/utils/batch_ops.py +343 -0
rem/utils/chunking.py +108 -0
rem/utils/clip_embeddings.py +276 -0
rem/utils/dict_utils.py +98 -0
rem/utils/embeddings.py +423 -0
rem/utils/examples/embeddings_example.py +305 -0
rem/utils/examples/sql_types_example.py +202 -0
rem/utils/markdown.py +16 -0
rem/utils/model_helpers.py +236 -0
rem/utils/schema_loader.py +336 -0
rem/utils/sql_types.py +348 -0
rem/utils/user_id.py +81 -0
rem/utils/vision.py +330 -0
rem/workers/README.md +506 -0
rem/workers/__init__.py +5 -0
rem/workers/dreaming.py +502 -0
rem/workers/engram_processor.py +312 -0
rem/workers/sqs_file_processor.py +193 -0
remdb-0.3.0.dist-info/METADATA +1455 -0
remdb-0.3.0.dist-info/RECORD +187 -0
remdb-0.3.0.dist-info/WHEEL +4 -0
remdb-0.3.0.dist-info/entry_points.txt +2 -0

rem/utils/vision.py ADDED Viewed

@@ -0,0 +1,330 @@
+"""
+Vision utility for image analysis using multiple LLM providers.
+Lightweight implementation supporting three providers:
+- Anthropic Claude (claude-3-5-sonnet-20241022 or newer)
+- Google Gemini (gemini-2.0-flash-exp or newer)
+- OpenAI-compatible (gpt-4o, gpt-4-turbo, or compatible endpoints)
+Handles image encoding and multimodal LLM requests for generating
+markdown descriptions of images.
+"""
+import base64
+import os
+from enum import Enum
+from pathlib import Path
+from typing import Optional
+import requests
+from loguru import logger
+class VisionProvider(str, Enum):
+    """Supported vision providers."""
+    ANTHROPIC = "anthropic"
+    GEMINI = "gemini"
+    OPENAI = "openai"
+class VisionResult:
+    """Result from image vision analysis."""
+    def __init__(
+        self,
+        description: str,
+        provider: VisionProvider,
+        model: str,
+        confidence: float = 0.9,
+    ):
+        """
+        Initialize vision result.
+        Args:
+            description: Markdown description of the image
+            provider: Vision provider used
+            model: Model name used
+            confidence: Confidence score (0.0-1.0)
+        """
+        self.description = description
+        self.provider = provider
+        self.model = model
+        self.confidence = confidence
+    def __repr__(self) -> str:
+        return f"VisionResult(provider={self.provider.value}, model={self.model}, chars={len(self.description)})"
+class ImageAnalyzer:
+    """
+    Analyze images using vision-enabled LLMs.
+    Supports three providers with automatic provider selection based on API keys.
+    """
+    def __init__(
+        self,
+        provider: VisionProvider = VisionProvider.ANTHROPIC,
+        api_key: Optional[str] = None,
+        model: Optional[str] = None,
+        base_url: Optional[str] = None,
+    ):
+        """
+        Initialize image analyzer.
+        Args:
+            provider: Vision provider to use
+            api_key: API key (from env if None)
+            model: Model name (provider default if None)
+            base_url: Custom base URL (for OpenAI-compatible endpoints)
+        """
+        self.provider = provider
+        # Get API key from settings if not provided
+        if api_key is None:
+            from ..settings import settings
+            if provider == VisionProvider.ANTHROPIC:
+                api_key = settings.llm.anthropic_api_key
+            elif provider == VisionProvider.GEMINI:
+                # Gemini uses same key as Google
+                api_key = settings.llm.anthropic_api_key  # TODO: Add gemini_api_key to settings
+            elif provider == VisionProvider.OPENAI:
+                api_key = settings.llm.openai_api_key
+        if not api_key:
+            logger.warning(f"No API key found for {provider.value} - vision analysis will fail")
+        self.api_key = api_key
+        # Set default models
+        if model is None:
+            if provider == VisionProvider.ANTHROPIC:
+                model = "claude-3-5-sonnet-20241022"
+            elif provider == VisionProvider.GEMINI:
+                model = "gemini-2.0-flash-exp"
+            elif provider == VisionProvider.OPENAI:
+                model = "gpt-4o"
+        self.model = model
+        self.base_url = base_url
+    def analyze_image(
+        self,
+        image_path: str | Path,
+        prompt: str = "Describe this image in detail as markdown. Include key visual elements, text, diagrams, and context.",
+    ) -> VisionResult:
+        """
+        Analyze image and generate markdown description.
+        Args:
+            image_path: Path to image file
+            prompt: Analysis prompt for the LLM
+        Returns:
+            VisionResult with markdown description
+        Raises:
+            ValueError: If API key missing or file invalid
+            RuntimeError: If API request fails
+        """
+        if not self.api_key:
+            raise ValueError(f"API key required for {self.provider.value} vision analysis")
+        image_path = Path(image_path)
+        if not image_path.exists():
+            raise FileNotFoundError(f"Image file not found: {image_path}")
+        # Read and encode image
+        with open(image_path, "rb") as f:
+            image_bytes = f.read()
+        # Detect media type
+        suffix = image_path.suffix.lower()
+        media_type_map = {
+            ".png": "image/png",
+            ".jpg": "image/jpeg",
+            ".jpeg": "image/jpeg",
+            ".gif": "image/gif",
+            ".webp": "image/webp",
+        }
+        media_type = media_type_map.get(suffix, "image/png")
+        logger.info(f"Analyzing {image_path.name} with {self.provider.value} ({self.model})")
+        # Route to provider-specific implementation
+        if self.provider == VisionProvider.ANTHROPIC:
+            description = self._analyze_anthropic(image_bytes, media_type, prompt)
+        elif self.provider == VisionProvider.GEMINI:
+            description = self._analyze_gemini(image_bytes, media_type, prompt)
+        elif self.provider == VisionProvider.OPENAI:
+            description = self._analyze_openai(image_bytes, media_type, prompt)
+        else:
+            raise ValueError(f"Unsupported provider: {self.provider}")
+        logger.info(f"✓ Vision analysis complete: {len(description)} characters")
+        return VisionResult(
+            description=description,
+            provider=self.provider,
+            model=self.model,
+            confidence=0.9,
+        )
+    def _analyze_anthropic(
+        self,
+        image_bytes: bytes,
+        media_type: str,
+        prompt: str,
+    ) -> str:
+        """Analyze image using Anthropic Claude."""
+        # Encode image to base64
+        image_b64 = base64.b64encode(image_bytes).decode("utf-8")
+        # Build request
+        headers = {
+            "x-api-key": self.api_key,
+            "anthropic-version": "2023-06-01",
+            "content-type": "application/json",
+        }
+        body = {
+            "model": self.model,
+            "max_tokens": 2048,
+            "messages": [
+                {
+                    "role": "user",
+                    "content": [
+                        {
+                            "type": "image",
+                            "source": {
+                                "type": "base64",
+                                "media_type": media_type,
+                                "data": image_b64,
+                            },
+                        },
+                        {
+                            "type": "text",
+                            "text": prompt,
+                        },
+                    ],
+                }
+            ],
+        }
+        response = requests.post(
+            "https://api.anthropic.com/v1/messages",
+            headers=headers,
+            json=body,
+            timeout=60.0,
+        )
+        if response.status_code != 200:
+            error_detail = response.text
+            logger.error(f"Anthropic API error: {response.status_code} - {error_detail}")
+            raise RuntimeError(f"Vision analysis failed: {response.status_code} - {error_detail}")
+        result = response.json()
+        return result["content"][0]["text"]
+    def _analyze_gemini(
+        self,
+        image_bytes: bytes,
+        media_type: str,
+        prompt: str,
+    ) -> str:
+        """Analyze image using Google Gemini."""
+        # Encode image to base64
+        image_b64 = base64.b64encode(image_bytes).decode("utf-8")
+        # Build request (Gemini REST API)
+        url = f"https://generativelanguage.googleapis.com/v1beta/models/{self.model}:generateContent"
+        params = {"key": self.api_key}
+        body = {
+            "contents": [
+                {
+                    "parts": [
+                        {
+                            "inline_data": {
+                                "mime_type": media_type,
+                                "data": image_b64,
+                            }
+                        },
+                        {"text": prompt},
+                    ]
+                }
+            ]
+        }
+        response = requests.post(
+            url,
+            params=params,
+            json=body,
+            timeout=60.0,
+        )
+        if response.status_code != 200:
+            error_detail = response.text
+            logger.error(f"Gemini API error: {response.status_code} - {error_detail}")
+            raise RuntimeError(f"Vision analysis failed: {response.status_code} - {error_detail}")
+        result = response.json()
+        return result["candidates"][0]["content"]["parts"][0]["text"]
+    def _analyze_openai(
+        self,
+        image_bytes: bytes,
+        media_type: str,
+        prompt: str,
+    ) -> str:
+        """Analyze image using OpenAI or OpenAI-compatible endpoint."""
+        # Encode image to base64
+        image_b64 = base64.b64encode(image_bytes).decode("utf-8")
+        # Build request
+        headers = {
+            "Authorization": f"Bearer {self.api_key}",
+            "Content-Type": "application/json",
+        }
+        # Use custom base URL if provided, otherwise use OpenAI
+        base_url = self.base_url or "https://api.openai.com/v1"
+        url = f"{base_url}/chat/completions"
+        body = {
+            "model": self.model,
+            "messages": [
+                {
+                    "role": "user",
+                    "content": [
+                        {
+                            "type": "image_url",
+                            "image_url": {
+                                "url": f"data:{media_type};base64,{image_b64}",
+                            },
+                        },
+                        {
+                            "type": "text",
+                            "text": prompt,
+                        },
+                    ],
+                }
+            ],
+            "max_tokens": 2048,
+        }
+        response = requests.post(
+            url,
+            headers=headers,
+            json=body,
+            timeout=60.0,
+        )
+        if response.status_code != 200:
+            error_detail = response.text
+            logger.error(f"OpenAI API error: {response.status_code} - {error_detail}")
+            raise RuntimeError(f"Vision analysis failed: {response.status_code} - {error_detail}")
+        result = response.json()
+        return result["choices"][0]["message"]["content"]