PyPI - remdb - Versions diffs - 0.3.7__py3-none-any.whl → 0.3.133__py3-none-any.whl - Mend

remdb 0.3.7py3-none-any.whl → 0.3.133py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (107) hide show

rem/__init__.py +129 -2
rem/agentic/README.md +76 -0
rem/agentic/__init__.py +15 -0
rem/agentic/agents/__init__.py +16 -2
rem/agentic/agents/sse_simulator.py +502 -0
rem/agentic/context.py +51 -25
rem/agentic/llm_provider_models.py +301 -0
rem/agentic/mcp/tool_wrapper.py +112 -17
rem/agentic/otel/setup.py +93 -4
rem/agentic/providers/phoenix.py +314 -132
rem/agentic/providers/pydantic_ai.py +215 -26
rem/agentic/schema.py +361 -21
rem/agentic/tools/rem_tools.py +3 -3
rem/api/README.md +238 -1
rem/api/deps.py +255 -0
rem/api/main.py +154 -37
rem/api/mcp_router/resources.py +1 -1
rem/api/mcp_router/server.py +26 -5
rem/api/mcp_router/tools.py +465 -7
rem/api/middleware/tracking.py +172 -0
rem/api/routers/admin.py +494 -0
rem/api/routers/auth.py +124 -0
rem/api/routers/chat/completions.py +402 -20
rem/api/routers/chat/models.py +88 -10
rem/api/routers/chat/otel_utils.py +33 -0
rem/api/routers/chat/sse_events.py +542 -0
rem/api/routers/chat/streaming.py +642 -45
rem/api/routers/dev.py +81 -0
rem/api/routers/feedback.py +268 -0
rem/api/routers/messages.py +473 -0
rem/api/routers/models.py +78 -0
rem/api/routers/query.py +360 -0
rem/api/routers/shared_sessions.py +406 -0
rem/auth/middleware.py +126 -27
rem/cli/commands/README.md +237 -64
rem/cli/commands/ask.py +13 -10
rem/cli/commands/cluster.py +1808 -0
rem/cli/commands/configure.py +5 -6
rem/cli/commands/db.py +396 -139
rem/cli/commands/experiments.py +469 -74
rem/cli/commands/process.py +22 -15
rem/cli/commands/scaffold.py +47 -0
rem/cli/commands/schema.py +97 -50
rem/cli/main.py +29 -6
rem/config.py +10 -3
rem/models/core/core_model.py +7 -1
rem/models/core/experiment.py +54 -0
rem/models/core/rem_query.py +5 -2
rem/models/entities/__init__.py +21 -0
rem/models/entities/domain_resource.py +38 -0
rem/models/entities/feedback.py +123 -0
rem/models/entities/message.py +30 -1
rem/models/entities/session.py +83 -0
rem/models/entities/shared_session.py +180 -0
rem/models/entities/user.py +10 -3
rem/registry.py +373 -0
rem/schemas/agents/rem.yaml +7 -3
rem/services/content/providers.py +92 -133
rem/services/content/service.py +92 -20
rem/services/dreaming/affinity_service.py +2 -16
rem/services/dreaming/moment_service.py +2 -15
rem/services/embeddings/api.py +24 -17
rem/services/embeddings/worker.py +16 -16
rem/services/phoenix/EXPERIMENT_DESIGN.md +3 -3
rem/services/phoenix/client.py +302 -28
rem/services/postgres/README.md +159 -15
rem/services/postgres/__init__.py +2 -1
rem/services/postgres/diff_service.py +531 -0
rem/services/postgres/pydantic_to_sqlalchemy.py +427 -129
rem/services/postgres/repository.py +132 -0
rem/services/postgres/schema_generator.py +291 -9
rem/services/postgres/service.py +6 -6
rem/services/rate_limit.py +113 -0
rem/services/rem/README.md +14 -0
rem/services/rem/parser.py +44 -9
rem/services/rem/service.py +36 -2
rem/services/session/compression.py +24 -1
rem/services/session/reload.py +1 -1
rem/services/user_service.py +98 -0
rem/settings.py +399 -29
rem/sql/background_indexes.sql +21 -16
rem/sql/migrations/001_install.sql +387 -54
rem/sql/migrations/002_install_models.sql +2320 -393
rem/sql/migrations/003_optional_extensions.sql +326 -0
rem/sql/migrations/004_cache_system.sql +548 -0
rem/utils/__init__.py +18 -0
rem/utils/constants.py +97 -0
rem/utils/date_utils.py +228 -0
rem/utils/embeddings.py +17 -4
rem/utils/files.py +167 -0
rem/utils/mime_types.py +158 -0
rem/utils/model_helpers.py +156 -1
rem/utils/schema_loader.py +282 -35
rem/utils/sql_paths.py +146 -0
rem/utils/sql_types.py +3 -1
rem/utils/vision.py +9 -14
rem/workers/README.md +14 -14
rem/workers/__init__.py +3 -1
rem/workers/db_listener.py +579 -0
rem/workers/db_maintainer.py +74 -0
rem/workers/unlogged_maintainer.py +463 -0
{remdb-0.3.7.dist-info → remdb-0.3.133.dist-info}/METADATA +460 -303
{remdb-0.3.7.dist-info → remdb-0.3.133.dist-info}/RECORD +105 -74
{remdb-0.3.7.dist-info → remdb-0.3.133.dist-info}/WHEEL +1 -1
rem/sql/002_install_models.sql +0 -1068
rem/sql/install_models.sql +0 -1038
{remdb-0.3.7.dist-info → remdb-0.3.133.dist-info}/entry_points.txt +0 -0

rem/api/routers/query.py ADDED Viewed

@@ -0,0 +1,360 @@
+"""
+REM Query API - Execute REM dialect or natural language queries.
+Endpoints:
+    POST /api/v1/query - Execute a REM query
+Modes:
+    - rem-dialect (default): Execute REM query syntax directly
+      Example: "LOOKUP sarah-chen", "SEARCH resources 'API design'", "TRAVERSE FROM doc-123 DEPTH 2"
+    - natural-language: Convert natural language to REM query via LLM agent
+      Example: "Find all documents by Sarah", "What meetings happened last week?"
+    - staged-plan: Execute a multi-stage query plan (query field is ignored)
+      Example: Execute a sequence of queries with context passing between stages
+      Status: TODO - signature only, implementation pending in RemService
+Model Selection:
+    Default model: openai:gpt-4.1 (widely available, good balance of speed/quality)
+    Recommended for speed: cerebras:qwen-3-32b
+    - Cerebras provides extremely fast inference (~1000 tokens/sec)
+    - Set CEREBRAS_API_KEY environment variable
+    - Pass model="cerebras:qwen-3-32b" in request
+Example:
+    # REM dialect (default)
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{"query": "LOOKUP sarah-chen"}'
+    # Natural language
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{"query": "Find all documents about API design", "mode": "natural-language"}'
+    # With Cerebras for speed
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{"query": "Who is Sarah?", "mode": "natural-language", "model": "cerebras:qwen-3-32b"}'
+    # Staged plan (TODO) - static query stages
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{"mode": "staged-plan", "plan": [
+            {"stage": 1, "query": "LOOKUP Sarah Chen", "name": "user"},
+            {"stage": 2, "query": "TRAVERSE FROM \"Sarah Chen\" DEPTH 2"}
+        ]}'
+    # Staged plan with LLM-driven dynamic stages
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{"mode": "staged-plan", "plan": [
+            {"stage": 1, "query": "LOOKUP Sarah Chen", "name": "user"},
+            {"stage": 2, "intent": "find her team members", "depends_on": ["user"]}
+        ]}'
+    # Plan continuation - pass previous_results to resume a multi-turn plan
+    # Turn 1: Execute stage 1, get back stage_results
+    # Turn 2: Continue with stage 2, passing previous results
+    curl -X POST http://localhost:8000/api/v1/query \\
+        -H "Content-Type: application/json" \\
+        -H "X-User-Id: user123" \\
+        -d '{
+            "mode": "staged-plan",
+            "plan": [
+                {"stage": 1, "query": "LOOKUP Sarah Chen", "name": "user"},
+                {"stage": 2, "intent": "find her team members", "depends_on": ["user"]}
+            ],
+            "previous_results": [
+                {"stage": 1, "name": "user", "query_executed": "LOOKUP Sarah Chen", "results": [...], "count": 1}
+            ],
+            "resume_from_stage": 2
+        }'
+"""
+from enum import Enum
+from typing import Any
+from fastapi import APIRouter, Header, HTTPException
+from loguru import logger
+from pydantic import BaseModel, Field
+from ...services.postgres import get_postgres_service
+from ...services.rem.service import RemService
+from ...services.rem.parser import RemQueryParser
+from ...models.core import RemQuery
+from ...settings import settings
+router = APIRouter(prefix="/api/v1", tags=["query"])
+class QueryMode(str, Enum):
+    """Query execution mode."""
+    REM_DIALECT = "rem-dialect"
+    NATURAL_LANGUAGE = "natural-language"
+    STAGED_PLAN = "staged-plan"
+class StagedPlanResult(BaseModel):
+    """Result from a completed stage - used for plan continuation."""
+    stage: int = Field(..., description="Stage number that produced this result")
+    name: str | None = Field(default=None, description="Stage name for referencing")
+    query_executed: str = Field(..., description="The REM query that was executed")
+    results: list[dict[str, Any]] = Field(default_factory=list, description="Query results")
+    count: int = Field(default=0, description="Number of results")
+class QueryPlanStage(BaseModel):
+    """A single stage in a multi-stage query plan.
+    Each stage can be either:
+    1. A static REM dialect query (query field set)
+    2. A dynamic query built by LLM from intent + previous results (intent field set)
+    The LLM interprets the intent along with previous stage results to construct
+    the appropriate REM query at runtime.
+    """
+    stage: int = Field(..., description="Stage number (1-indexed, executed in order)")
+    query: str | None = Field(
+        default=None,
+        description="Static REM dialect query (mutually exclusive with intent)",
+    )
+    intent: str | None = Field(
+        default=None,
+        description="Natural language intent - LLM builds query from this + previous results",
+    )
+    name: str | None = Field(default=None, description="Optional name for referencing results")
+    depends_on: list[str] | None = Field(
+        default=None,
+        description="Names of previous stages whose results are passed as context to LLM",
+    )
+class QueryRequest(BaseModel):
+    """Request body for REM query execution."""
+    query: str | None = Field(
+        default=None,
+        description="Query string - either REM dialect syntax or natural language. Required for rem-dialect and natural-language modes.",
+        examples=[
+            "LOOKUP sarah-chen",
+            "SEARCH resources 'API design' LIMIT 10",
+            "Find all documents by Sarah",
+        ],
+    )
+    mode: QueryMode = Field(
+        default=QueryMode.REM_DIALECT,
+        description="Query mode: 'rem-dialect' (default), 'natural-language', or 'staged-plan'",
+    )
+    model: str = Field(
+        default="openai:gpt-4.1",
+        description=(
+            "LLM model for natural-language mode. "
+            "Default: openai:gpt-4.1. "
+            "Recommended for speed: cerebras:qwen-3-32b (requires CEREBRAS_API_KEY)"
+        ),
+    )
+    plan_only: bool = Field(
+        default=False,
+        description="If true with natural-language mode, return generated query without executing",
+    )
+    plan: list[QueryPlanStage] | None = Field(
+        default=None,
+        description="Multi-stage query plan for staged-plan mode. Each stage executes in order.",
+    )
+    previous_results: list[StagedPlanResult] | None = Field(
+        default=None,
+        description=(
+            "Results from previous turns for plan continuation. "
+            "Pass this back from the response's stage_results to continue a multi-turn plan."
+        ),
+    )
+    resume_from_stage: int | None = Field(
+        default=None,
+        description="Stage number to resume from (1-indexed). Stages before this are skipped.",
+    )
+class QueryResponse(BaseModel):
+    """Response from REM query execution."""
+    query_type: str = Field(..., description="Type of query executed (LOOKUP, SEARCH, FUZZY, SQL, TRAVERSE)")
+    query: str = Field(..., description="The query that was executed (original or generated)")
+    results: list[dict[str, Any]] = Field(default_factory=list, description="Query results")
+    count: int = Field(..., description="Number of results")
+    # Natural language mode fields
+    mode: QueryMode = Field(..., description="Query mode used")
+    generated_query: str | None = Field(default=None, description="Generated REM query (natural-language mode only)")
+    confidence: float | None = Field(default=None, description="Confidence score (natural-language mode only)")
+    reasoning: str | None = Field(default=None, description="Query reasoning (natural-language mode only)")
+    warning: str | None = Field(default=None, description="Warning message if any")
+    plan_only: bool = Field(default=False, description="If true, query was not executed (plan mode)")
+    # Staged plan mode fields
+    stage_results: list[dict[str, Any]] | None = Field(
+        default=None,
+        description="Results from each stage (staged-plan mode only)",
+    )
+@router.post("/query", response_model=QueryResponse)
+async def execute_query(
+    request: QueryRequest,
+    x_user_id: str | None = Header(default=None, description="User ID for query isolation (optional, uses default if not provided)"),
+) -> QueryResponse:
+    """
+    Execute a REM query.
+    Supports three modes:
+    **rem-dialect** (default): Execute REM query syntax directly.
+    - LOOKUP "entity-key" - O(1) key-value lookup
+    - FUZZY "text" THRESHOLD 0.3 - Fuzzy text matching
+    - SEARCH table "semantic query" LIMIT 10 - Vector similarity search
+    - TRAVERSE FROM "entity" TYPE "rel" DEPTH 2 - Graph traversal
+    - SQL SELECT * FROM table WHERE ... - Direct SQL (SELECT only)
+    **natural-language**: Convert question to REM query via LLM.
+    - Uses REM Query Agent to parse intent
+    - Auto-executes if confidence >= 0.7
+    - Returns warning for low-confidence queries
+    **staged-plan**: Execute a multi-stage query plan.
+    - Pass plan=[{stage: 1, query: "...", name: "..."}, ...] instead of query
+    - Stages execute in order with context passing between them
+    - TODO: Implementation pending in RemService
+    **Model Selection**:
+    - Default: openai:gpt-4.1 (reliable, widely available)
+    - Speed: cerebras:qwen-3-32b (requires CEREBRAS_API_KEY)
+    Returns:
+        QueryResponse with results and metadata
+    """
+    if not settings.postgres.enabled:
+        raise HTTPException(
+            status_code=503,
+            detail="Database not configured. Set POSTGRES__ENABLED=true",
+        )
+    try:
+        # Get database service and ensure connected
+        db = get_postgres_service()
+        if db is None:
+            raise HTTPException(status_code=503, detail="Database service unavailable")
+        # Connect if not already connected
+        if db.pool is None:
+            await db.connect()
+        rem_service = RemService(db)
+        # Use effective_user_id from settings if not provided
+        effective_user_id = x_user_id or settings.test.effective_user_id
+        if request.mode == QueryMode.STAGED_PLAN:
+            # Staged plan mode - execute multi-stage query plan
+            # TODO: Implementation pending in RemService.execute_staged_plan()
+            if not request.plan:
+                raise HTTPException(
+                    status_code=400,
+                    detail="staged-plan mode requires 'plan' field with list of QueryPlanStage",
+                )
+            logger.info(f"Staged plan query: {len(request.plan)} stages")
+            # TODO: Call rem_service.execute_staged_plan(request.plan, x_user_id)
+            # For now, return a 501 Not Implemented
+            raise HTTPException(
+                status_code=501,
+                detail="staged-plan mode not yet implemented. See RemService TODO.",
+            )
+        elif request.mode == QueryMode.NATURAL_LANGUAGE:
+            # Natural language mode - use agent to convert
+            if not request.query:
+                raise HTTPException(
+                    status_code=400,
+                    detail="natural-language mode requires 'query' field",
+                )
+            logger.info(f"Natural language query: {request.query[:100]}... (model={request.model})")
+            result = await rem_service.ask_rem(
+                natural_query=request.query,
+                tenant_id=effective_user_id,
+                llm_model=request.model,
+                plan_mode=request.plan_only,
+            )
+            # Build response
+            response = QueryResponse(
+                query_type=result.get("results", {}).get("query_type", "UNKNOWN"),
+                query=request.query,
+                results=result.get("results", {}).get("results", []),
+                count=result.get("results", {}).get("count", 0),
+                mode=QueryMode.NATURAL_LANGUAGE,
+                generated_query=result.get("query"),
+                confidence=result.get("confidence"),
+                reasoning=result.get("reasoning"),
+                warning=result.get("warning"),
+                plan_only=result.get("plan_mode", False),
+            )
+            return response
+        else:
+            # REM dialect mode - parse and execute directly
+            if not request.query:
+                raise HTTPException(
+                    status_code=400,
+                    detail="rem-dialect mode requires 'query' field",
+                )
+            logger.info(f"REM dialect query: {request.query[:100]}...")
+            parser = RemQueryParser()
+            query_type, parameters = parser.parse(request.query)
+            # Create and execute RemQuery
+            rem_query = RemQuery.model_validate({
+                "query_type": query_type,
+                "parameters": parameters,
+                "user_id": effective_user_id,
+            })
+            result = await rem_service.execute_query(rem_query)
+            return QueryResponse(
+                query_type=result["query_type"],
+                query=request.query,
+                results=result.get("results", []),
+                count=result.get("count", 0),
+                mode=QueryMode.REM_DIALECT,
+            )
+    except HTTPException:
+        # Re-raise HTTPExceptions (400, 501, etc.) without wrapping
+        raise
+    except ValueError as e:
+        # Parse errors
+        raise HTTPException(status_code=400, detail=str(e))
+    except Exception as e:
+        logger.exception(f"Query execution failed: {e}")
+        raise HTTPException(status_code=500, detail=f"Query execution failed: {str(e)}")

remdb 0.3.7__py3-none-any.whl → 0.3.133__py3-none-any.whl

remdb 0.3.7py3-none-any.whl → 0.3.133py3-none-any.whl