PyPI - remdb - Versions diffs - 0.3.242__py3-none-any.whl - Mend

remdb 0.3.242__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of remdb might be problematic. Click here for more details.

Files changed (235) hide show

rem/__init__.py +129 -0
rem/agentic/README.md +760 -0
rem/agentic/__init__.py +54 -0
rem/agentic/agents/README.md +155 -0
rem/agentic/agents/__init__.py +38 -0
rem/agentic/agents/agent_manager.py +311 -0
rem/agentic/agents/sse_simulator.py +502 -0
rem/agentic/context.py +425 -0
rem/agentic/context_builder.py +360 -0
rem/agentic/llm_provider_models.py +301 -0
rem/agentic/mcp/__init__.py +0 -0
rem/agentic/mcp/tool_wrapper.py +273 -0
rem/agentic/otel/__init__.py +5 -0
rem/agentic/otel/setup.py +240 -0
rem/agentic/providers/phoenix.py +926 -0
rem/agentic/providers/pydantic_ai.py +854 -0
rem/agentic/query.py +117 -0
rem/agentic/query_helper.py +89 -0
rem/agentic/schema.py +737 -0
rem/agentic/serialization.py +245 -0
rem/agentic/tools/__init__.py +5 -0
rem/agentic/tools/rem_tools.py +242 -0
rem/api/README.md +657 -0
rem/api/deps.py +253 -0
rem/api/main.py +460 -0
rem/api/mcp_router/prompts.py +182 -0
rem/api/mcp_router/resources.py +820 -0
rem/api/mcp_router/server.py +243 -0
rem/api/mcp_router/tools.py +1605 -0
rem/api/middleware/tracking.py +172 -0
rem/api/routers/admin.py +520 -0
rem/api/routers/auth.py +898 -0
rem/api/routers/chat/__init__.py +5 -0
rem/api/routers/chat/child_streaming.py +394 -0
rem/api/routers/chat/completions.py +702 -0
rem/api/routers/chat/json_utils.py +76 -0
rem/api/routers/chat/models.py +202 -0
rem/api/routers/chat/otel_utils.py +33 -0
rem/api/routers/chat/sse_events.py +546 -0
rem/api/routers/chat/streaming.py +950 -0
rem/api/routers/chat/streaming_utils.py +327 -0
rem/api/routers/common.py +18 -0
rem/api/routers/dev.py +87 -0
rem/api/routers/feedback.py +276 -0
rem/api/routers/messages.py +620 -0
rem/api/routers/models.py +86 -0
rem/api/routers/query.py +362 -0
rem/api/routers/shared_sessions.py +422 -0
rem/auth/README.md +258 -0
rem/auth/__init__.py +36 -0
rem/auth/jwt.py +367 -0
rem/auth/middleware.py +318 -0
rem/auth/providers/__init__.py +16 -0
rem/auth/providers/base.py +376 -0
rem/auth/providers/email.py +215 -0
rem/auth/providers/google.py +163 -0
rem/auth/providers/microsoft.py +237 -0
rem/cli/README.md +517 -0
rem/cli/__init__.py +8 -0
rem/cli/commands/README.md +299 -0
rem/cli/commands/__init__.py +3 -0
rem/cli/commands/ask.py +549 -0
rem/cli/commands/cluster.py +1808 -0
rem/cli/commands/configure.py +495 -0
rem/cli/commands/db.py +828 -0
rem/cli/commands/dreaming.py +324 -0
rem/cli/commands/experiments.py +1698 -0
rem/cli/commands/mcp.py +66 -0
rem/cli/commands/process.py +388 -0
rem/cli/commands/query.py +109 -0
rem/cli/commands/scaffold.py +47 -0
rem/cli/commands/schema.py +230 -0
rem/cli/commands/serve.py +106 -0
rem/cli/commands/session.py +453 -0
rem/cli/dreaming.py +363 -0
rem/cli/main.py +123 -0
rem/config.py +244 -0
rem/mcp_server.py +41 -0
rem/models/core/__init__.py +49 -0
rem/models/core/core_model.py +70 -0
rem/models/core/engram.py +333 -0
rem/models/core/experiment.py +672 -0
rem/models/core/inline_edge.py +132 -0
rem/models/core/rem_query.py +246 -0
rem/models/entities/__init__.py +68 -0
rem/models/entities/domain_resource.py +38 -0
rem/models/entities/feedback.py +123 -0
rem/models/entities/file.py +57 -0
rem/models/entities/image_resource.py +88 -0
rem/models/entities/message.py +64 -0
rem/models/entities/moment.py +123 -0
rem/models/entities/ontology.py +181 -0
rem/models/entities/ontology_config.py +131 -0
rem/models/entities/resource.py +95 -0
rem/models/entities/schema.py +87 -0
rem/models/entities/session.py +84 -0
rem/models/entities/shared_session.py +180 -0
rem/models/entities/subscriber.py +175 -0
rem/models/entities/user.py +93 -0
rem/py.typed +0 -0
rem/registry.py +373 -0
rem/schemas/README.md +507 -0
rem/schemas/__init__.py +6 -0
rem/schemas/agents/README.md +92 -0
rem/schemas/agents/core/agent-builder.yaml +235 -0
rem/schemas/agents/core/moment-builder.yaml +178 -0
rem/schemas/agents/core/rem-query-agent.yaml +226 -0
rem/schemas/agents/core/resource-affinity-assessor.yaml +99 -0
rem/schemas/agents/core/simple-assistant.yaml +19 -0
rem/schemas/agents/core/user-profile-builder.yaml +163 -0
rem/schemas/agents/examples/contract-analyzer.yaml +317 -0
rem/schemas/agents/examples/contract-extractor.yaml +134 -0
rem/schemas/agents/examples/cv-parser.yaml +263 -0
rem/schemas/agents/examples/hello-world.yaml +37 -0
rem/schemas/agents/examples/query.yaml +54 -0
rem/schemas/agents/examples/simple.yaml +21 -0
rem/schemas/agents/examples/test.yaml +29 -0
rem/schemas/agents/rem.yaml +132 -0
rem/schemas/evaluators/hello-world/default.yaml +77 -0
rem/schemas/evaluators/rem/faithfulness.yaml +219 -0
rem/schemas/evaluators/rem/lookup-correctness.yaml +182 -0
rem/schemas/evaluators/rem/retrieval-precision.yaml +199 -0
rem/schemas/evaluators/rem/retrieval-recall.yaml +211 -0
rem/schemas/evaluators/rem/search-correctness.yaml +192 -0
rem/services/__init__.py +18 -0
rem/services/audio/INTEGRATION.md +308 -0
rem/services/audio/README.md +376 -0
rem/services/audio/__init__.py +15 -0
rem/services/audio/chunker.py +354 -0
rem/services/audio/transcriber.py +259 -0
rem/services/content/README.md +1269 -0
rem/services/content/__init__.py +5 -0
rem/services/content/providers.py +760 -0
rem/services/content/service.py +762 -0
rem/services/dreaming/README.md +230 -0
rem/services/dreaming/__init__.py +53 -0
rem/services/dreaming/affinity_service.py +322 -0
rem/services/dreaming/moment_service.py +251 -0
rem/services/dreaming/ontology_service.py +54 -0
rem/services/dreaming/user_model_service.py +297 -0
rem/services/dreaming/utils.py +39 -0
rem/services/email/__init__.py +10 -0
rem/services/email/service.py +522 -0
rem/services/email/templates.py +360 -0
rem/services/embeddings/__init__.py +11 -0
rem/services/embeddings/api.py +127 -0
rem/services/embeddings/worker.py +435 -0
rem/services/fs/README.md +662 -0
rem/services/fs/__init__.py +62 -0
rem/services/fs/examples.py +206 -0
rem/services/fs/examples_paths.py +204 -0
rem/services/fs/git_provider.py +935 -0
rem/services/fs/local_provider.py +760 -0
rem/services/fs/parsing-hooks-examples.md +172 -0
rem/services/fs/paths.py +276 -0
rem/services/fs/provider.py +460 -0
rem/services/fs/s3_provider.py +1042 -0
rem/services/fs/service.py +186 -0
rem/services/git/README.md +1075 -0
rem/services/git/__init__.py +17 -0
rem/services/git/service.py +469 -0
rem/services/phoenix/EXPERIMENT_DESIGN.md +1146 -0
rem/services/phoenix/README.md +453 -0
rem/services/phoenix/__init__.py +46 -0
rem/services/phoenix/client.py +960 -0
rem/services/phoenix/config.py +88 -0
rem/services/phoenix/prompt_labels.py +477 -0
rem/services/postgres/README.md +757 -0
rem/services/postgres/__init__.py +49 -0
rem/services/postgres/diff_service.py +599 -0
rem/services/postgres/migration_service.py +427 -0
rem/services/postgres/programmable_diff_service.py +635 -0
rem/services/postgres/pydantic_to_sqlalchemy.py +562 -0
rem/services/postgres/register_type.py +353 -0
rem/services/postgres/repository.py +481 -0
rem/services/postgres/schema_generator.py +661 -0
rem/services/postgres/service.py +802 -0
rem/services/postgres/sql_builder.py +355 -0
rem/services/rate_limit.py +113 -0
rem/services/rem/README.md +318 -0
rem/services/rem/__init__.py +23 -0
rem/services/rem/exceptions.py +71 -0
rem/services/rem/executor.py +293 -0
rem/services/rem/parser.py +180 -0
rem/services/rem/queries.py +196 -0
rem/services/rem/query.py +371 -0
rem/services/rem/service.py +608 -0
rem/services/session/README.md +374 -0
rem/services/session/__init__.py +13 -0
rem/services/session/compression.py +488 -0
rem/services/session/pydantic_messages.py +310 -0
rem/services/session/reload.py +85 -0
rem/services/user_service.py +130 -0
rem/settings.py +1877 -0
rem/sql/background_indexes.sql +52 -0
rem/sql/migrations/001_install.sql +983 -0
rem/sql/migrations/002_install_models.sql +3157 -0
rem/sql/migrations/003_optional_extensions.sql +326 -0
rem/sql/migrations/004_cache_system.sql +282 -0
rem/sql/migrations/005_schema_update.sql +145 -0
rem/sql/migrations/migrate_session_id_to_uuid.sql +45 -0
rem/utils/AGENTIC_CHUNKING.md +597 -0
rem/utils/README.md +628 -0
rem/utils/__init__.py +61 -0
rem/utils/agentic_chunking.py +622 -0
rem/utils/batch_ops.py +343 -0
rem/utils/chunking.py +108 -0
rem/utils/clip_embeddings.py +276 -0
rem/utils/constants.py +97 -0
rem/utils/date_utils.py +228 -0
rem/utils/dict_utils.py +98 -0
rem/utils/embeddings.py +436 -0
rem/utils/examples/embeddings_example.py +305 -0
rem/utils/examples/sql_types_example.py +202 -0
rem/utils/files.py +323 -0
rem/utils/markdown.py +16 -0
rem/utils/mime_types.py +158 -0
rem/utils/model_helpers.py +492 -0
rem/utils/schema_loader.py +649 -0
rem/utils/sql_paths.py +146 -0
rem/utils/sql_types.py +350 -0
rem/utils/user_id.py +81 -0
rem/utils/vision.py +325 -0
rem/workers/README.md +506 -0
rem/workers/__init__.py +7 -0
rem/workers/db_listener.py +579 -0
rem/workers/db_maintainer.py +74 -0
rem/workers/dreaming.py +502 -0
rem/workers/engram_processor.py +312 -0
rem/workers/sqs_file_processor.py +193 -0
rem/workers/unlogged_maintainer.py +463 -0
remdb-0.3.242.dist-info/METADATA +1632 -0
remdb-0.3.242.dist-info/RECORD +235 -0
remdb-0.3.242.dist-info/WHEEL +4 -0
remdb-0.3.242.dist-info/entry_points.txt +2 -0

rem/api/main.py ADDED Viewed

@@ -0,0 +1,460 @@
+"""
+REM API Server - FastAPI application with integrated MCP server.
+Design Pattern:
+1. Create FastMCP server with create_mcp_server()
+2. Get HTTP app with mcp.http_app(path="/", transport="http", stateless_http=True)
+3. Mount on FastAPI at /api/v1/mcp
+4. Add middleware in specific order (sessions, logging, auth, CORS)
+5. Register API routers for v1 endpoints
+Key Architecture Decisions
+- MCP mounted at /api/v1/mcp (not /mcp) for consistency
+- Stateless HTTP prevents stale session errors across pod restarts
+- Auth middleware excludes /api/auth and /api/v1/mcp/auth paths
+- CORS added LAST so it runs FIRST (middleware runs in reverse)
+- Combined lifespan for proper initialization order
+Middleware Order (runs in reverse):
+1. CORS (runs first - adds headers to all responses)
+2. Auth (protects /api/v1/* paths)
+3. Logging (logs all requests)
+4. Sessions (OAuth state management)
+Endpoints:
+- /                          : API information
+- /health                    : Health check
+- /api/v1/mcp                : MCP endpoint (HTTP transport)
+- /api/v1/chat/completions   : OpenAI-compatible chat completions (streaming & non-streaming)
+- /api/v1/query              : REM query execution (rem-dialect or natural-language)
+- /api/v1/resources          : Resource CRUD (TODO)
+- /api/v1/moments            : Moment CRUD (TODO)
+- /api/auth/*                : OAuth/OIDC authentication
+- /docs                      : OpenAPI documentation
+Headers → AgentContext Mapping:
+The following HTTP headers are automatically mapped to AgentContext fields:
+- X-User-Id       → context.user_id          (user identifier)
+- X-Tenant-Id     → context.tenant_id        (tenant identifier, required for REM)
+- X-Session-Id    → context.session_id       (session/conversation identifier)
+- X-Agent-Schema  → context.agent_schema_uri (agent schema to use)
+Example:
+    POST /api/v1/chat/completions
+    X-Tenant-Id: acme-corp
+    X-User-Id: user123
+    X-Agent-Schema: rem-agents-query-agent
+    {
+      "model": "anthropic:claude-sonnet-4-5-20250929",
+      "messages": [{"role": "user", "content": "Find Sarah's documents"}],
+      "stream": true
+    }
+Running:
+    # Development (auto-reload)
+    uv run python -m rem.api.main
+    # Production (Docker with hypercorn)
+    hypercorn rem.api.main:app --bind 0.0.0.0:8000
+"""
+import importlib.metadata
+import secrets
+import sys
+import time
+# Get package version for API responses
+try:
+    __version__ = importlib.metadata.version("remdb")
+except importlib.metadata.PackageNotFoundError:
+    __version__ = "0.0.0-dev"
+from contextlib import asynccontextmanager
+from fastapi import FastAPI, Request
+from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import JSONResponse
+from loguru import logger
+from starlette.middleware.base import BaseHTTPMiddleware
+from starlette.middleware.sessions import SessionMiddleware
+from .mcp_router.server import create_mcp_server
+from ..settings import settings
+# Configure loguru based on settings
+# Remove default handler and add one with configured level
+logger.remove()
+# Configure level icons - only warnings and errors get visual indicators
+logger.level("DEBUG", icon=" ")
+logger.level("INFO", icon=" ")
+logger.level("WARNING", icon="🟠")
+logger.level("ERROR", icon="🔴")
+logger.level("CRITICAL", icon="🔴")
+logger.add(
+    sys.stderr,
+    level=settings.api.log_level.upper(),
+    format="<green>{time:YYYY-MM-DD HH:mm:ss.SSS}</green> | {level.icon} <level>{level: <8}</level> | <cyan>{name}</cyan>:<cyan>{function}</cyan>:<cyan>{line}</cyan> - <level>{message}</level>",
+)
+class RequestLoggingMiddleware(BaseHTTPMiddleware):
+    """
+    Log all incoming HTTP requests and responses.
+    Design Pattern:
+    - Logs request method, path, client, user-agent
+    - Logs response status, content-type, duration
+    - Essential for debugging OAuth flow and MCP sessions
+    - Health checks and 404s logged at DEBUG level to reduce noise
+    - Scanner/exploit attempts (common vulnerability probes) logged at DEBUG
+    """
+    # Paths to log at DEBUG level (health checks, probes)
+    DEBUG_PATHS = {"/health", "/healthz", "/ready", "/readyz", "/livez"}
+    # Path patterns that indicate vulnerability scanners (log at DEBUG)
+    SCANNER_PATTERNS = (
+        "/vendor/",      # PHP composer exploits
+        "/.git/",        # Git config exposure
+        "/.env",         # Environment file exposure
+        "/wp-",          # WordPress exploits
+        "/phpunit/",     # PHPUnit RCE
+        "/eval-stdin",   # PHP eval exploits
+        "/console/",     # Console exposure
+        "/actuator/",    # Spring Boot actuator
+        "/debug/",       # Debug endpoints
+        "/admin/",       # Admin panel probes (when we don't have one)
+    )
+    def _should_log_at_debug(self, path: str, status_code: int) -> bool:
+        """Determine if request should be logged at DEBUG level."""
+        # Health checks
+        if path in self.DEBUG_PATHS:
+            return True
+        # 404 responses (not found - includes scanner probes)
+        if status_code == 404:
+            return True
+        # Known scanner patterns
+        if any(pattern in path for pattern in self.SCANNER_PATTERNS):
+            return True
+        return False
+    async def dispatch(self, request: Request, call_next):
+        start_time = time.time()
+        path = request.url.path
+        # Log incoming request (preliminary - may adjust after response)
+        client_host = request.client.host if request.client else "unknown"
+        user_agent = request.headers.get('user-agent', 'unknown')[:100]
+        # Extract auth info for logging (first 8 chars of token for debugging)
+        auth_header = request.headers.get('authorization', '')
+        auth_preview = ""
+        if auth_header.startswith('Bearer '):
+            token = auth_header[7:]
+            auth_preview = f"Bearer {token[:8]}..." if len(token) > 8 else f"Bearer {token}"
+        # Process request
+        response = await call_next(request)
+        # Extract user info set by auth middleware (after processing)
+        user = getattr(request.state, "user", None)
+        user_id = user.get("id", "none")[:12] if user else "anon"
+        user_email = user.get("email", "") if user else ""
+        # Determine log level based on path AND response status
+        duration_ms = (time.time() - start_time) * 1000
+        use_debug = self._should_log_at_debug(path, response.status_code)
+        log_fn = logger.debug if use_debug else logger.info
+        # Build user info string
+        user_info = f"user={user_id}"
+        if user_email:
+            user_info += f" ({user_email})"
+        if auth_preview:
+            user_info += f" | auth={auth_preview}"
+        # Log request and response together with auth info
+        log_fn(
+            f"→ REQUEST: {request.method} {path} | "
+            f"Client: {client_host} | "
+            f"{user_info}"
+        )
+        log_fn(
+            f"← RESPONSE: {request.method} {path} | "
+            f"Status: {response.status_code} | "
+            f"Duration: {duration_ms:.2f}ms"
+        )
+        return response
+class SSEBufferingMiddleware(BaseHTTPMiddleware):
+    """
+    Disable proxy buffering for SSE responses.
+    Adds X-Accel-Buffering: no header to prevent Nginx/Traefik
+    from buffering Server-Sent Events (critical for MCP SSE transport).
+    """
+    async def dispatch(self, request: Request, call_next):
+        response = await call_next(request)
+        # Disable buffering for SSE responses
+        content_type = response.headers.get("content-type", "")
+        if "text/event-stream" in content_type:
+            response.headers["X-Accel-Buffering"] = "no"
+            response.headers["Cache-Control"] = "no-cache"
+        return response
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    """
+    Application lifespan manager.
+    Handles startup and shutdown tasks.
+    OTEL instrumentation must be initialized at startup before any agents are created.
+    """
+    logger.info(f"Starting REM API ({settings.environment})")
+    # Initialize OTEL instrumentation if enabled
+    # Must be done at startup to instrument Pydantic AI before any agents are created
+    if settings.otel.enabled:
+        from ..agentic.otel.setup import setup_instrumentation
+        setup_instrumentation()
+    # Check database configuration
+    if not settings.postgres.enabled:
+        logger.warning(
+            "Running in NO-DATABASE mode - database connection disabled. "
+            "Agent execution works with file-based schemas, but session storage "
+            "and history lookups are unavailable. Enable database with POSTGRES__ENABLED=true"
+        )
+    else:
+        # Log database host only - never log credentials
+        logger.info(f"Database enabled: {settings.postgres.host}:{settings.postgres.port}/{settings.postgres.database}")
+    yield
+    logger.info("Shutting down REM API")
+def create_app() -> FastAPI:
+    """
+    Create and configure the FastAPI application with MCP server.
+    The returned app exposes `app.mcp_server` (FastMCP instance) for adding
+    custom tools, resources, and prompts:
+        app = create_app()
+        @app.mcp_server.tool()
+        async def my_tool(query: str) -> dict:
+            '''Custom MCP tool.'''
+            return {"result": query}
+        @app.mcp_server.resource("custom://data")
+        async def my_resource() -> str:
+            '''Custom resource.'''
+            return '{"data": "value"}'
+    Design Pattern:
+    1. Create MCP server
+    2. Get HTTP app with stateless_http=True
+    3. Combine lifespans (app + MCP)
+    4. Create FastAPI with combined lifespan
+    5. Add middleware (sessions, logging, auth, CORS) in specific order
+    6. Define health endpoints
+    7. Register API routers
+    8. Mount MCP app
+    9. Expose mcp_server on app for extension
+    Returns:
+        Configured FastAPI application with .mcp_server attribute
+    """
+    # Create MCP server and get HTTP app
+    # path="/" creates routes at root, then mount at /api/v1/mcp
+    # transport="http" for MCP HTTP protocol
+    # stateless_http=True prevents stale session errors (pods can restart)
+    mcp_server = create_mcp_server()
+    mcp_app = mcp_server.http_app(path="/", transport="http", stateless_http=True)
+    # Disable trailing slash redirects (prevents 307 redirects that strip auth headers)
+    if hasattr(mcp_app, "router"):
+        mcp_app.router.redirect_slashes = False
+    # Combine MCP and API lifespans
+    # Explicit nesting ensures proper initialization order
+    @asynccontextmanager
+    async def combined_lifespan(app: FastAPI):
+        async with lifespan(app):
+            async with mcp_app.lifespan(app):
+                yield
+    app = FastAPI(
+        title=f"{settings.app_name} API",
+        description=f"{settings.app_name} - Resources Entities Moments system for agentic AI",
+        version=__version__,
+        lifespan=combined_lifespan,
+        root_path=settings.root_path if settings.root_path else "",
+        redirect_slashes=False,  # Don't redirect /mcp/ -> /mcp
+    )
+    # Add request logging middleware
+    app.add_middleware(RequestLoggingMiddleware)
+    # Add SSE buffering middleware (for MCP SSE transport)
+    app.add_middleware(SSEBufferingMiddleware)
+    # Add Anonymous Tracking & Rate Limiting (Runs AFTER Auth if Auth is enabled)
+    # Must be added BEFORE AuthMiddleware in code to be INNER in the stack
+    from .middleware.tracking import AnonymousTrackingMiddleware
+    app.add_middleware(AnonymousTrackingMiddleware)
+    # Add authentication middleware
+    # Always load middleware for dev token support, but allow anonymous when auth disabled
+    from ..auth.middleware import AuthMiddleware
+    app.add_middleware(
+        AuthMiddleware,
+        protected_paths=["/api/v1", "/api/admin"],
+        excluded_paths=["/api/auth", "/api/dev", "/api/v1/mcp/auth", "/api/v1/slack"],
+        # Allow anonymous when auth is disabled, otherwise use setting
+        allow_anonymous=(not settings.auth.enabled) or settings.auth.allow_anonymous,
+        # MCP requires auth only when auth is fully enabled
+        mcp_requires_auth=settings.auth.enabled and settings.auth.mcp_requires_auth,
+    )
+    # Add session middleware for OAuth state management
+    # Must be added AFTER AuthMiddleware in code so it runs BEFORE (middleware runs in reverse)
+    # AuthMiddleware needs request.session to be available
+    session_secret = settings.auth.session_secret or secrets.token_hex(32)
+    if not settings.auth.session_secret:
+        logger.warning(
+            "AUTH__SESSION_SECRET not set - using generated key "
+            "(sessions won't persist across restarts)"
+        )
+    app.add_middleware(
+        SessionMiddleware,
+        secret_key=session_secret,
+        session_cookie="rem_session",
+        max_age=3600,  # 1 hour
+        same_site="lax",
+        https_only=settings.environment == "production",
+    )
+    # Add CORS middleware LAST (runs first in middleware chain)
+    # Must expose mcp-session-id header for MCP session management
+    CORS_ORIGIN_WHITELIST = [
+        "http://localhost:3000",  # Local development (React)
+        "http://localhost:5000",  # Local development (Flask/other)
+        "http://localhost:5173",  # Local development (Vite)
+    ]
+    app.add_middleware(
+        CORSMiddleware,
+        allow_origins=CORS_ORIGIN_WHITELIST,
+        allow_credentials=True,
+        allow_methods=["*"],
+        allow_headers=["*", "mcp-protocol-version", "mcp-session-id", "authorization"],
+        expose_headers=["mcp-session-id"],
+    )
+    # Root endpoint
+    @app.get("/")
+    async def root():
+        """API information endpoint."""
+        # TODO: If auth enabled and no user, return 401 with WWW-Authenticate
+        return {
+            "name": f"{settings.app_name} API",
+            "version": __version__,
+            "mcp_endpoint": "/api/v1/mcp",
+            "docs": "/docs",
+        }
+    # Health check endpoint
+    @app.get("/health")
+    async def health():
+        """Health check endpoint."""
+        return {"status": "healthy", "version": __version__}
+    # Register API routers
+    from .routers.chat import router as chat_router
+    from .routers.models import router as models_router
+    from .routers.messages import router as messages_router
+    from .routers.feedback import router as feedback_router
+    from .routers.admin import router as admin_router
+    from .routers.shared_sessions import router as shared_sessions_router
+    from .routers.query import router as query_router
+    app.include_router(chat_router)
+    app.include_router(models_router)
+    # shared_sessions_router MUST be before messages_router
+    # because messages_router has /sessions/{session_id} which would match
+    # before the more specific /sessions/shared-with-me routes
+    app.include_router(shared_sessions_router)
+    app.include_router(messages_router)
+    app.include_router(feedback_router)
+    app.include_router(admin_router)
+    app.include_router(query_router)
+    # Register auth router (if enabled)
+    if settings.auth.enabled:
+        from .routers.auth import router as auth_router
+        app.include_router(auth_router)
+    # Register dev router (non-production only)
+    if settings.environment != "production":
+        from .routers.dev import router as dev_router
+        app.include_router(dev_router)
+    # TODO: Register additional routers
+    # from .routers.query import router as query_router
+    # from .routers.resources import router as resources_router
+    # from .routers.moments import router as moments_router
+    #
+    # app.include_router(query_router)
+    # app.include_router(resources_router)
+    # app.include_router(moments_router)
+    # Add middleware to rewrite /api/v1/mcp to /api/v1/mcp/
+    @app.middleware("http")
+    async def mcp_path_rewrite_middleware(request: Request, call_next):
+        """Rewrite /api/v1/mcp to /api/v1/mcp/ to handle Claude Desktop requests."""
+        if request.url.path == "/api/v1/mcp":
+            request.scope["path"] = "/api/v1/mcp/"
+            request.scope["raw_path"] = b"/api/v1/mcp/"
+        return await call_next(request)
+    # Mount MCP app at /api/v1/mcp
+    app.mount("/api/v1/mcp", mcp_app)
+    # Expose MCP server on app for extension
+    # Users can add tools/resources/prompts via app.mcp_server
+    app.mcp_server = mcp_server  # type: ignore[attr-defined]
+    return app
+# Create application instance
+app = create_app()
+# Main entry point for uvicorn
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(
+        "rem.api.main:app",
+        host="0.0.0.0",
+        port=8000,
+        reload=True,
+    )

rem/api/mcp_router/prompts.py ADDED Viewed

@@ -0,0 +1,182 @@
+"""
+MCP Prompts for REM operations.
+Prompts are interactive templates that help users perform complex tasks.
+"""
+from fastmcp import FastMCP
+CREATEAGENT_PROMPT = """
+Create a custom REM agent schema.
+I'll help you create an agent schema that can be uploaded to REM and automatically processed.
+## What I need from you:
+1. **Agent purpose**: What should this agent do? What domain knowledge does it need?
+2. **Short name**: Lowercase with hyphens (e.g., "cv-parser", "contract-analyzer")
+3. **Version**: Semantic version (e.g., "1.0.0")
+4. **Structured output fields**: What data should the agent extract?
+## Agent Schema Format
+REM agents use JSON Schema format with these sections:
+```yaml
+---
+type: object
+description: |
+  System prompt with LLM instructions.
+  Provide clear, detailed guidance on what the agent should do.
+properties:
+  field_name:
+    type: string
+    description: Field description
+required:
+  - required_field
+json_schema_extra:
+  kind: agent
+  name: your-agent
+  version: "1.0.0"
+  tags: [domain, category]
+  # Optional: Fields to embed for semantic search
+  embedding_fields:
+    - field1
+    - field2
+```
+## Example: CV Parser
+```yaml
+---
+type: object
+description: |
+  Parse CV/resume documents to extract candidate information.
+  Extract:
+  - Candidate details (name, contact, summary)
+  - Work experience with dates
+  - Education history
+  - Skills and competencies
+  - Seniority level assessment
+properties:
+  candidate_name:
+    type: string
+    description: Full name of the candidate
+  skills:
+    type: array
+    items:
+      type: string
+    description: Technical and professional skills
+  experience:
+    type: array
+    items:
+      type: object
+      properties:
+        company: {type: string}
+        title: {type: string}
+        start_date: {type: string}
+        end_date: {type: string}
+    description: Work experience history
+  seniority_level:
+    type: string
+    enum: ["junior", "mid-level", "senior", "lead", "executive"]
+    description: Assessed seniority level
+required:
+  - candidate_name
+  - skills
+json_schema_extra:
+  kind: agent
+  name: cv-parser
+  version: "1.0.0"
+  tags: [recruitment, ontology-extractor]
+  embedding_fields:
+    - candidate_name
+    - skills
+  category: ontology-extractor
+```
+## Upload Process
+After creating your schema:
+1. **Save to local file system**: `~/.rem/fs/my-agent.yaml` or request an upload path for remote servers.
+2. **Upload via ingest_file**:
+   ```python
+   ingest_file(
+       file_uri="LOCAL PATH for local servers or remote S3 path for remote servers",
+       category="agent"
+   )
+   ```
+3. **Automatic processing**:
+   - File detected by worker
+   - Schema validated and stored in schemas table
+   - Available for immediate use
+## Ready?
+Tell me:
+1. What should your agent do?
+2. What data should it extract?
+3. What should we name it?
+I'll generate the complete schema for you!
+"""
+def register_prompts(mcp: FastMCP):
+    """
+    Register MCP prompts.
+    Args:
+        mcp: FastMCP server instance
+    """
+    @mcp.prompt()
+    def create_agent(
+        purpose: str = "",
+        short_name: str = "",
+        version: str = "1.0.0",
+    ) -> str:
+        """
+        Interactive prompt for creating custom REM agent schemas.
+        Guides users through creating agent schemas with domain knowledge,
+        structured output definitions, and upload instructions.
+        Args:
+            purpose: Agent purpose and domain (optional, will prompt if empty)
+            short_name: Agent short name in kebab-case (optional, will suggest)
+            version: Semantic version (default: "1.0.0")
+        Returns:
+            Interactive prompt with examples and upload instructions
+        """
+        prompt = CREATEAGENT_PROMPT
+        # Add context if parameters provided
+        if purpose:
+            prompt += f"\n\nYou mentioned: \"{purpose}\"\n"
+        if short_name:
+            prompt += f"Short name: {short_name}\n"
+        if version != "1.0.0":
+            prompt += f"Version: {version}\n"
+        return prompt