PyPI - contextos-vault - Versions diffs - 1.5.0__py3-none-any.whl - Mend

contextos-vault 1.5.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (50) hide show

contextos/__init__.py +3 -0
contextos/api.py +487 -0
contextos/auth.py +257 -0
contextos/cache_layer.py +135 -0
contextos/chunker.py +153 -0
contextos/cli.py +2302 -0
contextos/compressor.py +91 -0
contextos/config.py +145 -0
contextos/connectors/__init__.py +28 -0
contextos/connectors/base.py +119 -0
contextos/connectors/github.py +220 -0
contextos/connectors/json_source.py +224 -0
contextos/connectors/openapi.py +275 -0
contextos/dashboard.py +402 -0
contextos/embedder.py +153 -0
contextos/evaluator.py +221 -0
contextos/graph.py +196 -0
contextos/ingestors/__init__.py +64 -0
contextos/ingestors/docx.py +128 -0
contextos/ingestors/pdf.py +72 -0
contextos/ingestors/pptx.py +128 -0
contextos/logger.py +244 -0
contextos/mcp_server.py +478 -0
contextos/memory.py +234 -0
contextos/plugins.py +190 -0
contextos/py.typed +0 -0
contextos/retrieval.py +275 -0
contextos/scaffolder.py +166 -0
contextos/schema.py +189 -0
contextos/session.py +299 -0
contextos/store.py +448 -0
contextos/symbols.py +223 -0
contextos/templates/__init__.py +0 -0
contextos/templates/api-first/architecture/api.md +47 -0
contextos/templates/default/architecture/overview.md +33 -0
contextos/templates/default/context/current.md +35 -0
contextos/templates/default/decisions/ADR-001-example.md +36 -0
contextos/templates/default/domain/entity.md +32 -0
contextos/templates/default/product/vision.md +32 -0
contextos/templates/default/workflows/example-flow.md +35 -0
contextos/templates/microservice/architecture/service.md +44 -0
contextos/ui.py +155 -0
contextos/vault.py +314 -0
contextos/watcher.py +222 -0
contextos_vault-1.5.0.dist-info/METADATA +1031 -0
contextos_vault-1.5.0.dist-info/RECORD +50 -0
contextos_vault-1.5.0.dist-info/WHEEL +5 -0
contextos_vault-1.5.0.dist-info/entry_points.txt +2 -0
contextos_vault-1.5.0.dist-info/licenses/LICENSE +21 -0
contextos_vault-1.5.0.dist-info/top_level.txt +1 -0

contextos/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+"""ContextOS — Local-first knowledge OS for AI coding agents."""
+__version__ = "1.5.0"

contextos/api.py ADDED Viewed

@@ -0,0 +1,487 @@
+"""
+ContextOS api.py — FastAPI server.
+Binds EXCLUSIVELY to 127.0.0.1 — never 0.0.0.0.
+All endpoints (except /health) require Authorization: Bearer ctx_<token>
+"""
+from __future__ import annotations
+import json
+import logging
+import os
+import time
+from pathlib import Path
+from typing import Optional
+from fastapi import FastAPI, HTTPException, Depends, Query, Request, Response
+from fastapi.responses import JSONResponse
+from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
+from fastapi.middleware.cors import CORSMiddleware
+from contextos.schema import (
+    SearchRequest, SearchResponse, ContextRequest, ContextResponse,
+    HealthResponse, DocumentType, TokenScope,
+)
+logger = logging.getLogger(__name__)
+# ---------------------------------------------------------------------------
+# App factory — lazy-init heavy objects on first request
+# ---------------------------------------------------------------------------
+_embedder = None
+_store = None
+_graph_builder = None
+_config = None
+def get_config():
+    global _config
+    if _config is None:
+        from contextos.config import load_config
+        _config = load_config()
+    return _config
+def get_embedder():
+    global _embedder
+    if _embedder is None:
+        from contextos.embedder import Embedder
+        cfg = get_config()
+        _embedder = Embedder(cfg.embeddings_dir)
+    return _embedder
+def get_store():
+    global _store
+    if _store is None:
+        from contextos.store import VectorStore
+        cfg = get_config()
+        _store = VectorStore(cfg.lancedb_dir)
+    return _store
+def get_graph():
+    global _graph_builder
+    if _graph_builder is None:
+        from contextos.graph import GraphBuilder
+        cfg = get_config()
+        _graph_builder = GraphBuilder()
+        _graph_builder.load(cfg.graph_dir)
+    return _graph_builder
+# ---------------------------------------------------------------------------
+# FastAPI app
+# ---------------------------------------------------------------------------
+app = FastAPI(
+    title="ContextOS",
+    description="Local-first knowledge OS for AI coding agents",
+    version="1.3.0-rc1",
+    docs_url="/docs",
+    redoc_url=None,
+)
+# Only allow localhost origins
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["http://127.0.0.1", "http://localhost"],
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+security = HTTPBearer(auto_error=False)
+# ---------------------------------------------------------------------------
+# Request ID + logging middleware
+# ---------------------------------------------------------------------------
+@app.middleware("http")
+async def request_middleware(request: Request, call_next):
+    from contextos.logger import get_logger, new_request_id
+    request_id = new_request_id()
+    request.state.request_id = request_id
+    request.state.start_time = time.time()
+    response = await call_next(request)
+    latency_ms = int((time.time() - request.state.start_time) * 1000)
+    response.headers["X-Request-ID"] = request_id
+    response.headers["X-Latency-MS"] = str(latency_ms)
+    try:
+        cfg    = get_config()
+        from contextos.logger import get_logger
+        logger = get_logger(cfg.logs_dir)
+        logger.log_request(
+            request_id  = request_id,
+            endpoint    = request.url.path,
+            method      = request.method,
+            latency_ms  = latency_ms,
+            token_id    = None,
+            status_code = response.status_code,
+        )
+    except Exception as exc:
+        import logging as _logging
+        _logging.getLogger(__name__).debug("Request logging failed: %s", exc)
+    return response
+def require_token(credentials: Optional[HTTPAuthorizationCredentials] = Depends(security)):
+    """Validate Bearer token. Raises 401 if missing/invalid, 403 if expired, 429 if rate limited."""
+    if credentials is None:
+        raise HTTPException(status_code=401, detail="Authorization header required")
+    from contextos.auth import validate_token, check_rate_limit
+    cfg = get_config()
+    token = validate_token(credentials.credentials, cfg.tokens_dir)
+    if token is None:
+        raise HTTPException(status_code=401, detail="Invalid or revoked token")
+    if token.is_expired():
+        raise HTTPException(status_code=403, detail="Token has expired")
+    if not check_rate_limit(token, cfg.tokens_dir):
+        raise HTTPException(
+            status_code=429,
+            detail="Rate limit exceeded — 1000 req/min",
+            headers={"Retry-After": "60"},
+        )
+    return token
+def require_scope(required: TokenScope):
+    """Dependency factory: enforce a minimum token scope."""
+    def _check(token=Depends(require_token)):
+        if not token.has_scope(required):
+            raise HTTPException(
+                status_code=403,
+                detail=f"Insufficient scope. Required: {required.value}, "
+                       f"token has: {token.scope.value if token.scope else 'none'}"
+            )
+        return token
+    return _check
+# ---------------------------------------------------------------------------
+# Endpoints
+# ---------------------------------------------------------------------------
+@app.get("/health", response_model=HealthResponse)
+def health(deep: bool = Query(False, description="Run a live search to verify end-to-end")):
+    """Health check. ?deep=true runs a sample search to verify retrieval works."""
+    store     = get_store()
+    doc_count = store.count_documents()
+    if deep:
+        # End-to-end verification
+        try:
+            embedder = get_embedder()
+            qv = embedder.embed_query("health check")
+            results = store.search(qv, limit=1)
+            retrieval_ok = True
+        except Exception as exc:
+            logger.warning("Deep health check failed: %s", exc)
+            retrieval_ok = False
+        return {
+            "status":       "ok" if retrieval_ok else "degraded",
+            "indexed":      doc_count,
+            "version":      "1.3.0-rc1",
+            "retrieval_ok": retrieval_ok,
+        }
+    return HealthResponse(status="ok", indexed=doc_count, version="1.3.0-rc1")
+@app.get("/metrics")
+def metrics(_token=Depends(require_scope(TokenScope.read))):
+    """Return request metrics: total_requests, avg_latency_ms, cache stats."""
+    from contextos.logger import get_logger
+    from contextos.cache_layer import get_cache
+    cfg = get_config()
+    log_metrics   = get_logger(cfg.logs_dir).get_metrics()
+    cache_stats   = get_cache().stats()
+    return {**log_metrics, "cache": cache_stats}
+@app.get("/audit")
+def audit(
+    limit: int = Query(50, le=500),
+    _token=Depends(require_scope(TokenScope.admin)),
+):
+    """Return recent audit log entries. Requires admin scope."""
+    from contextos.logger import get_logger
+    cfg = get_config()
+    return {"entries": get_logger(cfg.logs_dir).read_audit(limit=limit)}
+@app.post("/search", response_model=SearchResponse)
+def search(
+    request: SearchRequest,
+    session_id: Optional[str] = None,
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """Primary retrieval endpoint. Agents call this to find relevant document chunks."""
+    from contextos.retrieval import search as do_search
+    embedder = get_embedder()
+    store    = get_store()
+    graph    = get_graph() if request.include_graph else None
+    result = do_search(
+        query=request.query,
+        embedder=embedder,
+        store=store,
+        graph_builder=graph,
+        project=request.project or None,
+        type_filter=request.type.value if request.type else None,
+        domain_filter=request.domain,
+        limit=request.limit,
+        include_graph=request.include_graph,
+        use_hybrid=request.use_hybrid,
+        hybrid_alpha=request.hybrid_alpha,
+    )
+    # Log to session if provided
+    if session_id:
+        try:
+            from contextos.session import log_search
+            cfg = get_config()
+            log_search(cfg.contextos_dir / "sessions", session_id,
+                       request.query, len(result.results))
+        except Exception:
+            pass
+    return result
+@app.post("/context", response_model=ContextResponse)
+def context(
+    request: ContextRequest,
+    session_id: Optional[str] = None,
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """Assemble a ready-to-paste context block. Cached for 5 minutes per query."""
+    from contextos.retrieval import assemble_context
+    from contextos.cache_layer import get_cache
+    cache = get_cache()
+    cache_key = cache.make_key(request.query, request.project, request.max_tokens)
+    # Try cache first
+    cached = cache.get(cache_key)
+    if cached is not None:
+        if session_id:
+            try:
+                from contextos.session import log_context
+                cfg = get_config()
+                log_context(cfg.contextos_dir / "sessions", session_id,
+                            request.query, cached.token_estimate)
+            except Exception:
+                pass
+        return cached
+    embedder = get_embedder()
+    store    = get_store()
+    graph    = get_graph()
+    result = assemble_context(
+        query=request.query,
+        embedder=embedder,
+        store=store,
+        graph_builder=graph,
+        project=request.project or None,
+        max_tokens=request.max_tokens,
+        priority_order=request.priority_order,
+        use_hybrid=getattr(request, 'use_hybrid', True),
+        hybrid_alpha=getattr(request, 'hybrid_alpha', 0.7),
+    )
+    # Store in cache
+    cache.set(cache_key, result)
+    if session_id:
+        try:
+            from contextos.session import log_context
+            cfg = get_config()
+            log_context(cfg.contextos_dir / "sessions", session_id,
+                        request.query, result.token_estimate)
+        except Exception:
+            pass
+    return result
+@app.get("/graph")
+def graph_endpoint(_token=Depends(require_scope(TokenScope.read))):
+    """Return the full knowledge graph as nodes and edges."""
+    graph_builder = get_graph()
+    cfg = get_config()
+    graph_path = cfg.graph_dir / "graph.json"
+    if not graph_path.exists():
+        return {"nodes": [], "edges": [], "summary": {"nodes": 0, "edges": 0}}
+    with open(graph_path, "r", encoding="utf-8") as f:
+        data = json.load(f)
+    summary = graph_builder.get_summary()
+    data["summary"] = summary
+    return data
+@app.get("/documents")
+def list_documents(
+    project: Optional[str] = Query(None),
+    type: Optional[str] = Query(None),
+    domain: Optional[str] = Query(None),
+    status: Optional[str] = Query(None),
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """List all indexed documents with optional filters."""
+    store = get_store()
+    docs = store.list_documents(
+        project=project,
+        type_filter=type,
+        domain_filter=domain,
+        status_filter=status,
+    )
+    return {"documents": docs, "count": len(docs)}
+# ---------------------------------------------------------------------------
+# Watcher status
+# ---------------------------------------------------------------------------
+@app.get("/watcher")
+def watcher_status_endpoint(_token=Depends(require_scope(TokenScope.read))):
+    """Return live watch mode status."""
+    try:
+        from contextos.watcher import watcher_status
+        return watcher_status()
+    except Exception:
+        return {"active": False}
+# ---------------------------------------------------------------------------
+# Session endpoints
+# ---------------------------------------------------------------------------
+@app.post("/session/start")
+def session_start_ep(
+    name: Optional[str] = None,
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """Start a new agent session."""
+    from contextos.session import create_session
+    cfg = get_config()
+    session = create_session(cfg.contextos_dir / "sessions", name)
+    return {"session_id": session["id"], "name": session["name"], "started_at": session["started_at"]}
+@app.post("/session/{session_id}/event")
+def session_event_ep(
+    session_id: str,
+    event_type: str,
+    payload: dict,
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """Log an event to an active session."""
+    from contextos.session import add_event
+    cfg = get_config()
+    success = add_event(cfg.contextos_dir / "sessions", session_id, event_type, payload)
+    if not success:
+        raise HTTPException(status_code=404, detail=f"Session {session_id} not found or ended")
+    return {"ok": True}
+@app.post("/session/{session_id}/end")
+def session_end_ep(session_id: str, _token=Depends(require_scope(TokenScope.read))):
+    """End a session and generate summary."""
+    from contextos.session import end_session
+    cfg = get_config()
+    try:
+        session = end_session(cfg.contextos_dir / "sessions", session_id)
+        return {"session_id": session_id, "summary": session.get("summary", {})}
+    except ValueError as exc:
+        raise HTTPException(status_code=404, detail=str(exc))
+@app.get("/session/last")
+def session_last_ep(_token=Depends(require_scope(TokenScope.read))):
+    """Return the most recent completed session summary."""
+    from contextos.session import get_last_session
+    cfg = get_config()
+    session = get_last_session(cfg.contextos_dir / "sessions")
+    return {"session": session}
+@app.get("/session/active")
+def session_active_ep(_token=Depends(require_scope(TokenScope.read))):
+    """Return the currently active session, if any."""
+    from contextos.session import get_active_session
+    cfg = get_config()
+    return {"session": get_active_session(cfg.contextos_dir / "sessions")}
+# ---------------------------------------------------------------------------
+# Pull endpoint
+# ---------------------------------------------------------------------------
+@app.post("/pull")
+def pull_ep(
+    connector: str,
+    source: Optional[str] = None,
+    project: Optional[str] = None,
+    pull_type: Optional[str] = None,
+    force: bool = False,
+    _token=Depends(require_scope(TokenScope.read)),
+):
+    """Pull external data from a connector into the output directory."""
+    from contextos.connectors import CONNECTORS
+    cfg = get_config()
+    conn_cls = CONNECTORS.get(connector.lower())
+    if not conn_cls:
+        raise HTTPException(status_code=400, detail=f"Unknown connector: {connector}")
+    proj = project or cfg.project_name
+    conn_config: dict = {}
+    if source:    conn_config["source"] = source; conn_config["repo"] = source
+    if pull_type: conn_config["type"]   = pull_type
+    conn    = conn_cls(project=proj, config=conn_config)
+    out_dir = cfg.contextos_dir / "pulled" / connector / proj
+    try:
+        return conn.pull(out_dir, force=force)
+    except Exception as exc:
+        raise HTTPException(status_code=500, detail=str(exc))
+# ---------------------------------------------------------------------------
+# Server startup
+# ---------------------------------------------------------------------------
+def create_app() -> FastAPI:
+    """Return the FastAPI app instance."""
+    return app
+def run_server(port: int = 8080):
+    """
+    Start uvicorn server. ALWAYS binds to 127.0.0.1.
+    Never binds to 0.0.0.0 — this is enforced here and not configurable.
+    """
+    import uvicorn
+    logger.info("Starting ContextOS API on http://127.0.0.1:%d", port)
+    uvicorn.run(
+        "contextos.api:app",
+        host="127.0.0.1",   # HARDCODED — never 0.0.0.0
+        port=port,
+        log_level="warning",
+        reload=False,
+    )