npm - ltcai - Versions diffs - 1.2.0 → 1.4.0 - Mend

ltcai 1.2.0 → 1.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

package/README.md +28 -8
package/docs/CHANGELOG.md +96 -0
package/latticeai/__init__.py +1 -1
package/latticeai/api/chat.py +786 -0
package/latticeai/api/computer_use.py +294 -0
package/latticeai/api/deps.py +15 -0
package/latticeai/api/garden.py +34 -0
package/latticeai/api/local_files.py +125 -0
package/latticeai/api/mcp.py +386 -0
package/latticeai/api/models.py +307 -0
package/latticeai/api/permissions.py +331 -0
package/latticeai/api/setup.py +158 -0
package/latticeai/api/static_routes.py +166 -0
package/latticeai/api/tools.py +579 -0
package/latticeai/core/workspace_os.py +1 -1
package/latticeai/server_app.py +231 -4876
package/latticeai/services/app_context.py +27 -0
package/latticeai/services/model_runtime.py +1973 -0
package/latticeai/services/tool_dispatch.py +135 -0
package/latticeai/services/upload_service.py +99 -0
package/package.json +3 -3
package/skills/SKILL_TEMPLATE.md +1 -1
package/skills/code_review/SKILL.md +1 -1
package/skills/data_analysis/SKILL.md +1 -1
package/skills/file_edit/SKILL.md +1 -1
package/skills/summarize_document/SKILL.md +1 -1
package/skills/web_search/SKILL.md +1 -1

package/latticeai/api/mcp.py ADDED Viewed

@@ -0,0 +1,386 @@
+"""MCP / skills / plugins API router.
+Extracted from ``server_app.py`` in v1.3.0. Paths and schemas unchanged:
+``/mcp/*``, ``/skills/*``, ``/plugins/directory*``, and ``/mcp/call``.
+Registry/tool symbols are imported directly from their owning modules
+(``mcp_registry``, ``tools``, ``latticeai.core.tool_registry``); server_app-defined
+helpers (auth, audit, tool governance/dispatch, KG) are injected, so there is no
+import cycle.
+"""
+from __future__ import annotations
+import json
+import logging
+from datetime import datetime
+from pathlib import Path
+from typing import Any, Callable, Dict, List, Optional
+from fastapi import APIRouter, HTTPException, Request
+from pydantic import BaseModel
+import mcp_registry
+from mcp_registry import (
+    _get_combined_registry,
+    _fetch_skills_marketplace,
+    _fetch_plugin_directory,
+    install_skill,
+    SKILLS_DIR,
+)
+from latticeai.core.tool_registry import MCP_TOOL_DESCRIPTIONS
+from tools import AGENT_ROOT, execute_tool
+class McpRecommendRequest(BaseModel):
+    query: str
+    limit: int = 5
+class McpInstallRequest(BaseModel):
+    mcp_id: str
+class McpCustomRequest(BaseModel):
+    name: str
+    package: str
+    description: str = ""
+    category: str = "custom"
+    icon: str = "🔌"
+    env_vars: List[Dict] = []
+class SkillInstallRequest(BaseModel):
+    plugin: str
+    skill: str
+class McpCallRequest(BaseModel):
+    action: str
+    args: Dict = {}
+def create_mcp_router(
+    *,
+    require_user: Callable[[Request], str],
+    require_admin: Callable[[Request], Any],
+    append_audit_event: Callable[..., None],
+    load_mcp_installs: Callable[[], Dict],
+    recommend_mcps: Callable[..., Any],
+    install_mcp: Callable[..., Any],
+    mcp_public_item: Callable[[Dict, Dict], Dict],
+    get_tool_permission: Callable[..., Any],
+    tool_governance: Dict,
+    tool_governance_default: Any,
+    check_tool_role: Callable[[str, str], None],
+    tool_response: Callable[..., Any],
+    require_graph: Callable[[], Any],
+    knowledge_graph: Any,
+    data_dir: Path,
+) -> APIRouter:
+    router = APIRouter()
+    # Bind injected deps to the names the moved handler bodies expect.
+    TOOL_GOVERNANCE = tool_governance
+    _TOOL_GOVERNANCE_DEFAULT = tool_governance_default
+    _check_tool_role = check_tool_role
+    _tool_response = tool_response
+    _require_graph = require_graph
+    KNOWLEDGE_GRAPH = knowledge_graph
+    _CUSTOM_MCP_FILE = data_dir / "custom_mcps.json"
+    def _load_custom_mcps() -> List[Dict]:
+        if not _CUSTOM_MCP_FILE.exists():
+            return []
+        try:
+            with open(_CUSTOM_MCP_FILE, "r", encoding="utf-8") as f:
+                return json.load(f)
+        except Exception:
+            return []
+    def _save_custom_mcps(items: List[Dict]):
+        with open(_CUSTOM_MCP_FILE, "w", encoding="utf-8") as f:
+            json.dump(items, f, ensure_ascii=False, indent=2)
+    @router.get("/mcp/tools")
+    async def mcp_tools():
+        installed = load_mcp_installs().get("installed", {})
+        registry = await _get_combined_registry()
+        tools = []
+        for name, description in MCP_TOOL_DESCRIPTIONS.items():
+            policy = TOOL_GOVERNANCE.get(name, _TOOL_GOVERNANCE_DEFAULT)
+            tools.append({
+                "name": name,
+                "description": description,
+                "permission": get_tool_permission(name),
+                "governance": {
+                    "risk":         policy["risk"],
+                    "destructive":  policy["destructive"],
+                    "shell":        policy["shell"],
+                    "network":      policy["network"],
+                    "auto_approve": policy["auto_approve"],
+                    "sandbox":      policy["sandbox"],
+                    "rollback":     policy["rollback"],
+                },
+            })
+        return {
+            "status": "ok",
+            "workspace": str(AGENT_ROOT),
+            "installed_mcps": [mcp_public_item(item, installed) for item in registry],
+            "tools": tools,
+        }
+    @router.post("/mcp/recommend")
+    async def mcp_recommend(req: McpRecommendRequest, request: Request):
+        require_user(request)
+        return {"recommendations": await recommend_mcps(req.query, req.limit)}
+    @router.post("/mcp/install")
+    async def mcp_install(req: McpInstallRequest, request: Request):
+        admin_email, _ = require_admin(request)
+        append_audit_event("mcp_install", user_email=admin_email, mcp_id=req.mcp_id)
+        return await install_mcp(req.mcp_id)
+    @router.get("/mcp/installed")
+    async def mcp_installed(request: Request):
+        require_user(request)
+        installed = load_mcp_installs().get("installed", {})
+        registry = await _get_combined_registry()
+        return {"installed": [mcp_public_item(item, installed) for item in registry]}
+    @router.get("/mcp/connectors/{mcp_id}")
+    async def mcp_connector(mcp_id: str, request: Request):
+        require_user(request)
+        registry = await _get_combined_registry()
+        item = next((e for e in registry if e["id"] == mcp_id), None)
+        if not item or item.get("install_mode") != "connector":
+            raise HTTPException(status_code=404, detail="커넥터를 찾을 수 없습니다.")
+        installed = load_mcp_installs().get("installed", {})
+        public = mcp_public_item(item, installed)
+        public["instructions"] = [
+            "Codex 또는 ChatGPT 앱의 Connectors 설정을 엽니다.",
+            f"{item['name']} 항목을 선택하고 계정을 인증합니다.",
+            "인증 후 Lattice AI에서 이 MCP를 다시 활성화하면 작업에 사용할 수 있습니다.",
+        ]
+        return public
+    @router.post("/mcp/registry/refresh")
+    async def mcp_registry_refresh(request: Request):
+        require_user(request)
+        mcp_registry._REMOTE_REGISTRY_FETCHED_AT = None
+        registry = await _get_combined_registry()
+        return {"status": "ok", "total": len(registry), "remote": len(mcp_registry._REMOTE_REGISTRY_CACHE)}
+    @router.get("/mcp/claude-code-servers")
+    async def mcp_claude_code_servers(request: Request):
+        """Read ~/.claude/settings.json mcpServers and return them as Lattice MCP items."""
+        require_user(request)
+        settings_path = Path.home() / ".claude" / "settings.json"
+        if not settings_path.exists():
+            return {"servers": []}
+        try:
+            with open(settings_path, "r", encoding="utf-8") as f:
+                settings = json.load(f)
+            mcp_servers = settings.get("mcpServers", {})
+            servers = []
+            for name, cfg in mcp_servers.items():
+                cmd = cfg.get("command", "")
+                args = cfg.get("args", [])
+                package = " ".join([cmd] + args) if args else cmd
+                env = cfg.get("env", {})
+                env_vars = [{"name": k, "value": v} for k, v in env.items()]
+                servers.append({
+                    "id": f"claude-code:{name}",
+                    "name": name,
+                    "description": f"Claude Code MCP: {package}",
+                    "package": package,
+                    "icon": "🤖",
+                    "category": "Claude Code",
+                    "source": "claude-code",
+                    "installed": True,
+                    "env_vars": env_vars,
+                })
+            return {"servers": servers}
+        except Exception as e:
+            logging.warning("mcp_claude_code_servers failed: %s", e)
+            return {"servers": []}
+    @router.get("/mcp/custom")
+    async def mcp_custom_list(request: Request):
+        """Return user-added custom MCP entries."""
+        require_user(request)
+        return {"custom": _load_custom_mcps()}
+    @router.post("/mcp/custom")
+    async def mcp_custom_add(req: McpCustomRequest, request: Request):
+        """Save a custom MCP entry (admin-only)."""
+        admin_email, _ = require_admin(request)
+        append_audit_event("mcp_custom_add", user_email=admin_email, name=req.name, package=req.package)
+        if not req.name.strip():
+            raise HTTPException(status_code=400, detail="name은 필수입니다.")
+        if not req.package.strip():
+            raise HTTPException(status_code=400, detail="package는 필수입니다.")
+        items = _load_custom_mcps()
+        entry = {
+            "id": f"custom:{req.name.strip().lower().replace(' ', '-')}",
+            "name": req.name.strip(),
+            "package": req.package.strip(),
+            "description": req.description.strip(),
+            "category": req.category or "custom",
+            "icon": req.icon or "🔌",
+            "env_vars": req.env_vars or [],
+            "install_mode": "npm",
+            "source": "custom",
+            "installed": False,
+            "added_at": datetime.now().isoformat(),
+        }
+        items = [e for e in items if e["id"] != entry["id"]]
+        items.append(entry)
+        _save_custom_mcps(items)
+        return {"status": "ok", "entry": entry}
+    @router.delete("/mcp/custom/{mcp_id:path}")
+    async def mcp_custom_delete(mcp_id: str, request: Request):
+        """Remove a custom MCP entry."""
+        require_admin(request)
+        items = _load_custom_mcps()
+        before = len(items)
+        items = [e for e in items if e["id"] != mcp_id]
+        if len(items) == before:
+            raise HTTPException(status_code=404, detail="항목을 찾을 수 없습니다.")
+        _save_custom_mcps(items)
+        return {"status": "ok"}
+    # ── Skills & Plugin Directory ─────────────────────────────────────────
+    @router.get("/skills/marketplace")
+    async def skills_marketplace(request: Request, category: Optional[str] = None, author: Optional[str] = None):
+        require_user(request)
+        skills = await _fetch_skills_marketplace()
+        installed_names = {d.name for d in SKILLS_DIR.iterdir() if d.is_dir()} if SKILLS_DIR.exists() else set()
+        filtered = skills
+        if category:
+            filtered = [s for s in filtered if s.get("category", "").lower() == category.lower()]
+        if author:
+            filtered = [s for s in filtered if s.get("author", "").lower() == author.lower()]
+        return {
+            "skills": [{**s, "installed": s["skill"] in installed_names} for s in filtered],
+            "total": len(filtered),
+            "authors": sorted({s["author"] for s in skills}),
+            "categories": sorted({s["category"] for s in skills}),
+        }
+    @router.post("/skills/install")
+    async def skills_install(req: SkillInstallRequest, request: Request):
+        admin_email, _ = require_admin(request)
+        append_audit_event("skill_install", user_email=admin_email, plugin=req.plugin, skill=req.skill)
+        return await install_skill(req.plugin, req.skill)
+    @router.get("/skills/list")
+    async def skills_list(request: Request):
+        require_user(request)
+        if not SKILLS_DIR.exists():
+            return {"skills": []}
+        skills = []
+        for skill_dir in sorted(SKILLS_DIR.iterdir()):
+            if not skill_dir.is_dir():
+                continue
+            skill_md = skill_dir / "SKILL.md"
+            if not skill_md.exists():
+                continue
+            lines = skill_md.read_text(encoding="utf-8").splitlines()
+            desc = next((l.split(":", 1)[1].strip() for l in lines if l.startswith("description:")), "")
+            comment = lines[0] if lines else ""
+            if "anthropics/claude-plugins-official" in comment:
+                source = "anthropic"
+            elif "Source:" in comment:
+                source = "third-party"
+            else:
+                source = "local"
+            skills.append({"name": skill_dir.name, "description": desc, "source": source})
+        return {"skills": skills, "total": len(skills)}
+    @router.post("/skills/marketplace/refresh")
+    async def skills_marketplace_refresh(request: Request):
+        require_user(request)
+        mcp_registry._SKILLS_MARKETPLACE_FETCHED_AT = None
+        skills = await _fetch_skills_marketplace()
+        by_author = {}
+        for s in skills:
+            by_author[s["author"]] = by_author.get(s["author"], 0) + 1
+        return {"status": "ok", "total": len(skills), "by_author": by_author}
+    @router.get("/plugins/directory")
+    async def plugins_directory(
+        request: Request,
+        category: Optional[str] = None,
+        license: Optional[str] = None,
+        q: Optional[str] = None,
+    ):
+        require_user(request)
+        plugins = await _fetch_plugin_directory()
+        filtered = plugins
+        if category:
+            filtered = [p for p in filtered if p.get("category", "").lower() == category.lower()]
+        if license:
+            filtered = [p for p in filtered if p.get("license", "").lower() == license.lower()]
+        if q:
+            q_lower = q.lower()
+            filtered = [
+                p for p in filtered
+                if q_lower in p.get("name", "").lower()
+                or q_lower in p.get("description", "").lower()
+                or q_lower in p.get("author", "").lower()
+            ]
+        return {
+            "plugins": filtered,
+            "total": len(filtered),
+            "categories": sorted({p["category"] for p in plugins if p.get("category")}),
+            "licenses": sorted({p["license"] for p in plugins if p.get("license")}),
+        }
+    @router.post("/plugins/directory/refresh")
+    async def plugins_directory_refresh(request: Request):
+        require_user(request)
+        mcp_registry._PLUGIN_DIRECTORY_FETCHED_AT = None
+        plugins = await _fetch_plugin_directory()
+        by_license = {}
+        for p in plugins:
+            lic = p.get("license", "unknown")
+            by_license[lic] = by_license.get(lic, 0) + 1
+        return {"status": "ok", "total": len(plugins), "by_license": by_license}
+    @router.post("/mcp/call")
+    async def mcp_call(req: McpCallRequest, request: Request):
+        current_user = require_user(request)
+        args = req.args or {}
+        if req.action == "knowledge_graph_ingest":
+            _require_graph()
+            return KNOWLEDGE_GRAPH.ingest_message(
+                args.get("role") or ("assistant" if args.get("type") == "ai_response" else "user"),
+                args.get("content") or "",
+                user_email=args.get("user_email") or current_user,
+                user_nickname=args.get("user_nickname"),
+                source=args.get("source") or "mcp",
+                conversation_id=args.get("conversation_id"),
+                raw=args,
+            )
+        if req.action == "knowledge_graph_search":
+            _require_graph()
+            return KNOWLEDGE_GRAPH.search(args.get("query") or args.get("q") or "", args.get("limit", 30))
+        if req.action == "knowledge_graph_graph":
+            _require_graph()
+            return KNOWLEDGE_GRAPH.graph(args.get("limit", 300))
+        if req.action == "knowledge_graph_context":
+            _require_graph()
+            return {
+                "context": KNOWLEDGE_GRAPH.context_for_query(
+                    args.get("query") or args.get("q") or "",
+                    args.get("limit", 6),
+                )
+            }
+        _check_tool_role(req.action, current_user)
+        return _tool_response(execute_tool, req.action, req.args or {})
+    return router

package/latticeai/api/models.py ADDED Viewed

@@ -0,0 +1,307 @@
+"""Model / engine API router.
+Extracted from ``server_app.py`` in v1.3.0. Paths and schemas unchanged:
+``/models*``, ``/engines*`` (install/verify-cloud/pull-model/prepare-model[/stream]),
+``/setup/set-api-key``.
+Mirrors the established router-factory convention: the heavy provider/runtime
+helpers (engine_status, prepare_and_load_model, download_hf_model,
+verify_cloud_models, …) remain owned by server_app for now and are injected here
+as callables, so this module has no import cycle and adds no import-time
+side effects.
+"""
+from __future__ import annotations
+import asyncio
+import logging
+import subprocess
+from typing import Any, Callable, Dict, List, Optional
+from fastapi import APIRouter, HTTPException, Request
+from fastapi.responses import StreamingResponse
+from pydantic import BaseModel
+class LoadModelRequest(BaseModel):
+    model_id: str
+    engine: Optional[str] = None
+    user_email: Optional[str] = None
+    adapter_path: Optional[str] = None
+    draft_model_id: Optional[str] = None
+class InstallEngineRequest(BaseModel):
+    engine: str
+class SetApiKeyRequest(BaseModel):
+    provider: str
+    key: str
+    user_email: Optional[str] = None
+class PullModelRequest(BaseModel):
+    model: str
+class PrepareModelRequest(BaseModel):
+    model: str
+    engine: Optional[str] = None
+    user_email: Optional[str] = None
+class VerifyCloudRequest(BaseModel):
+    force: bool = False
+    provider: Optional[str] = None
+def create_models_router(
+    *,
+    model_router: Any,
+    require_user: Callable[[Request], str],
+    get_current_user: Callable[[Request], Optional[str]],
+    load_users: Callable[[], Dict],
+    get_user_role: Callable[..., str],
+    install_engine: Callable[[str], Dict],
+    verify_cloud_models: Callable[..., Any],
+    normalize_local_model_request: Callable[..., str],
+    download_hf_model: Callable[..., Dict],
+    prepare_and_load_model: Callable[..., Any],
+    prepare_and_load_model_stream: Callable[..., Any],
+    sse_event: Callable[[str, Dict], str],
+    ensure_ollama_server: Callable[[], None],
+    local_binary: Callable[[str], Optional[str]],
+    engine_status: Callable[[], List[Dict]],
+    filter_lower_family_versions: Callable[[List[Dict]], List[Dict]],
+    list_compat_profiles: Callable[[], Any],
+    set_user_api_key: Callable[..., None],
+    engine_model_catalog: Dict,
+    model_engine_aliases: Dict,
+    cloud_verify_ttl_seconds: int,
+    is_public_mode: bool,
+    allow_local_models: bool,
+    require_auth: bool,
+) -> APIRouter:
+    router = APIRouter()
+    # Bind injected deps to the names the moved handler bodies expect.
+    _router = model_router
+    ENGINE_MODEL_CATALOG = engine_model_catalog
+    MODEL_ENGINE_ALIASES = model_engine_aliases
+    CLOUD_VERIFY_TTL_SECONDS = cloud_verify_ttl_seconds
+    IS_PUBLIC_MODE = is_public_mode
+    ALLOW_LOCAL_MODELS = allow_local_models
+    REQUIRE_AUTH = require_auth
+    _list_compat_profiles = list_compat_profiles
+    def _recommended_with_engine_options(items: List[Dict[str, object]]) -> List[Dict[str, object]]:
+        out: List[Dict[str, object]] = []
+        for item in items:
+            base = {
+                "id": item["id"],
+                "name": item["name"],
+                "tag": item["tag"],
+                "size": item["size"],
+                "display_name": item.get("name") or item.get("id"),
+            }
+            short_id = str(item["id"]).lower()
+            aliases = MODEL_ENGINE_ALIASES.get(short_id) or {}
+            options: List[Dict[str, str]] = []
+            for engine_name in ("local_mlx", "ollama", "lmstudio", "llamacpp", "vllm"):
+                real = aliases.get(engine_name)
+                if not real:
+                    continue
+                options.append({
+                    "engine": engine_name,
+                    "model_id": real,
+                    "load_id": real if engine_name == "local_mlx" else f"{engine_name}:{real}",
+                })
+            if not options:
+                options.append({"engine": "local_mlx", "model_id": item["id"], "load_id": item["id"]})
+            base["engine_options"] = options
+            base["recommended_engine"] = options[0]["engine"]
+            out.append(base)
+        return out
+    # ── Engines ───────────────────────────────────────────────────────────
+    @router.post("/engines/install")
+    async def engines_install(req: InstallEngineRequest, request: Request):
+        require_user(request)
+        return install_engine(req.engine)
+    @router.post("/engines/verify-cloud")
+    async def engines_verify_cloud(req: VerifyCloudRequest, request: Request):
+        require_user(request)
+        results = await verify_cloud_models(force=req.force, provider_filter=req.provider)
+        return {"verified": results, "ttl_seconds": CLOUD_VERIFY_TTL_SECONDS}
+    @router.post("/engines/pull-model")
+    async def pull_ollama_model(req: PullModelRequest, request: Request):
+        require_user(request)
+        model_ref = normalize_local_model_request(req.model, None)
+        if not model_ref:
+            raise HTTPException(status_code=400, detail="모델 식별자가 비어 있습니다.")
+        if ":" in model_ref and model_ref.split(":", 1)[0].strip().lower() in {"ollama", "vllm", "lmstudio", "llamacpp", "local_mlx", "mlx"}:
+            provider, model_name = model_ref.split(":", 1)
+            provider = provider.strip().lower()
+            model_name = model_name.strip()
+        else:
+            provider, model_name = "local_mlx", model_ref
+        if not model_name:
+            raise HTTPException(status_code=400, detail="모델 이름이 비어 있습니다.")
+        if provider == "ollama":
+            ensure_ollama_server()
+            ollama = local_binary("ollama")
+            if not ollama:
+                raise HTTPException(status_code=400, detail="Ollama가 설치되지 않았습니다.")
+            try:
+                completed = subprocess.run(
+                    [ollama, "pull", model_name],
+                    capture_output=True, text=True, timeout=900, check=False,
+                )
+            except subprocess.TimeoutExpired:
+                raise HTTPException(status_code=408, detail="모델 다운로드 시간이 초과되었습니다.")
+            if completed.returncode != 0:
+                raise HTTPException(status_code=500, detail=completed.stderr[-2000:] or "pull 실패")
+            return {"provider": provider, "model": model_name, "returncode": completed.returncode}
+        if provider == "lmstudio":
+            raise HTTPException(
+                status_code=400,
+                detail=(
+                    "LM Studio 모델은 Lattice에서 Hugging Face로 pull하지 않습니다. "
+                    "LM Studio 앱에서 모델을 다운로드하고 Local Server를 켠 뒤 모델을 로드하세요. "
+                    "그러면 모델 선택창에 실제 /v1/models 항목이 표시됩니다."
+                ),
+            )
+        if provider in {"vllm", "llamacpp", "local_mlx", "mlx"}:
+            download_provider = "local_mlx" if provider == "mlx" else provider
+            result = download_hf_model(model_name, download_provider)
+            return {"provider": provider, "model": model_name, "returncode": 0, **result}
+        raise HTTPException(status_code=400, detail=f"{provider} 엔진 모델 다운로드는 아직 자동화되지 않았습니다.")
+    @router.post("/engines/prepare-model")
+    async def engines_prepare_model(req: PrepareModelRequest, request: Request):
+        require_user(request)
+        return await prepare_and_load_model(
+            req.model, request, engine=req.engine, user_email=req.user_email,
+        )
+    @router.post("/engines/prepare-model/stream")
+    async def engines_prepare_model_stream(req: PrepareModelRequest, request: Request):
+        require_user(request)
+        async def event_stream():
+            try:
+                async for chunk in prepare_and_load_model_stream(
+                    req.model, request, engine=req.engine, user_email=req.user_email,
+                ):
+                    yield chunk
+            except HTTPException as exc:
+                yield sse_event("error", {
+                    "status_code": exc.status_code,
+                    "detail": exc.detail or "모델 준비에 실패했습니다.",
+                })
+            except Exception as exc:
+                logging.exception("model prepare stream failed")
+                yield sse_event("error", {
+                    "status_code": 500,
+                    "detail": str(exc)[-1000:] or "모델 준비에 실패했습니다.",
+                })
+        return StreamingResponse(
+            event_stream(),
+            media_type="text/event-stream",
+            headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"},
+        )
+    @router.post("/setup/set-api-key")
+    async def set_api_key(req: SetApiKeyRequest, request: Request):
+        from llm_router import OPENAI_COMPATIBLE_PROVIDERS
+        config = OPENAI_COMPATIBLE_PROVIDERS.get(req.provider)
+        if not config:
+            raise HTTPException(status_code=400, detail="알 수 없는 프로바이더입니다.")
+        if not req.key.strip():
+            raise HTTPException(status_code=400, detail="API 키가 비어있습니다.")
+        current_user = get_current_user(request)
+        if REQUIRE_AUTH and not current_user:
+            raise HTTPException(status_code=401, detail="인증이 필요합니다.")
+        if req.user_email and req.user_email != current_user:
+            users = load_users()
+            if get_user_role(current_user or "", users) != "admin":
+                raise HTTPException(status_code=403, detail="다른 사용자의 API 키를 설정할 권한이 없습니다.")
+        target_email = (req.user_email or current_user or "").strip()
+        if not target_email:
+            raise HTTPException(status_code=400, detail="사용자 식별이 필요합니다. 로그인 후 다시 시도하세요.")
+        set_user_api_key(target_email, req.provider, req.key.strip())
+        return {"ok": True, "provider": req.provider, "user_email": target_email, "scope": "user"}
+    # ── Models ────────────────────────────────────────────────────────────
+    @router.get("/models")
+    async def list_models():
+        recommended = _recommended_with_engine_options(
+            list(filter_lower_family_versions(ENGINE_MODEL_CATALOG.get("local_mlx", [])))
+        )
+        return {
+            "recommended": recommended,
+            "cloud": _router.detected_cloud_models(),
+            "engines": await asyncio.to_thread(engine_status),
+            "loaded": _router.loaded_model_ids,
+            "current": _router.current_model_id,
+            "compat_profiles": _list_compat_profiles(),
+        }
+    @router.get("/models/compat-profiles")
+    async def list_model_compat_profiles(request: Request):
+        require_user(request)
+        return {"profiles": _list_compat_profiles()}
+    @router.post("/models/load")
+    async def load_model(req: LoadModelRequest, request: Request):
+        try:
+            model_id = req.model_id
+            requested_engine = req.engine or (model_id.split(":", 1)[0] if ":" in model_id else "local_mlx")
+            if IS_PUBLIC_MODE and not ALLOW_LOCAL_MODELS and requested_engine in {"local_mlx", "mlx"}:
+                raise HTTPException(
+                    status_code=400,
+                    detail="Public mode blocks local MLX model loading. Use openai:, openrouter:, groq:, together:, or set LATTICEAI_ALLOW_LOCAL_MODELS=true.",
+                )
+            return await prepare_and_load_model(
+                model_id, request, engine=req.engine, user_email=req.user_email,
+                adapter_path=req.adapter_path, draft_model_id=req.draft_model_id,
+            )
+        except HTTPException:
+            raise
+        except Exception as e:
+            raise HTTPException(status_code=500, detail=str(e))
+    @router.post("/models/switch/{model_id:path}")
+    async def switch_model(model_id: str, request: Request):
+        require_user(request)
+        try:
+            _router.switch_model(model_id)
+            return {"status": "ok", "current": _router.current_model_id}
+        except KeyError:
+            raise HTTPException(status_code=404, detail=f"Model '{model_id}' not loaded. Call /models/load first.")
+    @router.delete("/models/unload/{model_id:path}")
+    async def unload_model(model_id: str, request: Request):
+        require_user(request)
+        _router.unload_model(model_id)
+        return {"status": "ok", "unloaded": model_id}
+    @router.delete("/models/unload-all")
+    async def unload_all_models(request: Request):
+        require_user(request)
+        unloaded = _router.loaded_model_ids
+        _router.unload_all()
+        return {"status": "ok", "unloaded": unloaded}
+    return router