npm - ltcai - Versions diffs - 1.2.0 → 1.4.0 - Mend

ltcai 1.2.0 → 1.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

package/README.md +28 -8
package/docs/CHANGELOG.md +96 -0
package/latticeai/__init__.py +1 -1
package/latticeai/api/chat.py +786 -0
package/latticeai/api/computer_use.py +294 -0
package/latticeai/api/deps.py +15 -0
package/latticeai/api/garden.py +34 -0
package/latticeai/api/local_files.py +125 -0
package/latticeai/api/mcp.py +386 -0
package/latticeai/api/models.py +307 -0
package/latticeai/api/permissions.py +331 -0
package/latticeai/api/setup.py +158 -0
package/latticeai/api/static_routes.py +166 -0
package/latticeai/api/tools.py +579 -0
package/latticeai/core/workspace_os.py +1 -1
package/latticeai/server_app.py +231 -4876
package/latticeai/services/app_context.py +27 -0
package/latticeai/services/model_runtime.py +1973 -0
package/latticeai/services/tool_dispatch.py +135 -0
package/latticeai/services/upload_service.py +99 -0
package/package.json +3 -3
package/skills/SKILL_TEMPLATE.md +1 -1
package/skills/code_review/SKILL.md +1 -1
package/skills/data_analysis/SKILL.md +1 -1
package/skills/file_edit/SKILL.md +1 -1
package/skills/summarize_document/SKILL.md +1 -1
package/skills/web_search/SKILL.md +1 -1

package/latticeai/api/chat.py ADDED Viewed

@@ -0,0 +1,786 @@
+"""Chat, history, and local agent API routes."""
+from __future__ import annotations
+import asyncio
+import base64
+import io
+import json
+import logging
+import re
+import secrets
+import shutil
+import subprocess
+import tempfile
+import threading
+from pathlib import Path
+from typing import AsyncIterator, Dict, List, Optional
+from fastapi import APIRouter, HTTPException, Request
+from fastapi.responses import JSONResponse, StreamingResponse
+from pydantic import BaseModel
+from PIL import Image
+from latticeai.core.agent import AgentRunContext, AgentState
+from latticeai.core.context_builder import format_sources_footnote, retrieve_context_for_generation
+from latticeai.core.document_generator import DocumentGenerationSession, detect_document_intent
+from latticeai.services.chat_service import ChatService
+from latticeai.services.tool_dispatch import build_agent_runtime, collect_created_files
+from telegram_bot import broadcast_web_chat
+from tools import AGENT_ROOT, ToolError, ensure_agent_root, execute_tool, knowledge_save, local_read, network_status
+class ChatRequest(BaseModel):
+    message: str
+    conversation_id: Optional[str] = None
+    client_url: Optional[str] = None
+    model: Optional[str] = None
+    max_tokens: int = 2048
+    temperature: float = 0.2
+    stream: bool = True
+    context: Optional[str] = None
+    source: Optional[str] = None
+    user_email: Optional[str] = None
+    user_nickname: Optional[str] = None
+    image_data: Optional[str] = None
+class AgentRequest(BaseModel):
+    message: str
+    conversation_id: Optional[str] = None
+    source: Optional[str] = None
+    max_steps: int = 25
+    temperature: float = 0.1
+    user_email: Optional[str] = None
+    user_nickname: Optional[str] = None
+    planning_model: Optional[str] = None
+    executing_model: Optional[str] = None
+    reviewing_model: Optional[str] = None
+    human_in_loop: bool = False
+class AgentResumeRequest(BaseModel):
+    context_id: str
+    approved: bool = True
+    modified_plan: Optional[dict] = None
+    executing_model: Optional[str] = None
+    reviewing_model: Optional[str] = None
+class AgentEvalRequest(BaseModel):
+    skill: str
+    case_id: Optional[str] = None
+def detect_language(text: str) -> str:
+    """Detect language: 'ko' (Korean) or 'en' (English)."""
+    total = max(len(text), 1)
+    ko = sum(1 for c in text if '가' <= c <= '힣')
+    if ko / total > 0.05:
+        return "ko"
+    return "en"
+_LANG_HINT = {
+    "ko": "Respond in Korean (한국어로 답변하세요).",
+    "en": "Respond in English.",
+}
+def is_network_status_request(text: str) -> bool:
+    """사용자가 현재 IP/네트워크 정보를 물었는지 감지합니다."""
+    t = (text or "").lower()
+    has_ip = bool(re.search(r"((?<![a-z0-9])ip(?![a-z0-9])|아이피|ip\s*주소|아이피\s*주소|ipconfig|ifconfig|네트워크)", t))
+    asks_current = any(word in t for word in ["내", "현재", "지금", "local", "로컬", "주소", "address", "뭐", "알려", "확인", "상태"])
+    return has_ip and asks_current
+def is_current_url_request(text: str) -> bool:
+    t = (text or "").lower()
+    has_url = any(word in t for word in ["url", "주소", "링크", "address"])
+    asks_current = any(word in t for word in ["현재", "지금", "여기", "접속", "페이지", "브라우저", "알려", "뭐"])
+    return has_url and asks_current
+def is_clear_command(text: str) -> bool:
+    return (text or "").strip().lower() in {"/clear", "/clear_all"}
+def format_network_status(info: Dict) -> str:
+    lines = [
+        f"내부 IP: {info.get('local_ip') or '확인 안 됨'}",
+        f"외부 IP: {info.get('public_ip') or '확인 안 됨'}",
+        f"호스트명: {info.get('hostname') or '확인 안 됨'}",
+    ]
+    local_ips = info.get("local_ips") or {}
+    if local_ips:
+        lines.extend(["", "인터페이스:"])
+        lines.extend(f"- {name}: {ip}" for name, ip in local_ips.items())
+    note = info.get("note")
+    if note:
+        lines.extend(["", note])
+    return "\n".join(lines)
+async def single_text_stream(text: str, model: str = "system") -> AsyncIterator[str]:
+    yield f"data: {json.dumps({'chunk': text, 'model': model}, ensure_ascii=False)}\n\n"
+    yield "data: [DONE]\n\n"
+def create_chat_router(
+    *,
+    config,
+    model_router,
+    chat_service: ChatService,
+    workspace_store,
+    workspace_graph,
+    gardener,
+    require_user,
+    enforce_rate_limit,
+    get_history_user,
+    save_to_history,
+    append_audit_event,
+    clear_history,
+    clear_conversation,
+    get_history,
+    group_history_conversations,
+    get_conversation_messages,
+    conversation_title,
+    load_users,
+    get_user_role,
+    enable_graph: bool,
+    knowledge_graph,
+    public_model: str,
+    base_dir: Path,
+) -> APIRouter:
+    api_router = APIRouter()
+    router = model_router
+    CONFIG = config
+    CHAT_SERVICE = chat_service
+    WORKSPACE_OS = workspace_store
+    ENABLE_GRAPH = enable_graph
+    KNOWLEDGE_GRAPH = knowledge_graph
+    PUBLIC_MODEL = public_model
+    BASE_DIR = base_dir
+    _doc_gen_sessions: dict = {}
+    _pending_agents: dict[str, tuple] = {}
+    _pending_agents_lock = threading.Lock()
+    def build_recent_chat_context(
+        limit: int = 10,
+        include_image_missing_replies: bool = True,
+        user_email: Optional[str] = None,
+        conversation_id: Optional[str] = None,
+    ) -> str:
+        history = get_history()
+        if conversation_id:
+            history = [item for item in history if item.get("conversation_id") == conversation_id]
+        if user_email:
+            history = [item for item in history if item.get("user_email") == user_email or item.get("role") == "assistant"]
+        history = history[-limit:]
+        lines = []
+        for item in history:
+            role = item.get("role", "user")
+            content = item.get("content", "")
+            if not include_image_missing_replies and role == "assistant":
+                if "이미지" in content and any(word in content for word in ["업로드", "제공", "올려"]):
+                    continue
+            source = item.get("source")
+            label = role
+            if source:
+                label = f"{role} ({source})"
+            lines.append(f"{label}: {content}")
+        return "\n".join(lines)
+    def extract_screenshot_context(image_data: Optional[str]) -> str:
+        if not image_data:
+            return ""
+        lines = ["[SCREENSHOT INGESTION]"]
+        image_bytes = b""
+        try:
+            image_bytes = base64.b64decode(image_data)
+            image = Image.open(io.BytesIO(image_bytes)).convert("RGB")
+            lines.append(f"- image_size: {image.width}x{image.height}")
+            lines.append(f"- image_mode: {image.mode}")
+        except Exception as e:
+            lines.append(f"- image_decode_error: {e}")
+            return "\n".join(lines)
+        tesseract_path = shutil.which("tesseract")
+        if not tesseract_path:
+            lines.append("- ocr: unavailable; install `tesseract` to enable OCR text extraction.")
+            return "\n".join(lines)
+        temp_path = None
+        try:
+            with tempfile.NamedTemporaryFile(prefix="ltcai-screenshot-", suffix=".png", delete=False) as temp:
+                temp.write(image_bytes)
+                temp_path = temp.name
+            ocr_text = ""
+            for lang in ("kor+eng", "eng"):
+                completed = subprocess.run(
+                    [tesseract_path, temp_path, "stdout", "-l", lang, "--psm", "6"],
+                    capture_output=True,
+                    text=True,
+                    timeout=20,
+                    check=False,
+                )
+                if completed.returncode == 0 and completed.stdout.strip():
+                    ocr_text = completed.stdout.strip()
+                    lines.append(f"- ocr_language: {lang}")
+                    break
+            if ocr_text:
+                lines.append("- ocr_text:")
+                lines.append(ocr_text[:4000])
+            else:
+                lines.append("- ocr: no text extracted.")
+        except Exception as e:
+            lines.append(f"- ocr_error: {e}")
+        finally:
+            if temp_path:
+                try:
+                    Path(temp_path).unlink()
+                except OSError:
+                    pass
+        return "\n".join(lines)
+    _AGENT_RUNTIME = build_agent_runtime(
+        model_router=router,
+        execute_tool=execute_tool,
+        recent_chat_context=build_recent_chat_context,
+        clear_history=clear_history,
+        knowledge_save=knowledge_save,
+        audit=append_audit_event,
+    )
+    @api_router.post("/chat")
+    async def chat(req: ChatRequest, request: Request):
+        current_user = require_user(request)
+        enforce_rate_limit(current_user, "chat")
+        img_len = len(req.image_data) if req.image_data else 0
+        print(
+            f"🧪 /chat request: stream={req.stream} image_data_len={img_len} "
+            f"message_len={len(req.message or '')}"
+        )
+        effective_email = req.user_email or current_user or None
+        history_user = get_history_user(effective_email, req.user_nickname)
+        if is_network_status_request(req.message):
+            history_message = f"{req.message}\n[Image attached]" if req.image_data else req.message
+            save_to_history("user", history_message, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+            try:
+                answer = format_network_status(network_status())
+            except ToolError as exc:
+                answer = f"네트워크 정보를 확인하지 못했습니다: {exc}"
+            save_to_history("assistant", answer, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+            if req.source != "telegram":
+                asyncio.create_task(broadcast_web_chat("user", req.message))
+                asyncio.create_task(broadcast_web_chat("assistant", answer))
+            if req.stream:
+                return StreamingResponse(
+                    single_text_stream(answer),
+                    media_type="text/event-stream",
+                    headers={"X-Model": "network_status"},
+                )
+            return JSONResponse(content={"response": answer})
+        if is_clear_command(req.message):
+            command = req.message.strip().lower()
+            clear_scope = "all" if command == "/clear_all" else "conversation"
+            if ENABLE_GRAPH and KNOWLEDGE_GRAPH:
+                try:
+                    KNOWLEDGE_GRAPH.ingest_event(
+                        "ClearEvent",
+                        f"{command} requested",
+                        user_email=effective_email,
+                        user_nickname=req.user_nickname,
+                        source=req.source or "web",
+                        conversation_id=req.conversation_id,
+                        metadata={"command": command, "scope": clear_scope},
+                    )
+                except Exception as e:
+                    logging.warning("knowledge graph clear event ingest failed: %s", e)
+            if command == "/clear_all":
+                result = clear_history(0)
+                answer = f"채팅창을 정리했습니다. 화면에서 제거 {result.get('removed', 0)}개. 감사 로그와 지식 그래프/RAG 데이터는 유지됩니다."
+            else:
+                if req.conversation_id:
+                    result = clear_conversation(req.conversation_id)
+                    answer = f"현재 대화방 채팅창을 정리했습니다. 화면에서 제거 {result.get('removed', 0)}개. 감사 로그와 지식 그래프/RAG 데이터는 유지됩니다."
+                else:
+                    result = clear_history(0)
+                    answer = f"채팅창을 정리했습니다. 화면에서 제거 {result.get('removed', 0)}개. 감사 로그와 지식 그래프/RAG 데이터는 유지됩니다."
+            append_audit_event(
+                "clear_command",
+                user_email=effective_email,
+                user_nickname=req.user_nickname,
+                source=req.source or "web",
+                conversation_id=req.conversation_id,
+                command=command,
+                scope=clear_scope,
+                removed=result.get("removed", 0),
+                kept=result.get("kept", 0),
+            )
+            if req.stream:
+                return StreamingResponse(
+                    single_text_stream(answer),
+                    media_type="text/event-stream",
+                    headers={"X-Model": "history"},
+                )
+            return JSONResponse(content={"response": answer})
+        if is_current_url_request(req.message) and req.client_url:
+            answer = f"현재 페이지 URL: {req.client_url}"
+            save_to_history("user", req.message, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+            save_to_history("assistant", answer, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+            if req.source != "telegram":
+                asyncio.create_task(broadcast_web_chat("user", req.message))
+                asyncio.create_task(broadcast_web_chat("assistant", answer))
+            if req.stream:
+                return StreamingResponse(
+                    single_text_stream(answer),
+                    media_type="text/event-stream",
+                    headers={"X-Model": "client_url"},
+                )
+            return JSONResponse(content={"response": answer})
+        if not router.current_model_id:
+            detail = "No model loaded. Call /models/load first."
+            if IS_PUBLIC_MODE:
+                detail = f"No public model loaded. Set OPENAI_API_KEY and LATTICEAI_PUBLIC_MODEL={PUBLIC_MODEL}, or call /models/load with an OpenAI-compatible model."
+            raise HTTPException(status_code=400, detail=detail)
+        if req.model and req.model != router.current_model_id:
+            if req.model not in router.loaded_model_ids:
+                raise HTTPException(status_code=404, detail=f"Model '{req.model}' not loaded.")
+            router.switch_model(req.model)
+        lang = detect_language(req.message)
+        context = f"[LANGUAGE: {_LANG_HINT[lang]}]\n" + (req.context or "")
+        try:
+            knowledge_context = gardener.get_relevant_context(req.message)
+            if knowledge_context:
+                context += f"\n\n[LOCAL KNOWLEDGE BASE]\n{knowledge_context}"
+                print(f"📖 Context reinforced with local knowledge.")
+        except Exception as e:
+            logging.warning("Knowledge reinforcement skipped: %s", e)
+        is_doc_gen = detect_document_intent(req.message)
+        doc_gen_context_result = None
+        try:
+            if ENABLE_GRAPH and KNOWLEDGE_GRAPH:
+                if is_doc_gen:
+                    doc_gen_context_result = retrieve_context_for_generation(
+                        KNOWLEDGE_GRAPH, req.message, max_results=10, max_hops=2,
+                    )
+                    graph_md = doc_gen_context_result.get("context_markdown", "")
+                    if graph_md:
+                        context += f"\n\n[KNOWLEDGE GRAPH — Document Generation Context]\n{graph_md}"
+                        print("📝 Document generation context retrieved from knowledge graph.")
+                else:
+                    graph_context = KNOWLEDGE_GRAPH.context_for_query(req.message)
+                    if graph_context:
+                        context += f"\n\n[KNOWLEDGE GRAPH]\n{graph_context}"
+                        print("🕸️ Context reinforced with knowledge graph.")
+        except Exception as e:
+            logging.warning("Knowledge graph reinforcement skipped: %s", e)
+        if req.image_data:
+            screenshot_context = extract_screenshot_context(req.image_data)
+            if screenshot_context:
+                context += f"\n\n{screenshot_context}"
+        if CONFIG.auto_read_chat_paths:
+            _file_path_re = re.compile(r'(?:^|[\s\'\"(])((~|/[\w.])[^\s\'")\]]*)', re.MULTILINE)
+            for _m in _file_path_re.finditer(req.message or ""):
+                _fpath = _m.group(1).strip()
+                try:
+                    _result = local_read(_fpath)
+                    _fcontent = _result.get("content", "")
+                    if _fcontent:
+                        context += f"\n\n[FILE: {_fpath}]\n```\n{_fcontent[:6000]}\n```"
+                        print(f"📂 Auto-injected file context: {_fpath}")
+                except Exception:
+                    pass
+        trace_seed = CHAT_SERVICE.build_graph_trace(
+            req.message,
+            KNOWLEDGE_GRAPH if (ENABLE_GRAPH and KNOWLEDGE_GRAPH) else None,
+            context,
+        )
+        history_message = f"{req.message}\n[Image attached]" if req.image_data else req.message
+        save_to_history("user", history_message, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+        if req.source != "telegram":
+            asyncio.create_task(broadcast_web_chat("user", req.message))
+        if is_doc_gen and ENABLE_GRAPH and KNOWLEDGE_GRAPH:
+            conv_key = req.conversation_id or "default"
+            session = _doc_gen_sessions.get(conv_key)
+            if session is None:
+                session = DocumentGenerationSession()
+                _doc_gen_sessions[conv_key] = session
+            graph_md = (doc_gen_context_result or {}).get("context_markdown", "")
+            system_prompt = session.get_system_prompt(graph_md)
+            sources = (doc_gen_context_result or {}).get("sources", [])
+            footnote = format_sources_footnote(sources)
+            if req.stream:
+                async def _stream_doc_gen():
+                    collected = []
+                    async for chunk in router.stream_generate_document(
+                        req.message, system_prompt,
+                        max_tokens=req.max_tokens or 8192,
+                        temperature=req.temperature or 0.3,
+                    ):
+                        collected.append(chunk)
+                        yield f"data: {json.dumps({'text': chunk}, ensure_ascii=False)}\n\n"
+                    full_text = "".join(collected)
+                    if footnote:
+                        yield f"data: {json.dumps({'text': footnote}, ensure_ascii=False)}\n\n"
+                        full_text += footnote
+                    session.update(graph_md, full_text, req.conversation_id)
+                    save_to_history("assistant", full_text, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+                    trace_record = CHAT_SERVICE.record_trace(
+                        question=req.message,
+                        response=full_text,
+                        conversation_id=req.conversation_id,
+                        user_email=effective_email,
+                        trace=trace_seed,
+                    )
+                    if req.source != "telegram":
+                        asyncio.create_task(broadcast_web_chat("assistant", full_text))
+                    yield f"data: {json.dumps({'text': '', 'trace_id': trace_record['id'], 'trace': trace_record}, ensure_ascii=False)}\n\n"
+                    yield "data: [DONE]\n\n"
+                return StreamingResponse(
+                    _stream_doc_gen(),
+                    media_type="text/event-stream",
+                    headers={"X-Model": router.current_model_id, "X-Doc-Gen": "true"},
+                )
+            else:
+                result = await router.generate_document(
+                    req.message, system_prompt,
+                    max_tokens=req.max_tokens or 8192,
+                    temperature=req.temperature or 0.3,
+                )
+                if footnote:
+                    result += footnote
+                session.update(graph_md, result, req.conversation_id)
+                save_to_history("assistant", str(result), source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+                trace_record = CHAT_SERVICE.record_trace(
+                    question=req.message,
+                    response=str(result),
+                    conversation_id=req.conversation_id,
+                    user_email=effective_email,
+                    trace=trace_seed,
+                )
+                if req.source != "telegram":
+                    asyncio.create_task(broadcast_web_chat("assistant", str(result)))
+                return JSONResponse(content={"response": str(result), "trace_id": trace_record["id"], "trace": trace_record})
+        if req.stream:
+            recent_context = build_recent_chat_context(user_email=effective_email, conversation_id=req.conversation_id)
+            stream_context = context
+            if recent_context:
+                stream_context = f"[RECENT CONVERSATION]\n{recent_context}\n\n{context}".strip()
+            return StreamingResponse(
+                _stream_chat(req, stream_context, req.image_data, trace_seed=trace_seed, effective_email=effective_email),
+                media_type="text/event-stream",
+                headers={"X-Model": router.current_model_id},
+            )
+        else:
+            if req.image_data:
+                recent_context = build_recent_chat_context(
+                    limit=6,
+                    include_image_missing_replies=False,
+                    user_email=effective_email,
+                    conversation_id=req.conversation_id,
+                )
+                full_context = f"[RECENT CONVERSATION]\n{recent_context}\n\n{context}".strip() if recent_context else context
+            else:
+                history_context = build_recent_chat_context(user_email=effective_email, conversation_id=req.conversation_id)
+                full_context = f"{history_context}\n{context}" if context else history_context
+            result = await router.generate(req.message, full_context, req.max_tokens, req.temperature, req.image_data)
+            save_to_history("assistant", str(result), source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+            trace_record = CHAT_SERVICE.record_trace(
+                question=req.message,
+                response=str(result),
+                conversation_id=req.conversation_id,
+                user_email=effective_email,
+                trace=trace_seed,
+            )
+            if req.source != "telegram":
+                asyncio.create_task(broadcast_web_chat("assistant", str(result)))
+            return JSONResponse(content={"response": str(result), "trace_id": trace_record["id"], "trace": trace_record})
+    @api_router.get("/history")
+    async def fetch_history(request: Request):
+        """웹 화면에서 이전 대화를 불러올 수 있도록 히스토리를 반환합니다."""
+        require_user(request)
+        return get_history()
+    @api_router.get("/history/conversations")
+    async def fetch_history_conversations(request: Request):
+        """저장된 히스토리를 대화 단위로 묶어 반환합니다."""
+        require_user(request)
+        return group_history_conversations()
+    @api_router.get("/history/conversations/{conversation_id:path}")
+    async def fetch_history_conversation(conversation_id: str, request: Request):
+        """선택한 대화의 메시지를 반환합니다."""
+        require_user(request)
+        messages = get_conversation_messages(conversation_id)
+        if not messages:
+            raise HTTPException(status_code=404, detail="대화를 찾을 수 없습니다.")
+        return {"id": conversation_id, "messages": messages}
+    @api_router.delete("/history/conversations/{conversation_id:path}")
+    async def delete_history_conversation(conversation_id: str, request: Request):
+        """선택한 대화방의 메시지만 삭제합니다."""
+        email = require_user(request)
+        result = clear_conversation(conversation_id, request.query_params.get("started_at"))
+        append_audit_event(
+            "conversation_delete",
+            user_email=email,
+            conversation_id=conversation_id,
+            started_at=request.query_params.get("started_at"),
+            removed=result.get("removed", 0),
+            kept=result.get("kept", 0),
+        )
+        return result
+    @api_router.delete("/history")
+    async def delete_history(request: Request, keep_last: int = 0):
+        email = require_user(request)
+        result = clear_history(keep_last)
+        append_audit_event(
+            "history_delete",
+            user_email=email,
+            keep_last=keep_last,
+            removed=result.get("removed", 0),
+            kept=result.get("kept", 0),
+        )
+        return result
+    @api_router.get("/history/search")
+    async def search_history(q: str, request: Request):
+        """키워드로 채팅 히스토리를 검색합니다."""
+        require_user(request)
+        if not q or not q.strip():
+            return {"results": [], "query": q}
+        q_lower = q.strip().lower()
+        history = get_history()
+        matches = [item for item in history if q_lower in (item.get("content") or "").lower()]
+        grouped: Dict[str, Dict] = {}
+        for item in matches:
+            cid = item.get("conversation_id") or "legacy"
+            if cid not in grouped:
+                grouped[cid] = {"conversation_id": cid, "title": conversation_title(item), "messages": []}
+            grouped[cid]["messages"].append(item)
+        return {"results": list(grouped.values())[-30:], "query": q}
+    async def _stream_chat(
+        req: ChatRequest,
+        context: str = "",
+        image_data: str = None,
+        *,
+        trace_seed: Optional[Dict] = None,
+        effective_email: Optional[str] = None,
+    ) -> AsyncIterator[str]:
+        full_response = ""
+        async for chunk in router.stream_generate(req.message, context, req.max_tokens, req.temperature, image_data):
+            clean_chunk = chunk
+            if hasattr(chunk, "text"):
+                clean_chunk = chunk.text
+            elif isinstance(chunk, str) and "text='" in chunk:
+                try:
+                    clean_chunk = chunk.split("text='")[1].split("', token=")[0].replace('\\n', '\n').replace('\\\\n', '\n')
+                except Exception:
+                    pass
+            full_response += str(clean_chunk)
+            yield f"data: {json.dumps({'chunk': clean_chunk, 'model': router.current_model_id}, ensure_ascii=False)}\n\n"
+        history_user = get_history_user(req.user_email, req.user_nickname)
+        save_to_history("assistant", full_response, source=req.source or "web", conversation_id=req.conversation_id, **history_user)
+        trace_record = CHAT_SERVICE.record_trace(
+            question=req.message,
+            response=full_response,
+            conversation_id=req.conversation_id,
+            user_email=effective_email or req.user_email,
+            trace=trace_seed or CHAT_SERVICE.build_graph_trace(
+                req.message,
+                KNOWLEDGE_GRAPH if (ENABLE_GRAPH and KNOWLEDGE_GRAPH) else None,
+                context,
+            ),
+        )
+        if req.source != "telegram":
+            asyncio.create_task(broadcast_web_chat("assistant", full_response))
+        yield f"data: {json.dumps({'chunk': '', 'model': router.current_model_id, 'trace_id': trace_record['id'], 'trace': trace_record}, ensure_ascii=False)}\n\n"
+        yield "data: [DONE]\n\n"
+    @api_router.post("/agent/eval")
+    async def agent_eval(req: AgentEvalRequest, request: Request):
+        """Run a skill's eval cases from schema.json and return pass/fail per case."""
+        require_user(request)
+        skill_dir = BASE_DIR / "skills" / req.skill
+        schema_path = skill_dir / "schema.json"
+        if not schema_path.exists():
+            raise HTTPException(404, detail=f"Skill '{req.skill}' not found or missing schema.json")
+        schema = json.loads(schema_path.read_text(encoding="utf-8"))
+        eval_cases = schema.get("evals", [])
+        if req.case_id:
+            eval_cases = [c for c in eval_cases if c.get("id") == req.case_id]
+        if not eval_cases:
+            return {"skill": req.skill, "total": 0, "passed": 0, "failed": 0, "results": [],
+                    "message": "No eval cases defined in schema.json"}
+        action_name = schema.get("action", req.skill)
+        results = []
+        for case in eval_cases:
+            case_id = case.get("id", "?")
+            try:
+                result   = execute_tool(action_name, case.get("input", {}))
+                criteria = case.get("pass_criteria", "")
+                if "success == true" in criteria:
+                    passed = result.get("success") is True
+                elif "success == false" in criteria:
+                    passed = result.get("success") is False
+                else:
+                    passed = True  # manual review required
+                results.append({"id": case_id, "description": case.get("description", ""),
+                                "passed": passed, "result": result, "pass_criteria": criteria})
+            except Exception as exc:
+                results.append({"id": case_id, "description": case.get("description", ""),
+                                "passed": False, "error": str(exc),
+                                "pass_criteria": case.get("pass_criteria", "")})
+        n_passed = sum(1 for r in results if r.get("passed") is True)
+        return {
+            "skill": req.skill, "action": action_name,
+            "total": len(results), "passed": n_passed, "failed": len(results) - n_passed,
+            "results": results,
+        }
+    @api_router.post("/agent")
+    async def agent(req: AgentRequest, request: Request):
+        """Natural-language local agent.
+        State machine:
+            IDLE → PLANNING → WAITING_APPROVAL → EXECUTING → VERIFYING
+                                           ↓                     ↓
+                                         FAILED       DONE | EXECUTING(retry) | ROLLBACK
+                                                                                      ↓
+                                                                                   FAILED
+        """
+        current_user = require_user(request)
+        enforce_rate_limit(current_user, "agent")
+        if not router.current_model_id:
+            raise HTTPException(status_code=400, detail="No model loaded. Call /models/load first.")
+        ensure_agent_root()
+        lang = detect_language(req.message)
+        lang_hint = _LANG_HINT[lang]
+        max_steps = max(1, min(req.max_steps, 50))
+        max_retry = 3
+        ctx = AgentRunContext()
+        ctx.executing_model = req.executing_model
+        ctx.reviewing_model = req.reviewing_model
+        # PLANNING phase
+        ctx.state = AgentState.PLANNING
+        ctx.state_history.append(ctx.state.value)
+        await _AGENT_RUNTIME.plan(ctx, req, lang_hint, current_user, model_id=req.planning_model)
+        # Human-in-the-loop: pause after planning, return plan to UI
+        if req.human_in_loop:
+            context_id = secrets.token_urlsafe(16)
+            with _pending_agents_lock:
+                _pending_agents[context_id] = (ctx, req, lang_hint, current_user)
+            return {
+                "status": "waiting_approval",
+                "context_id": context_id,
+                "plan": ctx.plan,
+                "steps": ctx.transcript,
+                "state_history": ctx.state_history,
+                "planning_model": req.planning_model or router.current_model_id,
+                "executing_model": req.executing_model or router.current_model_id,
+                "reviewing_model": req.reviewing_model or router.current_model_id,
+            }
+        # Auto-approve and run to completion (default behaviour)
+        _AGENT_RUNTIME.approve(ctx, current_user)
+        return await _agent_finish(ctx, req, lang_hint, current_user, max_steps, max_retry)
+    async def _agent_finish(
+        ctx: AgentRunContext, req: AgentRequest, lang_hint: str,
+        current_user: str, max_steps: int, max_retry: int,
+    ) -> dict:
+        """HTTP glue: drive the runtime to a terminal state, persist, shape the response."""
+        await _AGENT_RUNTIME.run_to_completion(ctx, req, lang_hint, current_user, max_steps, max_retry)
+        asyncio.create_task(_AGENT_RUNTIME.memory_update(ctx, req, current_user))
+        message = ctx.final_message or "작업을 완료했습니다."
+        save_to_history("user", req.message, source=req.source or "web", conversation_id=req.conversation_id)
+        save_to_history("assistant", message, source=req.source or "web", conversation_id=req.conversation_id)
+        try:
+            WORKSPACE_OS.record_agent_run(
+                agent_id="agent:executor",
+                status="ok" if ctx.state == AgentState.DONE else "failed",
+                input_text=req.message,
+                output_text=message,
+                user_email=current_user or None,
+                timeline=ctx.transcript,
+                relationships=["agent:planner", "agent:reviewer"],
+                graph=_workspace_graph(),
+            )
+        except Exception as exc:
+            logging.warning("workspace agent run record failed: %s", exc)
+        created_files = collect_created_files(ctx.transcript)
+        return {
+            "status": "ok" if ctx.state == AgentState.DONE else "failed",
+            "response": message,
+            "workspace": str(AGENT_ROOT),
+            "steps": ctx.transcript,
+            "state_history": ctx.state_history,
+            "final_state": ctx.state.value,
+            "created_files": created_files,
+        }
+    @api_router.post("/agent/resume")
+    async def agent_resume(req: AgentResumeRequest, request: Request):
+        """Resume a paused agent after human approval of the plan."""
+        current_user = require_user(request)
+        with _pending_agents_lock:
+            entry = _pending_agents.pop(req.context_id, None)
+        if not entry:
+            raise HTTPException(status_code=404, detail="Agent context not found or expired. Start a new request.")
+        ctx, orig_req, lang_hint, _orig_user = entry
+        if not req.approved:
+            return {"status": "cancelled", "response": "사용자가 계획을 취소했습니다."}
+        if req.modified_plan:
+            ctx.plan = req.modified_plan
+            ctx.transcript[-1].update(ctx.plan)  # keep transcript in sync
+        # Apply model overrides from resume request (takes priority over original request)
+        ctx.executing_model = req.executing_model or ctx.executing_model
+        ctx.reviewing_model = req.reviewing_model or ctx.reviewing_model
+        _AGENT_RUNTIME.approve(ctx, current_user)
+        max_steps = max(1, min(orig_req.max_steps, 50))
+        max_retry = 3
+        return await _agent_finish(ctx, orig_req, lang_hint, current_user, max_steps, max_retry)
+    return api_router