PyPI - realtimex-deeptutor - Versions diffs - 0.5.0.post1__py3-none-any.whl - Mend

realtimex-deeptutor 0.5.0.post1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (276) hide show

realtimex_deeptutor/__init__.py +67 -0
realtimex_deeptutor-0.5.0.post1.dist-info/METADATA +1612 -0
realtimex_deeptutor-0.5.0.post1.dist-info/RECORD +276 -0
realtimex_deeptutor-0.5.0.post1.dist-info/WHEEL +5 -0
realtimex_deeptutor-0.5.0.post1.dist-info/entry_points.txt +2 -0
realtimex_deeptutor-0.5.0.post1.dist-info/licenses/LICENSE +661 -0
realtimex_deeptutor-0.5.0.post1.dist-info/top_level.txt +2 -0
src/__init__.py +40 -0
src/agents/__init__.py +24 -0
src/agents/base_agent.py +657 -0
src/agents/chat/__init__.py +24 -0
src/agents/chat/chat_agent.py +435 -0
src/agents/chat/prompts/en/chat_agent.yaml +35 -0
src/agents/chat/prompts/zh/chat_agent.yaml +35 -0
src/agents/chat/session_manager.py +311 -0
src/agents/co_writer/__init__.py +0 -0
src/agents/co_writer/edit_agent.py +260 -0
src/agents/co_writer/narrator_agent.py +423 -0
src/agents/co_writer/prompts/en/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/en/narrator_agent.yaml +88 -0
src/agents/co_writer/prompts/zh/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/zh/narrator_agent.yaml +88 -0
src/agents/guide/__init__.py +16 -0
src/agents/guide/agents/__init__.py +11 -0
src/agents/guide/agents/chat_agent.py +104 -0
src/agents/guide/agents/interactive_agent.py +223 -0
src/agents/guide/agents/locate_agent.py +149 -0
src/agents/guide/agents/summary_agent.py +150 -0
src/agents/guide/guide_manager.py +500 -0
src/agents/guide/prompts/en/chat_agent.yaml +41 -0
src/agents/guide/prompts/en/interactive_agent.yaml +202 -0
src/agents/guide/prompts/en/locate_agent.yaml +68 -0
src/agents/guide/prompts/en/summary_agent.yaml +157 -0
src/agents/guide/prompts/zh/chat_agent.yaml +41 -0
src/agents/guide/prompts/zh/interactive_agent.yaml +626 -0
src/agents/guide/prompts/zh/locate_agent.yaml +68 -0
src/agents/guide/prompts/zh/summary_agent.yaml +157 -0
src/agents/ideagen/__init__.py +12 -0
src/agents/ideagen/idea_generation_workflow.py +426 -0
src/agents/ideagen/material_organizer_agent.py +173 -0
src/agents/ideagen/prompts/en/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/en/material_organizer.yaml +69 -0
src/agents/ideagen/prompts/zh/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/zh/material_organizer.yaml +69 -0
src/agents/question/__init__.py +24 -0
src/agents/question/agents/__init__.py +18 -0
src/agents/question/agents/generate_agent.py +381 -0
src/agents/question/agents/relevance_analyzer.py +207 -0
src/agents/question/agents/retrieve_agent.py +239 -0
src/agents/question/coordinator.py +718 -0
src/agents/question/example.py +109 -0
src/agents/question/prompts/en/coordinator.yaml +75 -0
src/agents/question/prompts/en/generate_agent.yaml +77 -0
src/agents/question/prompts/en/relevance_analyzer.yaml +41 -0
src/agents/question/prompts/en/retrieve_agent.yaml +32 -0
src/agents/question/prompts/zh/coordinator.yaml +75 -0
src/agents/question/prompts/zh/generate_agent.yaml +77 -0
src/agents/question/prompts/zh/relevance_analyzer.yaml +39 -0
src/agents/question/prompts/zh/retrieve_agent.yaml +30 -0
src/agents/research/agents/__init__.py +23 -0
src/agents/research/agents/decompose_agent.py +507 -0
src/agents/research/agents/manager_agent.py +228 -0
src/agents/research/agents/note_agent.py +180 -0
src/agents/research/agents/rephrase_agent.py +263 -0
src/agents/research/agents/reporting_agent.py +1333 -0
src/agents/research/agents/research_agent.py +714 -0
src/agents/research/data_structures.py +451 -0
src/agents/research/main.py +188 -0
src/agents/research/prompts/en/decompose_agent.yaml +89 -0
src/agents/research/prompts/en/manager_agent.yaml +24 -0
src/agents/research/prompts/en/note_agent.yaml +121 -0
src/agents/research/prompts/en/rephrase_agent.yaml +58 -0
src/agents/research/prompts/en/reporting_agent.yaml +380 -0
src/agents/research/prompts/en/research_agent.yaml +173 -0
src/agents/research/prompts/zh/decompose_agent.yaml +89 -0
src/agents/research/prompts/zh/manager_agent.yaml +24 -0
src/agents/research/prompts/zh/note_agent.yaml +121 -0
src/agents/research/prompts/zh/rephrase_agent.yaml +58 -0
src/agents/research/prompts/zh/reporting_agent.yaml +380 -0
src/agents/research/prompts/zh/research_agent.yaml +173 -0
src/agents/research/research_pipeline.py +1309 -0
src/agents/research/utils/__init__.py +60 -0
src/agents/research/utils/citation_manager.py +799 -0
src/agents/research/utils/json_utils.py +98 -0
src/agents/research/utils/token_tracker.py +297 -0
src/agents/solve/__init__.py +80 -0
src/agents/solve/analysis_loop/__init__.py +14 -0
src/agents/solve/analysis_loop/investigate_agent.py +414 -0
src/agents/solve/analysis_loop/note_agent.py +190 -0
src/agents/solve/main_solver.py +862 -0
src/agents/solve/memory/__init__.py +34 -0
src/agents/solve/memory/citation_memory.py +353 -0
src/agents/solve/memory/investigate_memory.py +226 -0
src/agents/solve/memory/solve_memory.py +340 -0
src/agents/solve/prompts/en/analysis_loop/investigate_agent.yaml +55 -0
src/agents/solve/prompts/en/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/en/solve_loop/manager_agent.yaml +67 -0
src/agents/solve/prompts/en/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/en/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/en/solve_loop/solve_agent.yaml +75 -0
src/agents/solve/prompts/en/solve_loop/tool_agent.yaml +38 -0
src/agents/solve/prompts/zh/analysis_loop/investigate_agent.yaml +53 -0
src/agents/solve/prompts/zh/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/zh/solve_loop/manager_agent.yaml +66 -0
src/agents/solve/prompts/zh/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/zh/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/zh/solve_loop/solve_agent.yaml +76 -0
src/agents/solve/prompts/zh/solve_loop/tool_agent.yaml +41 -0
src/agents/solve/solve_loop/__init__.py +22 -0
src/agents/solve/solve_loop/citation_manager.py +74 -0
src/agents/solve/solve_loop/manager_agent.py +274 -0
src/agents/solve/solve_loop/precision_answer_agent.py +96 -0
src/agents/solve/solve_loop/response_agent.py +301 -0
src/agents/solve/solve_loop/solve_agent.py +325 -0
src/agents/solve/solve_loop/tool_agent.py +470 -0
src/agents/solve/utils/__init__.py +64 -0
src/agents/solve/utils/config_validator.py +313 -0
src/agents/solve/utils/display_manager.py +223 -0
src/agents/solve/utils/error_handler.py +363 -0
src/agents/solve/utils/json_utils.py +98 -0
src/agents/solve/utils/performance_monitor.py +407 -0
src/agents/solve/utils/token_tracker.py +541 -0
src/api/__init__.py +0 -0
src/api/main.py +240 -0
src/api/routers/__init__.py +1 -0
src/api/routers/agent_config.py +69 -0
src/api/routers/chat.py +296 -0
src/api/routers/co_writer.py +337 -0
src/api/routers/config.py +627 -0
src/api/routers/dashboard.py +18 -0
src/api/routers/guide.py +337 -0
src/api/routers/ideagen.py +436 -0
src/api/routers/knowledge.py +821 -0
src/api/routers/notebook.py +247 -0
src/api/routers/question.py +537 -0
src/api/routers/research.py +394 -0
src/api/routers/settings.py +164 -0
src/api/routers/solve.py +305 -0
src/api/routers/system.py +252 -0
src/api/run_server.py +61 -0
src/api/utils/history.py +172 -0
src/api/utils/log_interceptor.py +21 -0
src/api/utils/notebook_manager.py +415 -0
src/api/utils/progress_broadcaster.py +72 -0
src/api/utils/task_id_manager.py +100 -0
src/config/__init__.py +0 -0
src/config/accessors.py +18 -0
src/config/constants.py +34 -0
src/config/defaults.py +18 -0
src/config/schema.py +38 -0
src/config/settings.py +50 -0
src/core/errors.py +62 -0
src/knowledge/__init__.py +23 -0
src/knowledge/add_documents.py +606 -0
src/knowledge/config.py +65 -0
src/knowledge/example_add_documents.py +236 -0
src/knowledge/extract_numbered_items.py +1039 -0
src/knowledge/initializer.py +621 -0
src/knowledge/kb.py +22 -0
src/knowledge/manager.py +782 -0
src/knowledge/progress_tracker.py +182 -0
src/knowledge/start_kb.py +535 -0
src/logging/__init__.py +103 -0
src/logging/adapters/__init__.py +17 -0
src/logging/adapters/lightrag.py +184 -0
src/logging/adapters/llamaindex.py +141 -0
src/logging/config.py +80 -0
src/logging/handlers/__init__.py +20 -0
src/logging/handlers/console.py +75 -0
src/logging/handlers/file.py +201 -0
src/logging/handlers/websocket.py +127 -0
src/logging/logger.py +709 -0
src/logging/stats/__init__.py +16 -0
src/logging/stats/llm_stats.py +179 -0
src/services/__init__.py +56 -0
src/services/config/__init__.py +61 -0
src/services/config/knowledge_base_config.py +210 -0
src/services/config/loader.py +260 -0
src/services/config/unified_config.py +603 -0
src/services/embedding/__init__.py +45 -0
src/services/embedding/adapters/__init__.py +22 -0
src/services/embedding/adapters/base.py +106 -0
src/services/embedding/adapters/cohere.py +127 -0
src/services/embedding/adapters/jina.py +99 -0
src/services/embedding/adapters/ollama.py +116 -0
src/services/embedding/adapters/openai_compatible.py +96 -0
src/services/embedding/client.py +159 -0
src/services/embedding/config.py +156 -0
src/services/embedding/provider.py +119 -0
src/services/llm/__init__.py +152 -0
src/services/llm/capabilities.py +313 -0
src/services/llm/client.py +302 -0
src/services/llm/cloud_provider.py +530 -0
src/services/llm/config.py +200 -0
src/services/llm/error_mapping.py +103 -0
src/services/llm/exceptions.py +152 -0
src/services/llm/factory.py +450 -0
src/services/llm/local_provider.py +347 -0
src/services/llm/providers/anthropic.py +95 -0
src/services/llm/providers/base_provider.py +93 -0
src/services/llm/providers/open_ai.py +83 -0
src/services/llm/registry.py +71 -0
src/services/llm/telemetry.py +40 -0
src/services/llm/types.py +27 -0
src/services/llm/utils.py +333 -0
src/services/prompt/__init__.py +25 -0
src/services/prompt/manager.py +206 -0
src/services/rag/__init__.py +64 -0
src/services/rag/components/__init__.py +29 -0
src/services/rag/components/base.py +59 -0
src/services/rag/components/chunkers/__init__.py +18 -0
src/services/rag/components/chunkers/base.py +34 -0
src/services/rag/components/chunkers/fixed.py +71 -0
src/services/rag/components/chunkers/numbered_item.py +94 -0
src/services/rag/components/chunkers/semantic.py +97 -0
src/services/rag/components/embedders/__init__.py +14 -0
src/services/rag/components/embedders/base.py +32 -0
src/services/rag/components/embedders/openai.py +63 -0
src/services/rag/components/indexers/__init__.py +18 -0
src/services/rag/components/indexers/base.py +35 -0
src/services/rag/components/indexers/graph.py +172 -0
src/services/rag/components/indexers/lightrag.py +156 -0
src/services/rag/components/indexers/vector.py +146 -0
src/services/rag/components/parsers/__init__.py +18 -0
src/services/rag/components/parsers/base.py +35 -0
src/services/rag/components/parsers/markdown.py +52 -0
src/services/rag/components/parsers/pdf.py +115 -0
src/services/rag/components/parsers/text.py +86 -0
src/services/rag/components/retrievers/__init__.py +18 -0
src/services/rag/components/retrievers/base.py +34 -0
src/services/rag/components/retrievers/dense.py +200 -0
src/services/rag/components/retrievers/hybrid.py +164 -0
src/services/rag/components/retrievers/lightrag.py +169 -0
src/services/rag/components/routing.py +286 -0
src/services/rag/factory.py +234 -0
src/services/rag/pipeline.py +215 -0
src/services/rag/pipelines/__init__.py +32 -0
src/services/rag/pipelines/academic.py +44 -0
src/services/rag/pipelines/lightrag.py +43 -0
src/services/rag/pipelines/llamaindex.py +313 -0
src/services/rag/pipelines/raganything.py +384 -0
src/services/rag/service.py +244 -0
src/services/rag/types.py +73 -0
src/services/search/__init__.py +284 -0
src/services/search/base.py +87 -0
src/services/search/consolidation.py +398 -0
src/services/search/providers/__init__.py +128 -0
src/services/search/providers/baidu.py +188 -0
src/services/search/providers/exa.py +194 -0
src/services/search/providers/jina.py +161 -0
src/services/search/providers/perplexity.py +153 -0
src/services/search/providers/serper.py +209 -0
src/services/search/providers/tavily.py +161 -0
src/services/search/types.py +114 -0
src/services/setup/__init__.py +34 -0
src/services/setup/init.py +285 -0
src/services/tts/__init__.py +16 -0
src/services/tts/config.py +99 -0
src/tools/__init__.py +91 -0
src/tools/code_executor.py +536 -0
src/tools/paper_search_tool.py +171 -0
src/tools/query_item_tool.py +310 -0
src/tools/question/__init__.py +15 -0
src/tools/question/exam_mimic.py +616 -0
src/tools/question/pdf_parser.py +211 -0
src/tools/question/question_extractor.py +397 -0
src/tools/rag_tool.py +173 -0
src/tools/tex_chunker.py +339 -0
src/tools/tex_downloader.py +253 -0
src/tools/web_search.py +71 -0
src/utils/config_manager.py +206 -0
src/utils/document_validator.py +168 -0
src/utils/error_rate_tracker.py +111 -0
src/utils/error_utils.py +82 -0
src/utils/json_parser.py +110 -0
src/utils/network/circuit_breaker.py +79 -0

src/agents/base_agent.py ADDED Viewed

@@ -0,0 +1,657 @@
+#!/usr/bin/env python
+"""
+Unified BaseAgent - Base class for all module agents.
+This is the single source of truth for agent base functionality across:
+- solve module
+- research module
+- guide module
+- ideagen module
+- co_writer module
+- question module (unified in Jan 2026 refactor)
+"""
+from abc import ABC, abstractmethod
+import os
+from pathlib import Path
+import sys
+import time
+from typing import Any, AsyncGenerator
+# Add project root to path
+_project_root = Path(__file__).parent.parent.parent
+if str(_project_root) not in sys.path:
+    sys.path.insert(0, str(_project_root))
+from src.config.settings import settings
+from src.logging import LLMStats, get_logger
+from src.services.config import get_agent_params
+from src.services.llm import complete as llm_complete
+from src.services.llm import get_llm_config, get_token_limit_kwargs, supports_response_format
+from src.services.llm import stream as llm_stream
+from src.services.prompt import get_prompt_manager
+class BaseAgent(ABC):
+    """
+    Unified base class for all module agents.
+    This class provides:
+    - LLM configuration management (api_key, base_url, model)
+    - Agent parameters (temperature, max_tokens) from agents.yaml
+    - Prompt loading via PromptManager
+    - Unified LLM call interface
+    - Token tracking (supports TokenTracker, LLMStats, or singleton tracker)
+    - Logging
+    Subclasses must implement the `process()` method.
+    """
+    # Shared LLMStats tracker for each module (class-level)
+    _shared_stats: dict[str, LLMStats] = {}
+    def __init__(
+        self,
+        module_name: str,
+        agent_name: str,
+        api_key: str | None = None,
+        base_url: str | None = None,
+        model: str | None = None,
+        api_version: str | None = None,
+        language: str = "zh",
+        binding: str = "openai",
+        config: dict[str, Any] | None = None,
+        token_tracker: Any | None = None,
+        log_dir: str | None = None,
+    ):
+        """
+        Initialize base Agent.
+        Args:
+            module_name: Module name (solve/research/guide/ideagen/co_writer)
+            agent_name: Agent name (e.g., "solve_agent", "note_agent")
+            api_key: API key (optional, defaults to environment variable)
+            base_url: API endpoint (optional, defaults to environment variable)
+            model: Model name (optional, defaults to environment variable)
+            api_version: API version for Azure OpenAI (optional)
+            language: Language setting ('zh' | 'en'), default 'zh'
+            binding: Provider binding type (optional, defaults to 'openai')
+            config: Optional configuration dictionary
+            token_tracker: Optional external TokenTracker instance
+            log_dir: Optional log directory path
+        """
+        self.module_name = module_name
+        self.agent_name = agent_name
+        self.language = language
+        # Ensure config is always a dict (not a dataclass like LLMConfig)
+        if config is None:
+            self.config = {}
+        elif isinstance(config, dict):
+            self.config = config
+        else:
+            # If config is a dataclass (like LLMConfig), convert to empty dict
+            # The actual LLM config should be loaded via get_llm_config()
+            self.config = {}
+        # Load agent parameters from unified config (agents.yaml)
+        self._agent_params = get_agent_params(module_name)
+        # Load LLM configuration
+        try:
+            env_llm = get_llm_config()
+            self.api_key = api_key or env_llm.api_key
+            self.base_url = base_url or env_llm.base_url
+            self.model = model or env_llm.model
+            self.api_version = api_version or getattr(env_llm, "api_version", None)
+            self.binding = binding or getattr(env_llm, "binding", "openai")
+        except ValueError:
+            # Fallback if env config not available
+            self.api_key = api_key or os.getenv("LLM_API_KEY")
+            self.base_url = base_url or os.getenv("LLM_HOST")
+            self.model = model or os.getenv("LLM_MODEL")
+            self.api_version = api_version or os.getenv("LLM_API_VERSION")
+            self.binding = binding
+        # Get Agent-specific configuration (if config provided)
+        self.agent_config = self.config.get("agents", {}).get(agent_name, {})
+        llm_cfg = self.config.get("llm", {})
+        # Ensure llm_config is always a dict (handle case where LLMConfig object is passed)
+        if hasattr(llm_cfg, "__dataclass_fields__"):
+            from dataclasses import asdict
+            self.llm_config = asdict(llm_cfg)
+        else:
+            self.llm_config = llm_cfg if isinstance(llm_cfg, dict) else {}
+        # Agent status
+        self.enabled = self.agent_config.get("enabled", True)
+        # Token tracker (external instance, optional)
+        self.token_tracker = token_tracker
+        # Initialize logger
+        logger_name = f"{module_name.capitalize()}.{agent_name}"
+        self.logger = get_logger(logger_name, log_dir=log_dir)
+        # Load prompts using unified PromptManager
+        try:
+            self.prompts = get_prompt_manager().load_prompts(
+                module_name=module_name,
+                agent_name=agent_name,
+                language=language,
+            )
+            if self.prompts:
+                self.logger.debug(f"Prompts loaded: {agent_name} ({language})")
+        except Exception as e:
+            self.prompts = None
+            self.logger.warning(f"Failed to load prompts for {agent_name}: {e}")
+    # -------------------------------------------------------------------------
+    # Model and Parameter Getters
+    # -------------------------------------------------------------------------
+    def get_model(self) -> str:
+        """
+        Get model name.
+        Priority: agent_config > llm_config > self.model > environment variable
+        Returns:
+            Model name
+        Raises:
+            ValueError: If model is not configured
+        """
+        # 1. Try agent-specific config
+        if self.agent_config.get("model"):
+            return self.agent_config["model"]
+        # 2. Try general LLM config
+        if self.llm_config.get("model"):
+            return self.llm_config["model"]
+        # 3. Use instance model
+        if self.model:
+            return self.model
+        # 4. Fallback to environment variable
+        env_model = os.getenv("LLM_MODEL")
+        if env_model:
+            return env_model
+        raise ValueError(
+            f"Model not configured for agent {self.agent_name}. "
+            "Please set LLM_MODEL in .env or activate a provider."
+        )
+    def get_temperature(self) -> float:
+        """
+        Get temperature parameter from unified config (agents.yaml).
+        Returns:
+            Temperature value
+        """
+        return self._agent_params["temperature"]
+    def get_max_tokens(self) -> int:
+        """
+        Get maximum token count from unified config (agents.yaml).
+        Returns:
+            Maximum token count
+        """
+        return self._agent_params["max_tokens"]
+    def get_max_retries(self) -> int:
+        """
+        Get maximum retry count.
+        Returns:
+            Retry count
+        """
+        return self.agent_config.get("max_retries", settings.retry.max_retries)
+    def refresh_config(self) -> None:
+        """
+        Refresh LLM configuration from the current active settings.
+        This method reloads the LLM configuration from the unified config service,
+        allowing agents to pick up configuration changes made by users in Settings
+        without needing to restart the server or recreate the agent instance.
+        Call this method before processing requests if you want to ensure
+        the agent uses the latest user-configured LLM settings.
+        """
+        try:
+            llm_config = get_llm_config()
+            self.api_key = llm_config.api_key
+            self.base_url = llm_config.base_url
+            self.model = llm_config.model
+            self.api_version = getattr(llm_config, "api_version", None)
+            self.binding = getattr(llm_config, "binding", "openai")
+            self.logger.debug(
+                f"Config refreshed: model={self.model}, base_url={self.base_url[:30]}..."
+                if self.base_url
+                else f"Config refreshed: model={self.model}"
+            )
+        except Exception as e:
+            self.logger.warning(f"Failed to refresh config: {e}")
+    # -------------------------------------------------------------------------
+    # Token Tracking
+    # -------------------------------------------------------------------------
+    @classmethod
+    def get_stats(cls, module_name: str) -> LLMStats:
+        """
+        Get or create shared LLMStats tracker for a module.
+        Args:
+            module_name: Module name
+        Returns:
+            LLMStats instance
+        """
+        if module_name not in cls._shared_stats:
+            cls._shared_stats[module_name] = LLMStats(module_name=module_name.capitalize())
+        return cls._shared_stats[module_name]
+    @classmethod
+    def reset_stats(cls, module_name: str | None = None):
+        """
+        Reset shared stats.
+        Args:
+            module_name: Module name (if None, reset all)
+        """
+        if module_name:
+            if module_name in cls._shared_stats:
+                cls._shared_stats[module_name].reset()
+        else:
+            for stats in cls._shared_stats.values():
+                stats.reset()
+    @classmethod
+    def print_stats(cls, module_name: str | None = None):
+        """
+        Print stats summary.
+        Args:
+            module_name: Module name (if None, print all)
+        """
+        if module_name:
+            if module_name in cls._shared_stats:
+                cls._shared_stats[module_name].print_summary()
+        else:
+            for stats in cls._shared_stats.values():
+                stats.print_summary()
+    def _track_tokens(
+        self,
+        model: str,
+        system_prompt: str,
+        user_prompt: str,
+        response: str,
+        stage: str | None = None,
+    ):
+        """
+        Track token usage using available tracker.
+        Supports:
+        1. External TokenTracker (if self.token_tracker is set)
+        2. Shared LLMStats (always available)
+        Args:
+            model: Model name
+            system_prompt: System prompt
+            user_prompt: User prompt
+            response: LLM response
+            stage: Stage name (optional)
+        """
+        stage_label = stage or self.agent_name
+        # 1. Use external TokenTracker if provided
+        if self.token_tracker:
+            try:
+                self.token_tracker.add_usage(
+                    agent_name=self.agent_name,
+                    stage=stage_label,
+                    model=model,
+                    system_prompt=system_prompt,
+                    user_prompt=user_prompt,
+                    response_text=response,
+                )
+            except Exception:
+                pass  # Don't let tracking errors affect main flow
+        # 2. Always use shared LLMStats
+        stats = self.get_stats(self.module_name)
+        stats.add_call(
+            model=model,
+            system_prompt=system_prompt,
+            user_prompt=user_prompt,
+            response=response,
+        )
+    # -------------------------------------------------------------------------
+    # LLM Call Interface
+    # -------------------------------------------------------------------------
+    async def call_llm(
+        self,
+        user_prompt: str,
+        system_prompt: str,
+        messages: list[dict[str, str]] | None = None,
+        response_format: dict[str, str] | None = None,
+        temperature: float | None = None,
+        max_tokens: int | None = None,
+        model: str | None = None,
+        verbose: bool = True,
+        stage: str | None = None,
+    ) -> str:
+        """
+        Unified interface for calling LLM (non-streaming).
+        Uses the LLM factory to route calls to the appropriate provider
+        (cloud or local) based on configuration.
+        Args:
+            user_prompt: User prompt (ignored if messages provided)
+            system_prompt: System prompt (ignored if messages provided)
+            messages: Pre-built messages array (optional, overrides prompt/system_prompt)
+            response_format: Response format (e.g., {"type": "json_object"})
+            temperature: Temperature parameter (optional, uses config by default)
+            max_tokens: Maximum tokens (optional, uses config by default)
+            model: Model name (optional, uses config by default)
+            verbose: Whether to print raw LLM output (default True)
+            stage: Stage marker for logging and tracking
+        Returns:
+            LLM response text
+        """
+        model = model or self.get_model()
+        temperature = temperature if temperature is not None else self.get_temperature()
+        max_tokens = max_tokens if max_tokens is not None else self.get_max_tokens()
+        max_retries = self.get_max_retries()
+        # Record call start time
+        start_time = time.time()
+        # Build kwargs for LLM factory
+        kwargs = {
+            "temperature": temperature,
+        }
+        # Handle token limit for newer OpenAI models
+        if max_tokens:
+            kwargs.update(get_token_limit_kwargs(model, max_tokens))
+        # Handle response_format with capability check
+        if response_format:
+            try:
+                config = get_llm_config()
+                binding = getattr(config, "binding", None) or "openai"
+            except Exception:
+                binding = "openai"
+            if supports_response_format(binding, model):
+                kwargs["response_format"] = response_format
+            else:
+                self.logger.debug(f"response_format not supported for {binding}/{model}, skipping")
+        if messages:
+            kwargs["messages"] = messages
+        # Log input
+        stage_label = stage or self.agent_name
+        if hasattr(self.logger, "log_llm_input"):
+            self.logger.log_llm_input(
+                agent_name=self.agent_name,
+                stage=stage_label,
+                system_prompt=system_prompt,
+                user_prompt=user_prompt,
+                metadata={"model": model, "temperature": temperature, "max_tokens": max_tokens},
+            )
+        # Call LLM via factory (routes to cloud or local provider)
+        response = None
+        try:
+            response = await llm_complete(
+                prompt=user_prompt,
+                system_prompt=system_prompt,
+                model=model,
+                api_key=self.api_key,
+                base_url=self.base_url,
+                api_version=self.api_version,
+                max_retries=max_retries,
+                **kwargs,
+            )
+        except Exception as e:
+            self.logger.error(f"LLM call failed: {e}")
+            raise
+        # Calculate duration
+        call_duration = time.time() - start_time
+        # Track token usage
+        self._track_tokens(
+            model=model,
+            system_prompt=system_prompt,
+            user_prompt=user_prompt,
+            response=response,
+            stage=stage_label,
+        )
+        # Log output
+        if hasattr(self.logger, "log_llm_output"):
+            self.logger.log_llm_output(
+                agent_name=self.agent_name,
+                stage=stage_label,
+                response=response,
+                metadata={"length": len(response), "duration": call_duration},
+            )
+        # Verbose output
+        if verbose:
+            self.logger.debug(f"LLM response: model={model}, duration={call_duration:.2f}s")
+        return response
+    async def stream_llm(
+        self,
+        user_prompt: str,
+        system_prompt: str,
+        messages: list[dict[str, str]] | None = None,
+        temperature: float | None = None,
+        max_tokens: int | None = None,
+        model: str | None = None,
+        stage: str | None = None,
+    ) -> AsyncGenerator[str, None]:
+        """
+        Unified interface for streaming LLM responses.
+        Uses the LLM factory to route calls to the appropriate provider
+        (cloud or local) based on configuration.
+        Args:
+            user_prompt: User prompt (ignored if messages provided)
+            system_prompt: System prompt (ignored if messages provided)
+            messages: Pre-built messages array (optional, overrides prompt/system_prompt)
+            temperature: Temperature parameter (optional, uses config by default)
+            max_tokens: Maximum tokens (optional, uses config by default)
+            model: Model name (optional, uses config by default)
+            stage: Stage marker for logging
+        Yields:
+            Response chunks as strings
+        """
+        model = model or self.get_model()
+        temperature = temperature if temperature is not None else self.get_temperature()
+        max_tokens = max_tokens if max_tokens is not None else self.get_max_tokens()
+        # Build kwargs
+        kwargs = {
+            "temperature": temperature,
+        }
+        # Handle token limit for newer OpenAI models
+        if max_tokens:
+            kwargs.update(get_token_limit_kwargs(model, max_tokens))
+        # Log input
+        stage_label = stage or self.agent_name
+        if hasattr(self.logger, "log_llm_input"):
+            self.logger.log_llm_input(
+                agent_name=self.agent_name,
+                stage=stage_label,
+                system_prompt=system_prompt,
+                user_prompt=user_prompt,
+                metadata={"model": model, "temperature": temperature, "streaming": True},
+            )
+        # Track start time
+        start_time = time.time()
+        full_response = ""
+        try:
+            # Stream via factory (routes to cloud or local provider)
+            async for chunk in llm_stream(
+                prompt=user_prompt,
+                system_prompt=system_prompt,
+                model=model,
+                api_key=self.api_key,
+                base_url=self.base_url,
+                api_version=self.api_version,
+                messages=messages,
+                **kwargs,
+            ):
+                full_response += chunk
+                yield chunk
+            # Track token usage after streaming completes
+            self._track_tokens(
+                model=model,
+                system_prompt=system_prompt,
+                user_prompt=user_prompt,
+                response=full_response,
+                stage=stage_label,
+            )
+            # Log output
+            call_duration = time.time() - start_time
+            if hasattr(self.logger, "log_llm_output"):
+                self.logger.log_llm_output(
+                    agent_name=self.agent_name,
+                    stage=stage_label,
+                    response=full_response[:200] + "..."
+                    if len(full_response) > 200
+                    else full_response,
+                    metadata={
+                        "length": len(full_response),
+                        "duration": call_duration,
+                        "streaming": True,
+                    },
+                )
+        except Exception as e:
+            self.logger.error(f"LLM streaming failed: {e}")
+            raise
+    # -------------------------------------------------------------------------
+    # Prompt Helpers
+    # -------------------------------------------------------------------------
+    def get_prompt(
+        self,
+        section_or_type: str = "system",
+        field_or_fallback: str | None = None,
+        fallback: str = "",
+    ) -> str | None:
+        """
+        Get prompt by type or section/field.
+        Supports two calling patterns:
+        1. get_prompt("system") - simple key lookup
+        2. get_prompt("section", "field", "fallback") - nested lookup (for research module)
+        Args:
+            section_or_type: Prompt type key or section name
+            field_or_fallback: Field name (if nested) or fallback value (if simple)
+            fallback: Fallback value if prompt not found (only used in nested mode)
+        Returns:
+            Prompt string or fallback
+        """
+        if not self.prompts:
+            return (
+                fallback
+                if fallback
+                else (
+                    field_or_fallback
+                    if isinstance(field_or_fallback, str) and field_or_fallback
+                    else None
+                )
+            )
+        # Check if this is a nested lookup (section.field pattern)
+        # If field_or_fallback is provided and section_or_type points to a dict, use nested lookup
+        section_value = self.prompts.get(section_or_type)
+        if isinstance(section_value, dict) and field_or_fallback is not None:
+            # Nested lookup: get_prompt("section", "field", "fallback")
+            result = section_value.get(field_or_fallback)
+            if result is not None:
+                return result
+            return fallback if fallback else None
+        else:
+            # Simple lookup: get_prompt("key") or get_prompt("key", "fallback")
+            if section_value is not None:
+                return section_value
+            # field_or_fallback acts as fallback in simple mode
+            return field_or_fallback if field_or_fallback else (fallback if fallback else None)
+    def has_prompts(self) -> bool:
+        """Check if prompts have been loaded."""
+        return self.prompts is not None
+    # -------------------------------------------------------------------------
+    # Status
+    # -------------------------------------------------------------------------
+    def is_enabled(self) -> bool:
+        """
+        Check if Agent is enabled.
+        Returns:
+            Whether enabled
+        """
+        return self.enabled
+    # -------------------------------------------------------------------------
+    # Abstract Method
+    # -------------------------------------------------------------------------
+    @abstractmethod
+    async def process(self, *args, **kwargs) -> Any:
+        """
+        Main processing logic of Agent (must be implemented by subclasses).
+        Returns:
+            Processing result
+        """
+    # -------------------------------------------------------------------------
+    # String Representation
+    # -------------------------------------------------------------------------
+    def __repr__(self) -> str:
+        """String representation of Agent."""
+        return (
+            f"{self.__class__.__name__}("
+            f"module={self.module_name}, "
+            f"name={self.agent_name}, "
+            f"enabled={self.enabled})"
+        )
+__all__ = ["BaseAgent"]

src/agents/chat/__init__.py ADDED Viewed

@@ -0,0 +1,24 @@
+"""
+Chat Module - Lightweight conversational AI with session management.
+This module provides:
+- ChatAgent: Multi-turn conversational agent with RAG/Web Search support
+- SessionManager: Chat session persistence and management
+Usage:
+    from src.agents.chat import ChatAgent, SessionManager
+    agent = ChatAgent(language="en")
+    response = await agent.process(
+        message="What is machine learning?",
+        history=[],
+        kb_name="ai_textbook",
+        enable_rag=True,
+        enable_web_search=False
+    )
+"""
+from .chat_agent import ChatAgent
+from .session_manager import SessionManager
+__all__ = ["ChatAgent", "SessionManager"]