PyPI - realtimex-deeptutor - Versions diffs - 0.5.0.post1__py3-none-any.whl - Mend

realtimex-deeptutor 0.5.0.post1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (276) hide show

realtimex_deeptutor/__init__.py +67 -0
realtimex_deeptutor-0.5.0.post1.dist-info/METADATA +1612 -0
realtimex_deeptutor-0.5.0.post1.dist-info/RECORD +276 -0
realtimex_deeptutor-0.5.0.post1.dist-info/WHEEL +5 -0
realtimex_deeptutor-0.5.0.post1.dist-info/entry_points.txt +2 -0
realtimex_deeptutor-0.5.0.post1.dist-info/licenses/LICENSE +661 -0
realtimex_deeptutor-0.5.0.post1.dist-info/top_level.txt +2 -0
src/__init__.py +40 -0
src/agents/__init__.py +24 -0
src/agents/base_agent.py +657 -0
src/agents/chat/__init__.py +24 -0
src/agents/chat/chat_agent.py +435 -0
src/agents/chat/prompts/en/chat_agent.yaml +35 -0
src/agents/chat/prompts/zh/chat_agent.yaml +35 -0
src/agents/chat/session_manager.py +311 -0
src/agents/co_writer/__init__.py +0 -0
src/agents/co_writer/edit_agent.py +260 -0
src/agents/co_writer/narrator_agent.py +423 -0
src/agents/co_writer/prompts/en/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/en/narrator_agent.yaml +88 -0
src/agents/co_writer/prompts/zh/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/zh/narrator_agent.yaml +88 -0
src/agents/guide/__init__.py +16 -0
src/agents/guide/agents/__init__.py +11 -0
src/agents/guide/agents/chat_agent.py +104 -0
src/agents/guide/agents/interactive_agent.py +223 -0
src/agents/guide/agents/locate_agent.py +149 -0
src/agents/guide/agents/summary_agent.py +150 -0
src/agents/guide/guide_manager.py +500 -0
src/agents/guide/prompts/en/chat_agent.yaml +41 -0
src/agents/guide/prompts/en/interactive_agent.yaml +202 -0
src/agents/guide/prompts/en/locate_agent.yaml +68 -0
src/agents/guide/prompts/en/summary_agent.yaml +157 -0
src/agents/guide/prompts/zh/chat_agent.yaml +41 -0
src/agents/guide/prompts/zh/interactive_agent.yaml +626 -0
src/agents/guide/prompts/zh/locate_agent.yaml +68 -0
src/agents/guide/prompts/zh/summary_agent.yaml +157 -0
src/agents/ideagen/__init__.py +12 -0
src/agents/ideagen/idea_generation_workflow.py +426 -0
src/agents/ideagen/material_organizer_agent.py +173 -0
src/agents/ideagen/prompts/en/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/en/material_organizer.yaml +69 -0
src/agents/ideagen/prompts/zh/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/zh/material_organizer.yaml +69 -0
src/agents/question/__init__.py +24 -0
src/agents/question/agents/__init__.py +18 -0
src/agents/question/agents/generate_agent.py +381 -0
src/agents/question/agents/relevance_analyzer.py +207 -0
src/agents/question/agents/retrieve_agent.py +239 -0
src/agents/question/coordinator.py +718 -0
src/agents/question/example.py +109 -0
src/agents/question/prompts/en/coordinator.yaml +75 -0
src/agents/question/prompts/en/generate_agent.yaml +77 -0
src/agents/question/prompts/en/relevance_analyzer.yaml +41 -0
src/agents/question/prompts/en/retrieve_agent.yaml +32 -0
src/agents/question/prompts/zh/coordinator.yaml +75 -0
src/agents/question/prompts/zh/generate_agent.yaml +77 -0
src/agents/question/prompts/zh/relevance_analyzer.yaml +39 -0
src/agents/question/prompts/zh/retrieve_agent.yaml +30 -0
src/agents/research/agents/__init__.py +23 -0
src/agents/research/agents/decompose_agent.py +507 -0
src/agents/research/agents/manager_agent.py +228 -0
src/agents/research/agents/note_agent.py +180 -0
src/agents/research/agents/rephrase_agent.py +263 -0
src/agents/research/agents/reporting_agent.py +1333 -0
src/agents/research/agents/research_agent.py +714 -0
src/agents/research/data_structures.py +451 -0
src/agents/research/main.py +188 -0
src/agents/research/prompts/en/decompose_agent.yaml +89 -0
src/agents/research/prompts/en/manager_agent.yaml +24 -0
src/agents/research/prompts/en/note_agent.yaml +121 -0
src/agents/research/prompts/en/rephrase_agent.yaml +58 -0
src/agents/research/prompts/en/reporting_agent.yaml +380 -0
src/agents/research/prompts/en/research_agent.yaml +173 -0
src/agents/research/prompts/zh/decompose_agent.yaml +89 -0
src/agents/research/prompts/zh/manager_agent.yaml +24 -0
src/agents/research/prompts/zh/note_agent.yaml +121 -0
src/agents/research/prompts/zh/rephrase_agent.yaml +58 -0
src/agents/research/prompts/zh/reporting_agent.yaml +380 -0
src/agents/research/prompts/zh/research_agent.yaml +173 -0
src/agents/research/research_pipeline.py +1309 -0
src/agents/research/utils/__init__.py +60 -0
src/agents/research/utils/citation_manager.py +799 -0
src/agents/research/utils/json_utils.py +98 -0
src/agents/research/utils/token_tracker.py +297 -0
src/agents/solve/__init__.py +80 -0
src/agents/solve/analysis_loop/__init__.py +14 -0
src/agents/solve/analysis_loop/investigate_agent.py +414 -0
src/agents/solve/analysis_loop/note_agent.py +190 -0
src/agents/solve/main_solver.py +862 -0
src/agents/solve/memory/__init__.py +34 -0
src/agents/solve/memory/citation_memory.py +353 -0
src/agents/solve/memory/investigate_memory.py +226 -0
src/agents/solve/memory/solve_memory.py +340 -0
src/agents/solve/prompts/en/analysis_loop/investigate_agent.yaml +55 -0
src/agents/solve/prompts/en/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/en/solve_loop/manager_agent.yaml +67 -0
src/agents/solve/prompts/en/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/en/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/en/solve_loop/solve_agent.yaml +75 -0
src/agents/solve/prompts/en/solve_loop/tool_agent.yaml +38 -0
src/agents/solve/prompts/zh/analysis_loop/investigate_agent.yaml +53 -0
src/agents/solve/prompts/zh/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/zh/solve_loop/manager_agent.yaml +66 -0
src/agents/solve/prompts/zh/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/zh/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/zh/solve_loop/solve_agent.yaml +76 -0
src/agents/solve/prompts/zh/solve_loop/tool_agent.yaml +41 -0
src/agents/solve/solve_loop/__init__.py +22 -0
src/agents/solve/solve_loop/citation_manager.py +74 -0
src/agents/solve/solve_loop/manager_agent.py +274 -0
src/agents/solve/solve_loop/precision_answer_agent.py +96 -0
src/agents/solve/solve_loop/response_agent.py +301 -0
src/agents/solve/solve_loop/solve_agent.py +325 -0
src/agents/solve/solve_loop/tool_agent.py +470 -0
src/agents/solve/utils/__init__.py +64 -0
src/agents/solve/utils/config_validator.py +313 -0
src/agents/solve/utils/display_manager.py +223 -0
src/agents/solve/utils/error_handler.py +363 -0
src/agents/solve/utils/json_utils.py +98 -0
src/agents/solve/utils/performance_monitor.py +407 -0
src/agents/solve/utils/token_tracker.py +541 -0
src/api/__init__.py +0 -0
src/api/main.py +240 -0
src/api/routers/__init__.py +1 -0
src/api/routers/agent_config.py +69 -0
src/api/routers/chat.py +296 -0
src/api/routers/co_writer.py +337 -0
src/api/routers/config.py +627 -0
src/api/routers/dashboard.py +18 -0
src/api/routers/guide.py +337 -0
src/api/routers/ideagen.py +436 -0
src/api/routers/knowledge.py +821 -0
src/api/routers/notebook.py +247 -0
src/api/routers/question.py +537 -0
src/api/routers/research.py +394 -0
src/api/routers/settings.py +164 -0
src/api/routers/solve.py +305 -0
src/api/routers/system.py +252 -0
src/api/run_server.py +61 -0
src/api/utils/history.py +172 -0
src/api/utils/log_interceptor.py +21 -0
src/api/utils/notebook_manager.py +415 -0
src/api/utils/progress_broadcaster.py +72 -0
src/api/utils/task_id_manager.py +100 -0
src/config/__init__.py +0 -0
src/config/accessors.py +18 -0
src/config/constants.py +34 -0
src/config/defaults.py +18 -0
src/config/schema.py +38 -0
src/config/settings.py +50 -0
src/core/errors.py +62 -0
src/knowledge/__init__.py +23 -0
src/knowledge/add_documents.py +606 -0
src/knowledge/config.py +65 -0
src/knowledge/example_add_documents.py +236 -0
src/knowledge/extract_numbered_items.py +1039 -0
src/knowledge/initializer.py +621 -0
src/knowledge/kb.py +22 -0
src/knowledge/manager.py +782 -0
src/knowledge/progress_tracker.py +182 -0
src/knowledge/start_kb.py +535 -0
src/logging/__init__.py +103 -0
src/logging/adapters/__init__.py +17 -0
src/logging/adapters/lightrag.py +184 -0
src/logging/adapters/llamaindex.py +141 -0
src/logging/config.py +80 -0
src/logging/handlers/__init__.py +20 -0
src/logging/handlers/console.py +75 -0
src/logging/handlers/file.py +201 -0
src/logging/handlers/websocket.py +127 -0
src/logging/logger.py +709 -0
src/logging/stats/__init__.py +16 -0
src/logging/stats/llm_stats.py +179 -0
src/services/__init__.py +56 -0
src/services/config/__init__.py +61 -0
src/services/config/knowledge_base_config.py +210 -0
src/services/config/loader.py +260 -0
src/services/config/unified_config.py +603 -0
src/services/embedding/__init__.py +45 -0
src/services/embedding/adapters/__init__.py +22 -0
src/services/embedding/adapters/base.py +106 -0
src/services/embedding/adapters/cohere.py +127 -0
src/services/embedding/adapters/jina.py +99 -0
src/services/embedding/adapters/ollama.py +116 -0
src/services/embedding/adapters/openai_compatible.py +96 -0
src/services/embedding/client.py +159 -0
src/services/embedding/config.py +156 -0
src/services/embedding/provider.py +119 -0
src/services/llm/__init__.py +152 -0
src/services/llm/capabilities.py +313 -0
src/services/llm/client.py +302 -0
src/services/llm/cloud_provider.py +530 -0
src/services/llm/config.py +200 -0
src/services/llm/error_mapping.py +103 -0
src/services/llm/exceptions.py +152 -0
src/services/llm/factory.py +450 -0
src/services/llm/local_provider.py +347 -0
src/services/llm/providers/anthropic.py +95 -0
src/services/llm/providers/base_provider.py +93 -0
src/services/llm/providers/open_ai.py +83 -0
src/services/llm/registry.py +71 -0
src/services/llm/telemetry.py +40 -0
src/services/llm/types.py +27 -0
src/services/llm/utils.py +333 -0
src/services/prompt/__init__.py +25 -0
src/services/prompt/manager.py +206 -0
src/services/rag/__init__.py +64 -0
src/services/rag/components/__init__.py +29 -0
src/services/rag/components/base.py +59 -0
src/services/rag/components/chunkers/__init__.py +18 -0
src/services/rag/components/chunkers/base.py +34 -0
src/services/rag/components/chunkers/fixed.py +71 -0
src/services/rag/components/chunkers/numbered_item.py +94 -0
src/services/rag/components/chunkers/semantic.py +97 -0
src/services/rag/components/embedders/__init__.py +14 -0
src/services/rag/components/embedders/base.py +32 -0
src/services/rag/components/embedders/openai.py +63 -0
src/services/rag/components/indexers/__init__.py +18 -0
src/services/rag/components/indexers/base.py +35 -0
src/services/rag/components/indexers/graph.py +172 -0
src/services/rag/components/indexers/lightrag.py +156 -0
src/services/rag/components/indexers/vector.py +146 -0
src/services/rag/components/parsers/__init__.py +18 -0
src/services/rag/components/parsers/base.py +35 -0
src/services/rag/components/parsers/markdown.py +52 -0
src/services/rag/components/parsers/pdf.py +115 -0
src/services/rag/components/parsers/text.py +86 -0
src/services/rag/components/retrievers/__init__.py +18 -0
src/services/rag/components/retrievers/base.py +34 -0
src/services/rag/components/retrievers/dense.py +200 -0
src/services/rag/components/retrievers/hybrid.py +164 -0
src/services/rag/components/retrievers/lightrag.py +169 -0
src/services/rag/components/routing.py +286 -0
src/services/rag/factory.py +234 -0
src/services/rag/pipeline.py +215 -0
src/services/rag/pipelines/__init__.py +32 -0
src/services/rag/pipelines/academic.py +44 -0
src/services/rag/pipelines/lightrag.py +43 -0
src/services/rag/pipelines/llamaindex.py +313 -0
src/services/rag/pipelines/raganything.py +384 -0
src/services/rag/service.py +244 -0
src/services/rag/types.py +73 -0
src/services/search/__init__.py +284 -0
src/services/search/base.py +87 -0
src/services/search/consolidation.py +398 -0
src/services/search/providers/__init__.py +128 -0
src/services/search/providers/baidu.py +188 -0
src/services/search/providers/exa.py +194 -0
src/services/search/providers/jina.py +161 -0
src/services/search/providers/perplexity.py +153 -0
src/services/search/providers/serper.py +209 -0
src/services/search/providers/tavily.py +161 -0
src/services/search/types.py +114 -0
src/services/setup/__init__.py +34 -0
src/services/setup/init.py +285 -0
src/services/tts/__init__.py +16 -0
src/services/tts/config.py +99 -0
src/tools/__init__.py +91 -0
src/tools/code_executor.py +536 -0
src/tools/paper_search_tool.py +171 -0
src/tools/query_item_tool.py +310 -0
src/tools/question/__init__.py +15 -0
src/tools/question/exam_mimic.py +616 -0
src/tools/question/pdf_parser.py +211 -0
src/tools/question/question_extractor.py +397 -0
src/tools/rag_tool.py +173 -0
src/tools/tex_chunker.py +339 -0
src/tools/tex_downloader.py +253 -0
src/tools/web_search.py +71 -0
src/utils/config_manager.py +206 -0
src/utils/document_validator.py +168 -0
src/utils/error_rate_tracker.py +111 -0
src/utils/error_utils.py +82 -0
src/utils/json_parser.py +110 -0
src/utils/network/circuit_breaker.py +79 -0

src/services/llm/capabilities.py ADDED Viewed

@@ -0,0 +1,313 @@
+"""
+Provider Capabilities
+=====================
+Centralized configuration for LLM provider capabilities.
+This replaces scattered hardcoded checks throughout the codebase.
+Usage:
+    from src.services.llm.capabilities import get_capability, supports_response_format
+    # Check if a provider supports response_format
+    if supports_response_format(binding, model):
+        kwargs["response_format"] = {"type": "json_object"}
+    # Generic capability check
+    if get_capability(binding, "streaming", default=True):
+        # use streaming
+"""
+from typing import Any, Optional
+# Provider capabilities configuration
+# Keys are binding names (lowercase), values are capability dictionaries
+PROVIDER_CAPABILITIES: dict[str, dict[str, Any]] = {
+    # OpenAI and OpenAI-compatible providers
+    "openai": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,  # System prompt goes in messages array
+        "newer_models_use_max_completion_tokens": True,
+    },
+    "azure_openai": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+        "newer_models_use_max_completion_tokens": True,
+        "requires_api_version": True,
+    },
+    # Anthropic
+    "anthropic": {
+        "supports_response_format": False,  # Anthropic uses different format
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": False,  # System is a separate parameter
+        "has_thinking_tags": False,
+    },
+    "claude": {  # Alias for anthropic
+        "supports_response_format": False,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": False,
+        "has_thinking_tags": False,
+    },
+    # DeepSeek
+    "deepseek": {
+        "supports_response_format": False,  # DeepSeek doesn't support strict JSON schema yet
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+        "has_thinking_tags": True,  # DeepSeek reasoner has thinking tags
+    },
+    # OpenRouter (aggregator, generally OpenAI-compatible)
+    "openrouter": {
+        "supports_response_format": True,  # Depends on underlying model
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+    },
+    # Groq (fast inference)
+    "groq": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+    },
+    # Together AI
+    "together": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+    },
+    "together_ai": {  # Alias
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+    },
+    # Mistral
+    "mistral": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": True,
+        "system_in_messages": True,
+    },
+    # Local providers (generally OpenAI-compatible)
+    "ollama": {
+        "supports_response_format": True,  # Ollama supports JSON mode
+        "supports_streaming": True,
+        "supports_tools": False,  # Limited tool support
+        "system_in_messages": True,
+    },
+    "lm_studio": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": False,
+        "system_in_messages": True,
+    },
+    "vllm": {
+        "supports_response_format": True,
+        "supports_streaming": True,
+        "supports_tools": False,
+        "system_in_messages": True,
+    },
+    "llama_cpp": {
+        "supports_response_format": True,  # llama.cpp server supports JSON grammar
+        "supports_streaming": True,
+        "supports_tools": False,
+        "system_in_messages": True,
+    },
+}
+# Default capabilities for unknown providers (assume OpenAI-compatible)
+DEFAULT_CAPABILITIES: dict[str, Any] = {
+    "supports_response_format": True,
+    "supports_streaming": True,
+    "supports_tools": False,
+    "system_in_messages": True,
+    "has_thinking_tags": False,
+}
+# Model-specific overrides
+# Format: {model_pattern: {capability: value}}
+# Patterns are matched with case-insensitive startswith
+MODEL_OVERRIDES: dict[str, dict[str, Any]] = {
+    "deepseek": {
+        "supports_response_format": False,
+        "has_thinking_tags": True,
+    },
+    "deepseek-reasoner": {
+        "supports_response_format": False,
+        "has_thinking_tags": True,
+    },
+    "qwen": {
+        # Qwen models may have thinking tags
+        "has_thinking_tags": True,
+    },
+    "qwq": {
+        # QwQ is Qwen's reasoning model with thinking tags
+        "has_thinking_tags": True,
+    },
+    # Claude models through OpenRouter or other providers
+    "claude": {
+        "supports_response_format": False,
+        "system_in_messages": False,
+    },
+    # Anthropic models
+    "anthropic/": {
+        "supports_response_format": False,
+        "system_in_messages": False,
+    },
+}
+def get_capability(
+    binding: str,
+    capability: str,
+    model: Optional[str] = None,
+    default: Any = None,
+) -> Any:
+    """
+    Get a capability value for a provider/model combination.
+    Checks in order:
+    1. Model-specific overrides (matched by prefix)
+    2. Provider/binding capabilities
+    3. Default capabilities for unknown providers
+    4. Explicit default value
+    Args:
+        binding: Provider binding name (e.g., "openai", "anthropic", "deepseek")
+        capability: Capability name (e.g., "supports_response_format")
+        model: Optional model name for model-specific overrides
+        default: Default value if capability is not defined
+    Returns:
+        Capability value or default
+    """
+    binding_lower = (binding or "openai").lower()
+    # 1. Check model-specific overrides first
+    if model:
+        model_lower = model.lower()
+        # Sort by pattern length descending to match most specific first
+        for pattern, overrides in sorted(MODEL_OVERRIDES.items(), key=lambda x: -len(x[0])):
+            if model_lower.startswith(pattern):
+                if capability in overrides:
+                    return overrides[capability]
+    # 2. Check provider capabilities
+    provider_caps = PROVIDER_CAPABILITIES.get(binding_lower, {})
+    if capability in provider_caps:
+        return provider_caps[capability]
+    # 3. Check default capabilities for unknown providers
+    if capability in DEFAULT_CAPABILITIES:
+        return DEFAULT_CAPABILITIES[capability]
+    # 4. Return explicit default
+    return default
+def supports_response_format(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if the provider/model supports response_format parameter.
+    This is a convenience function for the most common capability check.
+    Args:
+        binding: Provider binding name
+        model: Optional model name for model-specific overrides
+    Returns:
+        True if response_format is supported
+    """
+    return get_capability(binding, "supports_response_format", model, default=True)
+def supports_streaming(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if the provider/model supports streaming responses.
+    Args:
+        binding: Provider binding name
+        model: Optional model name
+    Returns:
+        True if streaming is supported
+    """
+    return get_capability(binding, "supports_streaming", model, default=True)
+def system_in_messages(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if system prompt should be in messages array (OpenAI style)
+    or as a separate parameter (Anthropic style).
+    Args:
+        binding: Provider binding name
+        model: Optional model name
+    Returns:
+        True if system prompt goes in messages array
+    """
+    return get_capability(binding, "system_in_messages", model, default=True)
+def has_thinking_tags(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if the model output may contain thinking tags (<think>...</think>).
+    Args:
+        binding: Provider binding name
+        model: Optional model name
+    Returns:
+        True if thinking tags should be filtered
+    """
+    return get_capability(binding, "has_thinking_tags", model, default=False)
+def supports_tools(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if the provider/model supports function calling / tools.
+    Args:
+        binding: Provider binding name
+        model: Optional model name
+    Returns:
+        True if tools/function calling is supported
+    """
+    return get_capability(binding, "supports_tools", model, default=False)
+def requires_api_version(binding: str, model: Optional[str] = None) -> bool:
+    """
+    Check if the provider requires an API version parameter (e.g., Azure OpenAI).
+    Args:
+        binding: Provider binding name
+        model: Optional model name
+    Returns:
+        True if api_version is required
+    """
+    return get_capability(binding, "requires_api_version", model, default=False)
+__all__ = [
+    "PROVIDER_CAPABILITIES",
+    "MODEL_OVERRIDES",
+    "DEFAULT_CAPABILITIES",
+    "get_capability",
+    "supports_response_format",
+    "supports_streaming",
+    "system_in_messages",
+    "has_thinking_tags",
+    "supports_tools",
+    "requires_api_version",
+]

src/services/llm/client.py ADDED Viewed

@@ -0,0 +1,302 @@
+"""
+LLM Client
+==========
+Unified LLM client for all DeepTutor services.
+Note: This is a legacy interface. Prefer using the factory functions directly:
+    from src.services.llm import complete, stream
+"""
+from typing import Any, Dict, List, Optional
+from src.logging import get_logger
+from .capabilities import system_in_messages
+from .config import LLMConfig, get_llm_config
+class LLMClient:
+    """
+    Unified LLM client for all services.
+    Wraps the LLM Factory with a class-based interface.
+    Prefer using factory functions (complete, stream) directly for new code.
+    """
+    def __init__(self, config: Optional[LLMConfig] = None):
+        """
+        Initialize LLM client.
+        Args:
+            config: LLM configuration. If None, loads from environment.
+        """
+        self.config = config or get_llm_config()
+        self.logger = get_logger("LLMClient")
+    async def complete(
+        self,
+        prompt: str,
+        system_prompt: Optional[str] = None,
+        history: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
+    ) -> str:
+        """
+        Call LLM completion via Factory.
+        Args:
+            prompt: User prompt
+            system_prompt: Optional system prompt
+            history: Optional conversation history
+            **kwargs: Additional arguments passed to the API
+        Returns:
+            LLM response text
+        """
+        from . import factory
+        # Delegate to factory for unified routing and retry handling
+        return await factory.complete(
+            prompt=prompt,
+            system_prompt=system_prompt or "You are a helpful assistant.",
+            model=self.config.model,
+            api_key=self.config.api_key,
+            base_url=self.config.base_url,
+            api_version=getattr(self.config, "api_version", None),
+            binding=getattr(self.config, "binding", "openai"),
+            **kwargs,
+        )
+    def complete_sync(
+        self,
+        prompt: str,
+        system_prompt: Optional[str] = None,
+        history: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
+    ) -> str:
+        """
+        Synchronous wrapper for complete().
+        Use this when you need to call from non-async context.
+        """
+        import asyncio
+        try:
+            asyncio.get_running_loop()
+        except RuntimeError:
+            # No running event loop -> safe to run synchronously.
+            return asyncio.run(self.complete(prompt, system_prompt, history, **kwargs))
+        raise RuntimeError(
+            "LLMClient.complete_sync() cannot be called from a running event loop. "
+            "Use `await llm.complete(...)` instead."
+        )
+    def get_model_func(self):
+        """
+        Get a function compatible with LightRAG's llm_model_func parameter.
+        Returns:
+            Callable that can be used as llm_model_func
+        """
+        binding = getattr(self.config, "binding", "openai")
+        # Use capabilities to determine if provider uses OpenAI-style messages
+        uses_openai_style = system_in_messages(binding, self.config.model)
+        # For non-OpenAI-compatible providers (e.g., Anthropic), use Factory
+        if not uses_openai_style:
+            from . import factory
+            def llm_model_func_via_factory(
+                prompt: str,
+                system_prompt: Optional[str] = None,
+                history_messages: Optional[List[Dict]] = None,
+                **kwargs: Any,
+            ):
+                return factory.complete(
+                    prompt=prompt,
+                    system_prompt=system_prompt or "You are a helpful assistant.",
+                    model=self.config.model,
+                    api_key=self.config.api_key,
+                    base_url=self.config.base_url,
+                    binding=binding,
+                    history_messages=history_messages,
+                    **kwargs,
+                )
+            return llm_model_func_via_factory
+        # OpenAI-compatible bindings use lightrag (has caching)
+        from lightrag.llm.openai import openai_complete_if_cache
+        def llm_model_func(
+            prompt: str,
+            system_prompt: Optional[str] = None,
+            history_messages: Optional[List[Dict]] = None,
+            **kwargs: Any,
+        ):
+            # Only pass api_version if set (for Azure OpenAI)
+            lightrag_kwargs = {
+                "system_prompt": system_prompt,
+                "history_messages": history_messages or [],
+                "api_key": self.config.api_key,
+                "base_url": self.config.base_url,
+                **kwargs,
+            }
+            api_version = getattr(self.config, "api_version", None)
+            if api_version:
+                lightrag_kwargs["api_version"] = api_version
+            return openai_complete_if_cache(
+                self.config.model,
+                prompt,
+                **lightrag_kwargs,
+            )
+        return llm_model_func
+    def get_vision_model_func(self):
+        """
+        Get a function compatible with RAG-Anything's vision_model_func parameter.
+        Returns:
+            Callable that can be used as vision_model_func
+        """
+        binding = getattr(self.config, "binding", "openai")
+        # Use capabilities to determine if provider uses OpenAI-style messages
+        uses_openai_style = system_in_messages(binding, self.config.model)
+        # For non-OpenAI-compatible providers, use Factory
+        if not uses_openai_style:
+            from . import factory
+            def vision_model_func_via_factory(
+                prompt: str,
+                system_prompt: Optional[str] = None,
+                history_messages: Optional[List[Dict]] = None,
+                image_data: Optional[str] = None,
+                messages: Optional[List[Dict]] = None,
+                **kwargs: Any,
+            ):
+                # Use factory for unified handling
+                return factory.complete(
+                    prompt=prompt,
+                    system_prompt=system_prompt or "You are a helpful assistant.",
+                    model=self.config.model,
+                    api_key=self.config.api_key,
+                    base_url=self.config.base_url,
+                    binding=binding,
+                    messages=messages,
+                    history_messages=history_messages,
+                    image_data=image_data,
+                    **kwargs,
+                )
+            return vision_model_func_via_factory
+        # OpenAI-compatible bindings
+        from lightrag.llm.openai import openai_complete_if_cache
+        # Get api_version once for reuse
+        api_version = getattr(self.config, "api_version", None)
+        def vision_model_func(
+            prompt: str,
+            system_prompt: Optional[str] = None,
+            history_messages: Optional[List[Dict]] = None,
+            image_data: Optional[str] = None,
+            messages: Optional[List[Dict]] = None,
+            **kwargs: Any,
+        ):
+            # Handle multimodal messages
+            if messages:
+                clean_kwargs = {
+                    k: v
+                    for k, v in kwargs.items()
+                    if k not in ["messages", "prompt", "system_prompt", "history_messages"]
+                }
+                lightrag_kwargs = {
+                    "messages": messages,
+                    "api_key": self.config.api_key,
+                    "base_url": self.config.base_url,
+                    **clean_kwargs,
+                }
+                if api_version:
+                    lightrag_kwargs["api_version"] = api_version
+                return openai_complete_if_cache(
+                    self.config.model,
+                    prompt="",
+                    **lightrag_kwargs,
+                )
+            # Handle image data
+            if image_data:
+                # Build image message
+                image_message = {
+                    "role": "user",
+                    "content": [
+                        {"type": "text", "text": prompt},
+                        {
+                            "type": "image_url",
+                            "image_url": {"url": f"data:image/jpeg;base64,{image_data}"},
+                        },
+                    ],
+                }
+                lightrag_kwargs = {
+                    "messages": [image_message],
+                    "api_key": self.config.api_key,
+                    "base_url": self.config.base_url,
+                    **kwargs,
+                }
+                if api_version:
+                    lightrag_kwargs["api_version"] = api_version
+                return openai_complete_if_cache(
+                    self.config.model,
+                    prompt="",
+                    **lightrag_kwargs,
+                )
+            # Fallback to regular completion
+            lightrag_kwargs = {
+                "system_prompt": system_prompt,
+                "history_messages": history_messages or [],
+                "api_key": self.config.api_key,
+                "base_url": self.config.base_url,
+                **kwargs,
+            }
+            if api_version:
+                lightrag_kwargs["api_version"] = api_version
+            return openai_complete_if_cache(
+                self.config.model,
+                prompt,
+                **lightrag_kwargs,
+            )
+        return vision_model_func
+# Singleton instance
+_client: Optional[LLMClient] = None
+def get_llm_client(config: Optional[LLMConfig] = None) -> LLMClient:
+    """
+    Get or create the singleton LLM client.
+    Args:
+        config: Optional configuration. Only used on first call.
+    Returns:
+        LLMClient instance
+    """
+    global _client
+    if _client is None:
+        _client = LLMClient(config)
+    return _client
+def reset_llm_client():
+    """Reset the singleton LLM client."""
+    global _client
+    _client = None