PyPI - realtimex-deeptutor - Versions diffs - 0.5.0.post1__py3-none-any.whl - Mend

realtimex-deeptutor 0.5.0.post1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (276) hide show

realtimex_deeptutor/__init__.py +67 -0
realtimex_deeptutor-0.5.0.post1.dist-info/METADATA +1612 -0
realtimex_deeptutor-0.5.0.post1.dist-info/RECORD +276 -0
realtimex_deeptutor-0.5.0.post1.dist-info/WHEEL +5 -0
realtimex_deeptutor-0.5.0.post1.dist-info/entry_points.txt +2 -0
realtimex_deeptutor-0.5.0.post1.dist-info/licenses/LICENSE +661 -0
realtimex_deeptutor-0.5.0.post1.dist-info/top_level.txt +2 -0
src/__init__.py +40 -0
src/agents/__init__.py +24 -0
src/agents/base_agent.py +657 -0
src/agents/chat/__init__.py +24 -0
src/agents/chat/chat_agent.py +435 -0
src/agents/chat/prompts/en/chat_agent.yaml +35 -0
src/agents/chat/prompts/zh/chat_agent.yaml +35 -0
src/agents/chat/session_manager.py +311 -0
src/agents/co_writer/__init__.py +0 -0
src/agents/co_writer/edit_agent.py +260 -0
src/agents/co_writer/narrator_agent.py +423 -0
src/agents/co_writer/prompts/en/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/en/narrator_agent.yaml +88 -0
src/agents/co_writer/prompts/zh/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/zh/narrator_agent.yaml +88 -0
src/agents/guide/__init__.py +16 -0
src/agents/guide/agents/__init__.py +11 -0
src/agents/guide/agents/chat_agent.py +104 -0
src/agents/guide/agents/interactive_agent.py +223 -0
src/agents/guide/agents/locate_agent.py +149 -0
src/agents/guide/agents/summary_agent.py +150 -0
src/agents/guide/guide_manager.py +500 -0
src/agents/guide/prompts/en/chat_agent.yaml +41 -0
src/agents/guide/prompts/en/interactive_agent.yaml +202 -0
src/agents/guide/prompts/en/locate_agent.yaml +68 -0
src/agents/guide/prompts/en/summary_agent.yaml +157 -0
src/agents/guide/prompts/zh/chat_agent.yaml +41 -0
src/agents/guide/prompts/zh/interactive_agent.yaml +626 -0
src/agents/guide/prompts/zh/locate_agent.yaml +68 -0
src/agents/guide/prompts/zh/summary_agent.yaml +157 -0
src/agents/ideagen/__init__.py +12 -0
src/agents/ideagen/idea_generation_workflow.py +426 -0
src/agents/ideagen/material_organizer_agent.py +173 -0
src/agents/ideagen/prompts/en/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/en/material_organizer.yaml +69 -0
src/agents/ideagen/prompts/zh/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/zh/material_organizer.yaml +69 -0
src/agents/question/__init__.py +24 -0
src/agents/question/agents/__init__.py +18 -0
src/agents/question/agents/generate_agent.py +381 -0
src/agents/question/agents/relevance_analyzer.py +207 -0
src/agents/question/agents/retrieve_agent.py +239 -0
src/agents/question/coordinator.py +718 -0
src/agents/question/example.py +109 -0
src/agents/question/prompts/en/coordinator.yaml +75 -0
src/agents/question/prompts/en/generate_agent.yaml +77 -0
src/agents/question/prompts/en/relevance_analyzer.yaml +41 -0
src/agents/question/prompts/en/retrieve_agent.yaml +32 -0
src/agents/question/prompts/zh/coordinator.yaml +75 -0
src/agents/question/prompts/zh/generate_agent.yaml +77 -0
src/agents/question/prompts/zh/relevance_analyzer.yaml +39 -0
src/agents/question/prompts/zh/retrieve_agent.yaml +30 -0
src/agents/research/agents/__init__.py +23 -0
src/agents/research/agents/decompose_agent.py +507 -0
src/agents/research/agents/manager_agent.py +228 -0
src/agents/research/agents/note_agent.py +180 -0
src/agents/research/agents/rephrase_agent.py +263 -0
src/agents/research/agents/reporting_agent.py +1333 -0
src/agents/research/agents/research_agent.py +714 -0
src/agents/research/data_structures.py +451 -0
src/agents/research/main.py +188 -0
src/agents/research/prompts/en/decompose_agent.yaml +89 -0
src/agents/research/prompts/en/manager_agent.yaml +24 -0
src/agents/research/prompts/en/note_agent.yaml +121 -0
src/agents/research/prompts/en/rephrase_agent.yaml +58 -0
src/agents/research/prompts/en/reporting_agent.yaml +380 -0
src/agents/research/prompts/en/research_agent.yaml +173 -0
src/agents/research/prompts/zh/decompose_agent.yaml +89 -0
src/agents/research/prompts/zh/manager_agent.yaml +24 -0
src/agents/research/prompts/zh/note_agent.yaml +121 -0
src/agents/research/prompts/zh/rephrase_agent.yaml +58 -0
src/agents/research/prompts/zh/reporting_agent.yaml +380 -0
src/agents/research/prompts/zh/research_agent.yaml +173 -0
src/agents/research/research_pipeline.py +1309 -0
src/agents/research/utils/__init__.py +60 -0
src/agents/research/utils/citation_manager.py +799 -0
src/agents/research/utils/json_utils.py +98 -0
src/agents/research/utils/token_tracker.py +297 -0
src/agents/solve/__init__.py +80 -0
src/agents/solve/analysis_loop/__init__.py +14 -0
src/agents/solve/analysis_loop/investigate_agent.py +414 -0
src/agents/solve/analysis_loop/note_agent.py +190 -0
src/agents/solve/main_solver.py +862 -0
src/agents/solve/memory/__init__.py +34 -0
src/agents/solve/memory/citation_memory.py +353 -0
src/agents/solve/memory/investigate_memory.py +226 -0
src/agents/solve/memory/solve_memory.py +340 -0
src/agents/solve/prompts/en/analysis_loop/investigate_agent.yaml +55 -0
src/agents/solve/prompts/en/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/en/solve_loop/manager_agent.yaml +67 -0
src/agents/solve/prompts/en/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/en/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/en/solve_loop/solve_agent.yaml +75 -0
src/agents/solve/prompts/en/solve_loop/tool_agent.yaml +38 -0
src/agents/solve/prompts/zh/analysis_loop/investigate_agent.yaml +53 -0
src/agents/solve/prompts/zh/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/zh/solve_loop/manager_agent.yaml +66 -0
src/agents/solve/prompts/zh/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/zh/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/zh/solve_loop/solve_agent.yaml +76 -0
src/agents/solve/prompts/zh/solve_loop/tool_agent.yaml +41 -0
src/agents/solve/solve_loop/__init__.py +22 -0
src/agents/solve/solve_loop/citation_manager.py +74 -0
src/agents/solve/solve_loop/manager_agent.py +274 -0
src/agents/solve/solve_loop/precision_answer_agent.py +96 -0
src/agents/solve/solve_loop/response_agent.py +301 -0
src/agents/solve/solve_loop/solve_agent.py +325 -0
src/agents/solve/solve_loop/tool_agent.py +470 -0
src/agents/solve/utils/__init__.py +64 -0
src/agents/solve/utils/config_validator.py +313 -0
src/agents/solve/utils/display_manager.py +223 -0
src/agents/solve/utils/error_handler.py +363 -0
src/agents/solve/utils/json_utils.py +98 -0
src/agents/solve/utils/performance_monitor.py +407 -0
src/agents/solve/utils/token_tracker.py +541 -0
src/api/__init__.py +0 -0
src/api/main.py +240 -0
src/api/routers/__init__.py +1 -0
src/api/routers/agent_config.py +69 -0
src/api/routers/chat.py +296 -0
src/api/routers/co_writer.py +337 -0
src/api/routers/config.py +627 -0
src/api/routers/dashboard.py +18 -0
src/api/routers/guide.py +337 -0
src/api/routers/ideagen.py +436 -0
src/api/routers/knowledge.py +821 -0
src/api/routers/notebook.py +247 -0
src/api/routers/question.py +537 -0
src/api/routers/research.py +394 -0
src/api/routers/settings.py +164 -0
src/api/routers/solve.py +305 -0
src/api/routers/system.py +252 -0
src/api/run_server.py +61 -0
src/api/utils/history.py +172 -0
src/api/utils/log_interceptor.py +21 -0
src/api/utils/notebook_manager.py +415 -0
src/api/utils/progress_broadcaster.py +72 -0
src/api/utils/task_id_manager.py +100 -0
src/config/__init__.py +0 -0
src/config/accessors.py +18 -0
src/config/constants.py +34 -0
src/config/defaults.py +18 -0
src/config/schema.py +38 -0
src/config/settings.py +50 -0
src/core/errors.py +62 -0
src/knowledge/__init__.py +23 -0
src/knowledge/add_documents.py +606 -0
src/knowledge/config.py +65 -0
src/knowledge/example_add_documents.py +236 -0
src/knowledge/extract_numbered_items.py +1039 -0
src/knowledge/initializer.py +621 -0
src/knowledge/kb.py +22 -0
src/knowledge/manager.py +782 -0
src/knowledge/progress_tracker.py +182 -0
src/knowledge/start_kb.py +535 -0
src/logging/__init__.py +103 -0
src/logging/adapters/__init__.py +17 -0
src/logging/adapters/lightrag.py +184 -0
src/logging/adapters/llamaindex.py +141 -0
src/logging/config.py +80 -0
src/logging/handlers/__init__.py +20 -0
src/logging/handlers/console.py +75 -0
src/logging/handlers/file.py +201 -0
src/logging/handlers/websocket.py +127 -0
src/logging/logger.py +709 -0
src/logging/stats/__init__.py +16 -0
src/logging/stats/llm_stats.py +179 -0
src/services/__init__.py +56 -0
src/services/config/__init__.py +61 -0
src/services/config/knowledge_base_config.py +210 -0
src/services/config/loader.py +260 -0
src/services/config/unified_config.py +603 -0
src/services/embedding/__init__.py +45 -0
src/services/embedding/adapters/__init__.py +22 -0
src/services/embedding/adapters/base.py +106 -0
src/services/embedding/adapters/cohere.py +127 -0
src/services/embedding/adapters/jina.py +99 -0
src/services/embedding/adapters/ollama.py +116 -0
src/services/embedding/adapters/openai_compatible.py +96 -0
src/services/embedding/client.py +159 -0
src/services/embedding/config.py +156 -0
src/services/embedding/provider.py +119 -0
src/services/llm/__init__.py +152 -0
src/services/llm/capabilities.py +313 -0
src/services/llm/client.py +302 -0
src/services/llm/cloud_provider.py +530 -0
src/services/llm/config.py +200 -0
src/services/llm/error_mapping.py +103 -0
src/services/llm/exceptions.py +152 -0
src/services/llm/factory.py +450 -0
src/services/llm/local_provider.py +347 -0
src/services/llm/providers/anthropic.py +95 -0
src/services/llm/providers/base_provider.py +93 -0
src/services/llm/providers/open_ai.py +83 -0
src/services/llm/registry.py +71 -0
src/services/llm/telemetry.py +40 -0
src/services/llm/types.py +27 -0
src/services/llm/utils.py +333 -0
src/services/prompt/__init__.py +25 -0
src/services/prompt/manager.py +206 -0
src/services/rag/__init__.py +64 -0
src/services/rag/components/__init__.py +29 -0
src/services/rag/components/base.py +59 -0
src/services/rag/components/chunkers/__init__.py +18 -0
src/services/rag/components/chunkers/base.py +34 -0
src/services/rag/components/chunkers/fixed.py +71 -0
src/services/rag/components/chunkers/numbered_item.py +94 -0
src/services/rag/components/chunkers/semantic.py +97 -0
src/services/rag/components/embedders/__init__.py +14 -0
src/services/rag/components/embedders/base.py +32 -0
src/services/rag/components/embedders/openai.py +63 -0
src/services/rag/components/indexers/__init__.py +18 -0
src/services/rag/components/indexers/base.py +35 -0
src/services/rag/components/indexers/graph.py +172 -0
src/services/rag/components/indexers/lightrag.py +156 -0
src/services/rag/components/indexers/vector.py +146 -0
src/services/rag/components/parsers/__init__.py +18 -0
src/services/rag/components/parsers/base.py +35 -0
src/services/rag/components/parsers/markdown.py +52 -0
src/services/rag/components/parsers/pdf.py +115 -0
src/services/rag/components/parsers/text.py +86 -0
src/services/rag/components/retrievers/__init__.py +18 -0
src/services/rag/components/retrievers/base.py +34 -0
src/services/rag/components/retrievers/dense.py +200 -0
src/services/rag/components/retrievers/hybrid.py +164 -0
src/services/rag/components/retrievers/lightrag.py +169 -0
src/services/rag/components/routing.py +286 -0
src/services/rag/factory.py +234 -0
src/services/rag/pipeline.py +215 -0
src/services/rag/pipelines/__init__.py +32 -0
src/services/rag/pipelines/academic.py +44 -0
src/services/rag/pipelines/lightrag.py +43 -0
src/services/rag/pipelines/llamaindex.py +313 -0
src/services/rag/pipelines/raganything.py +384 -0
src/services/rag/service.py +244 -0
src/services/rag/types.py +73 -0
src/services/search/__init__.py +284 -0
src/services/search/base.py +87 -0
src/services/search/consolidation.py +398 -0
src/services/search/providers/__init__.py +128 -0
src/services/search/providers/baidu.py +188 -0
src/services/search/providers/exa.py +194 -0
src/services/search/providers/jina.py +161 -0
src/services/search/providers/perplexity.py +153 -0
src/services/search/providers/serper.py +209 -0
src/services/search/providers/tavily.py +161 -0
src/services/search/types.py +114 -0
src/services/setup/__init__.py +34 -0
src/services/setup/init.py +285 -0
src/services/tts/__init__.py +16 -0
src/services/tts/config.py +99 -0
src/tools/__init__.py +91 -0
src/tools/code_executor.py +536 -0
src/tools/paper_search_tool.py +171 -0
src/tools/query_item_tool.py +310 -0
src/tools/question/__init__.py +15 -0
src/tools/question/exam_mimic.py +616 -0
src/tools/question/pdf_parser.py +211 -0
src/tools/question/question_extractor.py +397 -0
src/tools/rag_tool.py +173 -0
src/tools/tex_chunker.py +339 -0
src/tools/tex_downloader.py +253 -0
src/tools/web_search.py +71 -0
src/utils/config_manager.py +206 -0
src/utils/document_validator.py +168 -0
src/utils/error_rate_tracker.py +111 -0
src/utils/error_utils.py +82 -0
src/utils/json_parser.py +110 -0
src/utils/network/circuit_breaker.py +79 -0

src/services/llm/cloud_provider.py ADDED Viewed

@@ -0,0 +1,530 @@
+"""
+Cloud LLM Provider
+==================
+Handles all cloud API LLM calls (OpenAI, DeepSeek, Anthropic, etc.)
+Provides both complete() and stream() methods.
+"""
+import logging
+import os
+from typing import AsyncGenerator, Dict, List, Optional
+import aiohttp
+from lightrag.llm.openai import openai_complete_if_cache
+# Get loggers for suppression during fallback scenarios
+# (lightrag logs errors internally before raising exceptions)
+_lightrag_logger = logging.getLogger("lightrag")
+_openai_logger = logging.getLogger("openai")
+from .capabilities import supports_response_format
+from .config import get_token_limit_kwargs
+from .exceptions import LLMAPIError, LLMAuthenticationError, LLMConfigError
+from .utils import (
+    build_auth_headers,
+    build_chat_url,
+    clean_thinking_tags,
+    extract_response_content,
+    sanitize_url,
+)
+async def complete(
+    prompt: str,
+    system_prompt: str = "You are a helpful assistant.",
+    model: Optional[str] = None,
+    api_key: Optional[str] = None,
+    base_url: Optional[str] = None,
+    api_version: Optional[str] = None,
+    binding: str = "openai",
+    **kwargs,
+) -> str:
+    """
+    Complete a prompt using cloud API providers.
+    Supports OpenAI-compatible APIs and Anthropic.
+    Args:
+        prompt: The user prompt
+        system_prompt: System prompt for context
+        model: Model name
+        api_key: API key
+        base_url: Base URL for the API
+        api_version: API version for Azure OpenAI
+        binding: Provider binding type (openai, anthropic)
+        **kwargs: Additional parameters (temperature, max_tokens, etc.)
+    Returns:
+        str: The LLM response
+    """
+    binding_lower = (binding or "openai").lower()
+    if binding_lower in ["anthropic", "claude"]:
+        return await _anthropic_complete(
+            model=model,
+            prompt=prompt,
+            system_prompt=system_prompt,
+            api_key=api_key,
+            base_url=base_url,
+            **kwargs,
+        )
+    # Default to OpenAI-compatible endpoint
+    return await _openai_complete(
+        model=model,
+        prompt=prompt,
+        system_prompt=system_prompt,
+        api_key=api_key,
+        base_url=base_url,
+        api_version=api_version,
+        binding=binding_lower,
+        **kwargs,
+    )
+async def stream(
+    prompt: str,
+    system_prompt: str = "You are a helpful assistant.",
+    model: Optional[str] = None,
+    api_key: Optional[str] = None,
+    base_url: Optional[str] = None,
+    api_version: Optional[str] = None,
+    binding: str = "openai",
+    messages: Optional[List[Dict[str, str]]] = None,
+    **kwargs,
+) -> AsyncGenerator[str, None]:
+    """
+    Stream a response from cloud API providers.
+    Args:
+        prompt: The user prompt (ignored if messages provided)
+        system_prompt: System prompt for context
+        model: Model name
+        api_key: API key
+        base_url: Base URL for the API
+        api_version: API version for Azure OpenAI
+        binding: Provider binding type (openai, anthropic)
+        messages: Pre-built messages array (optional, overrides prompt/system_prompt)
+        **kwargs: Additional parameters (temperature, max_tokens, etc.)
+    Yields:
+        str: Response chunks
+    """
+    binding_lower = (binding or "openai").lower()
+    if binding_lower in ["anthropic", "claude"]:
+        async for chunk in _anthropic_stream(
+            model=model,
+            prompt=prompt,
+            system_prompt=system_prompt,
+            api_key=api_key,
+            base_url=base_url,
+            messages=messages,
+            **kwargs,
+        ):
+            yield chunk
+    else:
+        async for chunk in _openai_stream(
+            model=model,
+            prompt=prompt,
+            system_prompt=system_prompt,
+            api_key=api_key,
+            base_url=base_url,
+            api_version=api_version,
+            binding=binding_lower,
+            messages=messages,
+            **kwargs,
+        ):
+            yield chunk
+async def _openai_complete(
+    model: str,
+    prompt: str,
+    system_prompt: str,
+    api_key: Optional[str],
+    base_url: Optional[str],
+    api_version: Optional[str] = None,
+    binding: str = "openai",
+    **kwargs,
+) -> str:
+    """OpenAI-compatible completion."""
+    # Sanitize URL
+    if base_url:
+        base_url = sanitize_url(base_url, model)
+    # Handle API Parameter Compatibility using capabilities
+    # Remove response_format for providers that don't support it (e.g., DeepSeek)
+    if not supports_response_format(binding, model):
+        kwargs.pop("response_format", None)
+    content = None
+    try:
+        # Try using lightrag's openai_complete_if_cache first (has caching)
+        # Only pass api_version if it's set (for Azure OpenAI)
+        # Standard OpenAI SDK doesn't accept api_version parameter
+        lightrag_kwargs = {
+            "system_prompt": system_prompt,
+            "history_messages": [],  # Required by lightrag to build messages array
+            "api_key": api_key,
+            "base_url": base_url,
+            **kwargs,
+        }
+        if api_version:
+            lightrag_kwargs["api_version"] = api_version
+        # Suppress lightrag's and openai's internal error logging during the call
+        # (errors are handled by our fallback mechanism)
+        original_lightrag_level = _lightrag_logger.level
+        original_openai_level = _openai_logger.level
+        _lightrag_logger.setLevel(logging.CRITICAL)
+        _openai_logger.setLevel(logging.CRITICAL)
+        try:
+            # model and prompt must be positional arguments
+            content = await openai_complete_if_cache(model, prompt, **lightrag_kwargs)
+        finally:
+            _lightrag_logger.setLevel(original_lightrag_level)
+            _openai_logger.setLevel(original_openai_level)
+    except Exception:
+        pass  # Fall through to direct call
+    # Fallback: Direct aiohttp call
+    if not content and base_url:
+        # Build URL using unified utility (use binding for Azure detection)
+        url = build_chat_url(base_url, api_version, binding)
+        # Build headers using unified utility
+        headers = build_auth_headers(api_key, binding)
+        data = {
+            "model": model,
+            "messages": [
+                {"role": "system", "content": system_prompt},
+                {"role": "user", "content": prompt},
+            ],
+            "temperature": kwargs.get("temperature", 0.7),
+        }
+        # Handle max_tokens / max_completion_tokens based on model
+        max_tokens = kwargs.get("max_tokens") or kwargs.get("max_completion_tokens") or 4096
+        data.update(get_token_limit_kwargs(model, max_tokens))
+        # Include response_format if present in kwargs
+        if "response_format" in kwargs:
+            data["response_format"] = kwargs["response_format"]
+        timeout = aiohttp.ClientTimeout(total=120)
+        async with aiohttp.ClientSession(timeout=timeout) as session:
+            async with session.post(url, headers=headers, json=data) as resp:
+                if resp.status == 200:
+                    result = await resp.json()
+                    if "choices" in result and result["choices"]:
+                        msg = result["choices"][0].get("message", {})
+                        # Use unified response extraction
+                        content = extract_response_content(msg)
+                else:
+                    error_text = await resp.text()
+                    raise LLMAPIError(
+                        f"OpenAI API error: {error_text}",
+                        status_code=resp.status,
+                        provider=binding or "openai",
+                    )
+    if content is not None:
+        # Clean thinking tags from response using unified utility
+        return clean_thinking_tags(content, binding, model)
+    raise LLMConfigError("Cloud completion failed: no valid configuration")
+async def _openai_stream(
+    model: str,
+    prompt: str,
+    system_prompt: str,
+    api_key: Optional[str],
+    base_url: Optional[str],
+    api_version: Optional[str] = None,
+    binding: str = "openai",
+    messages: Optional[List[Dict[str, str]]] = None,
+    **kwargs,
+) -> AsyncGenerator[str, None]:
+    """OpenAI-compatible streaming."""
+    import json
+    # Sanitize URL
+    if base_url:
+        base_url = sanitize_url(base_url, model)
+    # Handle API Parameter Compatibility using capabilities
+    if not supports_response_format(binding, model):
+        kwargs.pop("response_format", None)
+    # Build URL using unified utility
+    effective_base = base_url or "https://api.openai.com/v1"
+    url = build_chat_url(effective_base, api_version, binding)
+    # Build headers using unified utility
+    headers = build_auth_headers(api_key, binding)
+    # Build messages
+    if messages:
+        msg_list = messages
+    else:
+        msg_list = [
+            {"role": "system", "content": system_prompt},
+            {"role": "user", "content": prompt},
+        ]
+    data = {
+        "model": model,
+        "messages": msg_list,
+        "temperature": kwargs.get("temperature", 0.7),
+        "stream": True,
+    }
+    # Handle max_tokens / max_completion_tokens based on model
+    max_tokens = kwargs.get("max_tokens") or kwargs.get("max_completion_tokens")
+    if max_tokens:
+        data.update(get_token_limit_kwargs(model, max_tokens))
+    # Include response_format if present in kwargs
+    if "response_format" in kwargs:
+        data["response_format"] = kwargs["response_format"]
+    timeout = aiohttp.ClientTimeout(total=300)
+    async with aiohttp.ClientSession(timeout=timeout) as session:
+        async with session.post(url, headers=headers, json=data) as resp:
+            if resp.status != 200:
+                error_text = await resp.text()
+                raise LLMAPIError(
+                    f"OpenAI stream error: {error_text}",
+                    status_code=resp.status,
+                    provider=binding or "openai",
+                )
+            # Track thinking block state for streaming
+            in_thinking_block = False
+            thinking_buffer = ""
+            async for line in resp.content:
+                line_str = line.decode("utf-8").strip()
+                if not line_str or not line_str.startswith("data:"):
+                    continue
+                data_str = line_str[5:].strip()
+                if data_str == "[DONE]":
+                    break
+                try:
+                    chunk_data = json.loads(data_str)
+                    if "choices" in chunk_data and chunk_data["choices"]:
+                        delta = chunk_data["choices"][0].get("delta", {})
+                        content = delta.get("content")
+                        if content:
+                            # Handle thinking tags in streaming
+                            if "<think>" in content:
+                                in_thinking_block = True
+                                thinking_buffer = content
+                                continue
+                            elif in_thinking_block:
+                                thinking_buffer += content
+                                if "</think>" in thinking_buffer:
+                                    # End of thinking block, clean and yield
+                                    cleaned = clean_thinking_tags(thinking_buffer, binding, model)
+                                    if cleaned:
+                                        yield cleaned
+                                    in_thinking_block = False
+                                    thinking_buffer = ""
+                                continue
+                            else:
+                                yield content
+                except json.JSONDecodeError:
+                    continue
+async def _anthropic_complete(
+    model: str,
+    prompt: str,
+    system_prompt: str,
+    api_key: Optional[str],
+    base_url: Optional[str],
+    messages: Optional[List[Dict[str, str]]] = None,
+    **kwargs,
+) -> str:
+    """Anthropic (Claude) API completion."""
+    api_key = api_key or os.getenv("ANTHROPIC_API_KEY")
+    if not api_key:
+        raise LLMAuthenticationError("Anthropic API key is missing.", provider="anthropic")
+    # Build URL using unified utility
+    effective_base = base_url or "https://api.anthropic.com/v1"
+    url = build_chat_url(effective_base, binding="anthropic")
+    # Build headers using unified utility
+    headers = build_auth_headers(api_key, binding="anthropic")
+    # Build messages - handle pre-built messages array
+    if messages:
+        # Filter out system messages for Anthropic (system is a separate parameter)
+        msg_list = [m for m in messages if m.get("role") != "system"]
+        system_content = next(
+            (m["content"] for m in messages if m.get("role") == "system"),
+            system_prompt,
+        )
+    else:
+        msg_list = [{"role": "user", "content": prompt}]
+        system_content = system_prompt
+    data = {
+        "model": model,
+        "system": system_content,
+        "messages": msg_list,
+        "max_tokens": kwargs.get("max_tokens", 4096),
+        "temperature": kwargs.get("temperature", 0.7),
+    }
+    timeout = aiohttp.ClientTimeout(total=120)
+    async with aiohttp.ClientSession(timeout=timeout) as session:
+        async with session.post(url, headers=headers, json=data) as response:
+            if response.status != 200:
+                error_text = await response.text()
+                raise LLMAPIError(
+                    f"Anthropic API error: {error_text}",
+                    status_code=response.status,
+                    provider="anthropic",
+                )
+            result = await response.json()
+            return result["content"][0]["text"]
+async def _anthropic_stream(
+    model: str,
+    prompt: str,
+    system_prompt: str,
+    api_key: Optional[str],
+    base_url: Optional[str],
+    messages: Optional[List[Dict[str, str]]] = None,
+    **kwargs,
+) -> AsyncGenerator[str, None]:
+    """Anthropic (Claude) API streaming."""
+    import json
+    api_key = api_key or os.getenv("ANTHROPIC_API_KEY")
+    if not api_key:
+        raise LLMAuthenticationError("Anthropic API key is missing.", provider="anthropic")
+    # Build URL using unified utility
+    effective_base = base_url or "https://api.anthropic.com/v1"
+    url = build_chat_url(effective_base, binding="anthropic")
+    # Build headers using unified utility
+    headers = build_auth_headers(api_key, binding="anthropic")
+    # Build messages
+    if messages:
+        # Filter out system messages for Anthropic
+        msg_list = [m for m in messages if m.get("role") != "system"]
+        system_content = next(
+            (m["content"] for m in messages if m.get("role") == "system"),
+            system_prompt,
+        )
+    else:
+        msg_list = [{"role": "user", "content": prompt}]
+        system_content = system_prompt
+    data = {
+        "model": model,
+        "system": system_content,
+        "messages": msg_list,
+        "max_tokens": kwargs.get("max_tokens", 4096),
+        "temperature": kwargs.get("temperature", 0.7),
+        "stream": True,
+    }
+    timeout = aiohttp.ClientTimeout(total=300)
+    async with aiohttp.ClientSession(timeout=timeout) as session:
+        async with session.post(url, headers=headers, json=data) as response:
+            if response.status != 200:
+                error_text = await response.text()
+                raise LLMAPIError(
+                    f"Anthropic stream error: {error_text}",
+                    status_code=response.status,
+                    provider="anthropic",
+                )
+            async for line in response.content:
+                line_str = line.decode("utf-8").strip()
+                if not line_str or not line_str.startswith("data:"):
+                    continue
+                data_str = line_str[5:].strip()
+                if not data_str:
+                    continue
+                try:
+                    chunk_data = json.loads(data_str)
+                    event_type = chunk_data.get("type")
+                    if event_type == "content_block_delta":
+                        delta = chunk_data.get("delta", {})
+                        text = delta.get("text")
+                        if text:
+                            yield text
+                except json.JSONDecodeError:
+                    continue
+async def fetch_models(
+    base_url: str,
+    api_key: Optional[str] = None,
+    binding: str = "openai",
+) -> List[str]:
+    """
+    Fetch available models from cloud provider.
+    Args:
+        base_url: API endpoint URL
+        api_key: API key
+        binding: Provider type (openai, anthropic)
+    Returns:
+        List of available model names
+    """
+    binding = binding.lower()
+    base_url = base_url.rstrip("/")
+    # Build headers using unified utility
+    headers = build_auth_headers(api_key, binding)
+    # Remove Content-Type for GET request
+    headers.pop("Content-Type", None)
+    timeout = aiohttp.ClientTimeout(total=30)
+    async with aiohttp.ClientSession(timeout=timeout) as session:
+        try:
+            url = f"{base_url}/models"
+            async with session.get(url, headers=headers) as resp:
+                if resp.status == 200:
+                    data = await resp.json()
+                    if "data" in data and isinstance(data["data"], list):
+                        return [
+                            m.get("id") or m.get("name")
+                            for m in data["data"]
+                            if m.get("id") or m.get("name")
+                        ]
+                    elif isinstance(data, list):
+                        return [
+                            m.get("id") or m.get("name") if isinstance(m, dict) else str(m)
+                            for m in data
+                        ]
+            return []
+        except Exception as e:
+            print(f"Error fetching models from {base_url}: {e}")
+            return []
+__all__ = [
+    "complete",
+    "stream",
+    "fetch_models",
+]