PyPI - realtimex-deeptutor - Versions diffs - 0.5.0.post1__py3-none-any.whl - Mend

realtimex-deeptutor 0.5.0.post1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (276) hide show

realtimex_deeptutor/__init__.py +67 -0
realtimex_deeptutor-0.5.0.post1.dist-info/METADATA +1612 -0
realtimex_deeptutor-0.5.0.post1.dist-info/RECORD +276 -0
realtimex_deeptutor-0.5.0.post1.dist-info/WHEEL +5 -0
realtimex_deeptutor-0.5.0.post1.dist-info/entry_points.txt +2 -0
realtimex_deeptutor-0.5.0.post1.dist-info/licenses/LICENSE +661 -0
realtimex_deeptutor-0.5.0.post1.dist-info/top_level.txt +2 -0
src/__init__.py +40 -0
src/agents/__init__.py +24 -0
src/agents/base_agent.py +657 -0
src/agents/chat/__init__.py +24 -0
src/agents/chat/chat_agent.py +435 -0
src/agents/chat/prompts/en/chat_agent.yaml +35 -0
src/agents/chat/prompts/zh/chat_agent.yaml +35 -0
src/agents/chat/session_manager.py +311 -0
src/agents/co_writer/__init__.py +0 -0
src/agents/co_writer/edit_agent.py +260 -0
src/agents/co_writer/narrator_agent.py +423 -0
src/agents/co_writer/prompts/en/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/en/narrator_agent.yaml +88 -0
src/agents/co_writer/prompts/zh/edit_agent.yaml +113 -0
src/agents/co_writer/prompts/zh/narrator_agent.yaml +88 -0
src/agents/guide/__init__.py +16 -0
src/agents/guide/agents/__init__.py +11 -0
src/agents/guide/agents/chat_agent.py +104 -0
src/agents/guide/agents/interactive_agent.py +223 -0
src/agents/guide/agents/locate_agent.py +149 -0
src/agents/guide/agents/summary_agent.py +150 -0
src/agents/guide/guide_manager.py +500 -0
src/agents/guide/prompts/en/chat_agent.yaml +41 -0
src/agents/guide/prompts/en/interactive_agent.yaml +202 -0
src/agents/guide/prompts/en/locate_agent.yaml +68 -0
src/agents/guide/prompts/en/summary_agent.yaml +157 -0
src/agents/guide/prompts/zh/chat_agent.yaml +41 -0
src/agents/guide/prompts/zh/interactive_agent.yaml +626 -0
src/agents/guide/prompts/zh/locate_agent.yaml +68 -0
src/agents/guide/prompts/zh/summary_agent.yaml +157 -0
src/agents/ideagen/__init__.py +12 -0
src/agents/ideagen/idea_generation_workflow.py +426 -0
src/agents/ideagen/material_organizer_agent.py +173 -0
src/agents/ideagen/prompts/en/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/en/material_organizer.yaml +69 -0
src/agents/ideagen/prompts/zh/idea_generation.yaml +187 -0
src/agents/ideagen/prompts/zh/material_organizer.yaml +69 -0
src/agents/question/__init__.py +24 -0
src/agents/question/agents/__init__.py +18 -0
src/agents/question/agents/generate_agent.py +381 -0
src/agents/question/agents/relevance_analyzer.py +207 -0
src/agents/question/agents/retrieve_agent.py +239 -0
src/agents/question/coordinator.py +718 -0
src/agents/question/example.py +109 -0
src/agents/question/prompts/en/coordinator.yaml +75 -0
src/agents/question/prompts/en/generate_agent.yaml +77 -0
src/agents/question/prompts/en/relevance_analyzer.yaml +41 -0
src/agents/question/prompts/en/retrieve_agent.yaml +32 -0
src/agents/question/prompts/zh/coordinator.yaml +75 -0
src/agents/question/prompts/zh/generate_agent.yaml +77 -0
src/agents/question/prompts/zh/relevance_analyzer.yaml +39 -0
src/agents/question/prompts/zh/retrieve_agent.yaml +30 -0
src/agents/research/agents/__init__.py +23 -0
src/agents/research/agents/decompose_agent.py +507 -0
src/agents/research/agents/manager_agent.py +228 -0
src/agents/research/agents/note_agent.py +180 -0
src/agents/research/agents/rephrase_agent.py +263 -0
src/agents/research/agents/reporting_agent.py +1333 -0
src/agents/research/agents/research_agent.py +714 -0
src/agents/research/data_structures.py +451 -0
src/agents/research/main.py +188 -0
src/agents/research/prompts/en/decompose_agent.yaml +89 -0
src/agents/research/prompts/en/manager_agent.yaml +24 -0
src/agents/research/prompts/en/note_agent.yaml +121 -0
src/agents/research/prompts/en/rephrase_agent.yaml +58 -0
src/agents/research/prompts/en/reporting_agent.yaml +380 -0
src/agents/research/prompts/en/research_agent.yaml +173 -0
src/agents/research/prompts/zh/decompose_agent.yaml +89 -0
src/agents/research/prompts/zh/manager_agent.yaml +24 -0
src/agents/research/prompts/zh/note_agent.yaml +121 -0
src/agents/research/prompts/zh/rephrase_agent.yaml +58 -0
src/agents/research/prompts/zh/reporting_agent.yaml +380 -0
src/agents/research/prompts/zh/research_agent.yaml +173 -0
src/agents/research/research_pipeline.py +1309 -0
src/agents/research/utils/__init__.py +60 -0
src/agents/research/utils/citation_manager.py +799 -0
src/agents/research/utils/json_utils.py +98 -0
src/agents/research/utils/token_tracker.py +297 -0
src/agents/solve/__init__.py +80 -0
src/agents/solve/analysis_loop/__init__.py +14 -0
src/agents/solve/analysis_loop/investigate_agent.py +414 -0
src/agents/solve/analysis_loop/note_agent.py +190 -0
src/agents/solve/main_solver.py +862 -0
src/agents/solve/memory/__init__.py +34 -0
src/agents/solve/memory/citation_memory.py +353 -0
src/agents/solve/memory/investigate_memory.py +226 -0
src/agents/solve/memory/solve_memory.py +340 -0
src/agents/solve/prompts/en/analysis_loop/investigate_agent.yaml +55 -0
src/agents/solve/prompts/en/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/en/solve_loop/manager_agent.yaml +67 -0
src/agents/solve/prompts/en/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/en/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/en/solve_loop/solve_agent.yaml +75 -0
src/agents/solve/prompts/en/solve_loop/tool_agent.yaml +38 -0
src/agents/solve/prompts/zh/analysis_loop/investigate_agent.yaml +53 -0
src/agents/solve/prompts/zh/analysis_loop/note_agent.yaml +54 -0
src/agents/solve/prompts/zh/solve_loop/manager_agent.yaml +66 -0
src/agents/solve/prompts/zh/solve_loop/precision_answer_agent.yaml +62 -0
src/agents/solve/prompts/zh/solve_loop/response_agent.yaml +90 -0
src/agents/solve/prompts/zh/solve_loop/solve_agent.yaml +76 -0
src/agents/solve/prompts/zh/solve_loop/tool_agent.yaml +41 -0
src/agents/solve/solve_loop/__init__.py +22 -0
src/agents/solve/solve_loop/citation_manager.py +74 -0
src/agents/solve/solve_loop/manager_agent.py +274 -0
src/agents/solve/solve_loop/precision_answer_agent.py +96 -0
src/agents/solve/solve_loop/response_agent.py +301 -0
src/agents/solve/solve_loop/solve_agent.py +325 -0
src/agents/solve/solve_loop/tool_agent.py +470 -0
src/agents/solve/utils/__init__.py +64 -0
src/agents/solve/utils/config_validator.py +313 -0
src/agents/solve/utils/display_manager.py +223 -0
src/agents/solve/utils/error_handler.py +363 -0
src/agents/solve/utils/json_utils.py +98 -0
src/agents/solve/utils/performance_monitor.py +407 -0
src/agents/solve/utils/token_tracker.py +541 -0
src/api/__init__.py +0 -0
src/api/main.py +240 -0
src/api/routers/__init__.py +1 -0
src/api/routers/agent_config.py +69 -0
src/api/routers/chat.py +296 -0
src/api/routers/co_writer.py +337 -0
src/api/routers/config.py +627 -0
src/api/routers/dashboard.py +18 -0
src/api/routers/guide.py +337 -0
src/api/routers/ideagen.py +436 -0
src/api/routers/knowledge.py +821 -0
src/api/routers/notebook.py +247 -0
src/api/routers/question.py +537 -0
src/api/routers/research.py +394 -0
src/api/routers/settings.py +164 -0
src/api/routers/solve.py +305 -0
src/api/routers/system.py +252 -0
src/api/run_server.py +61 -0
src/api/utils/history.py +172 -0
src/api/utils/log_interceptor.py +21 -0
src/api/utils/notebook_manager.py +415 -0
src/api/utils/progress_broadcaster.py +72 -0
src/api/utils/task_id_manager.py +100 -0
src/config/__init__.py +0 -0
src/config/accessors.py +18 -0
src/config/constants.py +34 -0
src/config/defaults.py +18 -0
src/config/schema.py +38 -0
src/config/settings.py +50 -0
src/core/errors.py +62 -0
src/knowledge/__init__.py +23 -0
src/knowledge/add_documents.py +606 -0
src/knowledge/config.py +65 -0
src/knowledge/example_add_documents.py +236 -0
src/knowledge/extract_numbered_items.py +1039 -0
src/knowledge/initializer.py +621 -0
src/knowledge/kb.py +22 -0
src/knowledge/manager.py +782 -0
src/knowledge/progress_tracker.py +182 -0
src/knowledge/start_kb.py +535 -0
src/logging/__init__.py +103 -0
src/logging/adapters/__init__.py +17 -0
src/logging/adapters/lightrag.py +184 -0
src/logging/adapters/llamaindex.py +141 -0
src/logging/config.py +80 -0
src/logging/handlers/__init__.py +20 -0
src/logging/handlers/console.py +75 -0
src/logging/handlers/file.py +201 -0
src/logging/handlers/websocket.py +127 -0
src/logging/logger.py +709 -0
src/logging/stats/__init__.py +16 -0
src/logging/stats/llm_stats.py +179 -0
src/services/__init__.py +56 -0
src/services/config/__init__.py +61 -0
src/services/config/knowledge_base_config.py +210 -0
src/services/config/loader.py +260 -0
src/services/config/unified_config.py +603 -0
src/services/embedding/__init__.py +45 -0
src/services/embedding/adapters/__init__.py +22 -0
src/services/embedding/adapters/base.py +106 -0
src/services/embedding/adapters/cohere.py +127 -0
src/services/embedding/adapters/jina.py +99 -0
src/services/embedding/adapters/ollama.py +116 -0
src/services/embedding/adapters/openai_compatible.py +96 -0
src/services/embedding/client.py +159 -0
src/services/embedding/config.py +156 -0
src/services/embedding/provider.py +119 -0
src/services/llm/__init__.py +152 -0
src/services/llm/capabilities.py +313 -0
src/services/llm/client.py +302 -0
src/services/llm/cloud_provider.py +530 -0
src/services/llm/config.py +200 -0
src/services/llm/error_mapping.py +103 -0
src/services/llm/exceptions.py +152 -0
src/services/llm/factory.py +450 -0
src/services/llm/local_provider.py +347 -0
src/services/llm/providers/anthropic.py +95 -0
src/services/llm/providers/base_provider.py +93 -0
src/services/llm/providers/open_ai.py +83 -0
src/services/llm/registry.py +71 -0
src/services/llm/telemetry.py +40 -0
src/services/llm/types.py +27 -0
src/services/llm/utils.py +333 -0
src/services/prompt/__init__.py +25 -0
src/services/prompt/manager.py +206 -0
src/services/rag/__init__.py +64 -0
src/services/rag/components/__init__.py +29 -0
src/services/rag/components/base.py +59 -0
src/services/rag/components/chunkers/__init__.py +18 -0
src/services/rag/components/chunkers/base.py +34 -0
src/services/rag/components/chunkers/fixed.py +71 -0
src/services/rag/components/chunkers/numbered_item.py +94 -0
src/services/rag/components/chunkers/semantic.py +97 -0
src/services/rag/components/embedders/__init__.py +14 -0
src/services/rag/components/embedders/base.py +32 -0
src/services/rag/components/embedders/openai.py +63 -0
src/services/rag/components/indexers/__init__.py +18 -0
src/services/rag/components/indexers/base.py +35 -0
src/services/rag/components/indexers/graph.py +172 -0
src/services/rag/components/indexers/lightrag.py +156 -0
src/services/rag/components/indexers/vector.py +146 -0
src/services/rag/components/parsers/__init__.py +18 -0
src/services/rag/components/parsers/base.py +35 -0
src/services/rag/components/parsers/markdown.py +52 -0
src/services/rag/components/parsers/pdf.py +115 -0
src/services/rag/components/parsers/text.py +86 -0
src/services/rag/components/retrievers/__init__.py +18 -0
src/services/rag/components/retrievers/base.py +34 -0
src/services/rag/components/retrievers/dense.py +200 -0
src/services/rag/components/retrievers/hybrid.py +164 -0
src/services/rag/components/retrievers/lightrag.py +169 -0
src/services/rag/components/routing.py +286 -0
src/services/rag/factory.py +234 -0
src/services/rag/pipeline.py +215 -0
src/services/rag/pipelines/__init__.py +32 -0
src/services/rag/pipelines/academic.py +44 -0
src/services/rag/pipelines/lightrag.py +43 -0
src/services/rag/pipelines/llamaindex.py +313 -0
src/services/rag/pipelines/raganything.py +384 -0
src/services/rag/service.py +244 -0
src/services/rag/types.py +73 -0
src/services/search/__init__.py +284 -0
src/services/search/base.py +87 -0
src/services/search/consolidation.py +398 -0
src/services/search/providers/__init__.py +128 -0
src/services/search/providers/baidu.py +188 -0
src/services/search/providers/exa.py +194 -0
src/services/search/providers/jina.py +161 -0
src/services/search/providers/perplexity.py +153 -0
src/services/search/providers/serper.py +209 -0
src/services/search/providers/tavily.py +161 -0
src/services/search/types.py +114 -0
src/services/setup/__init__.py +34 -0
src/services/setup/init.py +285 -0
src/services/tts/__init__.py +16 -0
src/services/tts/config.py +99 -0
src/tools/__init__.py +91 -0
src/tools/code_executor.py +536 -0
src/tools/paper_search_tool.py +171 -0
src/tools/query_item_tool.py +310 -0
src/tools/question/__init__.py +15 -0
src/tools/question/exam_mimic.py +616 -0
src/tools/question/pdf_parser.py +211 -0
src/tools/question/question_extractor.py +397 -0
src/tools/rag_tool.py +173 -0
src/tools/tex_chunker.py +339 -0
src/tools/tex_downloader.py +253 -0
src/tools/web_search.py +71 -0
src/utils/config_manager.py +206 -0
src/utils/document_validator.py +168 -0
src/utils/error_rate_tracker.py +111 -0
src/utils/error_utils.py +82 -0
src/utils/json_parser.py +110 -0
src/utils/network/circuit_breaker.py +79 -0

src/agents/question/coordinator.py ADDED Viewed

@@ -0,0 +1,718 @@
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+"""
+AgentCoordinator - Orchestrates question generation workflow.
+Refactored version:
+- Uses specialized agents: RetrieveAgent, GenerateAgent, RelevanceAnalyzer
+- No iterative validation loops - single-pass generation + relevance analysis
+- All questions are accepted, classified as "high" or "partial" relevance
+"""
+from collections.abc import Callable
+from datetime import datetime
+import json
+from pathlib import Path
+import sys
+from typing import Any
+# Add project root for imports
+project_root = Path(__file__).parent.parent.parent.parent
+sys.path.insert(0, str(project_root))
+from src.logging import Logger, get_logger
+from src.services.config import load_config_with_main
+from .agents.generate_agent import GenerateAgent
+from .agents.relevance_analyzer import RelevanceAnalyzer
+from .agents.retrieve_agent import RetrieveAgent
+class AgentCoordinator:
+    """
+    Coordinate question generation workflow using specialized agents.
+    Workflow:
+    1. RetrieveAgent: Generate queries and retrieve knowledge
+    2. Plan: Generate question plan with focuses
+    3. GenerateAgent: Generate questions
+    4. RelevanceAnalyzer: Analyze relevance (no rejection, just classification)
+    """
+    def __init__(
+        self,
+        api_key: str | None = None,
+        base_url: str | None = None,
+        api_version: str | None = None,
+        max_rounds: int = 10,  # Kept for backward compatibility, but not used for iteration
+        kb_name: str | None = None,
+        output_dir: str | None = None,
+        language: str = "en",
+    ):
+        """
+        Initialize the coordinator.
+        Args:
+            api_key: API key (optional, loaded from config if not provided)
+            base_url: API endpoint (optional)
+            api_version: API version for Azure (optional)
+            max_rounds: Deprecated, kept for backward compatibility
+            kb_name: Knowledge base name
+            output_dir: Output directory for results
+            language: Language for prompts ("en" or "zh")
+        """
+        self.kb_name = kb_name
+        self.output_dir = output_dir
+        self.language = language
+        # Store API credentials for creating agents
+        self._api_key = api_key
+        self._base_url = base_url
+        self._api_version = api_version
+        # Load configuration
+        self.config = load_config_with_main("question_config.yaml", project_root)
+        # Initialize logger
+        log_dir = self.config.get("paths", {}).get("user_log_dir") or self.config.get(
+            "logging", {}
+        ).get("log_dir")
+        self.logger: Logger = get_logger("QuestionCoordinator", log_dir=log_dir)
+        # Get config values
+        question_cfg = self.config.get("question", {})
+        self.rag_query_count = question_cfg.get("rag_query_count", 3)
+        self.max_parallel_questions = question_cfg.get("max_parallel_questions", 1)
+        self.rag_mode = question_cfg.get("rag_mode", "naive")
+        # Token tracking - will be updated from BaseAgent shared stats
+        self.token_stats = {
+            "model": "gpt-4o-mini",
+            "calls": 0,
+            "tokens": 0,
+            "input_tokens": 0,
+            "output_tokens": 0,
+            "cost": 0.0,
+        }
+        # WebSocket callback for streaming updates
+        self._ws_callback: Callable | None = None
+    def _update_token_stats(self):
+        """Update token_stats from BaseAgent's shared LLMStats for the question module."""
+        from src.agents.base_agent import BaseAgent
+        try:
+            stats = BaseAgent.get_stats("question")
+            summary = stats.get_summary()
+            self.token_stats = {
+                "model": summary.get("model", "gpt-4o-mini"),
+                "calls": summary.get("calls", 0),
+                "tokens": summary.get("total_tokens", 0),
+                "input_tokens": summary.get("input_tokens", 0),
+                "output_tokens": summary.get("output_tokens", 0),
+                "cost": summary.get("cost", 0.0),
+            }
+        except Exception as e:
+            self.logger.debug(f"Failed to update token stats: {e}")
+    def set_ws_callback(self, callback: Callable):
+        """Set WebSocket callback for streaming updates to frontend."""
+        self._ws_callback = callback
+    async def _send_ws_update(self, update_type: str, data: dict[str, Any]):
+        """Send update via WebSocket callback if available."""
+        if self._ws_callback:
+            try:
+                await self._ws_callback({"type": update_type, **data})
+            except Exception as e:
+                self.logger.debug(f"Failed to send WS update: {e}")
+    def _create_retrieve_agent(self) -> RetrieveAgent:
+        """Create a RetrieveAgent instance."""
+        return RetrieveAgent(
+            kb_name=self.kb_name,
+            rag_mode=self.rag_mode,
+            language=self.language,
+            api_key=self._api_key,
+            base_url=self._base_url,
+            api_version=self._api_version,
+        )
+    def _create_generate_agent(self) -> GenerateAgent:
+        """Create a GenerateAgent instance."""
+        return GenerateAgent(
+            language=self.language,
+            api_key=self._api_key,
+            base_url=self._base_url,
+            api_version=self._api_version,
+        )
+    def _create_relevance_analyzer(self) -> RelevanceAnalyzer:
+        """Create a RelevanceAnalyzer instance."""
+        return RelevanceAnalyzer(
+            language=self.language,
+            api_key=self._api_key,
+            base_url=self._base_url,
+            api_version=self._api_version,
+        )
+    # =========================================================================
+    # Main Entry Points
+    # =========================================================================
+    async def generate_question(
+        self,
+        requirement: dict[str, Any],
+    ) -> dict[str, Any]:
+        """
+        Generate a single question with relevance analysis.
+        This is used by Mimic mode and for single question generation.
+        Args:
+            requirement: Question requirement dict
+        Returns:
+            Dict with:
+                - success: bool
+                - question: Generated question dict
+                - analysis: Relevance analysis result
+                - rounds: Always 1 (no iteration)
+        """
+        self.logger.section("Single Question Generation")
+        self.logger.info(f"Knowledge point: {requirement.get('knowledge_point', 'N/A')}")
+        await self._send_ws_update(
+            "progress", {"stage": "generating", "progress": {"status": "initializing"}}
+        )
+        # Step 1: Retrieve knowledge
+        retrieve_agent = self._create_retrieve_agent()
+        retrieval_result = await retrieve_agent.process(
+            requirement=requirement,
+            num_queries=self.rag_query_count,
+        )
+        if not retrieval_result.get("has_content"):
+            self.logger.warning("No relevant knowledge found")
+            return {
+                "success": False,
+                "error": "knowledge_not_found",
+                "message": "Knowledge base does not contain relevant information.",
+            }
+        knowledge_context = retrieval_result["summary"]
+        # Step 2: Generate question
+        generate_agent = self._create_generate_agent()
+        # Check if this is mimic mode (has reference_question)
+        reference_question = requirement.get("reference_question")
+        gen_result = await generate_agent.process(
+            requirement=requirement,
+            knowledge_context=knowledge_context,
+            reference_question=reference_question,
+        )
+        if not gen_result.get("success"):
+            self.logger.error(f"Question generation failed: {gen_result.get('error')}")
+            return {
+                "success": False,
+                "error": gen_result.get("error", "Generation failed"),
+            }
+        question = gen_result["question"]
+        # Step 3: Analyze relevance
+        analyzer = self._create_relevance_analyzer()
+        analysis = await analyzer.process(
+            question=question,
+            knowledge_context=knowledge_context,
+        )
+        self.logger.success(f"Question generated with {analysis['relevance']} relevance")
+        # Build result (compatible with old format)
+        result = {
+            "success": True,
+            "question": question,
+            "validation": {
+                "decision": "approve",  # Always approve
+                "relevance": analysis["relevance"],
+                "kb_coverage": analysis["kb_coverage"],
+                "extension_points": analysis.get("extension_points", ""),
+            },
+            "rounds": 1,  # No iteration
+        }
+        # Save to disk if output_dir is set
+        if self.output_dir:
+            self._save_question_result(result, requirement)
+        # Update token stats from shared LLMStats
+        self._update_token_stats()
+        return result
+    async def generate_questions_custom(
+        self,
+        requirement: dict[str, Any],
+        num_questions: int,
+    ) -> dict[str, Any]:
+        """
+        Custom mode: Generate multiple questions from a requirement.
+        Flow:
+        1. Researching: Retrieve background knowledge
+        2. Planning: Generate question plan with focuses
+        3. Generating: Generate each question + relevance analysis
+        Args:
+            requirement: Base requirement dict (knowledge_point, difficulty, question_type)
+            num_questions: Number of questions to generate
+        Returns:
+            Summary dict with all results
+        """
+        if num_questions <= 0:
+            raise ValueError("num_questions must be greater than zero")
+        self.logger.section(f"Custom Mode Generation: {num_questions} question(s)")
+        # Create batch directory
+        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+        batch_dir = Path(self.output_dir) / f"batch_{timestamp}" if self.output_dir else None
+        if batch_dir:
+            batch_dir.mkdir(parents=True, exist_ok=True)
+        # =====================================================================
+        # Stage 1: Researching
+        # =====================================================================
+        self.logger.stage("Stage 1: Researching")
+        await self._send_ws_update(
+            "progress",
+            {"stage": "researching", "progress": {"status": "retrieving"}, "total": num_questions},
+        )
+        retrieve_agent = self._create_retrieve_agent()
+        retrieval_result = await retrieve_agent.process(
+            requirement=requirement,
+            num_queries=self.rag_query_count,
+        )
+        if not retrieval_result.get("has_content"):
+            self.logger.warning("No relevant knowledge found")
+            return {
+                "success": False,
+                "error": "knowledge_not_found",
+                "message": "Knowledge base does not contain relevant information.",
+                "search_queries": retrieval_result.get("queries", []),
+            }
+        knowledge_context = retrieval_result["summary"]
+        queries = retrieval_result["queries"]
+        # Save knowledge.json
+        if batch_dir:
+            self._save_knowledge_json(batch_dir, retrieval_result)
+        await self._send_ws_update("knowledge_saved", {"queries": queries})
+        # =====================================================================
+        # Stage 2: Planning
+        # =====================================================================
+        self.logger.stage("Stage 2: Planning")
+        await self._send_ws_update(
+            "progress", {"stage": "planning", "progress": {"status": "creating_plan"}}
+        )
+        plan = await self._generate_question_plan(requirement, knowledge_context, num_questions)
+        focuses = plan.get("focuses", [])
+        # Save plan.json
+        if batch_dir:
+            self._save_plan_json(batch_dir, plan)
+        await self._send_ws_update("plan_ready", {"plan": plan, "focuses": focuses})
+        # =====================================================================
+        # Stage 3: Generating
+        # =====================================================================
+        self.logger.stage("Stage 3: Generating")
+        await self._send_ws_update(
+            "progress",
+            {"stage": "generating", "progress": {"current": 0, "total": num_questions}},
+        )
+        results = []
+        failures = []
+        generate_agent = self._create_generate_agent()
+        analyzer = self._create_relevance_analyzer()
+        for idx, focus in enumerate(focuses):
+            question_id = focus.get("id", f"q_{idx + 1}")
+            self.logger.info(f"Generating question {question_id}")
+            await self._send_ws_update(
+                "question_update",
+                {
+                    "question_id": question_id,
+                    "status": "generating",
+                    "focus": focus.get("focus", ""),
+                },
+            )
+            # Generate question
+            gen_result = await generate_agent.process(
+                requirement=requirement,
+                knowledge_context=knowledge_context,
+                focus=focus,
+            )
+            if not gen_result.get("success"):
+                self.logger.error(f"Failed to generate question {question_id}")
+                failures.append(
+                    {
+                        "question_id": question_id,
+                        "error": gen_result.get("error", "Unknown error"),
+                    }
+                )
+                await self._send_ws_update(
+                    "question_update", {"question_id": question_id, "status": "error"}
+                )
+                continue
+            question = gen_result["question"]
+            # Analyze relevance
+            await self._send_ws_update(
+                "question_update", {"question_id": question_id, "status": "analyzing"}
+            )
+            analysis = await analyzer.process(
+                question=question,
+                knowledge_context=knowledge_context,
+            )
+            # Build validation dict (compatible with frontend)
+            validation = {
+                "decision": "approve",
+                "relevance": analysis["relevance"],
+                "kb_coverage": analysis["kb_coverage"],
+                "extension_points": analysis.get("extension_points", ""),
+            }
+            # Save result
+            result = {
+                "question_id": question_id,
+                "focus": focus,
+                "question": question,
+                "analysis": analysis,
+                "validation": validation,  # For frontend compatibility
+            }
+            if batch_dir:
+                self._save_custom_question_result(batch_dir, result)
+            results.append(result)
+            await self._send_ws_update(
+                "question_update", {"question_id": question_id, "status": "done"}
+            )
+            await self._send_ws_update(
+                "result",
+                {
+                    "question_id": question_id,
+                    "question": question,
+                    "validation": validation,  # Frontend expects 'validation'
+                    "focus": focus,
+                    "index": idx,
+                },
+            )
+            await self._send_ws_update(
+                "progress",
+                {"stage": "generating", "progress": {"current": idx + 1, "total": num_questions}},
+            )
+        # =====================================================================
+        # Complete
+        # =====================================================================
+        summary = {
+            "success": len(results) == num_questions,
+            "requested": num_questions,
+            "completed": len(results),
+            "failed": len(failures),
+            "search_queries": queries,
+            "plan": plan,
+            "results": results,
+            "failures": failures,
+        }
+        if batch_dir:
+            summary_file = batch_dir / "summary.json"
+            with open(summary_file, "w", encoding="utf-8") as f:
+                json.dump(summary, f, indent=2, ensure_ascii=False)
+            summary["output_dir"] = str(batch_dir)
+        # Update token stats from shared LLMStats
+        self._update_token_stats()
+        await self._send_ws_update(
+            "progress",
+            {
+                "stage": "complete",
+                "completed": len(results),
+                "failed": len(failures),
+                "total": num_questions,
+            },
+        )
+        self.logger.section("Generation Summary")
+        self.logger.info(f"Requested: {num_questions}")
+        self.logger.info(f"Completed: {len(results)}")
+        self.logger.info(f"Failed: {len(failures)}")
+        return summary
+    # =========================================================================
+    # Helper Methods
+    # =========================================================================
+    async def _generate_question_plan(
+        self,
+        requirement: dict[str, Any],
+        knowledge_context: str,
+        num_questions: int,
+    ) -> dict[str, Any]:
+        """
+        Generate a question plan with distinct focuses.
+        Args:
+            requirement: Base requirement
+            knowledge_context: Retrieved knowledge summary
+            num_questions: Number of questions
+        Returns:
+            Plan dict with focuses array
+        """
+        from src.services.llm import complete as llm_complete
+        from src.services.llm.config import get_llm_config
+        llm_config = get_llm_config()
+        system_prompt = (
+            "You are an educational content planner. Create distinct question focuses "
+            "that test different aspects of the same topic.\n\n"
+            "CRITICAL: Return ONLY valid JSON. Do not wrap in markdown code blocks.\n"
+            'Output JSON with key "focuses" containing an array of objects, each with:\n'
+            '- "id": string like "q_1", "q_2"\n'
+            '- "focus": string describing what aspect to test\n'
+            f'- "type": "{requirement.get("question_type", "written")}"'
+        )
+        # Truncate knowledge context consistently (4000 chars across all agents)
+        truncated_knowledge = (
+            knowledge_context[:4000] if len(knowledge_context) > 4000 else knowledge_context
+        )
+        truncation_suffix = "...[truncated]" if len(knowledge_context) > 4000 else ""
+        user_prompt = (
+            f"Topic: {requirement.get('knowledge_point', '')}\n"
+            f"Difficulty: {requirement.get('difficulty', 'medium')}\n"
+            f"Question Type: {requirement.get('question_type', 'written')}\n"
+            f"Number: {num_questions}\n\n"
+            f"Knowledge:\n{truncated_knowledge}{truncation_suffix}\n\n"
+            f"Generate exactly {num_questions} distinct focuses in JSON."
+        )
+        try:
+            response = await llm_complete(
+                prompt=user_prompt,
+                system_prompt=system_prompt,
+                model=llm_config.model,
+                api_key=self._api_key or llm_config.api_key,
+                base_url=self._base_url or llm_config.base_url,
+                api_version=self._api_version,
+                response_format={"type": "json_object"},
+                temperature=0.3,
+            )
+            data = json.loads(response)
+            focuses = data.get("focuses", [])
+            if not isinstance(focuses, list):
+                focuses = []
+        except Exception as e:
+            self.logger.warning(f"Failed to generate plan: {e}")
+            focuses = []
+        # Fallback: create simple focuses
+        if len(focuses) < num_questions:
+            question_type = requirement.get("question_type", "written")
+            for i in range(len(focuses), num_questions):
+                focuses.append(
+                    {
+                        "id": f"q_{i + 1}",
+                        "focus": f"Aspect {i + 1} of {requirement.get('knowledge_point', 'topic')}",
+                        "type": question_type,
+                    }
+                )
+        return {
+            "knowledge_point": requirement.get("knowledge_point", ""),
+            "difficulty": requirement.get("difficulty", "medium"),
+            "question_type": requirement.get("question_type", "written"),
+            "num_questions": num_questions,
+            "focuses": focuses[:num_questions],
+        }
+    def _save_question_result(
+        self,
+        result: dict[str, Any],
+        requirement: dict[str, Any],
+    ) -> str | None:
+        """Save a single question result to disk."""
+        if not self.output_dir:
+            return None
+        try:
+            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+            output_path = Path(self.output_dir) / f"question_{timestamp}"
+            output_path.mkdir(parents=True, exist_ok=True)
+            # Save result.json
+            with open(output_path / "result.json", "w", encoding="utf-8") as f:
+                json.dump(result, f, indent=2, ensure_ascii=False)
+            # Save question.md
+            question = result.get("question", {})
+            validation = result.get("validation", {})
+            md_content = f"""# Generated Question
+**Knowledge point**: {requirement.get("knowledge_point", question.get("knowledge_point", "N/A"))}
+**Difficulty**: {requirement.get("difficulty", "N/A")}
+**Type**: {question.get("question_type", "N/A")}
+**Relevance**: {validation.get("relevance", "N/A")}
+---
+## Question
+{question.get("question", "")}
+"""
+            if question.get("options"):
+                md_content += "## Options\n"
+                for key, value in question.get("options", {}).items():
+                    md_content += f"- **{key}**: {value}\n"
+                md_content += "\n"
+            md_content += f"""
+## Answer
+{question.get("correct_answer", "")}
+## Explanation
+{question.get("explanation", "")}
+---
+## Relevance Analysis
+**KB Coverage**: {validation.get("kb_coverage", "")}
+"""
+            if validation.get("extension_points"):
+                md_content += f"\n**Extension Points**: {validation.get('extension_points', '')}"
+            with open(output_path / "question.md", "w", encoding="utf-8") as f:
+                f.write(md_content)
+            self.logger.info(f"Result saved to: {output_path}")
+            return str(output_path)
+        except Exception as e:
+            self.logger.warning(f"Failed to save result: {e}")
+            return None
+    def _save_knowledge_json(
+        self,
+        batch_dir: Path,
+        retrieval_result: dict[str, Any],
+    ):
+        """Save knowledge.json for a batch."""
+        knowledge_file = batch_dir / "knowledge.json"
+        with open(knowledge_file, "w", encoding="utf-8") as f:
+            json.dump(
+                {
+                    "queries": retrieval_result.get("queries", []),
+                    "retrievals": retrieval_result.get("retrievals", []),
+                },
+                f,
+                indent=2,
+                ensure_ascii=False,
+            )
+    def _save_plan_json(self, batch_dir: Path, plan: dict[str, Any]):
+        """Save plan.json for a batch."""
+        plan_file = batch_dir / "plan.json"
+        with open(plan_file, "w", encoding="utf-8") as f:
+            json.dump(plan, f, indent=2, ensure_ascii=False)
+    def _save_custom_question_result(
+        self,
+        batch_dir: Path,
+        result: dict[str, Any],
+    ):
+        """Save a single question result in custom mode."""
+        question_id = result.get("question_id", "q_unknown")
+        question_dir = batch_dir / question_id
+        question_dir.mkdir(parents=True, exist_ok=True)
+        # Save result.json
+        with open(question_dir / "result.json", "w", encoding="utf-8") as f:
+            json.dump(result, f, indent=2, ensure_ascii=False)
+        # Save question.md
+        question = result.get("question", {})
+        analysis = result.get("analysis", {})
+        focus = result.get("focus", {})
+        md_content = f"""# Generated Question
+**Focus**: {focus.get("focus", "N/A")}
+**Type**: {question.get("question_type", "N/A")}
+**Relevance**: {analysis.get("relevance", "N/A")}
+---
+## Question
+{question.get("question", "")}
+"""
+        if question.get("options"):
+            md_content += "## Options\n"
+            for key, value in question.get("options", {}).items():
+                md_content += f"- **{key}**: {value}\n"
+            md_content += "\n"
+        md_content += f"""
+## Answer
+{question.get("correct_answer", "")}
+## Explanation
+{question.get("explanation", "")}
+---
+## Relevance Analysis
+**KB Coverage**: {analysis.get("kb_coverage", "")}
+"""
+        if analysis.get("extension_points"):
+            md_content += f"\n**Extension Points**: {analysis.get('extension_points', '')}"
+        with open(question_dir / "question.md", "w", encoding="utf-8") as f:
+            f.write(md_content)