PyPI - MemoryOS - Versions diffs - 2.0.3__py3-none-any.whl - Mend

MemoryOS 2.0.3__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (315) hide show

memoryos-2.0.3.dist-info/METADATA +418 -0
memoryos-2.0.3.dist-info/RECORD +315 -0
memoryos-2.0.3.dist-info/WHEEL +4 -0
memoryos-2.0.3.dist-info/entry_points.txt +3 -0
memoryos-2.0.3.dist-info/licenses/LICENSE +201 -0
memos/__init__.py +20 -0
memos/api/client.py +571 -0
memos/api/config.py +1018 -0
memos/api/context/dependencies.py +50 -0
memos/api/exceptions.py +53 -0
memos/api/handlers/__init__.py +62 -0
memos/api/handlers/add_handler.py +158 -0
memos/api/handlers/base_handler.py +194 -0
memos/api/handlers/chat_handler.py +1401 -0
memos/api/handlers/component_init.py +388 -0
memos/api/handlers/config_builders.py +190 -0
memos/api/handlers/feedback_handler.py +93 -0
memos/api/handlers/formatters_handler.py +237 -0
memos/api/handlers/memory_handler.py +316 -0
memos/api/handlers/scheduler_handler.py +497 -0
memos/api/handlers/search_handler.py +222 -0
memos/api/handlers/suggestion_handler.py +117 -0
memos/api/mcp_serve.py +614 -0
memos/api/middleware/request_context.py +101 -0
memos/api/product_api.py +38 -0
memos/api/product_models.py +1206 -0
memos/api/routers/__init__.py +1 -0
memos/api/routers/product_router.py +477 -0
memos/api/routers/server_router.py +394 -0
memos/api/server_api.py +44 -0
memos/api/start_api.py +433 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/charactertext_chunker.py +41 -0
memos/chunkers/factory.py +24 -0
memos/chunkers/markdown_chunker.py +62 -0
memos/chunkers/sentence_chunker.py +54 -0
memos/chunkers/simple_chunker.py +50 -0
memos/cli.py +113 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +59 -0
memos/configs/embedder.py +88 -0
memos/configs/graph_db.py +236 -0
memos/configs/internet_retriever.py +100 -0
memos/configs/llm.py +151 -0
memos/configs/mem_agent.py +54 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +105 -0
memos/configs/mem_os.py +83 -0
memos/configs/mem_reader.py +91 -0
memos/configs/mem_scheduler.py +385 -0
memos/configs/mem_user.py +70 -0
memos/configs/memory.py +324 -0
memos/configs/parser.py +38 -0
memos/configs/reranker.py +18 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +80 -0
memos/context/context.py +355 -0
memos/dependency.py +52 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/ark.py +95 -0
memos/embedders/base.py +106 -0
memos/embedders/factory.py +29 -0
memos/embedders/ollama.py +77 -0
memos/embedders/sentence_transformer.py +49 -0
memos/embedders/universal_api.py +51 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +274 -0
memos/graph_dbs/factory.py +27 -0
memos/graph_dbs/item.py +46 -0
memos/graph_dbs/nebular.py +1794 -0
memos/graph_dbs/neo4j.py +1942 -0
memos/graph_dbs/neo4j_community.py +1058 -0
memos/graph_dbs/polardb.py +5446 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +25 -0
memos/llms/deepseek.py +13 -0
memos/llms/factory.py +38 -0
memos/llms/hf.py +443 -0
memos/llms/hf_singleton.py +114 -0
memos/llms/ollama.py +135 -0
memos/llms/openai.py +222 -0
memos/llms/openai_new.py +198 -0
memos/llms/qwen.py +13 -0
memos/llms/utils.py +14 -0
memos/llms/vllm.py +218 -0
memos/log.py +237 -0
memos/mem_agent/base.py +19 -0
memos/mem_agent/deepsearch_agent.py +391 -0
memos/mem_agent/factory.py +36 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +30 -0
memos/mem_cube/general.py +240 -0
memos/mem_cube/navie.py +172 -0
memos/mem_cube/utils.py +169 -0
memos/mem_feedback/base.py +15 -0
memos/mem_feedback/feedback.py +1192 -0
memos/mem_feedback/simple_feedback.py +40 -0
memos/mem_feedback/utils.py +230 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +1203 -0
memos/mem_os/main.py +582 -0
memos/mem_os/product.py +1608 -0
memos/mem_os/product_server.py +455 -0
memos/mem_os/utils/default_config.py +359 -0
memos/mem_os/utils/format_utils.py +1403 -0
memos/mem_os/utils/reference_utils.py +162 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +47 -0
memos/mem_reader/factory.py +53 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/multi_modal_struct.py +965 -0
memos/mem_reader/read_multi_modal/__init__.py +43 -0
memos/mem_reader/read_multi_modal/assistant_parser.py +311 -0
memos/mem_reader/read_multi_modal/base.py +273 -0
memos/mem_reader/read_multi_modal/file_content_parser.py +826 -0
memos/mem_reader/read_multi_modal/image_parser.py +359 -0
memos/mem_reader/read_multi_modal/multi_modal_parser.py +252 -0
memos/mem_reader/read_multi_modal/string_parser.py +139 -0
memos/mem_reader/read_multi_modal/system_parser.py +327 -0
memos/mem_reader/read_multi_modal/text_content_parser.py +131 -0
memos/mem_reader/read_multi_modal/tool_parser.py +210 -0
memos/mem_reader/read_multi_modal/user_parser.py +218 -0
memos/mem_reader/read_multi_modal/utils.py +358 -0
memos/mem_reader/simple_struct.py +912 -0
memos/mem_reader/strategy_struct.py +163 -0
memos/mem_reader/utils.py +157 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/api_analyzer.py +714 -0
memos/mem_scheduler/analyzer/eval_analyzer.py +219 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +571 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +1319 -0
memos/mem_scheduler/general_modules/__init__.py +0 -0
memos/mem_scheduler/general_modules/api_misc.py +137 -0
memos/mem_scheduler/general_modules/base.py +80 -0
memos/mem_scheduler/general_modules/init_components_for_scheduler.py +425 -0
memos/mem_scheduler/general_modules/misc.py +313 -0
memos/mem_scheduler/general_modules/scheduler_logger.py +389 -0
memos/mem_scheduler/general_modules/task_threads.py +315 -0
memos/mem_scheduler/general_scheduler.py +1495 -0
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +306 -0
memos/mem_scheduler/memory_manage_modules/retriever.py +547 -0
memos/mem_scheduler/monitors/__init__.py +0 -0
memos/mem_scheduler/monitors/dispatcher_monitor.py +366 -0
memos/mem_scheduler/monitors/general_monitor.py +394 -0
memos/mem_scheduler/monitors/task_schedule_monitor.py +254 -0
memos/mem_scheduler/optimized_scheduler.py +410 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/api_redis_model.py +518 -0
memos/mem_scheduler/orm_modules/base_model.py +729 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/orm_modules/redis_model.py +699 -0
memos/mem_scheduler/scheduler_factory.py +23 -0
memos/mem_scheduler/schemas/__init__.py +0 -0
memos/mem_scheduler/schemas/analyzer_schemas.py +52 -0
memos/mem_scheduler/schemas/api_schemas.py +233 -0
memos/mem_scheduler/schemas/general_schemas.py +55 -0
memos/mem_scheduler/schemas/message_schemas.py +173 -0
memos/mem_scheduler/schemas/monitor_schemas.py +406 -0
memos/mem_scheduler/schemas/task_schemas.py +132 -0
memos/mem_scheduler/task_schedule_modules/__init__.py +0 -0
memos/mem_scheduler/task_schedule_modules/dispatcher.py +740 -0
memos/mem_scheduler/task_schedule_modules/local_queue.py +247 -0
memos/mem_scheduler/task_schedule_modules/orchestrator.py +74 -0
memos/mem_scheduler/task_schedule_modules/redis_queue.py +1385 -0
memos/mem_scheduler/task_schedule_modules/task_queue.py +162 -0
memos/mem_scheduler/utils/__init__.py +0 -0
memos/mem_scheduler/utils/api_utils.py +77 -0
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +50 -0
memos/mem_scheduler/utils/filter_utils.py +176 -0
memos/mem_scheduler/utils/metrics.py +125 -0
memos/mem_scheduler/utils/misc_utils.py +290 -0
memos/mem_scheduler/utils/monitor_event_utils.py +67 -0
memos/mem_scheduler/utils/status_tracker.py +229 -0
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_scheduler/webservice_modules/rabbitmq_service.py +485 -0
memos/mem_scheduler/webservice_modules/redis_service.py +380 -0
memos/mem_user/factory.py +94 -0
memos/mem_user/mysql_persistent_user_manager.py +271 -0
memos/mem_user/mysql_user_manager.py +502 -0
memos/mem_user/persistent_factory.py +98 -0
memos/mem_user/persistent_user_manager.py +260 -0
memos/mem_user/redis_persistent_user_manager.py +225 -0
memos/mem_user/user_manager.py +488 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +56 -0
memos/memories/activation/kv.py +292 -0
memos/memories/activation/vllmkv.py +219 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +42 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +92 -0
memos/memories/textual/general.py +236 -0
memos/memories/textual/item.py +304 -0
memos/memories/textual/naive.py +187 -0
memos/memories/textual/prefer_text_memory/__init__.py +0 -0
memos/memories/textual/prefer_text_memory/adder.py +504 -0
memos/memories/textual/prefer_text_memory/config.py +106 -0
memos/memories/textual/prefer_text_memory/extractor.py +221 -0
memos/memories/textual/prefer_text_memory/factory.py +85 -0
memos/memories/textual/prefer_text_memory/retrievers.py +177 -0
memos/memories/textual/prefer_text_memory/spliter.py +132 -0
memos/memories/textual/prefer_text_memory/utils.py +93 -0
memos/memories/textual/preference.py +344 -0
memos/memories/textual/simple_preference.py +161 -0
memos/memories/textual/simple_tree.py +69 -0
memos/memories/textual/tree.py +459 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/handler.py +184 -0
memos/memories/textual/tree_text_memory/organize/manager.py +518 -0
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +238 -0
memos/memories/textual/tree_text_memory/organize/reorganizer.py +622 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/advanced_searcher.py +364 -0
memos/memories/textual/tree_text_memory/retrieve/bm25_util.py +186 -0
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +419 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +270 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +102 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +61 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +497 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +16 -0
memos/memories/textual/tree_text_memory/retrieve/retrieve_utils.py +472 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +848 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +135 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +54 -0
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +387 -0
memos/memos_tools/dinding_report_bot.py +453 -0
memos/memos_tools/lockfree_dict.py +120 -0
memos/memos_tools/notification_service.py +44 -0
memos/memos_tools/notification_utils.py +142 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +310 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/multi_mem_cube/__init__.py +0 -0
memos/multi_mem_cube/composite_cube.py +86 -0
memos/multi_mem_cube/single_cube.py +874 -0
memos/multi_mem_cube/views.py +54 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +21 -0
memos/parsers/markitdown.py +28 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +25 -0
memos/reranker/concat.py +103 -0
memos/reranker/cosine_local.py +102 -0
memos/reranker/factory.py +72 -0
memos/reranker/http_bge.py +324 -0
memos/reranker/http_bge_strategy.py +327 -0
memos/reranker/noop.py +19 -0
memos/reranker/strategies/__init__.py +4 -0
memos/reranker/strategies/base.py +61 -0
memos/reranker/strategies/concat_background.py +94 -0
memos/reranker/strategies/concat_docsource.py +110 -0
memos/reranker/strategies/dialogue_common.py +109 -0
memos/reranker/strategies/factory.py +31 -0
memos/reranker/strategies/single_turn.py +107 -0
memos/reranker/strategies/singleturn_outmem.py +98 -0
memos/settings.py +10 -0
memos/templates/__init__.py +0 -0
memos/templates/advanced_search_prompts.py +211 -0
memos/templates/cloud_service_prompt.py +107 -0
memos/templates/instruction_completion.py +66 -0
memos/templates/mem_agent_prompts.py +85 -0
memos/templates/mem_feedback_prompts.py +822 -0
memos/templates/mem_reader_prompts.py +1096 -0
memos/templates/mem_reader_strategy_prompts.py +238 -0
memos/templates/mem_scheduler_prompts.py +626 -0
memos/templates/mem_search_prompts.py +93 -0
memos/templates/mos_prompts.py +403 -0
memos/templates/prefer_complete_prompt.py +735 -0
memos/templates/tool_mem_prompts.py +139 -0
memos/templates/tree_reorganize_prompts.py +230 -0
memos/types/__init__.py +34 -0
memos/types/general_types.py +151 -0
memos/types/openai_chat_completion_types/__init__.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_assistant_message_param.py +56 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_image_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_input_audio_param.py +23 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_param.py +43 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_refusal_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_text_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_message_custom_tool_call_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_message_function_tool_call_param.py +32 -0
memos/types/openai_chat_completion_types/chat_completion_message_param.py +18 -0
memos/types/openai_chat_completion_types/chat_completion_message_tool_call_union_param.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_system_message_param.py +36 -0
memos/types/openai_chat_completion_types/chat_completion_tool_message_param.py +30 -0
memos/types/openai_chat_completion_types/chat_completion_user_message_param.py +34 -0
memos/utils.py +123 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +117 -0
memos/vec_dbs/factory.py +23 -0
memos/vec_dbs/item.py +50 -0
memos/vec_dbs/milvus.py +654 -0
memos/vec_dbs/qdrant.py +355 -0

memos/mem_os/main.py ADDED Viewed

@@ -0,0 +1,582 @@
+import concurrent.futures
+import json
+import os
+from typing import Any
+from memos.configs.mem_os import MOSConfig
+from memos.context.context import ContextThreadPoolExecutor
+from memos.llms.factory import LLMFactory
+from memos.log import get_logger
+from memos.mem_os.core import MOSCore
+from memos.mem_os.utils.default_config import get_default
+from memos.memories.textual.base import BaseTextMemory
+from memos.templates.mos_prompts import (
+    COT_DECOMPOSE_PROMPT,
+    PRO_MODE_WELCOME_MESSAGE,
+    SYNTHESIS_PROMPT,
+)
+logger = get_logger(__name__)
+class MOS(MOSCore):
+    """
+    The MOS (Memory Operating System) class inherits from MOSCore.
+    This class maintains backward compatibility with the original MOS interface.
+    """
+    def __init__(self, config: MOSConfig | None = None):
+        """
+        Initialize MOS with optional automatic configuration.
+        Args:
+            config (MOSConfig, optional): MOS configuration. If None, will use automatic configuration from environment variables.
+        """
+        if config is None:
+            # Auto-configure if no config provided
+            config, default_cube = self._auto_configure()
+            self._auto_registered_cube = default_cube
+        else:
+            self._auto_registered_cube = None
+        self.enable_cot = config.PRO_MODE
+        if config.PRO_MODE:
+            print(PRO_MODE_WELCOME_MESSAGE)
+            logger.info(PRO_MODE_WELCOME_MESSAGE)
+        super().__init__(config)
+        # Auto-register cube if one was created
+        if self._auto_registered_cube is not None:
+            self.register_mem_cube(self._auto_registered_cube)
+            logger.info(
+                f"Auto-registered default cube: {self._auto_registered_cube.config.cube_id}"
+            )
+    def _auto_configure(self, **kwargs) -> tuple[MOSConfig, Any]:
+        """
+        Automatically configure MOS with default settings.
+        Returns:
+            tuple[MOSConfig, Any]: MOS configuration and default MemCube
+        """
+        # Get configuration from environment variables
+        openai_api_key = os.getenv("OPENAI_API_KEY")
+        openai_api_base = os.getenv("OPENAI_API_BASE", "https://api.openai.com/v1")
+        text_mem_type = os.getenv("MOS_TEXT_MEM_TYPE", "general_text")
+        if not openai_api_key:
+            raise ValueError("OPENAI_API_KEY environment variable is required")
+        logger.info(f"Auto-configuring MOS with text_mem_type: {text_mem_type}")
+        return get_default(
+            openai_api_key=openai_api_key,
+            openai_api_base=openai_api_base,
+            text_mem_type=text_mem_type,
+        )
+    @classmethod
+    def simple(cls) -> "MOS":
+        """
+        Create a MOS instance with automatic configuration from environment variables.
+        This is the simplest way to get started with MemOS.
+        Environment variables needed:
+        - OPENAI_API_KEY: Your OpenAI API key
+        - OPENAI_API_BASE: OpenAI API base URL (optional, defaults to "https://api.openai.com/v1")
+        - MOS_TEXT_MEM_TYPE: Text memory type (optional, defaults to "general_text")
+        Returns:
+            MOS: Configured MOS instance with auto-registered default cube
+        Example:
+            ```python
+            # Set environment variables
+            export OPENAI_API_KEY="your-api-key"
+            export MOS_TEXT_MEM_TYPE="general_text"
+            # Then use
+            memory = MOS.simple()
+            memory.add_memory("Hello world!")
+            response = memory.chat("What did I just say?")
+            ```
+        """
+        return cls()
+    def chat(self, query: str, user_id: str | None = None, base_prompt: str | None = None) -> str:
+        """
+        Enhanced chat method with optional CoT (Chain of Thought) enhancement.
+        Args:
+            query (str): The user's query.
+            user_id (str, optional): User ID for context.
+            base_prompt (str, optional): A custom base prompt to use for the chat.
+                It can be a template string with a `{memories}` placeholder.
+                If not provided, a default prompt is used.
+        Returns:
+            str: The response from the MOS.
+        """
+        # Check if CoT enhancement is enabled (either explicitly or via PRO mode)
+        if not self.enable_cot:
+            # Use the original chat method from core
+            return super().chat(query, user_id, base_prompt=base_prompt)
+        # Enhanced chat with CoT decomposition
+        return self._chat_with_cot_enhancement(query, user_id, base_prompt=base_prompt)
+    def _chat_with_cot_enhancement(
+        self, query: str, user_id: str | None = None, base_prompt: str | None = None
+    ) -> str:
+        """
+        Chat with CoT enhancement for complex query decomposition.
+        This method includes all the same validation and processing logic as the core chat method.
+        Args:
+            query (str): The user's query.
+            user_id (str, optional): User ID for context.
+        Returns:
+            str: The enhanced response.
+        """
+        # Step 1: Perform all the same validation and setup as core chat method
+        target_user_id = user_id if user_id is not None else self.user_id
+        accessible_cubes = self.user_manager.get_user_cubes(target_user_id)
+        user_cube_ids = [cube.cube_id for cube in accessible_cubes]
+        # Register chat history if needed
+        if target_user_id not in self.chat_history_manager:
+            self._register_chat_history(target_user_id)
+        chat_history = self.chat_history_manager[target_user_id]
+        try:
+            # Step 2: Decompose the query using CoT
+            logger.info(f"🔍 [CoT] Decomposing query: {query}")
+            decomposition_result = self.cot_decompose(
+                query, self.config.chat_model, target_user_id, self.chat_llm
+            )
+            # Check if the query is complex and needs decomposition
+            if not decomposition_result.get("is_complex", False):
+                logger.info("🔍 [CoT] Query is not complex, using standard chat")
+                return super().chat(query, user_id, base_prompt=base_prompt)
+            sub_questions = decomposition_result.get("sub_questions", [])
+            logger.info(f"🔍 [CoT] Decomposed into {len(sub_questions)} sub-questions")
+            # Step 3: Get search engine for sub-questions (with proper validation)
+            search_engine = self._get_search_engine_for_cot_with_validation(user_cube_ids)
+            if not search_engine:
+                logger.warning("🔍 [CoT] No search engine available, using standard chat")
+                return super().chat(query, user_id, base_prompt=base_prompt)
+            # Step 4: Get answers for sub-questions
+            logger.info("🔍 [CoT] Getting answers for sub-questions...")
+            sub_questions, sub_answers = self.get_sub_answers(
+                sub_questions=sub_questions,
+                search_engine=search_engine,
+                llm_config=self.config.chat_model,
+                user_id=target_user_id,
+                top_k=getattr(self.config, "cot_top_k", 3),
+                llm=self.chat_llm,
+            )
+            # Step 5: Generate enhanced response using sub-answers
+            logger.info("🔍 [CoT] Generating enhanced response...")
+            enhanced_response = self._generate_enhanced_response_with_context(
+                original_query=query,
+                sub_questions=sub_questions,
+                sub_answers=sub_answers,
+                chat_history=chat_history,
+                user_id=target_user_id,
+                search_engine=search_engine,
+                base_prompt=base_prompt,
+            )
+            # Step 6: Update chat history (same as core method)
+            chat_history.chat_history.append({"role": "user", "content": query})
+            chat_history.chat_history.append({"role": "assistant", "content": enhanced_response})
+            self.chat_history_manager[target_user_id] = chat_history
+            # Step 7: Submit message to scheduler (same as core method)
+            if len(accessible_cubes) == 1:
+                mem_cube_id = accessible_cubes[0].cube_id
+                if self.enable_mem_scheduler and self.mem_scheduler is not None:
+                    from datetime import datetime
+                    from memos.mem_scheduler.schemas import (
+                        ANSWER_LABEL,
+                        ScheduleMessageItem,
+                    )
+                    message_item = ScheduleMessageItem(
+                        user_id=target_user_id,
+                        mem_cube_id=mem_cube_id,
+                        label=ANSWER_LABEL,
+                        content=enhanced_response,
+                        timestamp=datetime.now().isoformat(),
+                    )
+                    self.mem_scheduler.submit_messages(messages=[message_item])
+            return enhanced_response
+        except Exception as e:
+            logger.error(f"🔍 [CoT] Error in CoT enhancement: {e}")
+            logger.info("🔍 [CoT] Falling back to standard chat")
+            return super().chat(query, user_id, base_prompt=base_prompt)
+    def _get_search_engine_for_cot_with_validation(
+        self, user_cube_ids: list[str]
+    ) -> BaseTextMemory | None:
+        """
+        Get the best available search engine for CoT operations with proper validation.
+        Args:
+            user_cube_ids (list[str]): List of cube IDs the user has access to.
+        Returns:
+            BaseTextMemory or None: The search engine to use for CoT.
+        """
+        if not self.mem_cubes:
+            return None
+        # Get the first available text memory from user's accessible cubes
+        for mem_cube_id, mem_cube in self.mem_cubes.items():
+            if mem_cube_id not in user_cube_ids:
+                continue
+            if mem_cube.text_mem:
+                return mem_cube.text_mem
+        return None
+    def _generate_enhanced_response_with_context(
+        self,
+        original_query: str,
+        sub_questions: list[str],
+        sub_answers: list[str],
+        chat_history: Any,
+        user_id: str | None = None,
+        search_engine: BaseTextMemory | None = None,
+        base_prompt: str | None = None,
+    ) -> str:
+        """
+        Generate an enhanced response using sub-questions and their answers, with chat context.
+        Args:
+            original_query (str): The original user query.
+            sub_questions (list[str]): List of sub-questions.
+            sub_answers (list[str]): List of answers to sub-questions.
+            chat_history: The user's chat history.
+            user_id (str, optional): User ID for context.
+            search_engine (BaseTextMemory, optional): Search engine for context retrieval.
+            base_prompt (str, optional): A custom base prompt for the chat.
+        Returns:
+            str: The enhanced response.
+        """
+        # Build the synthesis prompt
+        qa_text = ""
+        for i, (question, answer) in enumerate(zip(sub_questions, sub_answers, strict=False), 1):
+            qa_text += f"Q{i}: {question}\nA{i}: {answer}\n\n"
+        # Build messages with chat history context (similar to core method)
+        if (search_engine is not None) and self.config.enable_textual_memory:
+            if self.enable_cot:
+                search_memories = search_engine.search(
+                    original_query, top_k=self.config.top_k, mode="fine"
+                )
+            else:
+                search_memories = search_engine.search(
+                    original_query, top_k=self.config.top_k, mode="fast"
+                )
+            system_prompt = self._build_system_prompt(
+                search_memories, base_prompt=base_prompt
+            )  # Use the same system prompt builder
+        else:
+            system_prompt = self._build_system_prompt(base_prompt=base_prompt)
+        current_messages = [
+            {"role": "system", "content": system_prompt + SYNTHESIS_PROMPT.format(qa_text=qa_text)},
+            *chat_history.chat_history,
+            {
+                "role": "user",
+                "content": original_query,
+            },
+        ]
+        # Handle activation memory if enabled (same as core method)
+        past_key_values = None
+        if self.config.enable_activation_memory:
+            if self.config.chat_model.backend not in ["huggingface", "huggingface_singleton"]:
+                logger.error(
+                    "Activation memory only used for huggingface backend. Skipping activation memory."
+                )
+            else:
+                # Get accessible cubes for the user
+                target_user_id = user_id if user_id is not None else self.user_id
+                accessible_cubes = self.user_manager.get_user_cubes(target_user_id)
+                user_cube_ids = [cube.cube_id for cube in accessible_cubes]
+                for mem_cube_id, mem_cube in self.mem_cubes.items():
+                    if mem_cube_id not in user_cube_ids:
+                        continue
+                    if mem_cube.act_mem:
+                        kv_cache = next(iter(mem_cube.act_mem.get_all()), None)
+                        past_key_values = (
+                            kv_cache.memory if (kv_cache and hasattr(kv_cache, "memory")) else None
+                        )
+                        break
+        try:
+            # Generate the enhanced response using the chat LLM with same parameters as core
+            if past_key_values is not None:
+                enhanced_response = self.chat_llm.generate(
+                    current_messages, past_key_values=past_key_values
+                )
+            else:
+                enhanced_response = self.chat_llm.generate(current_messages)
+            logger.info("🔍 [CoT] Generated enhanced response")
+            return enhanced_response
+        except Exception as e:
+            logger.error(f"🔍 [CoT] Error generating enhanced response: {e}")
+            # Fallback to standard chat
+            return super().chat(original_query, user_id, base_prompt=base_prompt)
+    @classmethod
+    def cot_decompose(
+        cls, query: str, llm_config: Any, user_id: str | None = None, llm: LLMFactory | None = None
+    ) -> list[str] | dict[str, Any]:
+        """
+        Decompose a complex query into sub-questions using Chain of Thought reasoning.
+        Args:
+            query (str): The complex query to decompose
+            llm_config: LLM configuration for decomposition
+            user_id (str, optional): User ID for context
+        Returns:
+            Union[List[str], Dict[str, Any]]: List of decomposed sub-questions or dict with complexity analysis
+        """
+        # Create a temporary LLM instance for decomposition
+        if llm is None:
+            llm = LLMFactory.from_config(llm_config)
+        # System prompt for CoT decomposition with complexity analysis
+        system_prompt = COT_DECOMPOSE_PROMPT.format(query=query)
+        messages = [{"role": "system", "content": system_prompt}]
+        try:
+            response = llm.generate(messages)
+            # Try to parse JSON response
+            result = json.loads(response)
+            return result
+        except json.JSONDecodeError as e:
+            logger.warning(f"Failed to parse JSON response from LLM: {e}")
+            logger.warning(f"Raw response: {response}")
+            # Try to extract JSON-like content from the response
+            try:
+                # Look for JSON-like content between curly braces
+                import re
+                json_match = re.search(r"\{.*\}", response, re.DOTALL)
+                if json_match:
+                    json_str = json_match.group(0)
+                    result = json.loads(json_str)
+                    return result
+            except Exception:
+                pass
+            # If all parsing attempts fail, return default
+            return {"is_complex": False, "sub_questions": []}
+        except Exception as e:
+            logger.error(f"Unexpected error in cot_decompose: {e}")
+            return {"is_complex": False, "sub_questions": []}
+    @classmethod
+    def get_sub_answers(
+        cls,
+        sub_questions: list[str] | dict[str, Any],
+        search_results: dict[str, Any] | None = None,
+        search_engine: BaseTextMemory | None = None,
+        llm_config: LLMFactory | None = None,
+        user_id: str | None = None,
+        top_k: int = 5,
+        llm: LLMFactory | None = None,
+    ) -> tuple[list[str], list[str]]:
+        """
+        Get answers for sub-questions using either search results or a search engine.
+        Args:
+            sub_questions (Union[List[str], Dict[str, Any]]): List of sub-questions from cot_decompose or dict with analysis
+            search_results (Dict[str, Any], optional): Search results containing relevant information
+            search_engine (BaseTextMemory, optional): Text memory engine for searching
+            llm_config (Any, optional): LLM configuration for processing (required if search_engine is provided)
+            user_id (str, optional): User ID for context
+            top_k (int): Number of top results to retrieve from search engine
+        Returns:
+            Tuple[List[str], List[str]]: (sub_questions, sub_answers)
+        """
+        # Extract sub-questions from decomposition result if needed
+        if isinstance(sub_questions, dict):
+            if not sub_questions.get("is_complex", False):
+                return [], []
+            sub_questions = sub_questions.get("sub_questions", [])
+        if not sub_questions:
+            return [], []
+        # Validate inputs
+        if search_results is None and search_engine is None:
+            raise ValueError("Either search_results or search_engine must be provided")
+        if llm is None:
+            llm = LLMFactory.from_config(llm_config)
+        # Step 1: Get search results if search_engine is provided
+        if search_engine is not None:
+            search_results = cls._search_with_engine(sub_questions, search_engine, top_k)
+        # Step 2: Generate answers for each sub-question using LLM in parallel
+        def generate_answer_for_question(question_index: int, sub_question: str) -> tuple[int, str]:
+            """Generate answer for a single sub-question."""
+            # Extract relevant information from search results
+            relevant_info = []
+            if search_results and search_results.get("text_mem"):
+                for cube_result in search_results["text_mem"]:
+                    for memory in cube_result.get("memories", []):
+                        relevant_info.append(memory.memory)
+            # Build system prompt with memories (similar to MOSCore._build_system_prompt)
+            base_prompt = (
+                "You are a knowledgeable and helpful AI assistant. "
+                "You have access to relevant information that helps you provide accurate answers. "
+                "Use the provided information to answer the question comprehensively. "
+                "If the information is not sufficient, acknowledge the limitations."
+            )
+            # Add memory context if available
+            if relevant_info:
+                memory_context = "\n\n## Relevant Information:\n"
+                for j, info in enumerate(relevant_info[:top_k], 1):  # Take top 3 most relevant
+                    memory_context += f"{j}. {info}\n"
+                system_prompt = base_prompt + memory_context
+            else:
+                system_prompt = (
+                    base_prompt
+                    + "\n\n## Relevant Information:\nNo specific information found in memory."
+                )
+            # Create messages for LLM
+            messages = [
+                {"role": "system", "content": system_prompt},
+                {"role": "user", "content": sub_question},
+            ]
+            try:
+                # Generate answer using LLM
+                response = llm.generate(messages)
+                return question_index, response
+            except Exception as e:
+                logger.error(f"Failed to generate answer for sub-question '{sub_question}': {e}")
+                return question_index, f"Unable to generate answer for: {sub_question}"
+        # Generate answers in parallel while maintaining order
+        sub_answers = [None] * len(sub_questions)
+        with ContextThreadPoolExecutor(max_workers=min(len(sub_questions), 10)) as executor:
+            # Submit all answer generation tasks
+            future_to_index = {
+                executor.submit(generate_answer_for_question, i, question): i
+                for i, question in enumerate(sub_questions)
+            }
+            # Collect results as they complete, but store them in the correct position
+            for future in concurrent.futures.as_completed(future_to_index):
+                try:
+                    question_index, answer = future.result()
+                    sub_answers[question_index] = answer
+                except Exception as e:
+                    question_index = future_to_index[future]
+                    logger.error(
+                        f"Exception occurred while generating answer for question at index {question_index}: {e}"
+                    )
+                    sub_answers[question_index] = (
+                        f"Error generating answer for question {question_index + 1}"
+                    )
+        return sub_questions, sub_answers
+    @classmethod
+    def _search_with_engine(
+        cls, sub_questions: list[str], search_engine: BaseTextMemory, top_k: int
+    ) -> dict[str, Any]:
+        """
+        Search for sub-questions using the provided search engine in parallel.
+        Args:
+            sub_questions (List[str]): List of sub-questions to search for
+            search_engine (BaseTextMemory): Text memory engine for searching
+            top_k (int): Number of top results to retrieve
+        Returns:
+            Dict[str, Any]: Search results in the expected format
+        """
+        def search_single_question(question: str) -> list[Any]:
+            """Search for a single question using the search engine."""
+            try:
+                # Handle different search method signatures
+                if hasattr(search_engine, "search"):
+                    # Try different parameter combinations based on the engine type
+                    try:
+                        # For tree_text memory
+                        return search_engine.search(question, top_k, mode="fast")
+                    except TypeError:
+                        try:
+                            # For general_text memory
+                            return search_engine.search(question, top_k)
+                        except TypeError:
+                            # For naive_text memory
+                            return search_engine.search(question, top_k)
+                else:
+                    return []
+            except Exception as e:
+                logger.error(f"Search failed for question '{question}': {e}")
+                return []
+        # Search in parallel while maintaining order
+        all_memories = []
+        with ContextThreadPoolExecutor(max_workers=min(len(sub_questions), 10)) as executor:
+            # Submit all search tasks and keep track of their order
+            future_to_index = {
+                executor.submit(search_single_question, question): i
+                for i, question in enumerate(sub_questions)
+            }
+            # Initialize results list with None values to maintain order
+            results = [None] * len(sub_questions)
+            # Collect results as they complete, but store them in the correct position
+            for future in concurrent.futures.as_completed(future_to_index):
+                index = future_to_index[future]
+                try:
+                    memories = future.result()
+                    results[index] = memories
+                except Exception as e:
+                    logger.error(
+                        f"Exception occurred while searching for question at index {index}: {e}"
+                    )
+                    results[index] = []
+            # Combine all results in the correct order
+            for result in results:
+                if result is not None:
+                    all_memories.extend(result)
+        # Format results in the expected structure
+        return {"text_mem": [{"cube_id": "search_engine", "memories": all_memories}]}