PyPI - MemoryOS - Versions diffs - 2.0.3__py3-none-any.whl - Mend

MemoryOS 2.0.3__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (315) hide show

memoryos-2.0.3.dist-info/METADATA +418 -0
memoryos-2.0.3.dist-info/RECORD +315 -0
memoryos-2.0.3.dist-info/WHEEL +4 -0
memoryos-2.0.3.dist-info/entry_points.txt +3 -0
memoryos-2.0.3.dist-info/licenses/LICENSE +201 -0
memos/__init__.py +20 -0
memos/api/client.py +571 -0
memos/api/config.py +1018 -0
memos/api/context/dependencies.py +50 -0
memos/api/exceptions.py +53 -0
memos/api/handlers/__init__.py +62 -0
memos/api/handlers/add_handler.py +158 -0
memos/api/handlers/base_handler.py +194 -0
memos/api/handlers/chat_handler.py +1401 -0
memos/api/handlers/component_init.py +388 -0
memos/api/handlers/config_builders.py +190 -0
memos/api/handlers/feedback_handler.py +93 -0
memos/api/handlers/formatters_handler.py +237 -0
memos/api/handlers/memory_handler.py +316 -0
memos/api/handlers/scheduler_handler.py +497 -0
memos/api/handlers/search_handler.py +222 -0
memos/api/handlers/suggestion_handler.py +117 -0
memos/api/mcp_serve.py +614 -0
memos/api/middleware/request_context.py +101 -0
memos/api/product_api.py +38 -0
memos/api/product_models.py +1206 -0
memos/api/routers/__init__.py +1 -0
memos/api/routers/product_router.py +477 -0
memos/api/routers/server_router.py +394 -0
memos/api/server_api.py +44 -0
memos/api/start_api.py +433 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/charactertext_chunker.py +41 -0
memos/chunkers/factory.py +24 -0
memos/chunkers/markdown_chunker.py +62 -0
memos/chunkers/sentence_chunker.py +54 -0
memos/chunkers/simple_chunker.py +50 -0
memos/cli.py +113 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +59 -0
memos/configs/embedder.py +88 -0
memos/configs/graph_db.py +236 -0
memos/configs/internet_retriever.py +100 -0
memos/configs/llm.py +151 -0
memos/configs/mem_agent.py +54 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +105 -0
memos/configs/mem_os.py +83 -0
memos/configs/mem_reader.py +91 -0
memos/configs/mem_scheduler.py +385 -0
memos/configs/mem_user.py +70 -0
memos/configs/memory.py +324 -0
memos/configs/parser.py +38 -0
memos/configs/reranker.py +18 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +80 -0
memos/context/context.py +355 -0
memos/dependency.py +52 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/ark.py +95 -0
memos/embedders/base.py +106 -0
memos/embedders/factory.py +29 -0
memos/embedders/ollama.py +77 -0
memos/embedders/sentence_transformer.py +49 -0
memos/embedders/universal_api.py +51 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +274 -0
memos/graph_dbs/factory.py +27 -0
memos/graph_dbs/item.py +46 -0
memos/graph_dbs/nebular.py +1794 -0
memos/graph_dbs/neo4j.py +1942 -0
memos/graph_dbs/neo4j_community.py +1058 -0
memos/graph_dbs/polardb.py +5446 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +25 -0
memos/llms/deepseek.py +13 -0
memos/llms/factory.py +38 -0
memos/llms/hf.py +443 -0
memos/llms/hf_singleton.py +114 -0
memos/llms/ollama.py +135 -0
memos/llms/openai.py +222 -0
memos/llms/openai_new.py +198 -0
memos/llms/qwen.py +13 -0
memos/llms/utils.py +14 -0
memos/llms/vllm.py +218 -0
memos/log.py +237 -0
memos/mem_agent/base.py +19 -0
memos/mem_agent/deepsearch_agent.py +391 -0
memos/mem_agent/factory.py +36 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +30 -0
memos/mem_cube/general.py +240 -0
memos/mem_cube/navie.py +172 -0
memos/mem_cube/utils.py +169 -0
memos/mem_feedback/base.py +15 -0
memos/mem_feedback/feedback.py +1192 -0
memos/mem_feedback/simple_feedback.py +40 -0
memos/mem_feedback/utils.py +230 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +1203 -0
memos/mem_os/main.py +582 -0
memos/mem_os/product.py +1608 -0
memos/mem_os/product_server.py +455 -0
memos/mem_os/utils/default_config.py +359 -0
memos/mem_os/utils/format_utils.py +1403 -0
memos/mem_os/utils/reference_utils.py +162 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +47 -0
memos/mem_reader/factory.py +53 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/multi_modal_struct.py +965 -0
memos/mem_reader/read_multi_modal/__init__.py +43 -0
memos/mem_reader/read_multi_modal/assistant_parser.py +311 -0
memos/mem_reader/read_multi_modal/base.py +273 -0
memos/mem_reader/read_multi_modal/file_content_parser.py +826 -0
memos/mem_reader/read_multi_modal/image_parser.py +359 -0
memos/mem_reader/read_multi_modal/multi_modal_parser.py +252 -0
memos/mem_reader/read_multi_modal/string_parser.py +139 -0
memos/mem_reader/read_multi_modal/system_parser.py +327 -0
memos/mem_reader/read_multi_modal/text_content_parser.py +131 -0
memos/mem_reader/read_multi_modal/tool_parser.py +210 -0
memos/mem_reader/read_multi_modal/user_parser.py +218 -0
memos/mem_reader/read_multi_modal/utils.py +358 -0
memos/mem_reader/simple_struct.py +912 -0
memos/mem_reader/strategy_struct.py +163 -0
memos/mem_reader/utils.py +157 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/api_analyzer.py +714 -0
memos/mem_scheduler/analyzer/eval_analyzer.py +219 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +571 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +1319 -0
memos/mem_scheduler/general_modules/__init__.py +0 -0
memos/mem_scheduler/general_modules/api_misc.py +137 -0
memos/mem_scheduler/general_modules/base.py +80 -0
memos/mem_scheduler/general_modules/init_components_for_scheduler.py +425 -0
memos/mem_scheduler/general_modules/misc.py +313 -0
memos/mem_scheduler/general_modules/scheduler_logger.py +389 -0
memos/mem_scheduler/general_modules/task_threads.py +315 -0
memos/mem_scheduler/general_scheduler.py +1495 -0
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +306 -0
memos/mem_scheduler/memory_manage_modules/retriever.py +547 -0
memos/mem_scheduler/monitors/__init__.py +0 -0
memos/mem_scheduler/monitors/dispatcher_monitor.py +366 -0
memos/mem_scheduler/monitors/general_monitor.py +394 -0
memos/mem_scheduler/monitors/task_schedule_monitor.py +254 -0
memos/mem_scheduler/optimized_scheduler.py +410 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/api_redis_model.py +518 -0
memos/mem_scheduler/orm_modules/base_model.py +729 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/orm_modules/redis_model.py +699 -0
memos/mem_scheduler/scheduler_factory.py +23 -0
memos/mem_scheduler/schemas/__init__.py +0 -0
memos/mem_scheduler/schemas/analyzer_schemas.py +52 -0
memos/mem_scheduler/schemas/api_schemas.py +233 -0
memos/mem_scheduler/schemas/general_schemas.py +55 -0
memos/mem_scheduler/schemas/message_schemas.py +173 -0
memos/mem_scheduler/schemas/monitor_schemas.py +406 -0
memos/mem_scheduler/schemas/task_schemas.py +132 -0
memos/mem_scheduler/task_schedule_modules/__init__.py +0 -0
memos/mem_scheduler/task_schedule_modules/dispatcher.py +740 -0
memos/mem_scheduler/task_schedule_modules/local_queue.py +247 -0
memos/mem_scheduler/task_schedule_modules/orchestrator.py +74 -0
memos/mem_scheduler/task_schedule_modules/redis_queue.py +1385 -0
memos/mem_scheduler/task_schedule_modules/task_queue.py +162 -0
memos/mem_scheduler/utils/__init__.py +0 -0
memos/mem_scheduler/utils/api_utils.py +77 -0
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +50 -0
memos/mem_scheduler/utils/filter_utils.py +176 -0
memos/mem_scheduler/utils/metrics.py +125 -0
memos/mem_scheduler/utils/misc_utils.py +290 -0
memos/mem_scheduler/utils/monitor_event_utils.py +67 -0
memos/mem_scheduler/utils/status_tracker.py +229 -0
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_scheduler/webservice_modules/rabbitmq_service.py +485 -0
memos/mem_scheduler/webservice_modules/redis_service.py +380 -0
memos/mem_user/factory.py +94 -0
memos/mem_user/mysql_persistent_user_manager.py +271 -0
memos/mem_user/mysql_user_manager.py +502 -0
memos/mem_user/persistent_factory.py +98 -0
memos/mem_user/persistent_user_manager.py +260 -0
memos/mem_user/redis_persistent_user_manager.py +225 -0
memos/mem_user/user_manager.py +488 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +56 -0
memos/memories/activation/kv.py +292 -0
memos/memories/activation/vllmkv.py +219 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +42 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +92 -0
memos/memories/textual/general.py +236 -0
memos/memories/textual/item.py +304 -0
memos/memories/textual/naive.py +187 -0
memos/memories/textual/prefer_text_memory/__init__.py +0 -0
memos/memories/textual/prefer_text_memory/adder.py +504 -0
memos/memories/textual/prefer_text_memory/config.py +106 -0
memos/memories/textual/prefer_text_memory/extractor.py +221 -0
memos/memories/textual/prefer_text_memory/factory.py +85 -0
memos/memories/textual/prefer_text_memory/retrievers.py +177 -0
memos/memories/textual/prefer_text_memory/spliter.py +132 -0
memos/memories/textual/prefer_text_memory/utils.py +93 -0
memos/memories/textual/preference.py +344 -0
memos/memories/textual/simple_preference.py +161 -0
memos/memories/textual/simple_tree.py +69 -0
memos/memories/textual/tree.py +459 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/handler.py +184 -0
memos/memories/textual/tree_text_memory/organize/manager.py +518 -0
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +238 -0
memos/memories/textual/tree_text_memory/organize/reorganizer.py +622 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/advanced_searcher.py +364 -0
memos/memories/textual/tree_text_memory/retrieve/bm25_util.py +186 -0
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +419 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +270 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +102 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +61 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +497 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +16 -0
memos/memories/textual/tree_text_memory/retrieve/retrieve_utils.py +472 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +848 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +135 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +54 -0
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +387 -0
memos/memos_tools/dinding_report_bot.py +453 -0
memos/memos_tools/lockfree_dict.py +120 -0
memos/memos_tools/notification_service.py +44 -0
memos/memos_tools/notification_utils.py +142 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +310 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/multi_mem_cube/__init__.py +0 -0
memos/multi_mem_cube/composite_cube.py +86 -0
memos/multi_mem_cube/single_cube.py +874 -0
memos/multi_mem_cube/views.py +54 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +21 -0
memos/parsers/markitdown.py +28 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +25 -0
memos/reranker/concat.py +103 -0
memos/reranker/cosine_local.py +102 -0
memos/reranker/factory.py +72 -0
memos/reranker/http_bge.py +324 -0
memos/reranker/http_bge_strategy.py +327 -0
memos/reranker/noop.py +19 -0
memos/reranker/strategies/__init__.py +4 -0
memos/reranker/strategies/base.py +61 -0
memos/reranker/strategies/concat_background.py +94 -0
memos/reranker/strategies/concat_docsource.py +110 -0
memos/reranker/strategies/dialogue_common.py +109 -0
memos/reranker/strategies/factory.py +31 -0
memos/reranker/strategies/single_turn.py +107 -0
memos/reranker/strategies/singleturn_outmem.py +98 -0
memos/settings.py +10 -0
memos/templates/__init__.py +0 -0
memos/templates/advanced_search_prompts.py +211 -0
memos/templates/cloud_service_prompt.py +107 -0
memos/templates/instruction_completion.py +66 -0
memos/templates/mem_agent_prompts.py +85 -0
memos/templates/mem_feedback_prompts.py +822 -0
memos/templates/mem_reader_prompts.py +1096 -0
memos/templates/mem_reader_strategy_prompts.py +238 -0
memos/templates/mem_scheduler_prompts.py +626 -0
memos/templates/mem_search_prompts.py +93 -0
memos/templates/mos_prompts.py +403 -0
memos/templates/prefer_complete_prompt.py +735 -0
memos/templates/tool_mem_prompts.py +139 -0
memos/templates/tree_reorganize_prompts.py +230 -0
memos/types/__init__.py +34 -0
memos/types/general_types.py +151 -0
memos/types/openai_chat_completion_types/__init__.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_assistant_message_param.py +56 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_image_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_input_audio_param.py +23 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_param.py +43 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_refusal_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_text_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_message_custom_tool_call_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_message_function_tool_call_param.py +32 -0
memos/types/openai_chat_completion_types/chat_completion_message_param.py +18 -0
memos/types/openai_chat_completion_types/chat_completion_message_tool_call_union_param.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_system_message_param.py +36 -0
memos/types/openai_chat_completion_types/chat_completion_tool_message_param.py +30 -0
memos/types/openai_chat_completion_types/chat_completion_user_message_param.py +34 -0
memos/utils.py +123 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +117 -0
memos/vec_dbs/factory.py +23 -0
memos/vec_dbs/item.py +50 -0
memos/vec_dbs/milvus.py +654 -0
memos/vec_dbs/qdrant.py +355 -0

memos/memories/textual/tree_text_memory/organize/reorganizer.py ADDED Viewed

@@ -0,0 +1,622 @@
+import json
+import time
+import traceback
+from collections import defaultdict
+from concurrent.futures import as_completed
+from queue import PriorityQueue
+from typing import Literal
+import numpy as np
+from memos.context.context import ContextThread, ContextThreadPoolExecutor
+from memos.dependency import require_python_package
+from memos.embedders.factory import OllamaEmbedder
+from memos.graph_dbs.item import GraphDBEdge, GraphDBNode
+from memos.graph_dbs.neo4j import Neo4jGraphDB
+from memos.llms.base import BaseLLM
+from memos.log import get_logger
+from memos.memories.textual.item import SourceMessage, TreeNodeTextualMemoryMetadata
+from memos.memories.textual.tree_text_memory.organize.handler import NodeHandler
+from memos.memories.textual.tree_text_memory.organize.relation_reason_detector import (
+    RelationAndReasoningDetector,
+)
+from memos.templates.tree_reorganize_prompts import LOCAL_SUBCLUSTER_PROMPT, REORGANIZE_PROMPT
+logger = get_logger(__name__)
+def build_summary_parent_node(cluster_nodes):
+    normalized_sources = []
+    for n in cluster_nodes:
+        sm = SourceMessage(
+            type="chat",
+            role=None,
+            chat_time=None,
+            message_id=None,
+            content=n.memory,
+            # extra
+            node_id=n.id,
+        )
+        normalized_sources.append(sm)
+    return normalized_sources
+class QueueMessage:
+    def __init__(
+        self,
+        op: Literal["add", "remove", "merge", "update", "end"],
+        # `str` for node and edge IDs, `GraphDBNode` and `GraphDBEdge` for actual objects
+        before_node: list[str] | list[GraphDBNode] | None = None,
+        before_edge: list[str] | list[GraphDBEdge] | None = None,
+        after_node: list[str] | list[GraphDBNode] | None = None,
+        after_edge: list[str] | list[GraphDBEdge] | None = None,
+    ):
+        self.op = op
+        self.before_node = before_node
+        self.before_edge = before_edge
+        self.after_node = after_node
+        self.after_edge = after_edge
+    def __str__(self) -> str:
+        return f"QueueMessage(op={self.op}, before_node={self.before_node if self.before_node is None else len(self.before_node)}, after_node={self.after_node if self.after_node is None else len(self.after_node)})"
+    def __lt__(self, other: "QueueMessage") -> bool:
+        op_priority = {"add": 2, "remove": 2, "merge": 1, "end": 0}
+        return op_priority[self.op] < op_priority[other.op]
+def extract_first_to_last_brace(text: str):
+    start = text.find("{")
+    end = text.rfind("}")
+    if start == -1 or end == -1 or end < start:
+        return "", None
+    json_str = text[start : end + 1]
+    return json_str, json.loads(json_str)
+class GraphStructureReorganizer:
+    def __init__(
+        self, graph_store: Neo4jGraphDB, llm: BaseLLM, embedder: OllamaEmbedder, is_reorganize: bool
+    ):
+        self.queue = PriorityQueue()  # Min-heap
+        self.graph_store = graph_store
+        self.llm = llm
+        self.embedder = embedder
+        self.relation_detector = RelationAndReasoningDetector(
+            self.graph_store, self.llm, self.embedder
+        )
+        self.resolver = NodeHandler(graph_store=graph_store, llm=llm, embedder=embedder)
+        self.is_reorganize = is_reorganize
+        self._reorganize_needed = True
+        if self.is_reorganize:
+            # ____ 1. For queue message driven thread ___________
+            self.thread = ContextThread(target=self._run_message_consumer_loop)
+            self.thread.start()
+            # ____ 2. For periodic structure optimization _______
+            self._stop_scheduler = False
+            self._is_optimizing = {"LongTermMemory": False, "UserMemory": False}
+            self.structure_optimizer_thread = ContextThread(
+                target=self._run_structure_organizer_loop
+            )
+            self.structure_optimizer_thread.start()
+    def add_message(self, message: QueueMessage):
+        self.queue.put_nowait(message)
+    def wait_until_current_task_done(self):
+        """
+        Wait until:
+        1) queue is empty
+        2) any running structure optimization is done
+        """
+        deadline = time.time() + 600
+        if not self.is_reorganize:
+            return
+        if not self.queue.empty():
+            self.queue.join()
+        logger.debug("Queue is now empty.")
+        while any(self._is_optimizing.values()):
+            logger.debug(f"Waiting for structure optimizer to finish... {self._is_optimizing}")
+            if time.time() > deadline:
+                logger.error(f"Wait timed out; flags={self._is_optimizing}")
+                break
+            time.sleep(1)
+        logger.debug("Structure optimizer is now idle.")
+    def _run_message_consumer_loop(self):
+        while True:
+            message = self.queue.get()
+            if message.op == "end":
+                break
+            try:
+                if self._preprocess_message(message):
+                    self.handle_message(message)
+            except Exception:
+                logger.error(traceback.format_exc())
+            self.queue.task_done()
+    @require_python_package(
+        import_name="schedule",
+        install_command="pip install schedule",
+        install_link="https://schedule.readthedocs.io/en/stable/installation.html",
+    )
+    def _run_structure_organizer_loop(self):
+        """
+        Use schedule library to periodically trigger structure optimization.
+        This runs until the stop flag is set.
+        """
+        import schedule
+        schedule.every(100).seconds.do(self.optimize_structure, scope="LongTermMemory")
+        schedule.every(100).seconds.do(self.optimize_structure, scope="UserMemory")
+        logger.info("Structure optimizer schedule started.")
+        while not getattr(self, "_stop_scheduler", False):
+            if any(self._is_optimizing.values()):
+                time.sleep(1)
+                continue
+            if self._reorganize_needed:
+                logger.info("[Reorganizer] Triggering optimize_structure due to new nodes.")
+                self.optimize_structure(scope="LongTermMemory")
+                self.optimize_structure(scope="UserMemory")
+                self._reorganize_needed = False
+            time.sleep(30)
+    def stop(self):
+        """
+        Stop the reorganizer thread.
+        """
+        if not self.is_reorganize:
+            return
+        self.add_message(QueueMessage(op="end"))
+        self.thread.join()
+        logger.info("Reorganize thread stopped.")
+        self._stop_scheduler = True
+        self.structure_optimizer_thread.join()
+        logger.info("Structure optimizer stopped.")
+    def handle_message(self, message: QueueMessage):
+        handle_map = {"add": self.handle_add, "remove": self.handle_remove}
+        handle_map[message.op](message)
+        logger.debug(f"message queue size: {self.queue.qsize()}")
+    def handle_add(self, message: QueueMessage):
+        logger.debug(f"Handling add operation: {str(message)[:500]}")
+        added_node = message.after_node[0]
+        detected_relationships = self.resolver.detect(
+            added_node, scope=added_node.metadata.memory_type
+        )
+        if detected_relationships:
+            for added_node, existing_node, relation in detected_relationships:
+                self.resolver.resolve(added_node, existing_node, relation)
+        self._reorganize_needed = True
+    def handle_remove(self, message: QueueMessage):
+        logger.debug(f"Handling remove operation: {str(message)[:50]}")
+    def optimize_structure(
+        self,
+        scope: str = "LongTermMemory",
+        local_tree_threshold: int = 10,
+        min_cluster_size: int = 4,
+        min_group_size: int = 20,
+        max_duration_sec: int = 600,
+    ):
+        """
+        Periodically reorganize the graph:
+        1. Weakly partition nodes into clusters.
+        2. Summarize each cluster.
+        3. Create parent nodes and build local PARENT trees.
+        """
+        # --- Total time watch dog: check functions ---
+        start_ts = time.time()
+        def _check_deadline(where: str):
+            if time.time() - start_ts > max_duration_sec:
+                logger.error(
+                    f"[GraphStructureReorganize] {scope} surpass {max_duration_sec}s，time "
+                    f"over at {where}"
+                )
+                return True
+            return False
+        if self._is_optimizing[scope]:
+            logger.info(f"[GraphStructureReorganize] Already optimizing for {scope}. Skipping.")
+            return
+        if self.graph_store.node_not_exist(scope):
+            logger.debug(f"[GraphStructureReorganize] No nodes for scope={scope}. Skip.")
+            return
+        self._is_optimizing[scope] = True
+        try:
+            logger.debug(
+                f"[GraphStructureReorganize] 🔍 Starting structure optimization for scope: {scope}"
+            )
+            logger.debug(
+                f"[GraphStructureReorganize] Num of scope in self.graph_store is"
+                f" {self.graph_store.get_memory_count(scope)}"
+            )
+            # Load candidate nodes
+            if _check_deadline("[GraphStructureReorganize] Before loading candidates"):
+                return
+            raw_nodes = self.graph_store.get_structure_optimization_candidates(scope)
+            nodes = [GraphDBNode(**n) for n in raw_nodes]
+            if not nodes:
+                logger.info("[GraphStructureReorganize] No nodes to optimize. Skipping.")
+                return
+            if len(nodes) < min_group_size:
+                logger.info(
+                    f"[GraphStructureReorganize] Only {len(nodes)} candidate nodes found. Not enough to reorganize. Skipping."
+                )
+                return
+            # Step 2: Partition nodes
+            if _check_deadline("[GraphStructureReorganize] Before partition"):
+                return
+            partitioned_groups = self._partition(nodes)
+            logger.info(
+                f"[GraphStructureReorganize] Partitioned into {len(partitioned_groups)} clusters."
+            )
+            if _check_deadline("[GraphStructureReorganize] Before submit partition task"):
+                return
+            with ContextThreadPoolExecutor(max_workers=4) as executor:
+                futures = []
+                for cluster_nodes in partitioned_groups:
+                    futures.append(
+                        executor.submit(
+                            self._process_cluster_and_write,
+                            cluster_nodes,
+                            scope,
+                            local_tree_threshold,
+                            min_cluster_size,
+                        )
+                    )
+                for f in as_completed(futures):
+                    if _check_deadline("[GraphStructureReorganize] Waiting clusters..."):
+                        for x in futures:
+                            x.cancel()
+                        return
+                    try:
+                        f.result()
+                    except Exception as e:
+                        logger.warning(
+                            f"[GraphStructureReorganize] Cluster processing failed: {e}, trace: {traceback.format_exc()}"
+                        )
+            logger.info("[GraphStructure Reorganize] Structure optimization finished.")
+        finally:
+            self._is_optimizing[scope] = False
+            logger.info("[GraphStructureReorganize] Structure optimization finished.")
+    def _process_cluster_and_write(
+        self,
+        cluster_nodes: list[GraphDBNode],
+        scope: str,
+        local_tree_threshold: int,
+        min_cluster_size: int,
+    ):
+        if len(cluster_nodes) <= min_cluster_size:
+            return
+        # Large cluster ➜ local sub-clustering
+        sub_clusters = self._local_subcluster(cluster_nodes)
+        sub_parents = []
+        for sub_nodes in sub_clusters:
+            if len(sub_nodes) < min_cluster_size:
+                continue  # Skip tiny noise
+            sub_parent_node = self._summarize_cluster(sub_nodes, scope)
+            self._create_parent_node(sub_parent_node)
+            self._link_cluster_nodes(sub_parent_node, sub_nodes)
+            sub_parents.append(sub_parent_node)
+        if sub_parents and len(sub_parents) >= min_cluster_size:
+            cluster_parent_node = self._summarize_cluster(cluster_nodes, scope)
+            self._create_parent_node(cluster_parent_node)
+            for sub_parent in sub_parents:
+                self.graph_store.add_edge(cluster_parent_node.id, sub_parent.id, "PARENT")
+        logger.info("Adding relations/reasons")
+        nodes_to_check = cluster_nodes
+        exclude_ids = [n.id for n in nodes_to_check]
+        with ContextThreadPoolExecutor(max_workers=4) as executor:
+            futures = []
+            for node in nodes_to_check:
+                futures.append(
+                    executor.submit(
+                        self.relation_detector.process_node,
+                        node,
+                        exclude_ids,
+                        10,  # top_k
+                    )
+                )
+            for f in as_completed(futures, timeout=300):
+                results = f.result()
+                # 1) Add pairwise relations
+                for rel in results["relations"]:
+                    if not self.graph_store.edge_exists(
+                        rel["source_id"], rel["target_id"], rel["relation_type"]
+                    ):
+                        self.graph_store.add_edge(
+                            rel["source_id"], rel["target_id"], rel["relation_type"]
+                        )
+                # 2) Add inferred nodes and link to sources
+                for inf_node in results["inferred_nodes"]:
+                    self.graph_store.add_node(
+                        inf_node.id,
+                        inf_node.memory,
+                        inf_node.metadata.model_dump(exclude_none=True),
+                    )
+                    for src_id in inf_node.metadata.sources:
+                        self.graph_store.add_edge(src_id, inf_node.id, "INFERS")
+                # 3) Add sequence links
+                for seq in results["sequence_links"]:
+                    if not self.graph_store.edge_exists(seq["from_id"], seq["to_id"], "FOLLOWS"):
+                        self.graph_store.add_edge(seq["from_id"], seq["to_id"], "FOLLOWS")
+                # 4) Add aggregate concept nodes
+                for agg_node in results["aggregate_nodes"]:
+                    self.graph_store.add_node(
+                        agg_node.id,
+                        agg_node.memory,
+                        agg_node.metadata.model_dump(exclude_none=True),
+                    )
+                    for child_id in agg_node.metadata.sources:
+                        self.graph_store.add_edge(agg_node.id, child_id, "AGGREGATE_TO")
+        logger.info("[Reorganizer] Cluster relation/reasoning done.")
+    def _local_subcluster(
+        self, cluster_nodes: list[GraphDBNode], max_length: int = 15000
+    ) -> list[list[GraphDBNode]]:
+        """
+        Use LLM to split a large cluster into semantically coherent sub-clusters.
+        """
+        if not cluster_nodes:
+            return []
+        # Prepare conversation-like input: ID + key + value
+        scene_lines = []
+        for node in cluster_nodes:
+            line = f"- ID: {node.id} | Key: {node.metadata.key} | Value: {node.memory}"
+            scene_lines.append(line)
+        joined_scene = "\n".join(scene_lines)
+        if len(joined_scene) > max_length:
+            logger.warning("Sub-cluster too long")
+        prompt = LOCAL_SUBCLUSTER_PROMPT.replace("{joined_scene}", joined_scene[:max_length])
+        messages = [{"role": "user", "content": prompt}]
+        response_text = self.llm.generate(messages)
+        response_json = self._parse_json_result(response_text)
+        assigned_ids = set()
+        result_subclusters = []
+        for cluster in response_json.get("clusters", []):
+            ids = []
+            for nid in cluster.get("ids", []):
+                if nid not in assigned_ids:
+                    ids.append(nid)
+                    assigned_ids.add(nid)
+            sub_nodes = [node for node in cluster_nodes if node.id in ids]
+            if len(sub_nodes) >= 2:
+                result_subclusters.append(sub_nodes)
+        return result_subclusters
+    @require_python_package(
+        import_name="sklearn",
+        install_command="pip install scikit-learn",
+        install_link="https://scikit-learn.org/stable/install.html",
+    )
+    def _partition(self, nodes, min_cluster_size: int = 10, max_cluster_size: int = 20):
+        """
+        Partition nodes by:
+        - If total nodes <= max_cluster_size -> return all nodes in one cluster.
+        - If total nodes > max_cluster_size -> cluster by embeddings, recursively split.
+        - Only keep clusters with size > min_cluster_size.
+        Args:
+            nodes: List of GraphDBNode
+            min_cluster_size: Min size to keep a cluster as-is
+        Returns:
+            List of clusters, each as a list of GraphDBNode
+        """
+        from sklearn.cluster import MiniBatchKMeans
+        if len(nodes) <= max_cluster_size:
+            logger.info(
+                f"[KMeansPartition] Node count {len(nodes)} <= {max_cluster_size}, skipping KMeans."
+            )
+            return [nodes]
+        def recursive_clustering(nodes_list, depth=0):
+            """Recursively split clusters until each is <= max_cluster_size."""
+            indent = "  " * depth
+            logger.info(
+                f"{indent}[Recursive] Start clustering {len(nodes_list)} nodes at depth {depth}"
+            )
+            if len(nodes_list) <= max_cluster_size:
+                logger.info(
+                    f"{indent}[Recursive] Node count <= {max_cluster_size}, stop splitting."
+                )
+                return [nodes_list]
+            # Try kmeans with k = ceil(len(nodes) / max_cluster_size)
+            x_nodes = [n for n in nodes_list if n.metadata.embedding]
+            x = np.array([n.metadata.embedding for n in x_nodes])
+            if len(x) < min_cluster_size:
+                logger.info(
+                    f"{indent}[Recursive] Too few embeddings ({len(x)}), skipping clustering."
+                )
+                return [nodes_list]
+            k = min(len(x), (len(nodes_list) + max_cluster_size - 1) // max_cluster_size)
+            k = max(1, k)
+            try:
+                logger.info(f"{indent}[Recursive] Clustering with k={k} on {len(x)} points.")
+                kmeans = MiniBatchKMeans(n_clusters=k, batch_size=256, random_state=42)
+                labels = kmeans.fit_predict(x)
+                label_groups = defaultdict(list)
+                for node, label in zip(x_nodes, labels, strict=False):
+                    label_groups[label].append(node)
+                # Map: label -> nodes with no embedding (fallback group)
+                no_embedding_nodes = [n for n in nodes_list if not n.metadata.embedding]
+                if no_embedding_nodes:
+                    logger.warning(
+                        f"{indent}[Recursive] {len(no_embedding_nodes)} nodes have no embedding. Added to largest cluster."
+                    )
+                    # Assign to largest cluster
+                    largest_label = max(label_groups.items(), key=lambda kv: len(kv[1]))[0]
+                    label_groups[largest_label].extend(no_embedding_nodes)
+                result = []
+                for label, sub_group in label_groups.items():
+                    logger.info(f"{indent}  Cluster-{label}: {len(sub_group)} nodes")
+                    result.extend(recursive_clustering(sub_group, depth=depth + 1))
+                return result
+            except Exception as e:
+                logger.warning(
+                    f"{indent}[Recursive] Clustering failed: {e}, fallback to one cluster."
+                )
+                return [nodes_list]
+        raw_clusters = recursive_clustering(nodes)
+        filtered_clusters = [c for c in raw_clusters if len(c) > min_cluster_size]
+        logger.info(f"[KMeansPartition] Total clusters before filtering: {len(raw_clusters)}")
+        for i, cluster in enumerate(raw_clusters):
+            logger.info(f"[KMeansPartition]   Cluster-{i}: {len(cluster)} nodes")
+        logger.info(
+            f"[KMeansPartition] Clusters after filtering (>{min_cluster_size}): {len(filtered_clusters)}"
+        )
+        return filtered_clusters
+    def _summarize_cluster(self, cluster_nodes: list[GraphDBNode], scope: str) -> GraphDBNode:
+        """
+        Generate a cluster label using LLM, based on top keys in the cluster.
+        """
+        if not cluster_nodes:
+            raise ValueError("Cluster nodes cannot be empty.")
+        memories_items_text = "\n\n".join(
+            [
+                f"{i}. key: {n.metadata.key}\nvalue: {n.memory}\nsummary:{n.metadata.background}"
+                for i, n in enumerate(cluster_nodes)
+            ]
+        )
+        # Build prompt
+        prompt = REORGANIZE_PROMPT.replace("{memory_items_text}", memories_items_text)
+        messages = [{"role": "user", "content": prompt}]
+        response_text = self.llm.generate(messages)
+        response_json = self._parse_json_result(response_text)
+        # Extract fields
+        parent_key = response_json.get("key", "").strip()
+        parent_value = response_json.get("value", "").strip()
+        parent_tags = response_json.get("tags", [])
+        parent_background = response_json.get("summary", "").strip()
+        embedding = self.embedder.embed([parent_value])[0]
+        parent_node = GraphDBNode(
+            memory=parent_value,
+            metadata=TreeNodeTextualMemoryMetadata(
+                user_id=None,
+                session_id=None,
+                memory_type=scope,
+                status="activated",
+                key=parent_key,
+                tags=parent_tags,
+                embedding=embedding,
+                usage=[],
+                sources=build_summary_parent_node(cluster_nodes),
+                background=parent_background,
+                confidence=0.66,
+                type="topic",
+            ),
+        )
+        return parent_node
+    def _parse_json_result(self, response_text):
+        try:
+            response_text = response_text.replace("```", "").replace("json", "")
+            response_json = extract_first_to_last_brace(response_text)[1]
+            return response_json
+        except json.JSONDecodeError as e:
+            logger.warning(
+                f"Failed to parse LLM response as JSON: {e}\nRaw response:\n{response_text}"
+            )
+            return {}
+    def _create_parent_node(self, parent_node: GraphDBNode) -> None:
+        """
+        Create a new parent node for the cluster.
+        """
+        self.graph_store.add_node(
+            parent_node.id,
+            parent_node.memory,
+            parent_node.metadata.model_dump(exclude_none=True),
+        )
+    def _link_cluster_nodes(self, parent_node: GraphDBNode, child_nodes: list[GraphDBNode]):
+        """
+        Add PARENT edges from the parent node to all nodes in the cluster.
+        """
+        for child in child_nodes:
+            if not self.graph_store.edge_exists(
+                parent_node.id, child.id, "PARENT", direction="OUTGOING"
+            ):
+                self.graph_store.add_edge(parent_node.id, child.id, "PARENT")
+    def _preprocess_message(self, message: QueueMessage) -> bool:
+        message = self._convert_id_to_node(message)
+        if message.after_node is None or None in message.after_node:
+            logger.debug(
+                f"Found non-existent node in after_node in message: {message}, skip this message."
+            )
+            return False
+        return True
+    def _convert_id_to_node(self, message: QueueMessage) -> QueueMessage:
+        """
+        Convert IDs in the message.after_node to GraphDBNode objects.
+        """
+        for i, node in enumerate(message.after_node or []):
+            if not isinstance(node, str):
+                continue
+            raw_node = self.graph_store.get_node(node, include_embedding=True)
+            if raw_node is None:
+                logger.debug(f"Node with ID {node} not found in the graph store.")
+                message.after_node[i] = None
+            else:
+                message.after_node[i] = GraphDBNode(**raw_node)
+        return message

memos/memories/textual/tree_text_memory/retrieve/__init__.py ADDED Viewed

File without changes