PyPI - MemoryOS - Versions diffs - 2.0.3__py3-none-any.whl - Mend

MemoryOS 2.0.3__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (315) hide show

memoryos-2.0.3.dist-info/METADATA +418 -0
memoryos-2.0.3.dist-info/RECORD +315 -0
memoryos-2.0.3.dist-info/WHEEL +4 -0
memoryos-2.0.3.dist-info/entry_points.txt +3 -0
memoryos-2.0.3.dist-info/licenses/LICENSE +201 -0
memos/__init__.py +20 -0
memos/api/client.py +571 -0
memos/api/config.py +1018 -0
memos/api/context/dependencies.py +50 -0
memos/api/exceptions.py +53 -0
memos/api/handlers/__init__.py +62 -0
memos/api/handlers/add_handler.py +158 -0
memos/api/handlers/base_handler.py +194 -0
memos/api/handlers/chat_handler.py +1401 -0
memos/api/handlers/component_init.py +388 -0
memos/api/handlers/config_builders.py +190 -0
memos/api/handlers/feedback_handler.py +93 -0
memos/api/handlers/formatters_handler.py +237 -0
memos/api/handlers/memory_handler.py +316 -0
memos/api/handlers/scheduler_handler.py +497 -0
memos/api/handlers/search_handler.py +222 -0
memos/api/handlers/suggestion_handler.py +117 -0
memos/api/mcp_serve.py +614 -0
memos/api/middleware/request_context.py +101 -0
memos/api/product_api.py +38 -0
memos/api/product_models.py +1206 -0
memos/api/routers/__init__.py +1 -0
memos/api/routers/product_router.py +477 -0
memos/api/routers/server_router.py +394 -0
memos/api/server_api.py +44 -0
memos/api/start_api.py +433 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/charactertext_chunker.py +41 -0
memos/chunkers/factory.py +24 -0
memos/chunkers/markdown_chunker.py +62 -0
memos/chunkers/sentence_chunker.py +54 -0
memos/chunkers/simple_chunker.py +50 -0
memos/cli.py +113 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +59 -0
memos/configs/embedder.py +88 -0
memos/configs/graph_db.py +236 -0
memos/configs/internet_retriever.py +100 -0
memos/configs/llm.py +151 -0
memos/configs/mem_agent.py +54 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +105 -0
memos/configs/mem_os.py +83 -0
memos/configs/mem_reader.py +91 -0
memos/configs/mem_scheduler.py +385 -0
memos/configs/mem_user.py +70 -0
memos/configs/memory.py +324 -0
memos/configs/parser.py +38 -0
memos/configs/reranker.py +18 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +80 -0
memos/context/context.py +355 -0
memos/dependency.py +52 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/ark.py +95 -0
memos/embedders/base.py +106 -0
memos/embedders/factory.py +29 -0
memos/embedders/ollama.py +77 -0
memos/embedders/sentence_transformer.py +49 -0
memos/embedders/universal_api.py +51 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +274 -0
memos/graph_dbs/factory.py +27 -0
memos/graph_dbs/item.py +46 -0
memos/graph_dbs/nebular.py +1794 -0
memos/graph_dbs/neo4j.py +1942 -0
memos/graph_dbs/neo4j_community.py +1058 -0
memos/graph_dbs/polardb.py +5446 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +25 -0
memos/llms/deepseek.py +13 -0
memos/llms/factory.py +38 -0
memos/llms/hf.py +443 -0
memos/llms/hf_singleton.py +114 -0
memos/llms/ollama.py +135 -0
memos/llms/openai.py +222 -0
memos/llms/openai_new.py +198 -0
memos/llms/qwen.py +13 -0
memos/llms/utils.py +14 -0
memos/llms/vllm.py +218 -0
memos/log.py +237 -0
memos/mem_agent/base.py +19 -0
memos/mem_agent/deepsearch_agent.py +391 -0
memos/mem_agent/factory.py +36 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +30 -0
memos/mem_cube/general.py +240 -0
memos/mem_cube/navie.py +172 -0
memos/mem_cube/utils.py +169 -0
memos/mem_feedback/base.py +15 -0
memos/mem_feedback/feedback.py +1192 -0
memos/mem_feedback/simple_feedback.py +40 -0
memos/mem_feedback/utils.py +230 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +1203 -0
memos/mem_os/main.py +582 -0
memos/mem_os/product.py +1608 -0
memos/mem_os/product_server.py +455 -0
memos/mem_os/utils/default_config.py +359 -0
memos/mem_os/utils/format_utils.py +1403 -0
memos/mem_os/utils/reference_utils.py +162 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +47 -0
memos/mem_reader/factory.py +53 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/multi_modal_struct.py +965 -0
memos/mem_reader/read_multi_modal/__init__.py +43 -0
memos/mem_reader/read_multi_modal/assistant_parser.py +311 -0
memos/mem_reader/read_multi_modal/base.py +273 -0
memos/mem_reader/read_multi_modal/file_content_parser.py +826 -0
memos/mem_reader/read_multi_modal/image_parser.py +359 -0
memos/mem_reader/read_multi_modal/multi_modal_parser.py +252 -0
memos/mem_reader/read_multi_modal/string_parser.py +139 -0
memos/mem_reader/read_multi_modal/system_parser.py +327 -0
memos/mem_reader/read_multi_modal/text_content_parser.py +131 -0
memos/mem_reader/read_multi_modal/tool_parser.py +210 -0
memos/mem_reader/read_multi_modal/user_parser.py +218 -0
memos/mem_reader/read_multi_modal/utils.py +358 -0
memos/mem_reader/simple_struct.py +912 -0
memos/mem_reader/strategy_struct.py +163 -0
memos/mem_reader/utils.py +157 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/api_analyzer.py +714 -0
memos/mem_scheduler/analyzer/eval_analyzer.py +219 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +571 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +1319 -0
memos/mem_scheduler/general_modules/__init__.py +0 -0
memos/mem_scheduler/general_modules/api_misc.py +137 -0
memos/mem_scheduler/general_modules/base.py +80 -0
memos/mem_scheduler/general_modules/init_components_for_scheduler.py +425 -0
memos/mem_scheduler/general_modules/misc.py +313 -0
memos/mem_scheduler/general_modules/scheduler_logger.py +389 -0
memos/mem_scheduler/general_modules/task_threads.py +315 -0
memos/mem_scheduler/general_scheduler.py +1495 -0
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +306 -0
memos/mem_scheduler/memory_manage_modules/retriever.py +547 -0
memos/mem_scheduler/monitors/__init__.py +0 -0
memos/mem_scheduler/monitors/dispatcher_monitor.py +366 -0
memos/mem_scheduler/monitors/general_monitor.py +394 -0
memos/mem_scheduler/monitors/task_schedule_monitor.py +254 -0
memos/mem_scheduler/optimized_scheduler.py +410 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/api_redis_model.py +518 -0
memos/mem_scheduler/orm_modules/base_model.py +729 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/orm_modules/redis_model.py +699 -0
memos/mem_scheduler/scheduler_factory.py +23 -0
memos/mem_scheduler/schemas/__init__.py +0 -0
memos/mem_scheduler/schemas/analyzer_schemas.py +52 -0
memos/mem_scheduler/schemas/api_schemas.py +233 -0
memos/mem_scheduler/schemas/general_schemas.py +55 -0
memos/mem_scheduler/schemas/message_schemas.py +173 -0
memos/mem_scheduler/schemas/monitor_schemas.py +406 -0
memos/mem_scheduler/schemas/task_schemas.py +132 -0
memos/mem_scheduler/task_schedule_modules/__init__.py +0 -0
memos/mem_scheduler/task_schedule_modules/dispatcher.py +740 -0
memos/mem_scheduler/task_schedule_modules/local_queue.py +247 -0
memos/mem_scheduler/task_schedule_modules/orchestrator.py +74 -0
memos/mem_scheduler/task_schedule_modules/redis_queue.py +1385 -0
memos/mem_scheduler/task_schedule_modules/task_queue.py +162 -0
memos/mem_scheduler/utils/__init__.py +0 -0
memos/mem_scheduler/utils/api_utils.py +77 -0
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +50 -0
memos/mem_scheduler/utils/filter_utils.py +176 -0
memos/mem_scheduler/utils/metrics.py +125 -0
memos/mem_scheduler/utils/misc_utils.py +290 -0
memos/mem_scheduler/utils/monitor_event_utils.py +67 -0
memos/mem_scheduler/utils/status_tracker.py +229 -0
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_scheduler/webservice_modules/rabbitmq_service.py +485 -0
memos/mem_scheduler/webservice_modules/redis_service.py +380 -0
memos/mem_user/factory.py +94 -0
memos/mem_user/mysql_persistent_user_manager.py +271 -0
memos/mem_user/mysql_user_manager.py +502 -0
memos/mem_user/persistent_factory.py +98 -0
memos/mem_user/persistent_user_manager.py +260 -0
memos/mem_user/redis_persistent_user_manager.py +225 -0
memos/mem_user/user_manager.py +488 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +56 -0
memos/memories/activation/kv.py +292 -0
memos/memories/activation/vllmkv.py +219 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +42 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +92 -0
memos/memories/textual/general.py +236 -0
memos/memories/textual/item.py +304 -0
memos/memories/textual/naive.py +187 -0
memos/memories/textual/prefer_text_memory/__init__.py +0 -0
memos/memories/textual/prefer_text_memory/adder.py +504 -0
memos/memories/textual/prefer_text_memory/config.py +106 -0
memos/memories/textual/prefer_text_memory/extractor.py +221 -0
memos/memories/textual/prefer_text_memory/factory.py +85 -0
memos/memories/textual/prefer_text_memory/retrievers.py +177 -0
memos/memories/textual/prefer_text_memory/spliter.py +132 -0
memos/memories/textual/prefer_text_memory/utils.py +93 -0
memos/memories/textual/preference.py +344 -0
memos/memories/textual/simple_preference.py +161 -0
memos/memories/textual/simple_tree.py +69 -0
memos/memories/textual/tree.py +459 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/handler.py +184 -0
memos/memories/textual/tree_text_memory/organize/manager.py +518 -0
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +238 -0
memos/memories/textual/tree_text_memory/organize/reorganizer.py +622 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/advanced_searcher.py +364 -0
memos/memories/textual/tree_text_memory/retrieve/bm25_util.py +186 -0
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +419 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +270 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +102 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +61 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +497 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +16 -0
memos/memories/textual/tree_text_memory/retrieve/retrieve_utils.py +472 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +848 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +135 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +54 -0
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +387 -0
memos/memos_tools/dinding_report_bot.py +453 -0
memos/memos_tools/lockfree_dict.py +120 -0
memos/memos_tools/notification_service.py +44 -0
memos/memos_tools/notification_utils.py +142 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +310 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/multi_mem_cube/__init__.py +0 -0
memos/multi_mem_cube/composite_cube.py +86 -0
memos/multi_mem_cube/single_cube.py +874 -0
memos/multi_mem_cube/views.py +54 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +21 -0
memos/parsers/markitdown.py +28 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +25 -0
memos/reranker/concat.py +103 -0
memos/reranker/cosine_local.py +102 -0
memos/reranker/factory.py +72 -0
memos/reranker/http_bge.py +324 -0
memos/reranker/http_bge_strategy.py +327 -0
memos/reranker/noop.py +19 -0
memos/reranker/strategies/__init__.py +4 -0
memos/reranker/strategies/base.py +61 -0
memos/reranker/strategies/concat_background.py +94 -0
memos/reranker/strategies/concat_docsource.py +110 -0
memos/reranker/strategies/dialogue_common.py +109 -0
memos/reranker/strategies/factory.py +31 -0
memos/reranker/strategies/single_turn.py +107 -0
memos/reranker/strategies/singleturn_outmem.py +98 -0
memos/settings.py +10 -0
memos/templates/__init__.py +0 -0
memos/templates/advanced_search_prompts.py +211 -0
memos/templates/cloud_service_prompt.py +107 -0
memos/templates/instruction_completion.py +66 -0
memos/templates/mem_agent_prompts.py +85 -0
memos/templates/mem_feedback_prompts.py +822 -0
memos/templates/mem_reader_prompts.py +1096 -0
memos/templates/mem_reader_strategy_prompts.py +238 -0
memos/templates/mem_scheduler_prompts.py +626 -0
memos/templates/mem_search_prompts.py +93 -0
memos/templates/mos_prompts.py +403 -0
memos/templates/prefer_complete_prompt.py +735 -0
memos/templates/tool_mem_prompts.py +139 -0
memos/templates/tree_reorganize_prompts.py +230 -0
memos/types/__init__.py +34 -0
memos/types/general_types.py +151 -0
memos/types/openai_chat_completion_types/__init__.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_assistant_message_param.py +56 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_image_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_input_audio_param.py +23 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_param.py +43 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_refusal_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_text_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_message_custom_tool_call_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_message_function_tool_call_param.py +32 -0
memos/types/openai_chat_completion_types/chat_completion_message_param.py +18 -0
memos/types/openai_chat_completion_types/chat_completion_message_tool_call_union_param.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_system_message_param.py +36 -0
memos/types/openai_chat_completion_types/chat_completion_tool_message_param.py +30 -0
memos/types/openai_chat_completion_types/chat_completion_user_message_param.py +34 -0
memos/utils.py +123 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +117 -0
memos/vec_dbs/factory.py +23 -0
memos/vec_dbs/item.py +50 -0
memos/vec_dbs/milvus.py +654 -0
memos/vec_dbs/qdrant.py +355 -0

memos/memories/activation/kv.py ADDED Viewed

@@ -0,0 +1,292 @@
+import os
+import pickle
+from datetime import datetime
+from transformers import DynamicCache
+from memos.configs.memory import KVCacheMemoryConfig
+from memos.dependency import require_python_package
+from memos.llms.factory import LLMFactory
+from memos.memories.activation.base import BaseActMemory
+from memos.memories.activation.item import KVCacheItem
+from memos.memories.textual.item import TextualMemoryItem
+class KVCacheMemory(BaseActMemory):
+    """
+    Key-Value Cache Memory for activation memories.
+    This memory type is designed to store and retrieve key-value caches.
+    """
+    @require_python_package(
+        import_name="torch",
+        install_link="https://pytorch.org/get-started/locally/",
+    )
+    def __init__(self, config: KVCacheMemoryConfig) -> None:
+        """Initialize the KV Cache Memory with a configuration."""
+        self.config = config
+        self.llm = LLMFactory.from_config(config.extractor_llm)
+        self.kv_cache_memories: dict[str, KVCacheItem] = {}
+    def extract(self, text: str) -> KVCacheItem:
+        """Extract memory based on the text.
+        Uses the LLM to build KV caches from the provided text.
+        Args:
+            text: Input text to extract memory from
+        Returns:
+            Extracted memory item
+        """
+        # Build KV cache from the text using the LLM
+        kv_cache = self.llm.build_kv_cache(text)
+        # Create a KVCacheItem with the extracted cache
+        cache_item = KVCacheItem(
+            memory=kv_cache,
+            metadata={"source_text": text, "extracted_at": datetime.now().isoformat()},
+        )
+        return cache_item
+    def add(self, memories: list[KVCacheItem]) -> None:
+        """Add memories to the KV cache memory.
+        Args:
+            memories: List of KVCacheItem to add
+        """
+        for memory in memories:
+            self.kv_cache_memories[memory.id] = memory
+    def get_cache(self, cache_ids: list[str]) -> DynamicCache | None:
+        """Merge multiple KV caches into a single cache.
+        Args:
+            cache_ids: List of cache IDs to merge
+        Returns:
+            Merged DynamicCache or None if no caches found
+        """
+        caches_to_merge = []
+        for cache_id in cache_ids:
+            cache_item = self.kv_cache_memories.get(cache_id)
+            if cache_item and cache_item.memory:
+                caches_to_merge.append(cache_item.memory)
+        if not caches_to_merge:
+            return None
+        return self._concat_caches(caches_to_merge)
+    def get(self, memory_id: str) -> KVCacheItem | None:
+        """Get a memory by its ID.
+        Args:
+            memory_id: ID of the memory to retrieve
+        Returns:
+            Memory dictionary or None if not found
+        """
+        return self.kv_cache_memories.get(memory_id)
+    def get_by_ids(self, memory_ids: list[str]) -> list[KVCacheItem | None]:
+        """Get memories by their IDs.
+        Args:
+            memory_ids: List of memory IDs to retrieve
+        Returns:
+            List of memory dictionaries or None for missing ones
+        """
+        results = []
+        for memory_id in memory_ids:
+            memory = self.get(memory_id)
+            results.append(memory)
+        return results
+    def get_all(self) -> list[KVCacheItem]:
+        """Get all memories.
+        Returns:
+            List of all KVCacheItems in the memory
+        """
+        return list(self.kv_cache_memories.values())
+    def delete(self, memory_ids: list[str]) -> None:
+        """Delete memories by their IDs.
+        Args:
+            memory_ids: List of memory IDs to delete
+        """
+        for memory_id in memory_ids:
+            self.kv_cache_memories.pop(memory_id, None)
+    def delete_all(self) -> None:
+        """Delete all memories."""
+        self.kv_cache_memories.clear()
+    def from_textual_memory(self, mem: TextualMemoryItem) -> KVCacheItem:
+        """
+        Convert a TextualMemoryItem to a KVCacheItem.
+        This method extracts the key-value cache from the textual memory.
+        """
+        # Build KV cache from the textual memory content
+        kv_cache = self.llm.build_kv_cache(mem.memory)
+        return KVCacheItem(memory=kv_cache, metadata=mem.metadata.model_dump())
+    def load(self, dir: str) -> None:
+        """Load memories from os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory containing the memory files.
+        """
+        import torch
+        file_path = os.path.join(dir, self.config.memory_filename)
+        if not os.path.exists(file_path):
+            # If file doesn't exist, start with empty memories
+            return
+        try:
+            # Allow loading DynamicCache and KVCacheItem types
+            torch.serialization.add_safe_globals([DynamicCache, KVCacheItem])
+            with open(file_path, "rb") as f:
+                data = pickle.load(f)
+            if isinstance(data, dict):
+                # Load memories, handle both old and new formats
+                if "kv_cache_memories" in data:
+                    memories = data["kv_cache_memories"]
+                    if isinstance(memories, list):
+                        # Convert list to dict format
+                        self.kv_cache_memories = {item.id: item for item in memories}
+                    else:
+                        self.kv_cache_memories = memories
+                else:
+                    # Reset to empty if no memories in data
+                    self.kv_cache_memories = {}
+            elif isinstance(data, list):
+                # Backward compatibility: convert list to dict
+                self.kv_cache_memories = {item.id: item for item in data}
+            else:
+                # Reset to empty if data format is unexpected
+                self.kv_cache_memories = {}
+        except (EOFError, pickle.UnpicklingError, Exception):
+            # If loading fails, start with empty memories
+            self.kv_cache_memories = {}
+    def dump(self, dir: str) -> None:
+        """Dump memories to os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory where the memory files will be saved.
+        """
+        file_path = os.path.join(dir, self.config.memory_filename)
+        # Create directory if it doesn't exist
+        os.makedirs(dir, exist_ok=True)
+        # Prepare data to save (only memories)
+        data = {"kv_cache_memories": self.kv_cache_memories}
+        with open(file_path, "wb") as f:
+            pickle.dump(data, f, protocol=pickle.HIGHEST_PROTOCOL)
+    def _concat_caches(self, caches: list[DynamicCache]) -> DynamicCache:
+        """
+        Faster concat merge: for each layer, gather all caches' tensors
+        and do a single torch.cat per layer.
+        """
+        import torch
+        assert caches, "Need at least one cache"
+        if len(caches) == 1:
+            return caches[0]
+        merged = DynamicCache()
+        # Check for new structure (layers)
+        if hasattr(caches[0], "layers"):
+            num_layers = len(caches[0].layers)
+            # Ensure merged has layers attribute and populate it
+            if not hasattr(merged, "layers"):
+                merged.layers = []
+            if num_layers > 0:
+                # Get the class of the layer from the first cache
+                # We assume all caches use the same layer class
+                layer_cls = type(caches[0].layers[0])
+                # Populate merged.layers
+                while len(merged.layers) < num_layers:
+                    merged.layers.append(layer_cls())
+            for layer in range(num_layers):
+                # gather all K and V for this layer
+                keys = [c.layers[layer].keys for c in caches]
+                vals = [c.layers[layer].values for c in caches]
+                # single concat per layer
+                merged.layers[layer].keys = torch.cat(keys, dim=-2)
+                merged.layers[layer].values = torch.cat(vals, dim=-2)
+        # Check for old structure (key_cache)
+        elif hasattr(caches[0], "key_cache"):
+            num_layers = len(caches[0].key_cache)
+            for layer in range(num_layers):
+                # gather all K and V for this layer
+                keys = [c.key_cache[layer] for c in caches]
+                vals = [c.value_cache[layer] for c in caches]
+                # single concat per layer
+                merged.key_cache.append(torch.cat(keys, dim=-2))
+                merged.value_cache.append(torch.cat(vals, dim=-2))
+        else:
+            raise AttributeError(
+                "DynamicCache object has neither 'layers' nor 'key_cache' attributes"
+            )
+        return merged
+def move_dynamic_cache_htod(dynamic_cache: DynamicCache, device: str) -> DynamicCache:
+    """
+    Move DynamicCache from CPU to GPU device.
+    Compatible with both old and new transformers versions.
+    In SimpleMemChat.run(), if self.config.enable_activation_memory is enabled,
+    we load serialized kv cache from a [class KVCacheMemory] object, which has a kv_cache_memories on CPU.
+    So before inferring with DynamicCache, we should move it to GPU in-place first.
+    """
+    # Handle compatibility between old and new transformers versions
+    if hasattr(dynamic_cache, "layers"):
+        # New version: use layers attribute
+        for layer in dynamic_cache.layers:
+            if hasattr(layer, "key_cache") and layer.key_cache is not None:
+                layer.key_cache = layer.key_cache.to(device, non_blocking=True)
+            if hasattr(layer, "value_cache") and layer.value_cache is not None:
+                layer.value_cache = layer.value_cache.to(device, non_blocking=True)
+            elif hasattr(layer, "keys") and hasattr(layer, "values"):
+                # Alternative attribute names in some versions
+                if layer.keys is not None:
+                    layer.keys = layer.keys.to(device, non_blocking=True)
+                if layer.values is not None:
+                    layer.values = layer.values.to(device, non_blocking=True)
+    elif hasattr(dynamic_cache, "key_cache") and hasattr(dynamic_cache, "value_cache"):
+        # Old version: use key_cache and value_cache attributes
+        for i in range(len(dynamic_cache.key_cache)):
+            if dynamic_cache.key_cache[i] is not None:
+                dynamic_cache.key_cache[i] = dynamic_cache.key_cache[i].to(
+                    device, non_blocking=True
+                )
+            if dynamic_cache.value_cache[i] is not None:
+                dynamic_cache.value_cache[i] = dynamic_cache.value_cache[i].to(
+                    device, non_blocking=True
+                )
+    return dynamic_cache

memos/memories/activation/vllmkv.py ADDED Viewed

@@ -0,0 +1,219 @@
+import os
+import pickle
+from datetime import datetime
+from memos.configs.memory import KVCacheMemoryConfig
+from memos.dependency import require_python_package
+from memos.llms.factory import LLMFactory
+from memos.memories.activation.base import BaseActMemory
+from memos.memories.activation.item import VLLMKVCacheItem
+from memos.memories.textual.item import TextualMemoryItem
+class VLLMKVCacheMemory(BaseActMemory):
+    """
+    VLLM Key-Value Cache Memory for activation memories.
+    This memory type is designed to store and retrieve prompt strings for vLLM KV cache preloading.
+    Unlike traditional KV cache that stores DynamicCache objects, vLLM handles cache on server side.
+    """
+    @require_python_package(
+        import_name="torch",
+        install_link="https://pytorch.org/get-started/locally/",
+    )
+    def __init__(self, config: KVCacheMemoryConfig) -> None:
+        """Initialize the VLLM KV Cache Memory with a configuration."""
+        self.config = config
+        self.llm = LLMFactory.from_config(config.extractor_llm)
+        self.kv_cache_memories: dict[str, VLLMKVCacheItem] = {}
+    def extract(self, text: str) -> VLLMKVCacheItem:
+        """Extract memory based on the text.
+        Uses the LLM to build vLLM KV cache from the provided text.
+        For vLLM, this means preloading the KV cache on the server side.
+        Args:
+            text: Input text to extract memory from
+        Returns:
+            Extracted VLLM KV cache item with prompt string
+        """
+        # Build vLLM KV cache from the text using the LLM
+        # This preloads the cache on the vLLM server and returns the prompt
+        prompt = self.llm.build_vllm_kv_cache(text)
+        # Create a VLLMKVCacheItem with the extracted prompt
+        cache_item = VLLMKVCacheItem(
+            memory=prompt,
+            metadata={"source_text": text, "extracted_at": datetime.now().isoformat()},
+        )
+        return cache_item
+    def add(self, memories: list[VLLMKVCacheItem]) -> None:
+        """Add memories to the VLLM KV cache memory.
+        Args:
+            memories: List of VLLMKVCacheItem to add
+        """
+        for memory in memories:
+            self.kv_cache_memories[memory.id] = memory
+    def get_cache(self, cache_ids: list[str]) -> str | None:
+        """Get the prompt string for the most recent cache.
+        Since vLLM handles KV cache on server side, we return the prompt string
+        that can be used for generation. For multiple caches, we return the most recent one.
+        Args:
+            cache_ids: List of cache IDs to consider
+        Returns:
+            Prompt string for the most recent cache or None if no caches found
+        """
+        if not cache_ids:
+            return None
+        # For vLLM, we typically want the most recent cache
+        # Return the prompt from the last cache ID in the list
+        latest_cache_id = cache_ids[-1]
+        cache_item = self.kv_cache_memories.get(latest_cache_id)
+        if cache_item and cache_item.memory:
+            return cache_item.memory
+        return None
+    def get(self, memory_id: str) -> VLLMKVCacheItem | None:
+        """Get a memory by its ID.
+        Args:
+            memory_id: ID of the memory to retrieve
+        Returns:
+            VLLMKVCacheItem or None if not found
+        """
+        return self.kv_cache_memories.get(memory_id)
+    def get_by_ids(self, memory_ids: list[str]) -> list[VLLMKVCacheItem | None]:
+        """Get memories by their IDs.
+        Args:
+            memory_ids: List of memory IDs to retrieve
+        Returns:
+            List of VLLMKVCacheItem or None for missing ones
+        """
+        results = []
+        for memory_id in memory_ids:
+            memory = self.get(memory_id)
+            results.append(memory)
+        return results
+    def get_all(self) -> list[VLLMKVCacheItem]:
+        """Get all memories.
+        Returns:
+            List of all VLLMKVCacheItems in the memory
+        """
+        return list(self.kv_cache_memories.values())
+    def delete(self, memory_ids: list[str]) -> None:
+        """Delete memories by their IDs.
+        Args:
+            memory_ids: List of memory IDs to delete
+        """
+        for memory_id in memory_ids:
+            self.kv_cache_memories.pop(memory_id, None)
+    def delete_all(self) -> None:
+        """Delete all memories."""
+        self.kv_cache_memories.clear()
+    def from_textual_memory(self, mem: TextualMemoryItem) -> VLLMKVCacheItem:
+        """
+        Convert a TextualMemoryItem to a VLLMKVCacheItem.
+        This method extracts the prompt string from the textual memory.
+        """
+        # Build vLLM KV cache from the textual memory content
+        prompt = self.llm.build_vllm_kv_cache(mem.memory)
+        return VLLMKVCacheItem(memory=prompt, metadata=mem.metadata.model_dump())
+    def load(self, dir: str) -> None:
+        """Load memories from os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory containing the memory files.
+        """
+        file_path = os.path.join(dir, self.config.memory_filename)
+        if not os.path.exists(file_path):
+            # If file doesn't exist, start with empty memories
+            return
+        try:
+            # Allow loading VLLMKVCacheItem types
+            import torch
+            torch.serialization.add_safe_globals([VLLMKVCacheItem])
+            with open(file_path, "rb") as f:
+                data = pickle.load(f)
+            if isinstance(data, dict):
+                # Load memories, handle both old and new formats
+                if "kv_cache_memories" in data:
+                    memories = data["kv_cache_memories"]
+                    if isinstance(memories, list):
+                        # Convert list to dict format
+                        self.kv_cache_memories = {item.id: item for item in memories}
+                    else:
+                        self.kv_cache_memories = memories
+                else:
+                    # Reset to empty if no memories in data
+                    self.kv_cache_memories = {}
+            elif isinstance(data, list):
+                # Backward compatibility: convert list to dict
+                self.kv_cache_memories = {item.id: item for item in data}
+            else:
+                # Reset to empty if data format is unexpected
+                self.kv_cache_memories = {}
+        except (EOFError, pickle.UnpicklingError, Exception):
+            # If loading fails, start with empty memories
+            self.kv_cache_memories = {}
+    def dump(self, dir: str) -> None:
+        """Dump memories to os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory where the memory files will be saved.
+        """
+        file_path = os.path.join(dir, self.config.memory_filename)
+        # Create directory if it doesn't exist
+        os.makedirs(dir, exist_ok=True)
+        # Prepare data to save (only memories)
+        data = {"kv_cache_memories": self.kv_cache_memories}
+        with open(file_path, "wb") as f:
+            pickle.dump(data, f, protocol=pickle.HIGHEST_PROTOCOL)
+    def preload_kv_cache(self, cache_ids: list[str]) -> None:
+        """
+        Preload KV cache on vLLM server for the given cache IDs.
+        This method calls build_vllm_kv_cache for each cache to ensure
+        the KV cache is loaded on the server side.
+        Args:
+            cache_ids: List of cache IDs to preload
+        """
+        for cache_id in cache_ids:
+            cache_item = self.kv_cache_memories.get(cache_id)
+            if cache_item and cache_item.memory:
+                # Re-preload the KV cache on the server
+                self.llm.build_vllm_kv_cache(cache_item.memory)

memos/memories/base.py ADDED Viewed

@@ -0,0 +1,19 @@
+from abc import ABC, abstractmethod
+class BaseMemory(ABC):
+    """Base class for all memory implementations."""
+    @abstractmethod
+    def load(self, dir: str) -> None:
+        """Load memories from os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory containing the memory files.
+        """
+    @abstractmethod
+    def dump(self, dir: str) -> None:
+        """Dump memories to os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory where the memory files will be saved.
+        """

memos/memories/factory.py ADDED Viewed

@@ -0,0 +1,42 @@
+from typing import Any, ClassVar
+from memos.configs.memory import MemoryConfigFactory
+from memos.memories.activation.base import BaseActMemory
+from memos.memories.activation.kv import KVCacheMemory
+from memos.memories.activation.vllmkv import VLLMKVCacheMemory
+from memos.memories.base import BaseMemory
+from memos.memories.parametric.base import BaseParaMemory
+from memos.memories.parametric.lora import LoRAMemory
+from memos.memories.textual.base import BaseTextMemory
+from memos.memories.textual.general import GeneralTextMemory
+from memos.memories.textual.naive import NaiveTextMemory
+from memos.memories.textual.preference import PreferenceTextMemory
+from memos.memories.textual.simple_preference import SimplePreferenceTextMemory
+from memos.memories.textual.simple_tree import SimpleTreeTextMemory
+from memos.memories.textual.tree import TreeTextMemory
+class MemoryFactory(BaseMemory):
+    """Factory class for creating memory instances."""
+    backend_to_class: ClassVar[dict[str, Any]] = {
+        "naive_text": NaiveTextMemory,
+        "general_text": GeneralTextMemory,
+        "tree_text": TreeTextMemory,
+        "simple_tree_text": SimpleTreeTextMemory,
+        "pref_text": PreferenceTextMemory,
+        "simple_pref_text": SimplePreferenceTextMemory,
+        "kv_cache": KVCacheMemory,
+        "vllm_kv_cache": VLLMKVCacheMemory,
+        "lora": LoRAMemory,
+    }
+    @classmethod
+    def from_config(
+        cls, config_factory: MemoryConfigFactory
+    ) -> BaseTextMemory | BaseActMemory | BaseParaMemory:
+        backend = config_factory.backend
+        if backend not in cls.backend_to_class:
+            raise ValueError(f"Invalid backend: {backend}")
+        memory_class = cls.backend_to_class[backend]
+        return memory_class(config_factory.config)

memos/memories/parametric/__init__.py ADDED Viewed

File without changes

memos/memories/parametric/base.py ADDED Viewed

@@ -0,0 +1,19 @@
+################################################################
+# TODO:
+# This file currently serves as a placeholder.
+# The actual implementation will be added here in the future.
+# Please do not use this as a functional module yet.
+################################################################
+from abc import abstractmethod
+from memos.configs.memory import BaseParaMemoryConfig
+from memos.memories.base import BaseMemory
+class BaseParaMemory(BaseMemory):
+    """Base class for all parametric memory implementations."""
+    @abstractmethod
+    def __init__(self, config: BaseParaMemoryConfig):
+        """Initialize memory with the given configuration."""

memos/memories/parametric/item.py ADDED Viewed

@@ -0,0 +1,11 @@
+import uuid
+from typing import Any
+from pydantic import BaseModel, Field
+class ParametricMemoryItem(BaseModel):
+    id: str = Field(default_factory=lambda: str(uuid.uuid4()))
+    memory: Any
+    metadata: dict = {}

memos/memories/parametric/lora.py ADDED Viewed

@@ -0,0 +1,41 @@
+################################################################
+# TODO:
+# This file currently serves as a placeholder.
+# The actual implementation will be added here in the future.
+# Please do not use this as a functional module yet.
+################################################################
+import os
+from memos.configs.memory import LoRAMemoryConfig
+from memos.memories.parametric.base import BaseParaMemory
+class LoRAMemory(BaseParaMemory):
+    """
+    LoRA Memory for parametric memories.
+    This memory type is designed to store and retrieve low-rank adaptation (LoRA) parameters.
+    """
+    def __init__(self, config: LoRAMemoryConfig) -> None:
+        """Initialize the LoRA Memory with a configuration."""
+        self.config = config
+    def load(self, dir: str) -> None:
+        """Load memories from os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory containing the memory files.
+        """
+    def dump(self, dir: str) -> None:
+        """Dump memories to os.path.join(dir, self.config.memory_filename)
+        Args:
+            dir (str): The directory where the memory files will be saved.
+        """
+        path = os.path.join(dir, self.config.memory_filename)
+        if not os.path.exists(dir):
+            os.makedirs(dir, exist_ok=True)
+        with open(path, "wb") as f:
+            f.write(b"Placeholder")

memos/memories/textual/__init__.py ADDED Viewed

File without changes