PyPI - MemoryOS - Versions diffs - 0.0.1__py3-none-any.whl → 0.1.12__py3-none-any.whl - Mend

MemoryOS 0.0.1py3-none-any.whl → 0.1.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MemoryOS might be problematic. Click here for more details.

Files changed (119) hide show

memoryos-0.1.12.dist-info/METADATA +257 -0
memoryos-0.1.12.dist-info/RECORD +117 -0
memos/__init__.py +20 -1
memos/api/start_api.py +420 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/factory.py +22 -0
memos/chunkers/sentence_chunker.py +35 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +45 -0
memos/configs/embedder.py +53 -0
memos/configs/graph_db.py +45 -0
memos/configs/llm.py +71 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +89 -0
memos/configs/mem_os.py +70 -0
memos/configs/mem_reader.py +53 -0
memos/configs/mem_scheduler.py +78 -0
memos/configs/memory.py +190 -0
memos/configs/parser.py +38 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +64 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/base.py +15 -0
memos/embedders/factory.py +23 -0
memos/embedders/ollama.py +74 -0
memos/embedders/sentence_transformer.py +40 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +215 -0
memos/graph_dbs/factory.py +21 -0
memos/graph_dbs/neo4j.py +827 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +16 -0
memos/llms/factory.py +25 -0
memos/llms/hf.py +231 -0
memos/llms/ollama.py +82 -0
memos/llms/openai.py +34 -0
memos/llms/utils.py +14 -0
memos/log.py +78 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +29 -0
memos/mem_cube/general.py +146 -0
memos/mem_cube/utils.py +24 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +819 -0
memos/mem_os/main.py +12 -0
memos/mem_os/product.py +89 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +27 -0
memos/mem_reader/factory.py +21 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/simple_struct.py +241 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/base_scheduler.py +164 -0
memos/mem_scheduler/general_scheduler.py +305 -0
memos/mem_scheduler/modules/__init__.py +0 -0
memos/mem_scheduler/modules/base.py +74 -0
memos/mem_scheduler/modules/dispatcher.py +103 -0
memos/mem_scheduler/modules/monitor.py +82 -0
memos/mem_scheduler/modules/redis_service.py +146 -0
memos/mem_scheduler/modules/retriever.py +41 -0
memos/mem_scheduler/modules/schemas.py +146 -0
memos/mem_scheduler/scheduler_factory.py +21 -0
memos/mem_scheduler/utils.py +26 -0
memos/mem_user/user_manager.py +478 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +25 -0
memos/memories/activation/kv.py +232 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +34 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +89 -0
memos/memories/textual/general.py +286 -0
memos/memories/textual/item.py +167 -0
memos/memories/textual/naive.py +185 -0
memos/memories/textual/tree.py +289 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/manager.py +305 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +64 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +158 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +13 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +166 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +68 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +48 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +19 -0
memos/parsers/markitdown.py +22 -0
memos/settings.py +8 -0
memos/templates/__init__.py +0 -0
memos/templates/mem_reader_prompts.py +98 -0
memos/templates/mem_scheduler_prompts.py +65 -0
memos/types.py +55 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +105 -0
memos/vec_dbs/factory.py +21 -0
memos/vec_dbs/item.py +43 -0
memos/vec_dbs/qdrant.py +292 -0
memoryos-0.0.1.dist-info/METADATA +0 -53
memoryos-0.0.1.dist-info/RECORD +0 -5
{memoryos-0.0.1.dist-info → memoryos-0.1.12.dist-info}/LICENSE +0 -0
{memoryos-0.0.1.dist-info → memoryos-0.1.12.dist-info}/WHEEL +0 -0

memos/mem_reader/simple_struct.py ADDED Viewed

@@ -0,0 +1,241 @@
+import concurrent.futures
+import copy
+import json
+from abc import ABC
+from typing import Any
+from memos import log
+from memos.chunkers import ChunkerFactory
+from memos.configs.mem_reader import SimpleStructMemReaderConfig
+from memos.configs.parser import ParserConfigFactory
+from memos.embedders.factory import EmbedderFactory
+from memos.llms.factory import LLMFactory
+from memos.mem_reader.base import BaseMemReader
+from memos.memories.textual.item import TextualMemoryItem, TreeNodeTextualMemoryMetadata
+from memos.parsers.factory import ParserFactory
+from memos.templates.mem_reader_prompts import (
+    SIMPLE_STRUCT_DOC_READER_PROMPT,
+    SIMPLE_STRUCT_MEM_READER_PROMPT,
+)
+logger = log.get_logger(__name__)
+class SimpleStructMemReader(BaseMemReader, ABC):
+    """Naive implementation of MemReader."""
+    def __init__(self, config: SimpleStructMemReaderConfig):
+        """
+        Initialize the NaiveMemReader with configuration.
+        Args:
+            config: Configuration object for the reader
+        """
+        self.config = config
+        self.llm = LLMFactory.from_config(config.llm)
+        self.embedder = EmbedderFactory.from_config(config.embedder)
+        self.chunker = ChunkerFactory.from_config(config.chunker)
+    def _process_chat_data(self, scene_data_info, info):
+        prompt = (
+            SIMPLE_STRUCT_MEM_READER_PROMPT.replace("${user_a}", "user")
+            .replace("${user_b}", "assistant")
+            .replace("${conversation}", "\n".join(scene_data_info))
+        )
+        messages = [{"role": "user", "content": prompt}]
+        response_text = self.llm.generate(messages)
+        response_json = self.parse_json_result(response_text)
+        chat_read_nodes = []
+        for memory_i_raw in response_json.get("memory list", []):
+            node_i = TextualMemoryItem(
+                memory=memory_i_raw.get("value", ""),
+                metadata=TreeNodeTextualMemoryMetadata(
+                    user_id=info.get("user_id"),
+                    session_id=info.get("session_id"),
+                    memory_type=memory_i_raw.get("memory_type", ""),
+                    status="activated",
+                    tags=memory_i_raw.get("tags", ""),
+                    key=memory_i_raw.get("key", ""),
+                    embedding=self.embedder.embed([memory_i_raw.get("value", "")])[0],
+                    usage=[],
+                    sources=scene_data_info,
+                    background=response_json.get("summary", ""),
+                    confidence=0.99,
+                    type="fact",
+                ),
+            )
+            chat_read_nodes.append(node_i)
+        return chat_read_nodes
+    def get_memory(
+        self, scene_data: list, type: str, info: dict[str, Any]
+    ) -> list[list[TextualMemoryItem]]:
+        """
+        Extract and classify memory content from scene_data.
+        For dictionaries: Use LLM to summarize pairs of Q&A
+        For file paths: Use chunker to split documents and LLM to summarize each chunk
+        Args:
+            scene_data: List of dialogue information or document paths
+            type: Type of scene_data: ['doc', 'chat']
+            info: Dictionary containing user_id and session_id.
+                Must be in format: {"user_id": "1111", "session_id": "2222"}
+                Optional parameters:
+                - topic_chunk_size: Size for large topic chunks (default: 1024)
+                - topic_chunk_overlap: Overlap for large topic chunks (default: 100)
+                - chunk_size: Size for small chunks (default: 256)
+                - chunk_overlap: Overlap for small chunks (default: 50)
+        Returns:
+            list[list[TextualMemoryItem]] containing memory content with summaries as keys and original text as values
+        Raises:
+            ValueError: If scene_data is empty or if info dictionary is missing required fields
+        """
+        if not scene_data:
+            raise ValueError("scene_data is empty")
+        # Validate info dictionary format
+        if not isinstance(info, dict):
+            raise ValueError("info must be a dictionary")
+        required_fields = {"user_id", "session_id"}
+        missing_fields = required_fields - set(info.keys())
+        if missing_fields:
+            raise ValueError(f"info dictionary is missing required fields: {missing_fields}")
+        if not all(isinstance(info[field], str) for field in required_fields):
+            raise ValueError("user_id and session_id must be strings")
+        list_scene_data_info = self.get_scene_data_info(scene_data, type)
+        memory_list = []
+        if type == "chat":
+            processing_func = self._process_chat_data
+        elif type == "doc":
+            processing_func = self._process_doc_data
+        else:
+            processing_func = self._process_doc_data
+        # Process Q&A pairs concurrently
+        with concurrent.futures.ThreadPoolExecutor() as executor:
+            futures = [
+                executor.submit(processing_func, scene_data_info, info)
+                for scene_data_info in list_scene_data_info
+            ]
+            for future in concurrent.futures.as_completed(futures):
+                res_memory = future.result()
+                memory_list.append(res_memory)
+        return memory_list
+    def get_scene_data_info(self, scene_data: list, type: str) -> list[str]:
+        """
+        Get raw information from scene_data.
+        If scene_data contains dictionaries, convert them to strings.
+        If scene_data contains file paths, parse them using the parser.
+        Args:
+            scene_data: List of dialogue information or document paths
+            type: Type of scene data: ['doc', 'chat']
+        Returns:
+            List of strings containing the processed scene data
+        """
+        results = []
+        parser_config = ParserConfigFactory.model_validate(
+            {
+                "backend": "markitdown",
+                "config": {},
+            }
+        )
+        parser = ParserFactory.from_config(parser_config)
+        if type == "chat":
+            for items in scene_data:
+                result = []
+                for item in items:
+                    # Convert dictionary to string
+                    if "chat_time" in item:
+                        mem = item["role"] + ": " + f"[{item['chat_time']}]: " + item["content"]
+                        result.append(mem)
+                    else:
+                        mem = item["role"] + ":" + item["content"]
+                        result.append(mem)
+                    if len(result) >= 10:
+                        results.append(result)
+                        context = copy.deepcopy(result[-2:])
+                        result = context
+                if result:
+                    results.append(result)
+        elif type == "doc":
+            for item in scene_data:
+                try:
+                    parsed_text = parser.parse(item)
+                    results.append({"file": item, "text": parsed_text})
+                except Exception as e:
+                    print(f"Error parsing file {item}: {e!s}")
+        return results
+    def _process_doc_data(self, scene_data_info, info):
+        chunks = self.chunker.chunk(scene_data_info["text"])
+        messages = [
+            [
+                {
+                    "role": "user",
+                    "content": SIMPLE_STRUCT_DOC_READER_PROMPT.replace("{chunk_text}", chunk.text),
+                }
+            ]
+            for chunk in chunks
+        ]
+        processed_chunks = []
+        with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
+            futures = [executor.submit(self.llm.generate, message) for message in messages]
+            for future in concurrent.futures.as_completed(futures):
+                chunk_result = future.result()
+                if chunk_result:
+                    processed_chunks.append(chunk_result)
+        processed_chunks = [self.parse_json_result(r) for r in processed_chunks]
+        doc_nodes = []
+        for i, chunk_res in enumerate(processed_chunks):
+            if chunk_res:
+                node_i = TextualMemoryItem(
+                    memory=chunk_res["summary"],
+                    metadata=TreeNodeTextualMemoryMetadata(
+                        user_id=info.get("user_id"),
+                        session_id=info.get("session_id"),
+                        memory_type="LongTermMemory",
+                        status="activated",
+                        tags=chunk_res["tags"],
+                        key="",
+                        embedding=self.embedder.embed([chunk_res["summary"]])[0],
+                        usage=[],
+                        sources=[f"{scene_data_info['file']}_{i}"],
+                        background="",
+                        confidence=0.99,
+                        type="fact",
+                    ),
+                )
+                doc_nodes.append(node_i)
+        return doc_nodes
+    def parse_json_result(self, response_text):
+        try:
+            response_text = response_text.replace("```", "").replace("json", "")
+            response_json = json.loads(response_text)
+            return response_json
+        except json.JSONDecodeError as e:
+            logger.warning(
+                f"Failed to parse LLM response as JSON: {e}\nRaw response:\n{response_text}"
+            )
+            return {}
+    def transform_memreader(self, data: dict) -> list[TextualMemoryItem]:
+        pass

memos/mem_scheduler/__init__.py ADDED Viewed

File without changes

memos/mem_scheduler/base_scheduler.py ADDED Viewed

@@ -0,0 +1,164 @@
+import queue
+import threading
+import time
+from abc import abstractmethod
+from queue import Queue
+from memos.configs.mem_scheduler import BaseSchedulerConfig
+from memos.llms.base import BaseLLM
+from memos.log import get_logger
+from memos.mem_scheduler.modules.dispatcher import SchedulerDispatcher
+from memos.mem_scheduler.modules.redis_service import RedisSchedulerModule
+from memos.mem_scheduler.modules.schemas import (
+    DEFAULT_CONSUME_INTERVAL_SECONDS,
+    DEFAULT_THREAD__POOL_MAX_WORKERS,
+    ScheduleLogForWebItem,
+    ScheduleMessageItem,
+)
+logger = get_logger(__name__)
+class BaseScheduler(RedisSchedulerModule):
+    """Base class for all mem_scheduler."""
+    def __init__(self, config: BaseSchedulerConfig):
+        """Initialize the scheduler with the given configuration."""
+        super().__init__()
+        self.config = config
+        self.max_workers = self.config.get(
+            "thread_pool_max_workers", DEFAULT_THREAD__POOL_MAX_WORKERS
+        )
+        self.retriever = None
+        self.monitor = None
+        self.enable_parallel_dispatch = self.config.get("enable_parallel_dispatch", False)
+        self.dispatcher = SchedulerDispatcher(
+            max_workers=self.max_workers, enable_parallel_dispatch=self.enable_parallel_dispatch
+        )
+        # message queue
+        self.memos_message_queue: Queue[ScheduleMessageItem] = Queue()
+        self._web_log_message_queue: Queue[ScheduleLogForWebItem] = Queue()
+        self._consumer_thread = None  # Reference to our consumer thread
+        self._running = False
+        self._consume_interval = self.config.get(
+            "consume_interval_seconds", DEFAULT_CONSUME_INTERVAL_SECONDS
+        )
+        # others
+        self._current_user_id: str | None = None
+    @abstractmethod
+    def initialize_modules(self, chat_llm: BaseLLM) -> None:
+        """Initialize all necessary modules for the scheduler
+        Args:
+            chat_llm: The LLM instance to be used for chat interactions
+        """
+    def submit_messages(self, messages: ScheduleMessageItem | list[ScheduleMessageItem]):
+        """Submit multiple messages to the message queue."""
+        if isinstance(messages, ScheduleMessageItem):
+            messages = [messages]  # transform single message to list
+        for message in messages:
+            self.memos_message_queue.put(message)
+            logger.info(f"Submitted message: {message.label} - {message.content}")
+    def _submit_web_logs(self, messages: ScheduleLogForWebItem | list[ScheduleLogForWebItem]):
+        if isinstance(messages, ScheduleLogForWebItem):
+            messages = [messages]  # transform single message to list
+        for message in messages:
+            self._web_log_message_queue.put(message)
+            logger.info(
+                f"Submitted Scheduling log for web: {message.log_title} - {message.log_content}"
+            )
+        logger.debug(f"{len(messages)} submitted. {self._web_log_message_queue.qsize()} in queue.")
+    def get_web_log_messages(self) -> list[dict]:
+        """
+        Retrieves all web log messages from the queue and returns them as a list of JSON-serializable dictionaries.
+        Returns:
+            List[dict]: A list of dictionaries representing ScheduleLogForWebItem objects,
+                       ready for JSON serialization. The list is ordered from oldest to newest.
+        """
+        messages = []
+        # Process all items in the queue
+        while not self._web_log_message_queue.empty():
+            item = self._web_log_message_queue.get()
+            # Convert the ScheduleLogForWebItem to a dictionary and ensure datetime is serialized
+            item_dict = item.to_dict()
+            messages.append(item_dict)
+        return messages
+    def _message_consumer(self) -> None:
+        """
+        Continuously checks the queue for messages and dispatches them.
+        Runs in a dedicated thread to process messages at regular intervals.
+        """
+        while self._running:  # Use a running flag for graceful shutdown
+            try:
+                # Check if queue has messages (non-blocking)
+                if not self.memos_message_queue.empty():
+                    # Get all available messages at once
+                    messages = []
+                    while not self.memos_message_queue.empty():
+                        try:
+                            messages.append(self.memos_message_queue.get_nowait())
+                        except queue.Empty:
+                            break
+                    if messages:
+                        try:
+                            self.dispatcher.dispatch(messages)
+                        except Exception as e:
+                            logger.error(f"Error dispatching messages: {e!s}")
+                        finally:
+                            # Mark all messages as processed
+                            for _ in messages:
+                                self.memos_message_queue.task_done()
+                # Sleep briefly to prevent busy waiting
+                time.sleep(self._consume_interval)  # Adjust interval as needed
+            except Exception as e:
+                logger.error(f"Unexpected error in message consumer: {e!s}")
+                time.sleep(self._consume_interval)  # Prevent tight error loops
+    def start(self) -> None:
+        """
+        Start the message consumer thread.
+        Initializes and starts a daemon thread that will periodically
+        check for and process messages from the queue.
+        """
+        if self._consumer_thread is not None and self._consumer_thread.is_alive():
+            logger.warning("Consumer thread is already running")
+            return
+        self._running = True
+        self._consumer_thread = threading.Thread(
+            target=self._message_consumer,
+            daemon=True,  # Allows program to exit even if thread is running
+            name="MessageConsumerThread",
+        )
+        self._consumer_thread.start()
+        logger.info("Message consumer thread started")
+    def stop(self) -> None:
+        """Stop the consumer thread and clean up resources."""
+        if self._consumer_thread is None or not self._running:
+            logger.warning("Consumer thread is not running")
+            return
+        self._running = False
+        if self._consumer_thread.is_alive():
+            self._consumer_thread.join(timeout=5.0)  # Wait up to 5 seconds
+            if self._consumer_thread.is_alive():
+                logger.warning("Consumer thread did not stop gracefully")
+        logger.info("Message consumer thread stopped")

MemoryOS 0.0.1__py3-none-any.whl → 0.1.12__py3-none-any.whl

Potentially problematic release.

MemoryOS 0.0.1py3-none-any.whl → 0.1.12py3-none-any.whl