PyPI - MemoryOS - Versions diffs - 1.0.0__py3-none-any.whl → 1.1.1__py3-none-any.whl - Mend

MemoryOS 1.0.0py3-none-any.whl → 1.1.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MemoryOS might be problematic. Click here for more details.

Files changed (94) hide show

{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/METADATA +8 -2
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/RECORD +92 -69
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/WHEEL +1 -1
memos/__init__.py +1 -1
memos/api/client.py +109 -0
memos/api/config.py +35 -8
memos/api/context/dependencies.py +15 -66
memos/api/middleware/request_context.py +63 -0
memos/api/product_api.py +5 -2
memos/api/product_models.py +107 -16
memos/api/routers/product_router.py +62 -19
memos/api/start_api.py +13 -0
memos/configs/graph_db.py +4 -0
memos/configs/mem_scheduler.py +38 -3
memos/configs/memory.py +13 -0
memos/configs/reranker.py +18 -0
memos/context/context.py +255 -0
memos/embedders/factory.py +2 -0
memos/graph_dbs/base.py +4 -2
memos/graph_dbs/nebular.py +368 -223
memos/graph_dbs/neo4j.py +49 -13
memos/graph_dbs/neo4j_community.py +13 -3
memos/llms/factory.py +2 -0
memos/llms/openai.py +74 -2
memos/llms/vllm.py +2 -0
memos/log.py +128 -4
memos/mem_cube/general.py +3 -1
memos/mem_os/core.py +89 -23
memos/mem_os/main.py +3 -6
memos/mem_os/product.py +418 -154
memos/mem_os/utils/reference_utils.py +20 -0
memos/mem_reader/factory.py +2 -0
memos/mem_reader/simple_struct.py +204 -82
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +569 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +126 -56
memos/mem_scheduler/general_modules/dispatcher.py +2 -2
memos/mem_scheduler/general_modules/misc.py +99 -1
memos/mem_scheduler/general_modules/scheduler_logger.py +17 -11
memos/mem_scheduler/general_scheduler.py +40 -88
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +308 -0
memos/mem_scheduler/{general_modules → memory_manage_modules}/retriever.py +34 -7
memos/mem_scheduler/monitors/dispatcher_monitor.py +9 -8
memos/mem_scheduler/monitors/general_monitor.py +119 -39
memos/mem_scheduler/optimized_scheduler.py +124 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/base_model.py +635 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/scheduler_factory.py +2 -0
memos/mem_scheduler/schemas/monitor_schemas.py +96 -29
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +33 -0
memos/mem_scheduler/utils/filter_utils.py +1 -1
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_user/mysql_user_manager.py +4 -2
memos/memories/activation/kv.py +2 -1
memos/memories/textual/item.py +96 -17
memos/memories/textual/naive.py +1 -1
memos/memories/textual/tree.py +57 -3
memos/memories/textual/tree_text_memory/organize/handler.py +4 -2
memos/memories/textual/tree_text_memory/organize/manager.py +28 -14
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +1 -2
memos/memories/textual/tree_text_memory/organize/reorganizer.py +75 -23
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +10 -6
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +6 -2
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +2 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +119 -21
memos/memories/textual/tree_text_memory/retrieve/searcher.py +172 -44
memos/memories/textual/tree_text_memory/retrieve/utils.py +6 -4
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +5 -4
memos/memos_tools/notification_utils.py +46 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +22 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/parsers/factory.py +2 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +24 -0
memos/reranker/concat.py +59 -0
memos/reranker/cosine_local.py +96 -0
memos/reranker/factory.py +48 -0
memos/reranker/http_bge.py +312 -0
memos/reranker/noop.py +16 -0
memos/templates/mem_reader_prompts.py +289 -40
memos/templates/mem_scheduler_prompts.py +242 -0
memos/templates/mos_prompts.py +133 -60
memos/types.py +4 -1
memos/api/context/context.py +0 -147
memos/mem_scheduler/mos_for_test_scheduler.py +0 -146
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/entry_points.txt +0 -0
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info/licenses}/LICENSE +0 -0
/memos/mem_scheduler/{general_modules → webservice_modules}/rabbitmq_service.py +0 -0
/memos/mem_scheduler/{general_modules → webservice_modules}/redis_service.py +0 -0

memos/mem_scheduler/general_modules/misc.py CHANGED Viewed

@@ -1,9 +1,10 @@
 import json
+import os
 from contextlib import suppress
 from datetime import datetime
 from queue import Empty, Full, Queue
-from typing import TYPE_CHECKING, TypeVar
+from typing import TYPE_CHECKING, Any, Generic, TypeVar
 from pydantic import field_serializer
@@ -16,6 +17,75 @@ T = TypeVar("T")
 BaseModelType = TypeVar("T", bound="BaseModel")
+class EnvConfigMixin(Generic[T]):
+    """Abstract base class for environment variable configuration."""
+    ENV_PREFIX = "MEMSCHEDULER_"
+    @classmethod
+    def get_env_prefix(cls) -> str:
+        """Automatically generates environment variable prefix from class name.
+        Converts the class name to uppercase and appends an underscore.
+        If the class name ends with 'Config', that suffix is removed first.
+        Examples:
+            RabbitMQConfig -> "RABBITMQ_"
+            OpenAIConfig -> "OPENAI_"
+            GraphDBAuthConfig -> "GRAPH_DB_AUTH_"
+        """
+        class_name = cls.__name__
+        # Remove 'Config' suffix if present
+        if class_name.endswith("Config"):
+            class_name = class_name[:-6]
+        # Convert to uppercase and add trailing underscore
+        return f"{cls.ENV_PREFIX}{class_name.upper()}_"
+    @classmethod
+    def from_env(cls: type[T]) -> T:
+        """Creates a config instance from environment variables.
+        Reads all environment variables with the class-specific prefix and maps them
+        to corresponding configuration fields (converting to the appropriate types).
+        Returns:
+            An instance of the config class populated from environment variables.
+        Raises:
+            ValueError: If required environment variables are missing.
+        """
+        prefix = cls.get_env_prefix()
+        field_values = {}
+        for field_name, field_info in cls.model_fields.items():
+            env_var = f"{prefix}{field_name.upper()}"
+            field_type = field_info.annotation
+            if field_info.is_required() and env_var not in os.environ:
+                raise ValueError(f"Required environment variable {env_var} is missing")
+            if env_var in os.environ:
+                raw_value = os.environ[env_var]
+                field_values[field_name] = cls._parse_env_value(raw_value, field_type)
+            elif field_info.default is not None:
+                field_values[field_name] = field_info.default
+            else:
+                raise ValueError()
+        return cls(**field_values)
+    @classmethod
+    def _parse_env_value(cls, value: str, target_type: type) -> Any:
+        """Converts environment variable string to appropriate type."""
+        if target_type is bool:
+            return value.lower() in ("true", "1", "t", "y", "yes")
+        if target_type is int:
+            return int(value)
+        if target_type is float:
+            return float(value)
+        return value
 class DictConversionMixin:
     """
     Provides conversion functionality between Pydantic models and dictionaries,
@@ -44,6 +114,26 @@ class DictConversionMixin:
             dump_data["timestamp"] = self.serialize_datetime(self.timestamp, None)
         return dump_data
+    def to_json(self, **kwargs) -> str:
+        """
+        Convert model instance to a JSON string.
+        - Accepts the same kwargs as json.dumps (e.g., indent, ensure_ascii)
+        - Default settings make JSON human-readable and UTF-8 safe
+        """
+        return json.dumps(self.to_dict(), ensure_ascii=False, default=lambda o: str(o), **kwargs)
+    @classmethod
+    def from_json(cls: type[BaseModelType], json_str: str) -> BaseModelType:
+        """
+        Create model instance from a JSON string.
+        - Parses JSON into a dictionary and delegates to from_dict
+        """
+        try:
+            data = json.loads(json_str)
+        except json.JSONDecodeError as e:
+            raise ValueError(f"Invalid JSON string: {e}") from e
+        return cls.from_dict(data)
     @classmethod
     def from_dict(cls: type[BaseModelType], data: dict) -> BaseModelType:
         """
@@ -102,3 +192,11 @@ class AutoDroppingQueue(Queue[T]):
     def get_queue_content_without_pop(self) -> list[T]:
         """Return a copy of the queue's contents without modifying it."""
         return list(self.queue)
+    def clear(self) -> None:
+        """Remove all items from the queue.
+        This operation is thread-safe.
+        """
+        with self.mutex:
+            self.queue.clear()

memos/mem_scheduler/general_modules/scheduler_logger.py CHANGED Viewed

@@ -69,7 +69,7 @@ class SchedulerLoggerModule(BaseSchedulerModule):
                 and mem_cube_id in self.monitor.activation_memory_monitors[user_id]
             ):
                 activation_monitor = self.monitor.activation_memory_monitors[user_id][mem_cube_id]
-                transformed_act_memory_size = len(activation_monitor.memories)
+                transformed_act_memory_size = len(activation_monitor.obj.memories)
                 logger.info(
                     f'activation_memory_monitors currently has "{transformed_act_memory_size}" transformed memory size'
                 )
@@ -98,6 +98,7 @@ class SchedulerLoggerModule(BaseSchedulerModule):
         )
         return log_message
+    # TODO: 日志打出来数量不对
     @log_exceptions(logger=logger)
     def log_working_memory_replacement(
         self,
@@ -125,6 +126,7 @@ class SchedulerLoggerModule(BaseSchedulerModule):
         added_memories = list(new_set - original_set)  # Present in new but not original
         # recording messages
+        log_messages = []
         for memory in added_memories:
             normalized_mem = transform_name_to_key(name=memory)
             if normalized_mem not in memory_type_map:
@@ -145,11 +147,13 @@ class SchedulerLoggerModule(BaseSchedulerModule):
                 mem_cube_id=mem_cube_id,
                 mem_cube=mem_cube,
             )
-            log_func_callback([log_message])
-            logger.info(
-                f"{len(added_memories)} {LONG_TERM_MEMORY_TYPE} memorie(s) "
-                f"transformed to {WORKING_MEMORY_TYPE} memories."
-            )
+            log_messages.append(log_message)
+        logger.info(
+            f"{len(added_memories)} {LONG_TERM_MEMORY_TYPE} memorie(s) "
+            f"transformed to {WORKING_MEMORY_TYPE} memories."
+        )
+        log_func_callback(log_messages)
     @log_exceptions(logger=logger)
     def log_activation_memory_update(
@@ -170,6 +174,7 @@ class SchedulerLoggerModule(BaseSchedulerModule):
         added_memories = list(new_set - original_set)  # Present in new but not original
         # recording messages
+        log_messages = []
         for mem in added_memories:
             log_message_a = self.create_autofilled_log_item(
                 log_content=mem,
@@ -194,12 +199,13 @@ class SchedulerLoggerModule(BaseSchedulerModule):
                 mem_cube_id=mem_cube_id,
                 mem_cube=mem_cube,
             )
-            logger.info(
-                f"{len(added_memories)} {ACTIVATION_MEMORY_TYPE} memorie(s) "
-                f"transformed to {PARAMETER_MEMORY_TYPE} memories."
-            )
-            log_func_callback([log_message_a, log_message_b])
+            log_messages.extend([log_message_a, log_message_b])
+        logger.info(
+            f"{len(added_memories)} {ACTIVATION_MEMORY_TYPE} memorie(s) "
+            f"transformed to {PARAMETER_MEMORY_TYPE} memories."
+        )
+        log_func_callback(log_messages)
     @log_exceptions(logger=logger)
     def log_adding_memory(

memos/mem_scheduler/general_scheduler.py CHANGED Viewed

@@ -27,6 +27,8 @@ class GeneralScheduler(BaseScheduler):
         """Initialize the scheduler with the given configuration."""
         super().__init__(config)
+        self.query_key_words_limit = self.config.get("query_key_words_limit", 20)
         # register handlers
         handlers = {
             QUERY_LABEL: self._query_message_consumer,
@@ -35,78 +37,6 @@ class GeneralScheduler(BaseScheduler):
         }
         self.dispatcher.register_handlers(handlers)
-    # for evaluation
-    def search_for_eval(
-        self, query: str, user_id: UserID | str, top_k: int, scheduler_flag: bool = True
-    ) -> (list[str], bool):
-        self.monitor.register_query_monitor_if_not_exists(
-            user_id=user_id, mem_cube_id=self.current_mem_cube_id
-        )
-        query_keywords = self.monitor.extract_query_keywords(query=query)
-        logger.info(f'Extract keywords "{query_keywords}" from query "{query}"')
-        item = QueryMonitorItem(
-            query_text=query,
-            keywords=query_keywords,
-            max_keywords=DEFAULT_MAX_QUERY_KEY_WORDS,
-        )
-        query_monitor = self.monitor.query_monitors[user_id][self.current_mem_cube_id]
-        query_monitor.put(item=item)
-        logger.debug(f"Queries in monitor are {query_monitor.get_queries_with_timesort()}.")
-        queries = [query]
-        # recall
-        mem_cube = self.current_mem_cube
-        text_mem_base = mem_cube.text_mem
-        cur_working_memory: list[TextualMemoryItem] = text_mem_base.get_working_memory()
-        text_working_memory: list[str] = [w_m.memory for w_m in cur_working_memory]
-        intent_result = self.monitor.detect_intent(
-            q_list=queries, text_working_memory=text_working_memory
-        )
-        if not scheduler_flag:
-            return text_working_memory, intent_result["trigger_retrieval"]
-        else:
-            if intent_result["trigger_retrieval"]:
-                missing_evidences = intent_result["missing_evidences"]
-                num_evidence = len(missing_evidences)
-                k_per_evidence = max(1, top_k // max(1, num_evidence))
-                new_candidates = []
-                for item in missing_evidences:
-                    logger.info(f"missing_evidences: {item}")
-                    results: list[TextualMemoryItem] = self.retriever.search(
-                        query=item,
-                        mem_cube=mem_cube,
-                        top_k=k_per_evidence,
-                        method=self.search_method,
-                    )
-                    logger.info(
-                        f"search results for {missing_evidences}: {[one.memory for one in results]}"
-                    )
-                    new_candidates.extend(results)
-                print(
-                    f"missing_evidences: {missing_evidences} and get {len(new_candidates)} new candidate memories."
-                )
-            else:
-                new_candidates = []
-                print(f"intent_result: {intent_result}. not triggered")
-            # rerank
-            new_order_working_memory = self.replace_working_memory(
-                user_id=user_id,
-                mem_cube_id=self.current_mem_cube_id,
-                mem_cube=self.current_mem_cube,
-                original_memory=cur_working_memory,
-                new_memory=new_candidates,
-            )
-            new_order_working_memory = new_order_working_memory[:top_k]
-            logger.info(f"size of new_order_working_memory: {len(new_order_working_memory)}")
-            return [m.memory for m in new_order_working_memory], intent_result["trigger_retrieval"]
     def _query_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
         """
         Process and handle query trigger messages from the queue.
@@ -140,7 +70,9 @@ class GeneralScheduler(BaseScheduler):
                     query = msg.content
                     query_keywords = self.monitor.extract_query_keywords(query=query)
-                    logger.info(f'Extract keywords "{query_keywords}" from query "{query}"')
+                    logger.info(
+                        f'Extracted keywords "{query_keywords}" from query "{query}" for user_id={user_id}'
+                    )
                     if len(query_keywords) == 0:
                         stripped_query = query.strip()
@@ -155,21 +87,26 @@ class GeneralScheduler(BaseScheduler):
                             )
                             words = stripped_query  # Default to character count
-                        query_keywords = list(set(words[:20]))
+                        query_keywords = list(set(words[: self.query_key_words_limit]))
                         logger.error(
-                            f"Keyword extraction failed for query. Using fallback keywords: {query_keywords[:10]}... (truncated)"
+                            f"Keyword extraction failed for query '{query}' (user_id={user_id}). Using fallback keywords: {query_keywords[:10]}... (truncated)",
+                            exc_info=True,
                         )
                     item = QueryMonitorItem(
+                        user_id=user_id,
+                        mem_cube_id=mem_cube_id,
                         query_text=query,
                         keywords=query_keywords,
                         max_keywords=DEFAULT_MAX_QUERY_KEY_WORDS,
                     )
-                    self.monitor.query_monitors[user_id][mem_cube_id].put(item=item)
+                    query_db_manager = self.monitor.query_monitors[user_id][mem_cube_id]
+                    query_db_manager.obj.put(item=item)
+                    # Sync with database after adding new item
+                    query_db_manager.sync_with_orm()
                 logger.debug(
-                    f"Queries in monitor are "
-                    f"{self.monitor.query_monitors[user_id][mem_cube_id].get_queries_with_timesort()}."
+                    f"Queries in monitor for user_id={user_id}, mem_cube_id={mem_cube_id}: {query_db_manager.obj.get_queries_with_timesort()}"
                 )
                 queries = [msg.content for msg in messages]
@@ -183,7 +120,7 @@ class GeneralScheduler(BaseScheduler):
                     top_k=self.top_k,
                 )
                 logger.info(
-                    f"Processed {queries} and get {len(new_candidates)} new candidate memories."
+                    f"Processed {len(queries)} queries {queries} and retrieved {len(new_candidates)} new candidate memories for user_id={user_id}"
                 )
                 # rerank
@@ -194,7 +131,9 @@ class GeneralScheduler(BaseScheduler):
                     original_memory=cur_working_memory,
                     new_memory=new_candidates,
                 )
-                logger.info(f"size of new_order_working_memory: {len(new_order_working_memory)}")
+                logger.info(
+                    f"Final working memory size: {len(new_order_working_memory)} memories for user_id={user_id}"
+                )
                 # update activation memories
                 logger.info(
@@ -293,10 +232,17 @@ class GeneralScheduler(BaseScheduler):
         text_mem_base = mem_cube.text_mem
         if not isinstance(text_mem_base, TreeTextMemory):
-            logger.error("Not implemented!", exc_info=True)
+            logger.error(
+                f"Not implemented! Expected TreeTextMemory but got {type(text_mem_base).__name__} "
+                f"for mem_cube_id={mem_cube_id}, user_id={user_id}. "
+                f"text_mem_base value: {text_mem_base}",
+                exc_info=True,
+            )
             return
-        logger.info(f"Processing {len(queries)} queries.")
+        logger.info(
+            f"Processing {len(queries)} queries for user_id={user_id}, mem_cube_id={mem_cube_id}"
+        )
         cur_working_memory: list[TextualMemoryItem] = text_mem_base.get_working_memory()
         text_working_memory: list[str] = [w_m.memory for w_m in cur_working_memory]
@@ -312,16 +258,20 @@ class GeneralScheduler(BaseScheduler):
             time_trigger_flag = True
         if (not intent_result["trigger_retrieval"]) and (not time_trigger_flag):
-            logger.info(f"Query schedule not triggered. Intent_result: {intent_result}")
+            logger.info(
+                f"Query schedule not triggered for user_id={user_id}, mem_cube_id={mem_cube_id}. Intent_result: {intent_result}"
+            )
             return
         elif (not intent_result["trigger_retrieval"]) and time_trigger_flag:
-            logger.info("Query schedule is forced to trigger due to time ticker")
+            logger.info(
+                f"Query schedule forced to trigger due to time ticker for user_id={user_id}, mem_cube_id={mem_cube_id}"
+            )
             intent_result["trigger_retrieval"] = True
             intent_result["missing_evidences"] = queries
         else:
             logger.info(
-                f'Query schedule triggered for user "{user_id}" and mem_cube "{mem_cube_id}".'
-                f" Missing evidences: {intent_result['missing_evidences']}"
+                f"Query schedule triggered for user_id={user_id}, mem_cube_id={mem_cube_id}. "
+                f"Missing evidences: {intent_result['missing_evidences']}"
             )
         missing_evidences = intent_result["missing_evidences"]
@@ -329,7 +279,9 @@ class GeneralScheduler(BaseScheduler):
         k_per_evidence = max(1, top_k // max(1, num_evidence))
         new_candidates = []
         for item in missing_evidences:
-            logger.info(f"missing_evidences: {item}")
+            logger.info(
+                f"Searching for missing evidence: '{item}' with top_k={k_per_evidence} for user_id={user_id}"
+            )
             info = {
                 "user_id": user_id,
                 "session_id": "",
@@ -343,7 +295,7 @@ class GeneralScheduler(BaseScheduler):
                 info=info,
             )
             logger.info(
-                f"search results for {missing_evidences}: {[one.memory for one in results]}"
+                f"Search results for missing evidence '{item}': {[one.memory for one in results]}"
             )
             new_candidates.extend(results)
         return cur_working_memory, new_candidates

memos/mem_scheduler/memory_manage_modules/__init__.py ADDED Viewed

@@ -0,0 +1,5 @@
+from .memory_filter import MemoryFilter
+from .retriever import SchedulerRetriever
+__all__ = ["MemoryFilter", "SchedulerRetriever"]

MemoryOS 1.0.0__py3-none-any.whl → 1.1.1__py3-none-any.whl

Potentially problematic release.

MemoryOS 1.0.0py3-none-any.whl → 1.1.1py3-none-any.whl