PyPI - MemoryOS - Versions diffs - 1.0.0__py3-none-any.whl → 1.1.1__py3-none-any.whl - Mend

MemoryOS 1.0.0py3-none-any.whl → 1.1.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MemoryOS might be problematic. Click here for more details.

Files changed (94) hide show

{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/METADATA +8 -2
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/RECORD +92 -69
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/WHEEL +1 -1
memos/__init__.py +1 -1
memos/api/client.py +109 -0
memos/api/config.py +35 -8
memos/api/context/dependencies.py +15 -66
memos/api/middleware/request_context.py +63 -0
memos/api/product_api.py +5 -2
memos/api/product_models.py +107 -16
memos/api/routers/product_router.py +62 -19
memos/api/start_api.py +13 -0
memos/configs/graph_db.py +4 -0
memos/configs/mem_scheduler.py +38 -3
memos/configs/memory.py +13 -0
memos/configs/reranker.py +18 -0
memos/context/context.py +255 -0
memos/embedders/factory.py +2 -0
memos/graph_dbs/base.py +4 -2
memos/graph_dbs/nebular.py +368 -223
memos/graph_dbs/neo4j.py +49 -13
memos/graph_dbs/neo4j_community.py +13 -3
memos/llms/factory.py +2 -0
memos/llms/openai.py +74 -2
memos/llms/vllm.py +2 -0
memos/log.py +128 -4
memos/mem_cube/general.py +3 -1
memos/mem_os/core.py +89 -23
memos/mem_os/main.py +3 -6
memos/mem_os/product.py +418 -154
memos/mem_os/utils/reference_utils.py +20 -0
memos/mem_reader/factory.py +2 -0
memos/mem_reader/simple_struct.py +204 -82
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +569 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +126 -56
memos/mem_scheduler/general_modules/dispatcher.py +2 -2
memos/mem_scheduler/general_modules/misc.py +99 -1
memos/mem_scheduler/general_modules/scheduler_logger.py +17 -11
memos/mem_scheduler/general_scheduler.py +40 -88
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +308 -0
memos/mem_scheduler/{general_modules → memory_manage_modules}/retriever.py +34 -7
memos/mem_scheduler/monitors/dispatcher_monitor.py +9 -8
memos/mem_scheduler/monitors/general_monitor.py +119 -39
memos/mem_scheduler/optimized_scheduler.py +124 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/base_model.py +635 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/scheduler_factory.py +2 -0
memos/mem_scheduler/schemas/monitor_schemas.py +96 -29
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +33 -0
memos/mem_scheduler/utils/filter_utils.py +1 -1
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_user/mysql_user_manager.py +4 -2
memos/memories/activation/kv.py +2 -1
memos/memories/textual/item.py +96 -17
memos/memories/textual/naive.py +1 -1
memos/memories/textual/tree.py +57 -3
memos/memories/textual/tree_text_memory/organize/handler.py +4 -2
memos/memories/textual/tree_text_memory/organize/manager.py +28 -14
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +1 -2
memos/memories/textual/tree_text_memory/organize/reorganizer.py +75 -23
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +10 -6
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +6 -2
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +2 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +119 -21
memos/memories/textual/tree_text_memory/retrieve/searcher.py +172 -44
memos/memories/textual/tree_text_memory/retrieve/utils.py +6 -4
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +5 -4
memos/memos_tools/notification_utils.py +46 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +22 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/parsers/factory.py +2 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +24 -0
memos/reranker/concat.py +59 -0
memos/reranker/cosine_local.py +96 -0
memos/reranker/factory.py +48 -0
memos/reranker/http_bge.py +312 -0
memos/reranker/noop.py +16 -0
memos/templates/mem_reader_prompts.py +289 -40
memos/templates/mem_scheduler_prompts.py +242 -0
memos/templates/mos_prompts.py +133 -60
memos/types.py +4 -1
memos/api/context/context.py +0 -147
memos/mem_scheduler/mos_for_test_scheduler.py +0 -146
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info}/entry_points.txt +0 -0
{memoryos-1.0.0.dist-info → memoryos-1.1.1.dist-info/licenses}/LICENSE +0 -0
/memos/mem_scheduler/{general_modules → webservice_modules}/rabbitmq_service.py +0 -0
/memos/mem_scheduler/{general_modules → webservice_modules}/redis_service.py +0 -0

memos/mem_os/utils/reference_utils.py CHANGED Viewed

@@ -1,3 +1,8 @@
+from memos.memories.textual.item import (
+    TextualMemoryItem,
+)
 def split_continuous_references(text: str) -> str:
     """
     Split continuous reference tags into individual reference tags.
@@ -131,3 +136,18 @@ def process_streaming_references_complete(text_buffer: str) -> tuple[str, str]:
     # No reference-like patterns found, process all text
     processed_text = split_continuous_references(text_buffer)
     return processed_text, ""
+def prepare_reference_data(memories_list: list[TextualMemoryItem]) -> list[dict]:
+    # Prepare reference data
+    reference = []
+    for memories in memories_list:
+        memories_json = memories.model_dump()
+        memories_json["metadata"]["ref_id"] = f"{memories.id.split('-')[0]}"
+        memories_json["metadata"]["embedding"] = []
+        memories_json["metadata"]["sources"] = []
+        memories_json["metadata"]["memory"] = memories.memory
+        memories_json["metadata"]["id"] = memories.id
+        reference.append({"metadata": memories_json["metadata"]})
+    return reference

memos/mem_reader/factory.py CHANGED Viewed

@@ -3,6 +3,7 @@ from typing import Any, ClassVar
 from memos.configs.mem_reader import MemReaderConfigFactory
 from memos.mem_reader.base import BaseMemReader
 from memos.mem_reader.simple_struct import SimpleStructMemReader
+from memos.memos_tools.singleton import singleton_factory
 class MemReaderFactory(BaseMemReader):
@@ -13,6 +14,7 @@ class MemReaderFactory(BaseMemReader):
     }
     @classmethod
+    @singleton_factory()
     def from_config(cls, config_factory: MemReaderConfigFactory) -> BaseMemReader:
         backend = config_factory.backend
         if backend not in cls.backend_to_class:

memos/mem_reader/simple_struct.py CHANGED Viewed

@@ -1,14 +1,19 @@
 import concurrent.futures
 import copy
 import json
+import os
+import re
 from abc import ABC
 from typing import Any
+from tqdm import tqdm
 from memos import log
 from memos.chunkers import ChunkerFactory
 from memos.configs.mem_reader import SimpleStructMemReaderConfig
 from memos.configs.parser import ParserConfigFactory
+from memos.context.context import ContextThreadPoolExecutor
 from memos.embedders.factory import EmbedderFactory
 from memos.llms.factory import LLMFactory
 from memos.mem_reader.base import BaseMemReader
@@ -16,12 +21,95 @@ from memos.memories.textual.item import TextualMemoryItem, TreeNodeTextualMemory
 from memos.parsers.factory import ParserFactory
 from memos.templates.mem_reader_prompts import (
     SIMPLE_STRUCT_DOC_READER_PROMPT,
+    SIMPLE_STRUCT_DOC_READER_PROMPT_ZH,
     SIMPLE_STRUCT_MEM_READER_EXAMPLE,
+    SIMPLE_STRUCT_MEM_READER_EXAMPLE_ZH,
     SIMPLE_STRUCT_MEM_READER_PROMPT,
+    SIMPLE_STRUCT_MEM_READER_PROMPT_ZH,
 )
+from memos.utils import timed
 logger = log.get_logger(__name__)
+PROMPT_DICT = {
+    "chat": {
+        "en": SIMPLE_STRUCT_MEM_READER_PROMPT,
+        "zh": SIMPLE_STRUCT_MEM_READER_PROMPT_ZH,
+        "en_example": SIMPLE_STRUCT_MEM_READER_EXAMPLE,
+        "zh_example": SIMPLE_STRUCT_MEM_READER_EXAMPLE_ZH,
+    },
+    "doc": {"en": SIMPLE_STRUCT_DOC_READER_PROMPT, "zh": SIMPLE_STRUCT_DOC_READER_PROMPT_ZH},
+}
+def detect_lang(text):
+    try:
+        if not text or not isinstance(text, str):
+            return "en"
+        chinese_pattern = r"[\u4e00-\u9fff\u3400-\u4dbf\U00020000-\U0002a6df\U0002a700-\U0002b73f\U0002b740-\U0002b81f\U0002b820-\U0002ceaf\uf900-\ufaff]"
+        chinese_chars = re.findall(chinese_pattern, text)
+        if len(chinese_chars) / len(re.sub(r"[\s\d\W]", "", text)) > 0.3:
+            return "zh"
+        return "en"
+    except Exception:
+        return "en"
+def _build_node(idx, message, info, scene_file, llm, parse_json_result, embedder):
+    # generate
+    try:
+        raw = llm.generate(message)
+        if not raw:
+            logger.warning(f"[LLM] Empty generation for input: {message}")
+            return None
+    except Exception as e:
+        logger.error(f"[LLM] Exception during generation: {e}")
+        return None
+    # parse_json_result
+    try:
+        chunk_res = parse_json_result(raw)
+        if not chunk_res:
+            logger.warning(f"[Parse] Failed to parse result: {raw}")
+            return None
+    except Exception as e:
+        logger.error(f"[Parse] Exception during JSON parsing: {e}")
+        return None
+    try:
+        value = chunk_res.get("value", "").strip()
+        if not value:
+            logger.warning("[BuildNode] value is empty")
+            return None
+        tags = chunk_res.get("tags", [])
+        if not isinstance(tags, list):
+            tags = []
+        key = chunk_res.get("key", None)
+        embedding = embedder.embed([value])[0]
+        return TextualMemoryItem(
+            memory=value,
+            metadata=TreeNodeTextualMemoryMetadata(
+                user_id=info.get("user_id", ""),
+                session_id=info.get("session_id", ""),
+                memory_type="LongTermMemory",
+                status="activated",
+                tags=tags,
+                key=key,
+                embedding=embedding,
+                usage=[],
+                sources=[{"type": "doc", "doc_path": f"{scene_file}_{idx}"}],
+                background="",
+                confidence=0.99,
+                type="fact",
+            ),
+        )
+    except Exception as e:
+        logger.error(f"[BuildNode] Error building node: {e}")
+        return None
 class SimpleStructMemReader(BaseMemReader, ABC):
@@ -39,42 +127,77 @@ class SimpleStructMemReader(BaseMemReader, ABC):
         self.embedder = EmbedderFactory.from_config(config.embedder)
         self.chunker = ChunkerFactory.from_config(config.chunker)
+    @timed
     def _process_chat_data(self, scene_data_info, info):
-        prompt = SIMPLE_STRUCT_MEM_READER_PROMPT.replace(
-            "${conversation}", "\n".join(scene_data_info)
-        )
+        mem_list = []
+        for item in scene_data_info:
+            if "chat_time" in item:
+                mem = item["role"] + ": " + f"[{item['chat_time']}]: " + item["content"]
+                mem_list.append(mem)
+            else:
+                mem = item["role"] + ":" + item["content"]
+                mem_list.append(mem)
+        lang = detect_lang("\n".join(mem_list))
+        template = PROMPT_DICT["chat"][lang]
+        examples = PROMPT_DICT["chat"][f"{lang}_example"]
+        prompt = template.replace("${conversation}", "\n".join(mem_list))
         if self.config.remove_prompt_example:
-            prompt = prompt.replace(SIMPLE_STRUCT_MEM_READER_EXAMPLE, "")
+            prompt = prompt.replace(examples, "")
         messages = [{"role": "user", "content": prompt}]
-        response_text = self.llm.generate(messages)
-        response_json = self.parse_json_result(response_text)
+        try:
+            response_text = self.llm.generate(messages)
+            response_json = self.parse_json_result(response_text)
+        except Exception as e:
+            logger.error(f"[LLM] Exception during chat generation: {e}")
+            response_json = {
+                "memory list": [
+                    {
+                        "key": "\n".join(mem_list)[:10],
+                        "memory_type": "UserMemory",
+                        "value": "\n".join(mem_list),
+                        "tags": [],
+                    }
+                ],
+                "summary": "\n".join(mem_list),
+            }
         chat_read_nodes = []
         for memory_i_raw in response_json.get("memory list", []):
-            node_i = TextualMemoryItem(
-                memory=memory_i_raw.get("value", ""),
-                metadata=TreeNodeTextualMemoryMetadata(
-                    user_id=info.get("user_id"),
-                    session_id=info.get("session_id"),
-                    memory_type=memory_i_raw.get("memory_type", "")
+            try:
+                memory_type = (
+                    memory_i_raw.get("memory_type", "LongTermMemory")
                     .replace("长期记忆", "LongTermMemory")
-                    .replace("用户记忆", "UserMemory"),
-                    status="activated",
-                    tags=memory_i_raw.get("tags", [])
-                    if type(memory_i_raw.get("tags", [])) is list
-                    else [],
-                    key=memory_i_raw.get("key", ""),
-                    embedding=self.embedder.embed([memory_i_raw.get("value", "")])[0],
-                    usage=[],
-                    sources=scene_data_info,
-                    background=response_json.get("summary", ""),
-                    confidence=0.99,
-                    type="fact",
-                ),
-            )
-            chat_read_nodes.append(node_i)
+                    .replace("用户记忆", "UserMemory")
+                )
+                if memory_type not in ["LongTermMemory", "UserMemory"]:
+                    memory_type = "LongTermMemory"
+                node_i = TextualMemoryItem(
+                    memory=memory_i_raw.get("value", ""),
+                    metadata=TreeNodeTextualMemoryMetadata(
+                        user_id=info.get("user_id"),
+                        session_id=info.get("session_id"),
+                        memory_type=memory_type,
+                        status="activated",
+                        tags=memory_i_raw.get("tags", [])
+                        if type(memory_i_raw.get("tags", [])) is list
+                        else [],
+                        key=memory_i_raw.get("key", ""),
+                        embedding=self.embedder.embed([memory_i_raw.get("value", "")])[0],
+                        usage=[],
+                        sources=scene_data_info,
+                        background=response_json.get("summary", ""),
+                        confidence=0.99,
+                        type="fact",
+                    ),
+                )
+                chat_read_nodes.append(node_i)
+            except Exception as e:
+                logger.error(f"[ChatReader] Error parsing memory item: {e}")
         return chat_read_nodes
@@ -127,8 +250,8 @@ class SimpleStructMemReader(BaseMemReader, ABC):
         else:
             processing_func = self._process_doc_data
-        # Process Q&A pairs concurrently
-        with concurrent.futures.ThreadPoolExecutor() as executor:
+        # Process Q&A pairs concurrently with context propagation
+        with ContextThreadPoolExecutor() as executor:
             futures = [
                 executor.submit(processing_func, scene_data_info, info)
                 for scene_data_info in list_scene_data_info
@@ -166,11 +289,9 @@ class SimpleStructMemReader(BaseMemReader, ABC):
                 for item in items:
                     # Convert dictionary to string
                     if "chat_time" in item:
-                        mem = item["role"] + ": " + f"[{item['chat_time']}]: " + item["content"]
-                        result.append(mem)
+                        result.append(item)
                     else:
-                        mem = item["role"] + ":" + item["content"]
-                        result.append(mem)
+                        result.append(item)
                     if len(result) >= 10:
                         results.append(result)
                         context = copy.deepcopy(result[-2:])
@@ -180,59 +301,60 @@ class SimpleStructMemReader(BaseMemReader, ABC):
         elif type == "doc":
             for item in scene_data:
                 try:
-                    if not isinstance(item, str):
-                        parsed_text = parser.parse(item)
-                        results.append({"file": "pure_text", "text": parsed_text})
+                    if os.path.exists(item):
+                        try:
+                            parsed_text = parser.parse(item)
+                            results.append({"file": item, "text": parsed_text})
+                        except Exception as e:
+                            logger.error(f"[SceneParser] Error parsing {item}: {e}")
+                            continue
                     else:
                         parsed_text = item
-                        results.append({"file": item, "text": parsed_text})
+                        results.append({"file": "pure_text", "text": parsed_text})
                 except Exception as e:
                     print(f"Error parsing file {item}: {e!s}")
         return results
-    def _process_doc_data(self, scene_data_info, info):
+    def _process_doc_data(self, scene_data_info, info, **kwargs):
         chunks = self.chunker.chunk(scene_data_info["text"])
-        messages = [
-            [
-                {
-                    "role": "user",
-                    "content": SIMPLE_STRUCT_DOC_READER_PROMPT.replace("{chunk_text}", chunk.text),
-                }
-            ]
-            for chunk in chunks
-        ]
+        messages = []
+        for chunk in chunks:
+            lang = detect_lang(chunk.text)
+            template = PROMPT_DICT["doc"][lang]
+            prompt = template.replace("{chunk_text}", chunk.text)
+            message = [{"role": "user", "content": prompt}]
+            messages.append(message)
-        processed_chunks = []
-        with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
-            futures = [executor.submit(self.llm.generate, message) for message in messages]
-            for future in concurrent.futures.as_completed(futures):
-                chunk_result = future.result()
-                if chunk_result:
-                    processed_chunks.append(chunk_result)
-        processed_chunks = [self.parse_json_result(r) for r in processed_chunks]
         doc_nodes = []
-        for i, chunk_res in enumerate(processed_chunks):
-            if chunk_res:
-                node_i = TextualMemoryItem(
-                    memory=chunk_res["value"],
-                    metadata=TreeNodeTextualMemoryMetadata(
-                        user_id=info.get("user_id"),
-                        session_id=info.get("session_id"),
-                        memory_type="LongTermMemory",
-                        status="activated",
-                        tags=chunk_res["tags"] if type(chunk_res["tags"]) is list else [],
-                        key=chunk_res["key"],
-                        embedding=self.embedder.embed([chunk_res["value"]])[0],
-                        usage=[],
-                        sources=[f"{scene_data_info['file']}_{i}"],
-                        background="",
-                        confidence=0.99,
-                        type="fact",
-                    ),
-                )
-                doc_nodes.append(node_i)
+        scene_file = scene_data_info["file"]
+        with ContextThreadPoolExecutor(max_workers=50) as executor:
+            futures = {
+                executor.submit(
+                    _build_node,
+                    idx,
+                    msg,
+                    info,
+                    scene_file,
+                    self.llm,
+                    self.parse_json_result,
+                    self.embedder,
+                ): idx
+                for idx, msg in enumerate(messages)
+            }
+            total = len(futures)
+            for future in tqdm(
+                concurrent.futures.as_completed(futures), total=total, desc="Processing"
+            ):
+                try:
+                    node = future.result()
+                    if node:
+                        doc_nodes.append(node)
+                except Exception as e:
+                    tqdm.write(f"[ERROR] {e}")
+                    logger.error(f"[DocReader] Future task failed: {e}")
         return doc_nodes
     def parse_json_result(self, response_text):
@@ -240,14 +362,14 @@ class SimpleStructMemReader(BaseMemReader, ABC):
             json_start = response_text.find("{")
             response_text = response_text[json_start:]
             response_text = response_text.replace("```", "").strip()
-            if response_text[-1] != "}":
+            if not response_text.endswith("}"):
                 response_text += "}"
-            response_json = json.loads(response_text)
-            return response_json
+            return json.loads(response_text)
         except json.JSONDecodeError as e:
-            logger.warning(
-                f"Failed to parse LLM response as JSON: {e}\nRaw response:\n{response_text}"
-            )
+            logger.error(f"[JSONParse] Failed to decode JSON: {e}\nRaw:\n{response_text}")
+            return {}
+        except Exception as e:
+            logger.error(f"[JSONParse] Unexpected error: {e}")
             return {}
     def transform_memreader(self, data: dict) -> list[TextualMemoryItem]:

memos/mem_scheduler/analyzer/__init__.py ADDED Viewed

File without changes

MemoryOS 1.0.0__py3-none-any.whl → 1.1.1__py3-none-any.whl

Potentially problematic release.

MemoryOS 1.0.0py3-none-any.whl → 1.1.1py3-none-any.whl