PyPI - MemoryOS - Versions diffs - 0.2.2__py3-none-any.whl → 1.0.1__py3-none-any.whl - Mend

MemoryOS 0.2.2py3-none-any.whl → 1.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MemoryOS might be problematic. Click here for more details.

Files changed (82) hide show

{memoryos-0.2.2.dist-info → memoryos-1.0.1.dist-info}/METADATA +7 -1
{memoryos-0.2.2.dist-info → memoryos-1.0.1.dist-info}/RECORD +81 -66
memos/__init__.py +1 -1
memos/api/config.py +31 -8
memos/api/context/context.py +1 -1
memos/api/context/context_thread.py +96 -0
memos/api/middleware/request_context.py +94 -0
memos/api/product_api.py +5 -1
memos/api/product_models.py +16 -0
memos/api/routers/product_router.py +39 -3
memos/api/start_api.py +3 -0
memos/configs/internet_retriever.py +13 -0
memos/configs/mem_scheduler.py +38 -16
memos/configs/memory.py +13 -0
memos/configs/reranker.py +18 -0
memos/graph_dbs/base.py +33 -4
memos/graph_dbs/nebular.py +631 -236
memos/graph_dbs/neo4j.py +18 -7
memos/graph_dbs/neo4j_community.py +6 -3
memos/llms/vllm.py +2 -0
memos/log.py +125 -8
memos/mem_os/core.py +49 -11
memos/mem_os/main.py +1 -1
memos/mem_os/product.py +392 -215
memos/mem_os/utils/default_config.py +1 -1
memos/mem_os/utils/format_utils.py +11 -47
memos/mem_os/utils/reference_utils.py +153 -0
memos/mem_reader/simple_struct.py +112 -43
memos/mem_scheduler/base_scheduler.py +58 -55
memos/mem_scheduler/{modules → general_modules}/base.py +1 -2
memos/mem_scheduler/{modules → general_modules}/dispatcher.py +54 -15
memos/mem_scheduler/{modules → general_modules}/rabbitmq_service.py +4 -4
memos/mem_scheduler/{modules → general_modules}/redis_service.py +1 -1
memos/mem_scheduler/{modules → general_modules}/retriever.py +19 -5
memos/mem_scheduler/{modules → general_modules}/scheduler_logger.py +10 -4
memos/mem_scheduler/general_scheduler.py +110 -67
memos/mem_scheduler/monitors/__init__.py +0 -0
memos/mem_scheduler/monitors/dispatcher_monitor.py +305 -0
memos/mem_scheduler/{modules/monitor.py → monitors/general_monitor.py} +57 -19
memos/mem_scheduler/mos_for_test_scheduler.py +7 -1
memos/mem_scheduler/schemas/general_schemas.py +3 -2
memos/mem_scheduler/schemas/message_schemas.py +2 -1
memos/mem_scheduler/schemas/monitor_schemas.py +10 -2
memos/mem_scheduler/utils/misc_utils.py +43 -2
memos/mem_user/mysql_user_manager.py +4 -2
memos/memories/activation/item.py +1 -1
memos/memories/activation/kv.py +20 -8
memos/memories/textual/base.py +1 -1
memos/memories/textual/general.py +1 -1
memos/memories/textual/item.py +1 -1
memos/memories/textual/tree.py +31 -1
memos/memories/textual/tree_text_memory/organize/{conflict.py → handler.py} +30 -48
memos/memories/textual/tree_text_memory/organize/manager.py +8 -96
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +2 -0
memos/memories/textual/tree_text_memory/organize/reorganizer.py +102 -140
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +231 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +9 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +67 -10
memos/memories/textual/tree_text_memory/retrieve/reranker.py +1 -1
memos/memories/textual/tree_text_memory/retrieve/searcher.py +246 -134
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +7 -2
memos/memories/textual/tree_text_memory/retrieve/utils.py +7 -5
memos/memos_tools/lockfree_dict.py +120 -0
memos/memos_tools/notification_utils.py +46 -0
memos/memos_tools/thread_safe_dict.py +288 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +24 -0
memos/reranker/cosine_local.py +95 -0
memos/reranker/factory.py +43 -0
memos/reranker/http_bge.py +99 -0
memos/reranker/noop.py +16 -0
memos/templates/mem_reader_prompts.py +290 -39
memos/templates/mem_scheduler_prompts.py +23 -10
memos/templates/mos_prompts.py +133 -31
memos/templates/tree_reorganize_prompts.py +24 -17
memos/utils.py +19 -0
memos/memories/textual/tree_text_memory/organize/redundancy.py +0 -193
{memoryos-0.2.2.dist-info → memoryos-1.0.1.dist-info}/LICENSE +0 -0
{memoryos-0.2.2.dist-info → memoryos-1.0.1.dist-info}/WHEEL +0 -0
{memoryos-0.2.2.dist-info → memoryos-1.0.1.dist-info}/entry_points.txt +0 -0
/memos/mem_scheduler/{modules → general_modules}/__init__.py +0 -0
/memos/mem_scheduler/{modules → general_modules}/misc.py +0 -0

memos/mem_os/product.py CHANGED Viewed

@@ -1,6 +1,8 @@
+import asyncio
 import json
 import os
 import random
+import threading
 import time
 from collections.abc import Generator
@@ -22,7 +24,10 @@ from memos.mem_os.utils.format_utils import (
     filter_nodes_by_tree_ids,
     remove_embedding_recursive,
     sort_children_by_memory_type,
-    split_continuous_references,
+)
+from memos.mem_os.utils.reference_utils import (
+    prepare_reference_data,
+    process_streaming_references_complete,
 )
 from memos.mem_scheduler.schemas.general_schemas import (
     ANSWER_LABEL,
@@ -34,7 +39,12 @@ from memos.mem_user.user_manager import UserRole
 from memos.memories.textual.item import (
     TextualMemoryItem,
 )
-from memos.templates.mos_prompts import MEMOS_PRODUCT_BASE_PROMPT, MEMOS_PRODUCT_ENHANCE_PROMPT
+from memos.templates.mos_prompts import (
+    FURTHER_SUGGESTION_PROMPT,
+    SUGGESTION_QUERY_PROMPT_EN,
+    SUGGESTION_QUERY_PROMPT_ZH,
+    get_memos_prompt,
+)
 from memos.types import MessageList
@@ -45,6 +55,39 @@ load_dotenv()
 CUBE_PATH = os.getenv("MOS_CUBE_PATH", "/tmp/data/")
+def _short_id(mem_id: str) -> str:
+    return (mem_id or "").split("-")[0] if mem_id else ""
+def _format_mem_block(memories_all, max_items: int = 20, max_chars_each: int = 320) -> str:
+    """
+    Modify TextualMemoryItem Format:
+      1:abcd :: [P] text...
+      2:ef01 :: [O] text...
+    sequence is [i:memId] i; [P]=PersonalMemory / [O]=OuterMemory
+    """
+    if not memories_all:
+        return "(none)", "(none)"
+    lines_o = []
+    lines_p = []
+    for idx, m in enumerate(memories_all[:max_items], 1):
+        mid = _short_id(getattr(m, "id", "") or "")
+        mtype = getattr(getattr(m, "metadata", {}), "memory_type", None) or getattr(
+            m, "metadata", {}
+        ).get("memory_type", "")
+        tag = "O" if "Outer" in str(mtype) else "P"
+        txt = (getattr(m, "memory", "") or "").replace("\n", " ").strip()
+        if len(txt) > max_chars_each:
+            txt = txt[: max_chars_each - 1] + "…"
+        mid = mid or f"mem_{idx}"
+        if tag == "O":
+            lines_o.append(f"[{idx}:{mid}] :: [{tag}] {txt}\n")
+        elif tag == "P":
+            lines_p.append(f"[{idx}:{mid}] :: [{tag}] {txt}")
+    return "\n".join(lines_o), "\n".join(lines_p)
 class MOSProduct(MOSCore):
     """
     The MOSProduct class inherits from MOSCore and manages multiple users.
@@ -348,7 +391,11 @@ class MOSProduct(MOSCore):
         return self._create_user_config(user_id, user_config)
     def _build_system_prompt(
-        self, memories_all: list[TextualMemoryItem], base_prompt: str | None = None
+        self,
+        memories_all: list[TextualMemoryItem],
+        base_prompt: str | None = None,
+        tone: str = "friendly",
+        verbosity: str = "mid",
     ) -> str:
         """
         Build custom system prompt for the user with memory references.
@@ -360,116 +407,46 @@ class MOSProduct(MOSCore):
         Returns:
             str: The custom system prompt.
         """
         # Build base prompt
         # Add memory context if available
-        if memories_all:
-            memory_context = "\n\n## Available ID Memories:\n"
-            for i, memory in enumerate(memories_all, 1):
-                # Format: [memory_id]: memory_content
-                memory_id = f"{memory.id.split('-')[0]}" if hasattr(memory, "id") else f"mem_{i}"
-                memory_content = memory.memory[:500] if hasattr(memory, "memory") else str(memory)
-                memory_content = memory_content.replace("\n", " ")
-                memory_context += f"{memory_id}: {memory_content}\n"
-            return MEMOS_PRODUCT_BASE_PROMPT + memory_context
-        return MEMOS_PRODUCT_BASE_PROMPT
+        now = datetime.now()
+        formatted_date = now.strftime("%Y-%m-%d (%A)")
+        sys_body = get_memos_prompt(
+            date=formatted_date, tone=tone, verbosity=verbosity, mode="base"
+        )
+        mem_block_o, mem_block_p = _format_mem_block(memories_all)
+        mem_block = mem_block_o + "\n" + mem_block_p
+        prefix = (base_prompt.strip() + "\n\n") if base_prompt else ""
+        return (
+            prefix
+            + sys_body
+            + "\n\n# Memories\n## PersonalMemory & OuterMemory (ordered)\n"
+            + mem_block
+        )
     def _build_enhance_system_prompt(
-        self, user_id: str, memories_all: list[TextualMemoryItem]
+        self,
+        user_id: str,
+        memories_all: list[TextualMemoryItem],
+        tone: str = "friendly",
+        verbosity: str = "mid",
     ) -> str:
         """
         Build enhance prompt for the user with memory references.
         """
-        if memories_all:
-            personal_memory_context = "\n\n## Available ID and PersonalMemory Memories:\n"
-            outer_memory_context = "\n\n## Available ID and OuterMemory Memories:\n"
-            for i, memory in enumerate(memories_all, 1):
-                # Format: [memory_id]: memory_content
-                if memory.metadata.memory_type != "OuterMemory":
-                    memory_id = (
-                        f"{memory.id.split('-')[0]}" if hasattr(memory, "id") else f"mem_{i}"
-                    )
-                    memory_content = (
-                        memory.memory[:500] if hasattr(memory, "memory") else str(memory)
-                    )
-                    personal_memory_context += f"{memory_id}: {memory_content}\n"
-                else:
-                    memory_id = (
-                        f"{memory.id.split('-')[0]}" if hasattr(memory, "id") else f"mem_{i}"
-                    )
-                    memory_content = (
-                        memory.memory[:500] if hasattr(memory, "memory") else str(memory)
-                    )
-                    memory_content = memory_content.replace("\n", " ")
-                    outer_memory_context += f"{memory_id}: {memory_content}\n"
-            return MEMOS_PRODUCT_ENHANCE_PROMPT + personal_memory_context + outer_memory_context
-        return MEMOS_PRODUCT_ENHANCE_PROMPT
-    def _process_streaming_references_complete(self, text_buffer: str) -> tuple[str, str]:
-        """
-        Complete streaming reference processing to ensure reference tags are never split.
-        Args:
-            text_buffer (str): The accumulated text buffer.
-        Returns:
-            tuple[str, str]: (processed_text, remaining_buffer)
-        """
-        import re
-        # Pattern to match complete reference tags: [refid:memoriesID]
-        complete_pattern = r"\[\d+:[^\]]+\]"
-        # Find all complete reference tags
-        complete_matches = list(re.finditer(complete_pattern, text_buffer))
-        if complete_matches:
-            # Find the last complete tag
-            last_match = complete_matches[-1]
-            end_pos = last_match.end()
-            # Get text up to the end of the last complete tag
-            processed_text = text_buffer[:end_pos]
-            remaining_buffer = text_buffer[end_pos:]
-            # Apply reference splitting to the processed text
-            processed_text = split_continuous_references(processed_text)
-            return processed_text, remaining_buffer
-        # Check for incomplete reference tags
-        # Look for opening bracket with number and colon
-        opening_pattern = r"\[\d+:"
-        opening_matches = list(re.finditer(opening_pattern, text_buffer))
-        if opening_matches:
-            # Find the last opening tag
-            last_opening = opening_matches[-1]
-            opening_start = last_opening.start()
-            # Check if we have a complete opening pattern
-            if last_opening.end() <= len(text_buffer):
-                # We have a complete opening pattern, keep everything in buffer
-                return "", text_buffer
-            else:
-                # Incomplete opening pattern, return text before it
-                processed_text = text_buffer[:opening_start]
-                # Apply reference splitting to the processed text
-                processed_text = split_continuous_references(processed_text)
-                return processed_text, text_buffer[opening_start:]
-        # Check for partial opening pattern (starts with [ but not complete)
-        if "[" in text_buffer:
-            ref_start = text_buffer.find("[")
-            processed_text = text_buffer[:ref_start]
-            # Apply reference splitting to the processed text
-            processed_text = split_continuous_references(processed_text)
-            return processed_text, text_buffer[ref_start:]
-        # No reference tags found, apply reference splitting and return all text
-        processed_text = split_continuous_references(text_buffer)
-        return processed_text, ""
+        now = datetime.now()
+        formatted_date = now.strftime("%Y-%m-%d (%A)")
+        sys_body = get_memos_prompt(
+            date=formatted_date, tone=tone, verbosity=verbosity, mode="enhance"
+        )
+        mem_block_o, mem_block_p = _format_mem_block(memories_all)
+        return (
+            sys_body
+            + "\n\n# Memories\n## PersonalMemory (ordered)\n"
+            + mem_block_p
+            + "\n## OuterMemory (ordered)\n"
+            + mem_block_o
+        )
     def _extract_references_from_response(self, response: str) -> tuple[str, list[dict]]:
         """
@@ -554,17 +531,212 @@ class MOSProduct(MOSCore):
                 mem_cube=self.mem_cubes[mem_cube_id],
                 label=label,
                 content=query,
-                timestamp=datetime.now(),
+                timestamp=datetime.utcnow(),
             )
             self.mem_scheduler.submit_messages(messages=[message_item])
+    async def _post_chat_processing(
+        self,
+        user_id: str,
+        cube_id: str,
+        query: str,
+        full_response: str,
+        system_prompt: str,
+        time_start: float,
+        time_end: float,
+        speed_improvement: float,
+        current_messages: list,
+    ) -> None:
+        """
+        Asynchronous processing of logs, notifications and memory additions
+        """
+        try:
+            logger.info(
+                f"user_id: {user_id}, cube_id: {cube_id}, current_messages: {current_messages}"
+            )
+            logger.info(f"user_id: {user_id}, cube_id: {cube_id}, full_response: {full_response}")
+            clean_response, extracted_references = self._extract_references_from_response(
+                full_response
+            )
+            logger.info(f"Extracted {len(extracted_references)} references from response")
+            # Send chat report notifications asynchronously
+            if self.online_bot:
+                try:
+                    from memos.memos_tools.notification_utils import (
+                        send_online_bot_notification_async,
+                    )
+                    # Prepare notification data
+                    chat_data = {
+                        "query": query,
+                        "user_id": user_id,
+                        "cube_id": cube_id,
+                        "system_prompt": system_prompt,
+                        "full_response": full_response,
+                    }
+                    system_data = {
+                        "references": extracted_references,
+                        "time_start": time_start,
+                        "time_end": time_end,
+                        "speed_improvement": speed_improvement,
+                    }
+                    emoji_config = {"chat": "💬", "system_info": "📊"}
+                    await send_online_bot_notification_async(
+                        online_bot=self.online_bot,
+                        header_name="MemOS Chat Report",
+                        sub_title_name="chat_with_references",
+                        title_color="#00956D",
+                        other_data1=chat_data,
+                        other_data2=system_data,
+                        emoji=emoji_config,
+                    )
+                except Exception as e:
+                    logger.warning(f"Failed to send chat notification (async): {e}")
+            self._send_message_to_scheduler(
+                user_id=user_id, mem_cube_id=cube_id, query=clean_response, label=ANSWER_LABEL
+            )
+            self.add(
+                user_id=user_id,
+                messages=[
+                    {
+                        "role": "user",
+                        "content": query,
+                        "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
+                    },
+                    {
+                        "role": "assistant",
+                        "content": clean_response,  # Store clean text without reference markers
+                        "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
+                    },
+                ],
+                mem_cube_id=cube_id,
+            )
+            logger.info(f"Post-chat processing completed for user {user_id}")
+        except Exception as e:
+            logger.error(f"Error in post-chat processing for user {user_id}: {e}", exc_info=True)
+    def _start_post_chat_processing(
+        self,
+        user_id: str,
+        cube_id: str,
+        query: str,
+        full_response: str,
+        system_prompt: str,
+        time_start: float,
+        time_end: float,
+        speed_improvement: float,
+        current_messages: list,
+    ) -> None:
+        """
+        Asynchronous processing of logs, notifications and memory additions, handle synchronous and asynchronous environments
+        """
+        def run_async_in_thread():
+            """Running asynchronous tasks in a new thread"""
+            try:
+                loop = asyncio.new_event_loop()
+                asyncio.set_event_loop(loop)
+                try:
+                    loop.run_until_complete(
+                        self._post_chat_processing(
+                            user_id=user_id,
+                            cube_id=cube_id,
+                            query=query,
+                            full_response=full_response,
+                            system_prompt=system_prompt,
+                            time_start=time_start,
+                            time_end=time_end,
+                            speed_improvement=speed_improvement,
+                            current_messages=current_messages,
+                        )
+                    )
+                finally:
+                    loop.close()
+            except Exception as e:
+                logger.error(
+                    f"Error in thread-based post-chat processing for user {user_id}: {e}",
+                    exc_info=True,
+                )
+        try:
+            # Try to get the current event loop
+            asyncio.get_running_loop()
+            # Create task and store reference to prevent garbage collection
+            task = asyncio.create_task(
+                self._post_chat_processing(
+                    user_id=user_id,
+                    cube_id=cube_id,
+                    query=query,
+                    full_response=full_response,
+                    system_prompt=system_prompt,
+                    time_start=time_start,
+                    time_end=time_end,
+                    speed_improvement=speed_improvement,
+                    current_messages=current_messages,
+                )
+            )
+            # Add exception handling for the background task
+            task.add_done_callback(
+                lambda t: logger.error(
+                    f"Error in background post-chat processing for user {user_id}: {t.exception()}",
+                    exc_info=True,
+                )
+                if t.exception()
+                else None
+            )
+        except RuntimeError:
+            # No event loop, run in a new thread
+            thread = threading.Thread(
+                target=run_async_in_thread,
+                name=f"PostChatProcessing-{user_id}",
+                # Set as a daemon thread to avoid blocking program exit
+                daemon=True,
+            )
+            thread.start()
     def _filter_memories_by_threshold(
-        self, memories: list[TextualMemoryItem], threshold: float = 0.20
+        self,
+        memories: list[TextualMemoryItem],
+        threshold: float = 0.30,
+        min_num: int = 3,
+        memory_type: Literal["OuterMemory"] = "OuterMemory",
     ) -> list[TextualMemoryItem]:
         """
-        Filter memories by threshold.
+        Filter memories by threshold and type, at least min_num memories for Non-OuterMemory.
+        Args:
+            memories: list[TextualMemoryItem],
+            threshold: float,
+            min_num: int,
+            memory_type: Literal["OuterMemory"],
+        Returns:
+            list[TextualMemoryItem]
         """
-        return [memory for memory in memories if memory.metadata.relativity >= threshold]
+        sorted_memories = sorted(memories, key=lambda m: m.metadata.relativity, reverse=True)
+        filtered_person = [m for m in memories if m.metadata.memory_type != memory_type]
+        filtered_outer = [m for m in memories if m.metadata.memory_type == memory_type]
+        filtered = []
+        per_memory_count = 0
+        for m in sorted_memories:
+            if m.metadata.relativity >= threshold:
+                if m.metadata.memory_type != memory_type:
+                    per_memory_count += 1
+                filtered.append(m)
+        if len(filtered) < min_num:
+            filtered = filtered_person[:min_num] + filtered_outer[:min_num]
+        else:
+            if per_memory_count < min_num:
+                filtered += filtered_person[per_memory_count:min_num]
+        filtered_memory = sorted(filtered, key=lambda m: m.metadata.relativity, reverse=True)
+        return filtered_memory
     def register_mem_cube(
         self,
@@ -662,7 +834,7 @@ class MOSProduct(MOSCore):
             # Create a default cube for the user using MOSCore's methods
             default_cube_name = f"{user_name}_{user_id}_default_cube"
-            mem_cube_name_or_path = f"{CUBE_PATH}/{default_cube_name}"
+            mem_cube_name_or_path = os.path.join(CUBE_PATH, default_cube_name)
             default_cube_id = self.create_cube_for_user(
                 cube_name=default_cube_name, owner_id=user_id, cube_path=mem_cube_name_or_path
             )
@@ -696,7 +868,23 @@ class MOSProduct(MOSCore):
         except Exception as e:
             return {"status": "error", "message": f"Failed to register user: {e!s}"}
-    def get_suggestion_query(self, user_id: str, language: str = "zh") -> list[str]:
+    def _get_further_suggestion(self, message: MessageList | None = None) -> list[str]:
+        """Get further suggestion prompt."""
+        try:
+            dialogue_info = "\n".join([f"{msg['role']}: {msg['content']}" for msg in message[-2:]])
+            further_suggestion_prompt = FURTHER_SUGGESTION_PROMPT.format(dialogue=dialogue_info)
+            message_list = [{"role": "system", "content": further_suggestion_prompt}]
+            response = self.chat_llm.generate(message_list)
+            clean_response = clean_json_response(response)
+            response_json = json.loads(clean_response)
+            return response_json["query"]
+        except Exception as e:
+            logger.error(f"Error getting further suggestion: {e}", exc_info=True)
+            return []
+    def get_suggestion_query(
+        self, user_id: str, language: str = "zh", message: MessageList | None = None
+    ) -> list[str]:
         """Get suggestion query from LLM.
         Args:
             user_id (str): User ID.
@@ -705,37 +893,13 @@ class MOSProduct(MOSCore):
         Returns:
             list[str]: The suggestion query list.
         """
+        if message:
+            further_suggestion = self._get_further_suggestion(message)
+            return further_suggestion
         if language == "zh":
-            suggestion_prompt = """
-            你是一个有用的助手，可以帮助用户生成建议查询。
-            我将获取用户最近的一些记忆，
-            你应该生成一些建议查询，这些查询应该是用户想要查询的内容，
-            用户最近的记忆是：
-            {memories}
-            请生成3个建议查询用中文，
-            输出应该是json格式，键是"query"，值是一个建议查询列表。
-            示例：
-            {{
-                "query": ["查询1", "查询2", "查询3"]
-            }}
-            """
+            suggestion_prompt = SUGGESTION_QUERY_PROMPT_ZH
         else:  # English
-            suggestion_prompt = """
-            You are a helpful assistant that can help users to generate suggestion query.
-            I will get some user recently memories,
-            you should generate some suggestion query, the query should be user what to query,
-            user recently memories is:
-            {memories}
-            if the user recently memories is empty, please generate 3 suggestion query in English,
-            output should be a json format, the key is "query", the value is a list of suggestion query.
-            example:
-            {{
-                "query": ["query1", "query2", "query3"]
-            }}
-            """
+            suggestion_prompt = SUGGESTION_QUERY_PROMPT_EN
         text_mem_result = super().search("my recently memories", user_id=user_id, top_k=3)[
             "text_mem"
         ]
@@ -749,14 +913,75 @@ class MOSProduct(MOSCore):
         response_json = json.loads(clean_response)
         return response_json["query"]
-    def chat_with_references(
+    def chat(
         self,
         query: str,
         user_id: str,
         cube_id: str | None = None,
         history: MessageList | None = None,
+        base_prompt: str | None = None,
+        internet_search: bool = False,
+        moscube: bool = False,
         top_k: int = 10,
+        threshold: float = 0.5,
+    ) -> str:
+        """
+        Chat with LLM with memory references and complete response.
+        """
+        self._load_user_cubes(user_id, self.default_cube_config)
+        time_start = time.time()
+        memories_result = super().search(
+            query,
+            user_id,
+            install_cube_ids=[cube_id] if cube_id else None,
+            top_k=top_k,
+            mode="fine",
+            internet_search=internet_search,
+            moscube=moscube,
+        )["text_mem"]
+        memories_list = []
+        if memories_result:
+            memories_list = memories_result[0]["memories"]
+            memories_list = self._filter_memories_by_threshold(memories_list, threshold)
+            new_memories_list = []
+            for m in memories_list:
+                m.metadata.embedding = []
+                new_memories_list.append(m)
+            memories_list = new_memories_list
+        system_prompt = super()._build_system_prompt(memories_list, base_prompt)
+        history_info = []
+        if history:
+            history_info = history[-20:]
+        current_messages = [
+            {"role": "system", "content": system_prompt},
+            *history_info,
+            {"role": "user", "content": query},
+        ]
+        response = self.chat_llm.generate(current_messages)
+        time_end = time.time()
+        self._start_post_chat_processing(
+            user_id=user_id,
+            cube_id=cube_id,
+            query=query,
+            full_response=response,
+            system_prompt=system_prompt,
+            time_start=time_start,
+            time_end=time_end,
+            speed_improvement=0.0,
+            current_messages=current_messages,
+        )
+        return response, memories_list
+    def chat_with_references(
+        self,
+        query: str,
+        user_id: str,
+        cube_id: str | None = None,
+        history: MessageList | None = None,
+        top_k: int = 20,
         internet_search: bool = False,
+        moscube: bool = False,
     ) -> Generator[str, None, None]:
         """
         Chat with LLM with memory references and streaming output.
@@ -782,7 +1007,9 @@ class MOSProduct(MOSCore):
             top_k=top_k,
             mode="fine",
             internet_search=internet_search,
+            moscube=moscube,
         )["text_mem"]
         yield f"data: {json.dumps({'type': 'status', 'data': '1'})}\n\n"
         search_time_end = time.time()
         logger.info(
@@ -794,6 +1021,9 @@ class MOSProduct(MOSCore):
         if memories_result:
             memories_list = memories_result[0]["memories"]
             memories_list = self._filter_memories_by_threshold(memories_list)
+        reference = prepare_reference_data(memories_list)
+        yield f"data: {json.dumps({'type': 'reference', 'data': reference})}\n\n"
         # Build custom system prompt with relevant memories)
         system_prompt = self._build_enhance_system_prompt(user_id, memories_list)
         # Get chat history
@@ -802,7 +1032,7 @@ class MOSProduct(MOSCore):
         chat_history = self.chat_history_manager[user_id]
         if history:
-            chat_history.chat_history = history[-10:]
+            chat_history.chat_history = history[-20:]
         current_messages = [
             {"role": "system", "content": system_prompt},
             *chat_history.chat_history,
@@ -835,7 +1065,7 @@ class MOSProduct(MOSCore):
             elif self.config.chat_model.backend == "vllm":
                 response_stream = self.chat_llm.generate_stream(current_messages)
         else:
-            if self.config.chat_model.backend in ["huggingface", "vllm"]:
+            if self.config.chat_model.backend in ["huggingface", "vllm", "openai"]:
                 response_stream = self.chat_llm.generate_stream(current_messages)
             else:
                 response_stream = self.chat_llm.generate(current_messages)
@@ -852,7 +1082,7 @@ class MOSProduct(MOSCore):
         full_response = ""
         token_count = 0
         # Use tiktoken for proper token-based chunking
-        if self.config.chat_model.backend not in ["huggingface", "vllm"]:
+        if self.config.chat_model.backend not in ["huggingface", "vllm", "openai"]:
             # For non-huggingface backends, we need to collect the full response first
             full_response_text = ""
             for chunk in response_stream:
@@ -868,7 +1098,7 @@ class MOSProduct(MOSCore):
             full_response += chunk
             # Process buffer to ensure complete reference tags
-            processed_chunk, remaining_buffer = self._process_streaming_references_complete(buffer)
+            processed_chunk, remaining_buffer = process_streaming_references_complete(buffer)
             if processed_chunk:
                 chunk_data = f"data: {json.dumps({'type': 'text', 'data': processed_chunk}, ensure_ascii=False)}\n\n"
@@ -877,88 +1107,34 @@ class MOSProduct(MOSCore):
         # Process any remaining buffer
         if buffer:
-            processed_chunk, remaining_buffer = self._process_streaming_references_complete(buffer)
+            processed_chunk, remaining_buffer = process_streaming_references_complete(buffer)
             if processed_chunk:
                 chunk_data = f"data: {json.dumps({'type': 'text', 'data': processed_chunk}, ensure_ascii=False)}\n\n"
                 yield chunk_data
-        # Prepare reference data
-        reference = []
-        for memories in memories_list:
-            memories_json = memories.model_dump()
-            memories_json["metadata"]["ref_id"] = f"{memories.id.split('-')[0]}"
-            memories_json["metadata"]["embedding"] = []
-            memories_json["metadata"]["sources"] = []
-            memories_json["metadata"]["memory"] = memories.memory
-            memories_json["metadata"]["id"] = memories.id
-            reference.append({"metadata": memories_json["metadata"]})
-        yield f"data: {json.dumps({'type': 'reference', 'data': reference})}\n\n"
         # set kvcache improve speed
         speed_improvement = round(float((len(system_prompt) / 2) * 0.0048 + 44.5), 1)
         total_time = round(float(time_end - time_start), 1)
         yield f"data: {json.dumps({'type': 'time', 'data': {'total_time': total_time, 'speed_improvement': f'{speed_improvement}%'}})}\n\n"
+        # get further suggestion
+        current_messages.append({"role": "assistant", "content": full_response})
+        further_suggestion = self._get_further_suggestion(current_messages)
+        logger.info(f"further_suggestion: {further_suggestion}")
+        yield f"data: {json.dumps({'type': 'suggestion', 'data': further_suggestion})}\n\n"
         yield f"data: {json.dumps({'type': 'end'})}\n\n"
-        logger.info(f"user_id: {user_id}, cube_id: {cube_id}, current_messages: {current_messages}")
-        logger.info(f"user_id: {user_id}, cube_id: {cube_id}, full_response: {full_response}")
-        clean_response, extracted_references = self._extract_references_from_response(full_response)
-        logger.info(f"Extracted {len(extracted_references)} references from response")
-        # Send chat report if online_bot is available
-        try:
-            from memos.memos_tools.notification_utils import send_online_bot_notification
-            # Prepare data for online_bot
-            chat_data = {
-                "query": query,
-                "user_id": user_id,
-                "cube_id": cube_id,
-                "system_prompt": system_prompt,
-                "full_response": full_response,
-            }
-            system_data = {
-                "references": extracted_references,
-                "time_start": time_start,
-                "time_end": time_end,
-                "speed_improvement": speed_improvement,
-            }
-            emoji_config = {"chat": "💬", "system_info": "📊"}
-            send_online_bot_notification(
-                online_bot=self.online_bot,
-                header_name="MemOS Chat Report",
-                sub_title_name="chat_with_references",
-                title_color="#00956D",
-                other_data1=chat_data,
-                other_data2=system_data,
-                emoji=emoji_config,
-            )
-        except Exception as e:
-            logger.warning(f"Failed to send chat notification: {e}")
-        self._send_message_to_scheduler(
-            user_id=user_id, mem_cube_id=cube_id, query=clean_response, label=ANSWER_LABEL
-        )
-        self.add(
+        # Asynchronous processing of logs, notifications and memory additions
+        self._start_post_chat_processing(
             user_id=user_id,
-            messages=[
-                {
-                    "role": "user",
-                    "content": query,
-                    "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
-                },
-                {
-                    "role": "assistant",
-                    "content": clean_response,  # Store clean text without reference markers
-                    "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
-                },
-            ],
-            mem_cube_id=cube_id,
+            cube_id=cube_id,
+            query=query,
+            full_response=full_response,
+            system_prompt=system_prompt,
+            time_start=time_start,
+            time_end=time_end,
+            speed_improvement=speed_improvement,
+            current_messages=current_messages,
         )
     def get_all(
@@ -1149,6 +1325,7 @@ class MOSProduct(MOSCore):
                 memories["metadata"]["memory"] = memories["memory"]
                 memories_list.append(memories)
             reformat_memory_list.append({"cube_id": memory["cube_id"], "memories": memories_list})
+        logger.info(f"search memory list is : {reformat_memory_list}")
         search_result["text_mem"] = reformat_memory_list
         time_end = time.time()
         logger.info(

MemoryOS 0.2.2__py3-none-any.whl → 1.0.1__py3-none-any.whl

Potentially problematic release.

MemoryOS 0.2.2py3-none-any.whl → 1.0.1py3-none-any.whl