PyPI - MemoryOS - Versions diffs - 2.0.3__py3-none-any.whl - Mend

MemoryOS 2.0.3__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (315) hide show

memoryos-2.0.3.dist-info/METADATA +418 -0
memoryos-2.0.3.dist-info/RECORD +315 -0
memoryos-2.0.3.dist-info/WHEEL +4 -0
memoryos-2.0.3.dist-info/entry_points.txt +3 -0
memoryos-2.0.3.dist-info/licenses/LICENSE +201 -0
memos/__init__.py +20 -0
memos/api/client.py +571 -0
memos/api/config.py +1018 -0
memos/api/context/dependencies.py +50 -0
memos/api/exceptions.py +53 -0
memos/api/handlers/__init__.py +62 -0
memos/api/handlers/add_handler.py +158 -0
memos/api/handlers/base_handler.py +194 -0
memos/api/handlers/chat_handler.py +1401 -0
memos/api/handlers/component_init.py +388 -0
memos/api/handlers/config_builders.py +190 -0
memos/api/handlers/feedback_handler.py +93 -0
memos/api/handlers/formatters_handler.py +237 -0
memos/api/handlers/memory_handler.py +316 -0
memos/api/handlers/scheduler_handler.py +497 -0
memos/api/handlers/search_handler.py +222 -0
memos/api/handlers/suggestion_handler.py +117 -0
memos/api/mcp_serve.py +614 -0
memos/api/middleware/request_context.py +101 -0
memos/api/product_api.py +38 -0
memos/api/product_models.py +1206 -0
memos/api/routers/__init__.py +1 -0
memos/api/routers/product_router.py +477 -0
memos/api/routers/server_router.py +394 -0
memos/api/server_api.py +44 -0
memos/api/start_api.py +433 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/charactertext_chunker.py +41 -0
memos/chunkers/factory.py +24 -0
memos/chunkers/markdown_chunker.py +62 -0
memos/chunkers/sentence_chunker.py +54 -0
memos/chunkers/simple_chunker.py +50 -0
memos/cli.py +113 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +59 -0
memos/configs/embedder.py +88 -0
memos/configs/graph_db.py +236 -0
memos/configs/internet_retriever.py +100 -0
memos/configs/llm.py +151 -0
memos/configs/mem_agent.py +54 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +105 -0
memos/configs/mem_os.py +83 -0
memos/configs/mem_reader.py +91 -0
memos/configs/mem_scheduler.py +385 -0
memos/configs/mem_user.py +70 -0
memos/configs/memory.py +324 -0
memos/configs/parser.py +38 -0
memos/configs/reranker.py +18 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +80 -0
memos/context/context.py +355 -0
memos/dependency.py +52 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/ark.py +95 -0
memos/embedders/base.py +106 -0
memos/embedders/factory.py +29 -0
memos/embedders/ollama.py +77 -0
memos/embedders/sentence_transformer.py +49 -0
memos/embedders/universal_api.py +51 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +274 -0
memos/graph_dbs/factory.py +27 -0
memos/graph_dbs/item.py +46 -0
memos/graph_dbs/nebular.py +1794 -0
memos/graph_dbs/neo4j.py +1942 -0
memos/graph_dbs/neo4j_community.py +1058 -0
memos/graph_dbs/polardb.py +5446 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +25 -0
memos/llms/deepseek.py +13 -0
memos/llms/factory.py +38 -0
memos/llms/hf.py +443 -0
memos/llms/hf_singleton.py +114 -0
memos/llms/ollama.py +135 -0
memos/llms/openai.py +222 -0
memos/llms/openai_new.py +198 -0
memos/llms/qwen.py +13 -0
memos/llms/utils.py +14 -0
memos/llms/vllm.py +218 -0
memos/log.py +237 -0
memos/mem_agent/base.py +19 -0
memos/mem_agent/deepsearch_agent.py +391 -0
memos/mem_agent/factory.py +36 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +30 -0
memos/mem_cube/general.py +240 -0
memos/mem_cube/navie.py +172 -0
memos/mem_cube/utils.py +169 -0
memos/mem_feedback/base.py +15 -0
memos/mem_feedback/feedback.py +1192 -0
memos/mem_feedback/simple_feedback.py +40 -0
memos/mem_feedback/utils.py +230 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +1203 -0
memos/mem_os/main.py +582 -0
memos/mem_os/product.py +1608 -0
memos/mem_os/product_server.py +455 -0
memos/mem_os/utils/default_config.py +359 -0
memos/mem_os/utils/format_utils.py +1403 -0
memos/mem_os/utils/reference_utils.py +162 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +47 -0
memos/mem_reader/factory.py +53 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/multi_modal_struct.py +965 -0
memos/mem_reader/read_multi_modal/__init__.py +43 -0
memos/mem_reader/read_multi_modal/assistant_parser.py +311 -0
memos/mem_reader/read_multi_modal/base.py +273 -0
memos/mem_reader/read_multi_modal/file_content_parser.py +826 -0
memos/mem_reader/read_multi_modal/image_parser.py +359 -0
memos/mem_reader/read_multi_modal/multi_modal_parser.py +252 -0
memos/mem_reader/read_multi_modal/string_parser.py +139 -0
memos/mem_reader/read_multi_modal/system_parser.py +327 -0
memos/mem_reader/read_multi_modal/text_content_parser.py +131 -0
memos/mem_reader/read_multi_modal/tool_parser.py +210 -0
memos/mem_reader/read_multi_modal/user_parser.py +218 -0
memos/mem_reader/read_multi_modal/utils.py +358 -0
memos/mem_reader/simple_struct.py +912 -0
memos/mem_reader/strategy_struct.py +163 -0
memos/mem_reader/utils.py +157 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/analyzer/__init__.py +0 -0
memos/mem_scheduler/analyzer/api_analyzer.py +714 -0
memos/mem_scheduler/analyzer/eval_analyzer.py +219 -0
memos/mem_scheduler/analyzer/mos_for_test_scheduler.py +571 -0
memos/mem_scheduler/analyzer/scheduler_for_eval.py +280 -0
memos/mem_scheduler/base_scheduler.py +1319 -0
memos/mem_scheduler/general_modules/__init__.py +0 -0
memos/mem_scheduler/general_modules/api_misc.py +137 -0
memos/mem_scheduler/general_modules/base.py +80 -0
memos/mem_scheduler/general_modules/init_components_for_scheduler.py +425 -0
memos/mem_scheduler/general_modules/misc.py +313 -0
memos/mem_scheduler/general_modules/scheduler_logger.py +389 -0
memos/mem_scheduler/general_modules/task_threads.py +315 -0
memos/mem_scheduler/general_scheduler.py +1495 -0
memos/mem_scheduler/memory_manage_modules/__init__.py +5 -0
memos/mem_scheduler/memory_manage_modules/memory_filter.py +306 -0
memos/mem_scheduler/memory_manage_modules/retriever.py +547 -0
memos/mem_scheduler/monitors/__init__.py +0 -0
memos/mem_scheduler/monitors/dispatcher_monitor.py +366 -0
memos/mem_scheduler/monitors/general_monitor.py +394 -0
memos/mem_scheduler/monitors/task_schedule_monitor.py +254 -0
memos/mem_scheduler/optimized_scheduler.py +410 -0
memos/mem_scheduler/orm_modules/__init__.py +0 -0
memos/mem_scheduler/orm_modules/api_redis_model.py +518 -0
memos/mem_scheduler/orm_modules/base_model.py +729 -0
memos/mem_scheduler/orm_modules/monitor_models.py +261 -0
memos/mem_scheduler/orm_modules/redis_model.py +699 -0
memos/mem_scheduler/scheduler_factory.py +23 -0
memos/mem_scheduler/schemas/__init__.py +0 -0
memos/mem_scheduler/schemas/analyzer_schemas.py +52 -0
memos/mem_scheduler/schemas/api_schemas.py +233 -0
memos/mem_scheduler/schemas/general_schemas.py +55 -0
memos/mem_scheduler/schemas/message_schemas.py +173 -0
memos/mem_scheduler/schemas/monitor_schemas.py +406 -0
memos/mem_scheduler/schemas/task_schemas.py +132 -0
memos/mem_scheduler/task_schedule_modules/__init__.py +0 -0
memos/mem_scheduler/task_schedule_modules/dispatcher.py +740 -0
memos/mem_scheduler/task_schedule_modules/local_queue.py +247 -0
memos/mem_scheduler/task_schedule_modules/orchestrator.py +74 -0
memos/mem_scheduler/task_schedule_modules/redis_queue.py +1385 -0
memos/mem_scheduler/task_schedule_modules/task_queue.py +162 -0
memos/mem_scheduler/utils/__init__.py +0 -0
memos/mem_scheduler/utils/api_utils.py +77 -0
memos/mem_scheduler/utils/config_utils.py +100 -0
memos/mem_scheduler/utils/db_utils.py +50 -0
memos/mem_scheduler/utils/filter_utils.py +176 -0
memos/mem_scheduler/utils/metrics.py +125 -0
memos/mem_scheduler/utils/misc_utils.py +290 -0
memos/mem_scheduler/utils/monitor_event_utils.py +67 -0
memos/mem_scheduler/utils/status_tracker.py +229 -0
memos/mem_scheduler/webservice_modules/__init__.py +0 -0
memos/mem_scheduler/webservice_modules/rabbitmq_service.py +485 -0
memos/mem_scheduler/webservice_modules/redis_service.py +380 -0
memos/mem_user/factory.py +94 -0
memos/mem_user/mysql_persistent_user_manager.py +271 -0
memos/mem_user/mysql_user_manager.py +502 -0
memos/mem_user/persistent_factory.py +98 -0
memos/mem_user/persistent_user_manager.py +260 -0
memos/mem_user/redis_persistent_user_manager.py +225 -0
memos/mem_user/user_manager.py +488 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +56 -0
memos/memories/activation/kv.py +292 -0
memos/memories/activation/vllmkv.py +219 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +42 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +92 -0
memos/memories/textual/general.py +236 -0
memos/memories/textual/item.py +304 -0
memos/memories/textual/naive.py +187 -0
memos/memories/textual/prefer_text_memory/__init__.py +0 -0
memos/memories/textual/prefer_text_memory/adder.py +504 -0
memos/memories/textual/prefer_text_memory/config.py +106 -0
memos/memories/textual/prefer_text_memory/extractor.py +221 -0
memos/memories/textual/prefer_text_memory/factory.py +85 -0
memos/memories/textual/prefer_text_memory/retrievers.py +177 -0
memos/memories/textual/prefer_text_memory/spliter.py +132 -0
memos/memories/textual/prefer_text_memory/utils.py +93 -0
memos/memories/textual/preference.py +344 -0
memos/memories/textual/simple_preference.py +161 -0
memos/memories/textual/simple_tree.py +69 -0
memos/memories/textual/tree.py +459 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/handler.py +184 -0
memos/memories/textual/tree_text_memory/organize/manager.py +518 -0
memos/memories/textual/tree_text_memory/organize/relation_reason_detector.py +238 -0
memos/memories/textual/tree_text_memory/organize/reorganizer.py +622 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/advanced_searcher.py +364 -0
memos/memories/textual/tree_text_memory/retrieve/bm25_util.py +186 -0
memos/memories/textual/tree_text_memory/retrieve/bochasearch.py +419 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +270 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +102 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +61 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +497 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +16 -0
memos/memories/textual/tree_text_memory/retrieve/retrieve_utils.py +472 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +848 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +135 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +54 -0
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +387 -0
memos/memos_tools/dinding_report_bot.py +453 -0
memos/memos_tools/lockfree_dict.py +120 -0
memos/memos_tools/notification_service.py +44 -0
memos/memos_tools/notification_utils.py +142 -0
memos/memos_tools/singleton.py +174 -0
memos/memos_tools/thread_safe_dict.py +310 -0
memos/memos_tools/thread_safe_dict_segment.py +382 -0
memos/multi_mem_cube/__init__.py +0 -0
memos/multi_mem_cube/composite_cube.py +86 -0
memos/multi_mem_cube/single_cube.py +874 -0
memos/multi_mem_cube/views.py +54 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +21 -0
memos/parsers/markitdown.py +28 -0
memos/reranker/__init__.py +4 -0
memos/reranker/base.py +25 -0
memos/reranker/concat.py +103 -0
memos/reranker/cosine_local.py +102 -0
memos/reranker/factory.py +72 -0
memos/reranker/http_bge.py +324 -0
memos/reranker/http_bge_strategy.py +327 -0
memos/reranker/noop.py +19 -0
memos/reranker/strategies/__init__.py +4 -0
memos/reranker/strategies/base.py +61 -0
memos/reranker/strategies/concat_background.py +94 -0
memos/reranker/strategies/concat_docsource.py +110 -0
memos/reranker/strategies/dialogue_common.py +109 -0
memos/reranker/strategies/factory.py +31 -0
memos/reranker/strategies/single_turn.py +107 -0
memos/reranker/strategies/singleturn_outmem.py +98 -0
memos/settings.py +10 -0
memos/templates/__init__.py +0 -0
memos/templates/advanced_search_prompts.py +211 -0
memos/templates/cloud_service_prompt.py +107 -0
memos/templates/instruction_completion.py +66 -0
memos/templates/mem_agent_prompts.py +85 -0
memos/templates/mem_feedback_prompts.py +822 -0
memos/templates/mem_reader_prompts.py +1096 -0
memos/templates/mem_reader_strategy_prompts.py +238 -0
memos/templates/mem_scheduler_prompts.py +626 -0
memos/templates/mem_search_prompts.py +93 -0
memos/templates/mos_prompts.py +403 -0
memos/templates/prefer_complete_prompt.py +735 -0
memos/templates/tool_mem_prompts.py +139 -0
memos/templates/tree_reorganize_prompts.py +230 -0
memos/types/__init__.py +34 -0
memos/types/general_types.py +151 -0
memos/types/openai_chat_completion_types/__init__.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_assistant_message_param.py +56 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_image_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_input_audio_param.py +23 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_param.py +43 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_refusal_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_content_part_text_param.py +16 -0
memos/types/openai_chat_completion_types/chat_completion_message_custom_tool_call_param.py +27 -0
memos/types/openai_chat_completion_types/chat_completion_message_function_tool_call_param.py +32 -0
memos/types/openai_chat_completion_types/chat_completion_message_param.py +18 -0
memos/types/openai_chat_completion_types/chat_completion_message_tool_call_union_param.py +15 -0
memos/types/openai_chat_completion_types/chat_completion_system_message_param.py +36 -0
memos/types/openai_chat_completion_types/chat_completion_tool_message_param.py +30 -0
memos/types/openai_chat_completion_types/chat_completion_user_message_param.py +34 -0
memos/utils.py +123 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +117 -0
memos/vec_dbs/factory.py +23 -0
memos/vec_dbs/item.py +50 -0
memos/vec_dbs/milvus.py +654 -0
memos/vec_dbs/qdrant.py +355 -0

memos/mem_scheduler/utils/misc_utils.py ADDED Viewed

@@ -0,0 +1,290 @@
+import json
+import os
+import re
+import traceback
+from collections import defaultdict
+from functools import wraps
+from pathlib import Path
+import yaml
+from memos.log import get_logger
+from memos.mem_scheduler.schemas.message_schemas import (
+    ScheduleMessageItem,
+)
+logger = get_logger(__name__)
+def _normalize_env_value(value: str | None) -> str:
+    """Normalize environment variable values for comparison."""
+    return value.strip().lower() if isinstance(value, str) else ""
+def is_playground_env() -> bool:
+    """Return True when ENV_NAME indicates a Playground environment."""
+    env_name = _normalize_env_value(os.getenv("ENV_NAME"))
+    return env_name.startswith("playground")
+def is_cloud_env() -> bool:
+    """
+    Determine whether the scheduler should treat the runtime as a cloud environment.
+    Rules:
+    - Any Playground ENV_NAME is explicitly NOT cloud.
+    - MEMSCHEDULER_RABBITMQ_EXCHANGE_NAME must be set to enable cloud behavior.
+    - The default memos-fanout/fanout combination is treated as non-cloud.
+    """
+    if is_playground_env():
+        return False
+    exchange_name = _normalize_env_value(os.getenv("MEMSCHEDULER_RABBITMQ_EXCHANGE_NAME"))
+    exchange_type = _normalize_env_value(os.getenv("MEMSCHEDULER_RABBITMQ_EXCHANGE_TYPE"))
+    if not exchange_name:
+        return False
+    return not (
+        exchange_name == "memos-fanout" and (not exchange_type or exchange_type == "fanout")
+    )
+def extract_json_obj(text: str):
+    """
+    Safely extracts JSON from LLM response text with robust error handling.
+    Args:
+        text: Raw text response from LLM that may contain JSON
+    Returns:
+        Parsed JSON data (dict or list)
+    Raises:
+        ValueError: If no valid JSON can be extracted
+    """
+    if not text:
+        raise ValueError("Empty input text")
+    # Normalize the text
+    text = text.strip()
+    # Remove common code block markers
+    patterns_to_remove = ["json```", "```python", "```json", "latex```", "```latex", "```"]
+    for pattern in patterns_to_remove:
+        text = text.replace(pattern, "")
+    # Try: direct JSON parse first
+    try:
+        return json.loads(text.strip())
+    except json.JSONDecodeError as e:
+        logger.info(f"Failed to parse JSON from text: {text}. Error: {e!s}", exc_info=True)
+    # Fallback 1: Extract JSON using regex
+    json_pattern = r"\{[\s\S]*\}|\[[\s\S]*\]"
+    matches = re.findall(json_pattern, text)
+    if matches:
+        try:
+            return json.loads(matches[0])
+        except json.JSONDecodeError as e:
+            logger.info(f"Failed to parse JSON from text: {text}. Error: {e!s}", exc_info=True)
+    # Fallback 2: Handle malformed JSON (common LLM issues)
+    try:
+        # Try adding missing quotes around keys
+        text = re.sub(r"([\{\s,])(\w+)(:)", r'\1"\2"\3', text)
+        return json.loads(text)
+    except json.JSONDecodeError as e:
+        logger.error(f"Failed to parse JSON from text: {text}. Error: {e!s}")
+        logger.error("Full traceback:\n" + traceback.format_exc())
+        raise ValueError(text) from e
+def extract_list_items(text: str, bullet_prefixes: tuple[str, ...] = ("- ",)) -> list[str]:
+    """
+    Extract bullet list items from LLM output where each item is on a single line
+    starting with a given bullet prefix (default: "- ").
+    This function is designed to be robust to common LLM formatting variations,
+    following similar normalization practices as `extract_json_obj`.
+    Behavior:
+    - Strips common code-fence markers (```json, ```python, ``` etc.).
+    - Collects all lines that start with any of the provided `bullet_prefixes`.
+    - Tolerates the "• " bullet as a loose fallback.
+    - Unescapes common sequences like "\\n" and "\\t" within items.
+    - If no bullet lines are found, falls back to attempting to parse a JSON array
+      (using `extract_json_obj`) and returns its string elements.
+    Args:
+        text: Raw text response from LLM.
+        bullet_prefixes: Tuple of accepted bullet line prefixes.
+    Returns:
+        List of extracted items (strings). Returns an empty list if none can be parsed.
+    """
+    if not text:
+        return []
+    # Normalize the text similar to extract_json_obj
+    normalized = text.strip()
+    patterns_to_remove = ["json```", "```python", "```json", "latex```", "```latex", "```"]
+    for pattern in patterns_to_remove:
+        normalized = normalized.replace(pattern, "")
+    normalized = normalized.replace("\r\n", "\n")
+    lines = normalized.splitlines()
+    items: list[str] = []
+    seen: set[str] = set()
+    for raw in lines:
+        line = raw.strip()
+        if not line:
+            continue
+        matched = False
+        for prefix in bullet_prefixes:
+            if line.startswith(prefix):
+                content = line[len(prefix) :].strip()
+                content = content.replace("\\n", "\n").replace("\\t", "\t").replace("\\r", "\r")
+                if content and content not in seen:
+                    items.append(content)
+                    seen.add(content)
+                matched = True
+                break
+        if matched:
+            continue
+    if items:
+        return items
+    else:
+        logger.error(f"Fail to parse {text}")
+    return []
+def extract_list_items_in_answer(
+    text: str, bullet_prefixes: tuple[str, ...] = ("- ",)
+) -> list[str]:
+    """
+    Extract list items specifically from content enclosed within `<answer>...</answer>` tags.
+    - When one or more `<answer>...</answer>` blocks are present, concatenates their inner
+      contents with newlines and parses using `extract_list_items`.
+    - When no `<answer>` block is found, falls back to parsing the entire input with
+      `extract_list_items`.
+    - Case-insensitive matching of the `<answer>` tag.
+    Args:
+        text: Raw text that may contain `<answer>...</answer>` blocks.
+        bullet_prefixes: Accepted bullet prefixes (default: strictly `"- "`).
+    Returns:
+        List of extracted items (strings), or an empty list when nothing is parseable.
+    """
+    if not text:
+        return []
+    try:
+        normalized = text.strip().replace("\r\n", "\n")
+        # Ordered, exact-case matching for <answer> blocks: answer -> Answer -> ANSWER
+        tag_variants = ["answer", "Answer", "ANSWER"]
+        matches: list[str] = []
+        for tag in tag_variants:
+            matches = re.findall(rf"<{tag}>([\\s\\S]*?)</{tag}>", normalized)
+            if matches:
+                break
+        # Fallback: case-insensitive matching if none of the exact-case variants matched
+        if not matches:
+            matches = re.findall(r"<answer>([\\s\\S]*?)</answer>", normalized, flags=re.IGNORECASE)
+        if matches:
+            combined = "\n".join(m.strip() for m in matches if m is not None)
+            return extract_list_items(combined, bullet_prefixes=bullet_prefixes)
+        # Fallback: parse the whole text if tags are absent
+        return extract_list_items(normalized, bullet_prefixes=bullet_prefixes)
+    except Exception as e:
+        logger.info(f"Failed to extract items within <answer> tags: {e!s}", exc_info=True)
+        # Final fallback: attempt direct list extraction
+        try:
+            return extract_list_items(text, bullet_prefixes=bullet_prefixes)
+        except Exception:
+            return []
+def parse_yaml(yaml_file: str | Path):
+    yaml_path = Path(yaml_file)
+    if not yaml_path.is_file():
+        raise FileNotFoundError(f"No such file: {yaml_file}")
+    with yaml_path.open("r", encoding="utf-8") as fr:
+        data = yaml.safe_load(fr)
+    return data
+def log_exceptions(logger=logger):
+    """
+    Exception-catching decorator that automatically logs errors (including stack traces)
+    Args:
+        logger: Optional logger object (default: module-level logger)
+    Example:
+        @log_exceptions()
+        def risky_function():
+            raise ValueError("Oops!")
+        @log_exceptions(logger=custom_logger)
+        def another_risky_function():
+            might_fail()
+    """
+    def decorator(func):
+        @wraps(func)
+        def wrapper(*args, **kwargs):
+            try:
+                return func(*args, **kwargs)
+            except Exception as e:
+                logger.error(f"Error in {func.__name__}: {e}", stack_info=True)
+        return wrapper
+    return decorator
+def group_messages_by_user_and_mem_cube(
+    messages: list[ScheduleMessageItem],
+) -> dict[str, dict[str, list[ScheduleMessageItem]]]:
+    """
+    Groups messages into a nested dictionary structure first by user_id, then by mem_cube_id.
+    Args:
+        messages: List of ScheduleMessageItem objects to be grouped
+    Returns:
+        A nested dictionary with the structure:
+        {
+            "user_id_1": {
+                "mem_cube_id_1": [msg1, msg2, ...],
+                "mem_cube_id_2": [msg3, msg4, ...],
+                ...
+            },
+            "user_id_2": {
+                ...
+            },
+            ...
+        }
+        Where each msg is the original ScheduleMessageItem object
+    """
+    grouped_dict = defaultdict(lambda: defaultdict(list))
+    for msg in messages:
+        grouped_dict[msg.user_id][msg.mem_cube_id].append(msg)
+    # Convert defaultdict to regular dict for cleaner output
+    return {user_id: dict(cube_groups) for user_id, cube_groups in grouped_dict.items()}

memos/mem_scheduler/utils/monitor_event_utils.py ADDED Viewed

@@ -0,0 +1,67 @@
+import json
+import os
+import socket
+from datetime import datetime, timezone
+from typing import Any
+from memos.log import get_logger
+from memos.mem_scheduler.schemas.message_schemas import ScheduleMessageItem
+logger = get_logger(__name__)
+def _iso_ts_now() -> str:
+    """Return current UTC timestamp in ISO format with milliseconds."""
+    return datetime.now(timezone.utc).isoformat()
+def to_iso(ts) -> str | None:
+    """Convert datetime to ISO string; return None if not convertible."""
+    if ts is None:
+        return None
+    if isinstance(ts, datetime):
+        dt = ts
+        if dt.tzinfo is None:
+            dt = dt.replace(tzinfo=timezone.utc)
+        return dt.isoformat()
+    try:
+        return datetime.fromtimestamp(float(ts), tz=timezone.utc).isoformat()
+    except Exception:
+        return None
+def emit_monitor_event(event: str, msg: ScheduleMessageItem, extra: dict[str, Any] | None = None):
+    """
+    Emit a structured MONITOR_EVENT log line for SLS consumption.
+    This must be fire-and-forget: any exception here should never break the scheduler flow.
+    """
+    try:
+        payload: dict[str, Any] = {
+            "event": event,
+            "ts": _iso_ts_now(),
+            "label": getattr(msg, "label", None),
+            "user_id": getattr(msg, "user_id", None),
+            "mem_cube_id": getattr(msg, "mem_cube_id", None),
+            "item_id": getattr(msg, "item_id", None),
+            "task_id": getattr(msg, "task_id", "") or "",
+            "trace_id": getattr(msg, "trace_id", None),
+            "stream_key": getattr(msg, "stream_key", None),
+            "redis_message_id": getattr(msg, "redis_message_id", None),
+            "monitor_flag": None,
+            "host": socket.gethostname(),
+            "env": os.getenv("ENV") or os.getenv("ENVIRONMENT") or "",
+        }
+        info = getattr(msg, "info", None)
+        if isinstance(info, dict):
+            payload["monitor_flag"] = info.get("monitor_flag")
+        if extra:
+            payload.update(extra)
+        logger.info("MONITOR_EVENT " + json.dumps(payload, ensure_ascii=False))
+    except Exception:
+        logger.debug("Failed to emit MONITOR_EVENT", exc_info=True)

memos/mem_scheduler/utils/status_tracker.py ADDED Viewed

@@ -0,0 +1,229 @@
+# src/memos/mem_scheduler/utils/status_tracker.py
+import json
+from datetime import datetime, timedelta, timezone
+from typing import TYPE_CHECKING
+from memos.dependency import require_python_package
+if TYPE_CHECKING:
+    import redis
+class TaskStatusTracker:
+    @require_python_package(import_name="redis", install_command="pip install redis")
+    def __init__(self, redis_client: "redis.Redis | None"):
+        self.redis = redis_client
+    def _get_key(self, user_id: str) -> str:
+        if not self.redis:
+            return
+        return f"memos:task_meta:{user_id}"
+    def _get_task_items_key(self, user_id: str, task_id: str) -> str:
+        """Get Redis key for task_id → [item_id] mapping."""
+        return f"memos:task_items:{user_id}:{task_id}"
+    def task_submitted(
+        self,
+        task_id: str,
+        user_id: str,
+        task_type: str,
+        mem_cube_id: str,
+        business_task_id: str | None = None,
+    ):
+        """
+        Submit a new task for tracking.
+        Args:
+            task_id: Internal item_id (UUID)
+            user_id: User identifier
+            task_type: Type of task (label)
+            mem_cube_id: Memory cube identifier
+            business_task_id: Optional business-level task ID (one task_id can have multiple item_ids)
+        """
+        if not self.redis:
+            return
+        key = self._get_key(user_id)
+        payload = {
+            "status": "waiting",
+            "task_type": task_type,
+            "mem_cube_id": mem_cube_id,
+            "submitted_at": datetime.now(timezone.utc).isoformat(),
+        }
+        # Add business_task_id to payload if provided
+        if business_task_id:
+            payload["business_task_id"] = business_task_id
+            # Add item_id to the task_id → [item_ids] set
+            task_items_key = self._get_task_items_key(user_id, business_task_id)
+            self.redis.sadd(task_items_key, task_id)
+            self.redis.expire(task_items_key, timedelta(days=7))
+        self.redis.hset(key, task_id, json.dumps(payload))
+        self.redis.expire(key, timedelta(days=7))
+    def task_started(self, task_id: str, user_id: str):
+        if not self.redis:
+            return
+        key = self._get_key(user_id)
+        existing_data_json = self.redis.hget(key, task_id)
+        if not existing_data_json:
+            # 容错处理: 如果任务不存在, 也创建一个
+            payload = {
+                "status": "in_progress",
+                "started_at": datetime.now(timezone.utc).isoformat(),
+            }
+        else:
+            payload = json.loads(existing_data_json)
+            payload["status"] = "in_progress"
+            payload["started_at"] = datetime.now(timezone.utc).isoformat()
+        self.redis.hset(key, task_id, json.dumps(payload))
+        self.redis.expire(key, timedelta(days=7))
+    def task_completed(self, task_id: str, user_id: str):
+        if not self.redis:
+            return
+        key = self._get_key(user_id)
+        existing_data_json = self.redis.hget(key, task_id)
+        if not existing_data_json:
+            return
+        payload = json.loads(existing_data_json)
+        payload["status"] = "completed"
+        payload["completed_at"] = datetime.now(timezone.utc).isoformat()
+        # 设置该任务条目的过期时间, 例如 24 小时
+        # 注意: Redis Hash 不能为单个 field 设置 TTL, 这里我们可以 通过后台任务清理或在获取时判断时间戳
+        # 简单起见, 我们暂时依赖一个后台清理任务
+        self.redis.hset(key, task_id, json.dumps(payload))
+        self.redis.expire(key, timedelta(days=7))
+    def task_failed(self, task_id: str, user_id: str, error_message: str):
+        if not self.redis:
+            return
+        key = self._get_key(user_id)
+        existing_data_json = self.redis.hget(key, task_id)
+        if not existing_data_json:
+            payload = {
+                "status": "failed",
+                "error": error_message,
+                "failed_at": datetime.now(timezone.utc).isoformat(),
+            }
+        else:
+            payload = json.loads(existing_data_json)
+            payload["status"] = "failed"
+            payload["error"] = error_message
+            payload["failed_at"] = datetime.now(timezone.utc).isoformat()
+        self.redis.hset(key, task_id, json.dumps(payload))
+        self.redis.expire(key, timedelta(days=7))
+    def get_task_status(self, task_id: str, user_id: str) -> dict | None:
+        if not self.redis:
+            return None
+        key = self._get_key(user_id)
+        data = self.redis.hget(key, task_id)
+        return json.loads(data) if data else None
+    def get_all_tasks_for_user(self, user_id: str) -> dict[str, dict]:
+        if not self.redis:
+            return {}
+        key = self._get_key(user_id)
+        all_tasks = self.redis.hgetall(key)
+        return {tid: json.loads(t_data) for tid, t_data in all_tasks.items()}
+    def get_task_status_by_business_id(self, business_task_id: str, user_id: str) -> dict | None:
+        """
+        Get aggregated status for a business-level task_id.
+        Args:
+            business_task_id: Business-level task ID
+            user_id: User identifier
+        Returns:
+            Aggregated status dict with status determined by all item statuses:
+            - If any item is 'waiting' or 'in_progress' → 'in_progress'
+            - If all items are 'completed' → 'completed'
+            - If any item is 'failed' → 'failed'
+            Returns None if task_id not found.
+        """
+        if not self.redis:
+            return None
+        # Get all item_ids for this task_id
+        task_items_key = self._get_task_items_key(user_id, business_task_id)
+        item_ids = self.redis.smembers(task_items_key)
+        if not item_ids:
+            return None
+        # Get statuses for all items
+        key = self._get_key(user_id)
+        item_statuses = []
+        errors = []
+        for item_id in item_ids:
+            item_data_json = self.redis.hget(key, item_id)
+            if item_data_json:
+                item_data = json.loads(item_data_json)
+                item_statuses.append(item_data["status"])
+                if item_data.get("status") == "failed" and "error" in item_data:
+                    errors.append(item_data["error"])
+        if not item_statuses:
+            return None
+        # Aggregate status
+        if "failed" in item_statuses:
+            aggregated_status = "failed"
+        elif "in_progress" in item_statuses or "waiting" in item_statuses:
+            aggregated_status = "in_progress"
+        elif all(s == "completed" for s in item_statuses):
+            aggregated_status = "completed"
+        else:
+            # Fallback
+            aggregated_status = "unknown"
+        return {
+            "status": aggregated_status,
+            "business_task_id": business_task_id,
+            "item_count": len(item_ids),
+            "item_statuses": item_statuses,
+            "errors": errors,
+        }
+    def get_all_tasks_global(self) -> dict[str, dict[str, dict]]:
+        """
+        Retrieve all tasks for all users from Redis.
+        Returns:
+            dict: {user_id: {task_id: task_data, ...}, ...}
+        """
+        if not self.redis:
+            return {}
+        all_users_tasks = {}
+        cursor: int | str = 0
+        while True:
+            cursor, keys = self.redis.scan(cursor=cursor, match="memos:task_meta:*", count=100)
+            for key in keys:
+                # key format: memos:task_meta:{user_id}
+                parts = key.split(":")
+                if len(parts) < 3:
+                    continue
+                user_id = parts[2]
+                tasks = self.redis.hgetall(key)
+                if tasks:
+                    user_tasks = {tid: json.loads(t_data) for tid, t_data in tasks.items()}
+                    all_users_tasks[user_id] = user_tasks
+            if cursor == 0 or cursor == "0":
+                break
+        return all_users_tasks

memos/mem_scheduler/webservice_modules/__init__.py ADDED Viewed

File without changes