PyPI - MemoryOS - Versions diffs - 0.0.1__py3-none-any.whl → 0.1.13__py3-none-any.whl - Mend

MemoryOS 0.0.1py3-none-any.whl → 0.1.13py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MemoryOS might be problematic. Click here for more details.

Files changed (124) hide show

memoryos-0.1.13.dist-info/METADATA +288 -0
memoryos-0.1.13.dist-info/RECORD +122 -0
memos/__init__.py +20 -1
memos/api/start_api.py +420 -0
memos/chunkers/__init__.py +4 -0
memos/chunkers/base.py +24 -0
memos/chunkers/factory.py +22 -0
memos/chunkers/sentence_chunker.py +35 -0
memos/configs/__init__.py +0 -0
memos/configs/base.py +82 -0
memos/configs/chunker.py +45 -0
memos/configs/embedder.py +53 -0
memos/configs/graph_db.py +45 -0
memos/configs/internet_retriever.py +81 -0
memos/configs/llm.py +71 -0
memos/configs/mem_chat.py +81 -0
memos/configs/mem_cube.py +89 -0
memos/configs/mem_os.py +74 -0
memos/configs/mem_reader.py +53 -0
memos/configs/mem_scheduler.py +78 -0
memos/configs/memory.py +195 -0
memos/configs/parser.py +38 -0
memos/configs/utils.py +8 -0
memos/configs/vec_db.py +64 -0
memos/deprecation.py +262 -0
memos/embedders/__init__.py +0 -0
memos/embedders/base.py +15 -0
memos/embedders/factory.py +23 -0
memos/embedders/ollama.py +74 -0
memos/embedders/sentence_transformer.py +40 -0
memos/exceptions.py +30 -0
memos/graph_dbs/__init__.py +0 -0
memos/graph_dbs/base.py +215 -0
memos/graph_dbs/factory.py +21 -0
memos/graph_dbs/neo4j.py +827 -0
memos/hello_world.py +97 -0
memos/llms/__init__.py +0 -0
memos/llms/base.py +16 -0
memos/llms/factory.py +25 -0
memos/llms/hf.py +231 -0
memos/llms/ollama.py +82 -0
memos/llms/openai.py +34 -0
memos/llms/utils.py +14 -0
memos/log.py +78 -0
memos/mem_chat/__init__.py +0 -0
memos/mem_chat/base.py +30 -0
memos/mem_chat/factory.py +21 -0
memos/mem_chat/simple.py +200 -0
memos/mem_cube/__init__.py +0 -0
memos/mem_cube/base.py +29 -0
memos/mem_cube/general.py +146 -0
memos/mem_cube/utils.py +24 -0
memos/mem_os/client.py +5 -0
memos/mem_os/core.py +819 -0
memos/mem_os/main.py +503 -0
memos/mem_os/product.py +89 -0
memos/mem_reader/__init__.py +0 -0
memos/mem_reader/base.py +27 -0
memos/mem_reader/factory.py +21 -0
memos/mem_reader/memory.py +298 -0
memos/mem_reader/simple_struct.py +241 -0
memos/mem_scheduler/__init__.py +0 -0
memos/mem_scheduler/base_scheduler.py +164 -0
memos/mem_scheduler/general_scheduler.py +305 -0
memos/mem_scheduler/modules/__init__.py +0 -0
memos/mem_scheduler/modules/base.py +74 -0
memos/mem_scheduler/modules/dispatcher.py +103 -0
memos/mem_scheduler/modules/monitor.py +82 -0
memos/mem_scheduler/modules/redis_service.py +146 -0
memos/mem_scheduler/modules/retriever.py +41 -0
memos/mem_scheduler/modules/schemas.py +146 -0
memos/mem_scheduler/scheduler_factory.py +21 -0
memos/mem_scheduler/utils.py +26 -0
memos/mem_user/user_manager.py +488 -0
memos/memories/__init__.py +0 -0
memos/memories/activation/__init__.py +0 -0
memos/memories/activation/base.py +42 -0
memos/memories/activation/item.py +25 -0
memos/memories/activation/kv.py +232 -0
memos/memories/base.py +19 -0
memos/memories/factory.py +34 -0
memos/memories/parametric/__init__.py +0 -0
memos/memories/parametric/base.py +19 -0
memos/memories/parametric/item.py +11 -0
memos/memories/parametric/lora.py +41 -0
memos/memories/textual/__init__.py +0 -0
memos/memories/textual/base.py +89 -0
memos/memories/textual/general.py +286 -0
memos/memories/textual/item.py +167 -0
memos/memories/textual/naive.py +185 -0
memos/memories/textual/tree.py +321 -0
memos/memories/textual/tree_text_memory/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/__init__.py +0 -0
memos/memories/textual/tree_text_memory/organize/manager.py +305 -0
memos/memories/textual/tree_text_memory/retrieve/__init__.py +0 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever.py +263 -0
memos/memories/textual/tree_text_memory/retrieve/internet_retriever_factory.py +89 -0
memos/memories/textual/tree_text_memory/retrieve/reasoner.py +61 -0
memos/memories/textual/tree_text_memory/retrieve/recall.py +158 -0
memos/memories/textual/tree_text_memory/retrieve/reranker.py +111 -0
memos/memories/textual/tree_text_memory/retrieve/retrieval_mid_structs.py +13 -0
memos/memories/textual/tree_text_memory/retrieve/searcher.py +208 -0
memos/memories/textual/tree_text_memory/retrieve/task_goal_parser.py +68 -0
memos/memories/textual/tree_text_memory/retrieve/utils.py +48 -0
memos/memories/textual/tree_text_memory/retrieve/xinyusearch.py +335 -0
memos/parsers/__init__.py +0 -0
memos/parsers/base.py +15 -0
memos/parsers/factory.py +19 -0
memos/parsers/markitdown.py +22 -0
memos/settings.py +8 -0
memos/templates/__init__.py +0 -0
memos/templates/mem_reader_prompts.py +98 -0
memos/templates/mem_scheduler_prompts.py +65 -0
memos/templates/mos_prompts.py +63 -0
memos/types.py +55 -0
memos/vec_dbs/__init__.py +0 -0
memos/vec_dbs/base.py +105 -0
memos/vec_dbs/factory.py +21 -0
memos/vec_dbs/item.py +43 -0
memos/vec_dbs/qdrant.py +292 -0
memoryos-0.0.1.dist-info/METADATA +0 -53
memoryos-0.0.1.dist-info/RECORD +0 -5
{memoryos-0.0.1.dist-info → memoryos-0.1.13.dist-info}/LICENSE +0 -0
{memoryos-0.0.1.dist-info → memoryos-0.1.13.dist-info}/WHEEL +0 -0

memos/api/start_api.py ADDED Viewed

@@ -0,0 +1,420 @@
+import logging
+import os
+from typing import Any, Generic, TypeVar
+from dotenv import load_dotenv
+from fastapi import FastAPI
+from fastapi.requests import Request
+from fastapi.responses import JSONResponse, RedirectResponse
+from pydantic import BaseModel, Field
+from memos.configs.mem_os import MOSConfig
+from memos.mem_os.main import MOS
+from memos.mem_user.user_manager import UserManager, UserRole
+# Configure logging
+logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
+logger = logging.getLogger(__name__)
+# Load environment variables
+load_dotenv()
+T = TypeVar("T")
+# Default configuration
+DEFAULT_CONFIG = {
+    "user_id": os.getenv("MOS_USER_ID", "default_user"),
+    "session_id": os.getenv("MOS_SESSION_ID", "default_session"),
+    "enable_textual_memory": True,
+    "enable_activation_memory": False,
+    "top_k": int(os.getenv("MOS_TOP_K", "5")),
+    "chat_model": {
+        "backend": os.getenv("MOS_CHAT_MODEL_PROVIDER", "openai"),
+        "config": {
+            "model_name_or_path": os.getenv("MOS_CHAT_MODEL", "gpt-3.5-turbo"),
+            "api_key": os.getenv("OPENAI_API_KEY", "apikey"),
+            "temperature": float(os.getenv("MOS_CHAT_TEMPERATURE", "0.7")),
+            "api_base": os.getenv("OPENAI_API_BASE", "https://api.openai.com/v1"),
+        },
+    },
+}
+# Initialize MOS instance with lazy initialization
+MOS_INSTANCE = None
+def get_mos_instance():
+    """Get or create MOS instance with default user creation."""
+    global MOS_INSTANCE
+    if MOS_INSTANCE is None:
+        # Create a temporary MOS instance to access user manager
+        temp_config = MOSConfig(**DEFAULT_CONFIG)
+        temp_mos = MOS.__new__(MOS)
+        temp_mos.config = temp_config
+        temp_mos.user_id = temp_config.user_id
+        temp_mos.session_id = temp_config.session_id
+        temp_mos.mem_cubes = {}
+        temp_mos.chat_llm = None  # Will be initialized later
+        temp_mos.user_manager = UserManager()
+        # Create default user if it doesn't exist
+        if not temp_mos.user_manager.validate_user(temp_config.user_id):
+            temp_mos.user_manager.create_user(
+                user_name=temp_config.user_id, role=UserRole.USER, user_id=temp_config.user_id
+            )
+            logger.info(f"Created default user: {temp_config.user_id}")
+        # Now create the actual MOS instance
+        MOS_INSTANCE = MOS(config=temp_config)
+    return MOS_INSTANCE
+app = FastAPI(
+    title="MemOS REST APIs",
+    description="A REST API for managing and searching memories using MemOS.",
+    version="1.0.0",
+)
+class BaseRequest(BaseModel):
+    """Base model for all requests."""
+    user_id: str | None = Field(
+        None, description="User ID for the request", json_schema_extra={"example": "user123"}
+    )
+class BaseResponse(BaseModel, Generic[T]):
+    """Base model for all responses."""
+    code: int = Field(200, description="Response status code", json_schema_extra={"example": 200})
+    message: str = Field(
+        ..., description="Response message", json_schema_extra={"example": "Operation successful"}
+    )
+    data: T | None = Field(None, description="Response data")
+class Message(BaseModel):
+    role: str = Field(
+        ...,
+        description="Role of the message (user or assistant).",
+        json_schema_extra={"example": "user"},
+    )
+    content: str = Field(
+        ...,
+        description="Message content.",
+        json_schema_extra={"example": "Hello, how can I help you?"},
+    )
+class MemoryCreate(BaseRequest):
+    messages: list[Message] | None = Field(
+        None,
+        description="List of messages to store.",
+        json_schema_extra={"example": [{"role": "user", "content": "Hello"}]},
+    )
+    mem_cube_id: str | None = Field(
+        None, description="ID of the memory cube", json_schema_extra={"example": "cube123"}
+    )
+    memory_content: str | None = Field(
+        None,
+        description="Content to store as memory",
+        json_schema_extra={"example": "This is a memory content"},
+    )
+    doc_path: str | None = Field(
+        None,
+        description="Path to document to store",
+        json_schema_extra={"example": "/path/to/document.txt"},
+    )
+class SearchRequest(BaseRequest):
+    query: str = Field(
+        ...,
+        description="Search query.",
+        json_schema_extra={"example": "How to implement a feature?"},
+    )
+    install_cube_ids: list[str] | None = Field(
+        None,
+        description="List of cube IDs to search in",
+        json_schema_extra={"example": ["cube123", "cube456"]},
+    )
+class MemCubeRegister(BaseRequest):
+    mem_cube_name_or_path: str = Field(
+        ...,
+        description="Name or path of the MemCube to register.",
+        json_schema_extra={"example": "/path/to/cube"},
+    )
+    mem_cube_id: str | None = Field(
+        None, description="ID for the MemCube", json_schema_extra={"example": "cube123"}
+    )
+class ChatRequest(BaseRequest):
+    query: str = Field(
+        ...,
+        description="Chat query message.",
+        json_schema_extra={"example": "What is the latest update?"},
+    )
+class UserCreate(BaseRequest):
+    user_name: str | None = Field(
+        None, description="Name of the user", json_schema_extra={"example": "john_doe"}
+    )
+    role: str = Field("user", description="Role of the user", json_schema_extra={"example": "user"})
+    user_id: str = Field(..., description="User ID", json_schema_extra={"example": "user123"})
+class CubeShare(BaseRequest):
+    target_user_id: str = Field(
+        ..., description="Target user ID to share with", json_schema_extra={"example": "user456"}
+    )
+class SimpleResponse(BaseResponse[None]):
+    """Simple response model for operations without data return."""
+class ConfigResponse(BaseResponse[None]):
+    """Response model for configuration endpoint."""
+class MemoryResponse(BaseResponse[dict]):
+    """Response model for memory operations."""
+class SearchResponse(BaseResponse[dict]):
+    """Response model for search operations."""
+class ChatResponse(BaseResponse[str]):
+    """Response model for chat operations."""
+class UserResponse(BaseResponse[dict]):
+    """Response model for user operations."""
+class UserListResponse(BaseResponse[list]):
+    """Response model for user list operations."""
+@app.post("/configure", summary="Configure MemOS", response_model=ConfigResponse)
+async def set_config(config: MOSConfig):
+    """Set MemOS configuration."""
+    global MOS_INSTANCE
+    # Create a temporary user manager to check/create default user
+    temp_user_manager = UserManager()
+    # Create default user if it doesn't exist
+    if not temp_user_manager.validate_user(config.user_id):
+        temp_user_manager.create_user(
+            user_name=config.user_id, role=UserRole.USER, user_id=config.user_id
+        )
+        logger.info(f"Created default user: {config.user_id}")
+    # Now create the MOS instance
+    MOS_INSTANCE = MOS(config=config)
+    return ConfigResponse(message="Configuration set successfully")
+@app.post("/users", summary="Create a new user", response_model=UserResponse)
+async def create_user(user_create: UserCreate):
+    """Create a new user."""
+    mos_instance = get_mos_instance()
+    role = UserRole(user_create.role)
+    user_id = mos_instance.create_user(
+        user_id=user_create.user_id, role=role, user_name=user_create.user_name
+    )
+    return UserResponse(message="User created successfully", data={"user_id": user_id})
+@app.get("/users", summary="List all users", response_model=UserListResponse)
+async def list_users():
+    """List all active users."""
+    mos_instance = get_mos_instance()
+    users = mos_instance.list_users()
+    return UserListResponse(message="Users retrieved successfully", data=users)
+@app.get("/users/me", summary="Get current user info", response_model=UserResponse)
+async def get_user_info():
+    """Get current user information including accessible cubes."""
+    mos_instance = get_mos_instance()
+    user_info = mos_instance.get_user_info()
+    return UserResponse(message="User info retrieved successfully", data=user_info)
+@app.post("/mem_cubes", summary="Register a MemCube", response_model=SimpleResponse)
+async def register_mem_cube(mem_cube: MemCubeRegister):
+    """Register a new MemCube."""
+    mos_instance = get_mos_instance()
+    mos_instance.register_mem_cube(
+        mem_cube_name_or_path=mem_cube.mem_cube_name_or_path,
+        mem_cube_id=mem_cube.mem_cube_id,
+        user_id=mem_cube.user_id,
+    )
+    return SimpleResponse(message="MemCube registered successfully")
+@app.delete(
+    "/mem_cubes/{mem_cube_id}", summary="Unregister a MemCube", response_model=SimpleResponse
+)
+async def unregister_mem_cube(mem_cube_id: str, user_id: str | None = None):
+    """Unregister a MemCube."""
+    mos_instance = get_mos_instance()
+    mos_instance.unregister_mem_cube(mem_cube_id=mem_cube_id, user_id=user_id)
+    return SimpleResponse(message="MemCube unregistered successfully")
+@app.post(
+    "/mem_cubes/{cube_id}/share",
+    summary="Share a cube with another user",
+    response_model=SimpleResponse,
+)
+async def share_cube(cube_id: str, share_request: CubeShare):
+    """Share a cube with another user."""
+    mos_instance = get_mos_instance()
+    success = mos_instance.share_cube_with_user(cube_id, share_request.target_user_id)
+    if success:
+        return SimpleResponse(message="Cube shared successfully")
+    else:
+        raise ValueError("Failed to share cube")
+@app.post("/memories", summary="Create memories", response_model=SimpleResponse)
+async def add_memory(memory_create: MemoryCreate):
+    """Store new memories in a MemCube."""
+    if not any([memory_create.messages, memory_create.memory_content, memory_create.doc_path]):
+        raise ValueError("Either messages, memory_content, or doc_path must be provided")
+    mos_instance = get_mos_instance()
+    if memory_create.messages:
+        messages = [m.model_dump() for m in memory_create.messages]
+        mos_instance.add(
+            messages=messages,
+            mem_cube_id=memory_create.mem_cube_id,
+            user_id=memory_create.user_id,
+        )
+    elif memory_create.memory_content:
+        mos_instance.add(
+            memory_content=memory_create.memory_content,
+            mem_cube_id=memory_create.mem_cube_id,
+            user_id=memory_create.user_id,
+        )
+    elif memory_create.doc_path:
+        mos_instance.add(
+            doc_path=memory_create.doc_path,
+            mem_cube_id=memory_create.mem_cube_id,
+            user_id=memory_create.user_id,
+        )
+    return SimpleResponse(message="Memories added successfully")
+@app.get("/memories", summary="Get all memories", response_model=MemoryResponse)
+async def get_all_memories(
+    mem_cube_id: str | None = None,
+    user_id: str | None = None,
+):
+    """Retrieve all memories from a MemCube."""
+    mos_instance = get_mos_instance()
+    result = mos_instance.get_all(mem_cube_id=mem_cube_id, user_id=user_id)
+    return MemoryResponse(message="Memories retrieved successfully", data=result)
+@app.get(
+    "/memories/{mem_cube_id}/{memory_id}", summary="Get a memory", response_model=MemoryResponse
+)
+async def get_memory(mem_cube_id: str, memory_id: str, user_id: str | None = None):
+    """Retrieve a specific memory by ID from a MemCube."""
+    mos_instance = get_mos_instance()
+    result = mos_instance.get(mem_cube_id=mem_cube_id, memory_id=memory_id, user_id=user_id)
+    return MemoryResponse(message="Memory retrieved successfully", data=result)
+@app.post("/search", summary="Search memories", response_model=SearchResponse)
+async def search_memories(search_req: SearchRequest):
+    """Search for memories across MemCubes."""
+    mos_instance = get_mos_instance()
+    result = mos_instance.search(
+        query=search_req.query,
+        user_id=search_req.user_id,
+        install_cube_ids=search_req.install_cube_ids,
+    )
+    return SearchResponse(message="Search completed successfully", data=result)
+@app.put(
+    "/memories/{mem_cube_id}/{memory_id}", summary="Update a memory", response_model=SimpleResponse
+)
+async def update_memory(
+    mem_cube_id: str, memory_id: str, updated_memory: dict[str, Any], user_id: str | None = None
+):
+    """Update an existing memory in a MemCube."""
+    mos_instance = get_mos_instance()
+    mos_instance.update(
+        mem_cube_id=mem_cube_id,
+        memory_id=memory_id,
+        text_memory_item=updated_memory,
+        user_id=user_id,
+    )
+    return SimpleResponse(message="Memory updated successfully")
+@app.delete(
+    "/memories/{mem_cube_id}/{memory_id}", summary="Delete a memory", response_model=SimpleResponse
+)
+async def delete_memory(mem_cube_id: str, memory_id: str, user_id: str | None = None):
+    """Delete a specific memory from a MemCube."""
+    mos_instance = get_mos_instance()
+    mos_instance.delete(mem_cube_id=mem_cube_id, memory_id=memory_id, user_id=user_id)
+    return SimpleResponse(message="Memory deleted successfully")
+@app.delete("/memories/{mem_cube_id}", summary="Delete all memories", response_model=SimpleResponse)
+async def delete_all_memories(mem_cube_id: str, user_id: str | None = None):
+    """Delete all memories from a MemCube."""
+    mos_instance = get_mos_instance()
+    mos_instance.delete_all(mem_cube_id=mem_cube_id, user_id=user_id)
+    return SimpleResponse(message="All memories deleted successfully")
+@app.post("/chat", summary="Chat with MemOS", response_model=ChatResponse)
+async def chat(chat_req: ChatRequest):
+    """Chat with the MemOS system."""
+    mos_instance = get_mos_instance()
+    response = mos_instance.chat(query=chat_req.query, user_id=chat_req.user_id)
+    if response is None:
+        raise ValueError("No response generated")
+    return ChatResponse(message="Chat response generated", data=response)
+@app.get("/", summary="Redirect to the OpenAPI documentation", include_in_schema=False)
+async def home():
+    """Redirect to the OpenAPI documentation."""
+    return RedirectResponse(url="/docs", status_code=307)
+@app.exception_handler(ValueError)
+async def value_error_handler(request: Request, exc: ValueError):
+    """Handle ValueError exceptions globally."""
+    return JSONResponse(
+        status_code=400,
+        content={"code": 400, "message": str(exc), "data": None},
+    )
+@app.exception_handler(Exception)
+async def global_exception_handler(request: Request, exc: Exception):
+    """Handle all unhandled exceptions globally."""
+    logger.exception("Unhandled error:")
+    return JSONResponse(
+        status_code=500,
+        content={"code": 500, "message": str(exc), "data": None},
+    )

memos/chunkers/__init__.py ADDED Viewed

@@ -0,0 +1,4 @@
+from .factory import ChunkerFactory
+__all__ = ["ChunkerFactory"]

memos/chunkers/base.py ADDED Viewed

@@ -0,0 +1,24 @@
+from abc import ABC, abstractmethod
+from memos.configs.chunker import BaseChunkerConfig
+class Chunk:
+    """Class representing a text chunk."""
+    def __init__(self, text: str, token_count: int, sentences: list[str]):
+        self.text = text
+        self.token_count = token_count
+        self.sentences = sentences
+class BaseChunker(ABC):
+    """Base class for all text chunkers."""
+    @abstractmethod
+    def __init__(self, config: BaseChunkerConfig):
+        """Initialize the chunker with the given configuration."""
+    @abstractmethod
+    def chunk(self, text: str) -> list[Chunk]:
+        """Chunk the given text into smaller chunks."""

memos/chunkers/factory.py ADDED Viewed

@@ -0,0 +1,22 @@
+from typing import Any, ClassVar
+from memos.configs.chunker import ChunkerConfigFactory
+from .base import BaseChunker
+from .sentence_chunker import SentenceChunker
+class ChunkerFactory:
+    """Factory class for creating chunker instances."""
+    backend_to_class: ClassVar[dict[str, Any]] = {
+        "sentence": SentenceChunker,
+    }
+    @classmethod
+    def from_config(cls, config_factory: ChunkerConfigFactory) -> BaseChunker:
+        backend = config_factory.backend
+        if backend not in cls.backend_to_class:
+            raise ValueError(f"Invalid backend: {backend}")
+        chunker_class = cls.backend_to_class[backend]
+        return chunker_class(config_factory.config)

memos/chunkers/sentence_chunker.py ADDED Viewed

@@ -0,0 +1,35 @@
+from chonkie import SentenceChunker as ChonkieSentenceChunker
+from memos.configs.chunker import SentenceChunkerConfig
+from memos.log import get_logger
+from .base import BaseChunker, Chunk
+logger = get_logger(__name__)
+class SentenceChunker(BaseChunker):
+    """Sentence-based text chunker."""
+    def __init__(self, config: SentenceChunkerConfig):
+        self.config = config
+        self.chunker = ChonkieSentenceChunker(
+            tokenizer_or_token_counter=config.tokenizer_or_token_counter,
+            chunk_size=config.chunk_size,
+            chunk_overlap=config.chunk_overlap,
+            min_sentences_per_chunk=config.min_sentences_per_chunk,
+        )
+        logger.info(f"Initialized SentenceChunker with config: {config}")
+    def chunk(self, text: str) -> list[Chunk]:
+        """Chunk the given text into smaller chunks based on sentences."""
+        chonkie_chunks = self.chunker.chunk(text)
+        chunks = []
+        for c in chonkie_chunks:
+            chunk = Chunk(text=c.text, token_count=c.token_count, sentences=c.sentences)
+            chunks.append(chunk)
+        logger.debug(f"Generated {len(chunks)} chunks from input text")
+        return chunks

memos/configs/__init__.py ADDED Viewed

File without changes

memos/configs/base.py ADDED Viewed

@@ -0,0 +1,82 @@
+import os
+from typing import Any
+import yaml
+from pydantic import BaseModel, ConfigDict, Field, model_validator
+from memos.log import get_logger
+logger = get_logger(__name__)
+class BaseConfig(BaseModel):
+    """Base configuration.
+    All configurations should inherit from this class.
+    This class uses Pydantic's ConfigDict to enforce strict validation
+    and forbids extra fields."""
+    model_schema: str = Field(
+        "NOT_SET",
+        description="Schema for configuration. This value will be automatically set.",
+        exclude=True,
+    )
+    model_config = ConfigDict(extra="forbid", strict=True)
+    @model_validator(mode="after")
+    def set_default_schema(self) -> "BaseConfig":
+        dot_path_schema = self.__module__ + "." + self.__class__.__name__
+        if self.model_schema == dot_path_schema:
+            return self
+        if self.model_schema != "NOT_SET":
+            logger.warning(
+                f"Schema is set to {self.model_schema}, but it should be {dot_path_schema}. "
+                "Changing schema to the default value."
+            )
+        self.model_schema = dot_path_schema
+        return self
+    @classmethod
+    def from_json_file(cls, json_path: str) -> Any:
+        """Load configuration from a JSON file."""
+        with open(json_path, encoding="utf-8") as f:
+            data = f.read()
+        return cls.model_validate_json(data)
+    def to_json_file(self, json_path: str) -> None:
+        """Dump configuration to a JSON file."""
+        dir_path = os.path.dirname(json_path)
+        if dir_path:
+            os.makedirs(dir_path, exist_ok=True)
+        with open(json_path, "w", encoding="utf-8") as f:
+            f.write(self.model_dump_json(indent=2, warnings="none"))
+    @classmethod
+    def from_yaml_file(cls, yaml_path: str) -> Any:
+        """Load configuration from a YAML file."""
+        with open(yaml_path, encoding="utf-8") as f:
+            data = yaml.safe_load(f)
+        return cls.model_validate(data)
+    def to_yaml_file(self, yaml_path: str) -> None:
+        """Dump configuration to a YAML file."""
+        dir_path = os.path.dirname(yaml_path)
+        if dir_path:
+            os.makedirs(dir_path, exist_ok=True)
+        with open(yaml_path, "w", encoding="utf-8") as f:
+            yaml.safe_dump(
+                self.model_dump(mode="json", warnings="none"),
+                f,
+                default_flow_style=False,
+                allow_unicode=True,
+                indent=2,
+            )
+    def get(self, key, default=None):
+        return getattr(self, key, default)

memos/configs/chunker.py ADDED Viewed

@@ -0,0 +1,45 @@
+from typing import Any, ClassVar
+from pydantic import Field, field_validator, model_validator
+from memos.configs.base import BaseConfig
+class BaseChunkerConfig(BaseConfig):
+    """Base configuration class for chunkers."""
+    tokenizer_or_token_counter: str = Field(
+        default="gpt2", description="Tokenizer model name or a token counting function"
+    )
+    chunk_size: int = Field(default=512, description="Maximum tokens per chunk")
+    chunk_overlap: int = Field(default=128, description="Overlap between chunks")
+    min_sentences_per_chunk: int = Field(default=1, description="Minimum sentences in each chunk")
+class SentenceChunkerConfig(BaseChunkerConfig):
+    """Configuration for sentence-based text chunker."""
+class ChunkerConfigFactory(BaseConfig):
+    """Factory class for creating chunker configurations."""
+    backend: str = Field(..., description="Backend for chunker")
+    config: dict[str, Any] = Field(..., description="Configuration for the chunker backend")
+    backend_to_class: ClassVar[dict[str, Any]] = {
+        "sentence": SentenceChunkerConfig,
+    }
+    @field_validator("backend")
+    @classmethod
+    def validate_backend(cls, backend: str) -> str:
+        """Validate the backend field."""
+        if backend not in cls.backend_to_class:
+            raise ValueError(f"Invalid backend: {backend}")
+        return backend
+    @model_validator(mode="after")
+    def create_config(self) -> "ChunkerConfigFactory":
+        config_class = self.backend_to_class[self.backend]
+        self.config = config_class(**self.config)
+        return self

memos/configs/embedder.py ADDED Viewed

@@ -0,0 +1,53 @@
+from typing import Any, ClassVar
+from pydantic import Field, field_validator, model_validator
+from memos.configs.base import BaseConfig
+class BaseEmbedderConfig(BaseConfig):
+    """Base configuration class for embedding models."""
+    model_name_or_path: str = Field(..., description="Model name or path")
+    embedding_dims: int | None = Field(
+        default=None, description="Number of dimensions for the embedding"
+    )
+class OllamaEmbedderConfig(BaseEmbedderConfig):
+    api_base: str = Field(default="http://localhost:11434", description="Base URL for Ollama API")
+class SenTranEmbedderConfig(BaseEmbedderConfig):
+    """Configuration class for Sentence Transformer embeddings."""
+    trust_remote_code: bool = Field(
+        default=True,
+        description="Whether to trust remote code when loading the model",
+    )
+class EmbedderConfigFactory(BaseConfig):
+    """Factory class for creating embedder configurations."""
+    backend: str = Field(..., description="Backend for embedding model")
+    config: dict[str, Any] = Field(..., description="Configuration for the embedding model backend")
+    backend_to_class: ClassVar[dict[str, Any]] = {
+        "ollama": OllamaEmbedderConfig,
+        "sentence_transformer": SenTranEmbedderConfig,
+    }
+    @field_validator("backend")
+    @classmethod
+    def validate_backend(cls, backend: str) -> str:
+        """Validate the backend field."""
+        if backend not in cls.backend_to_class:
+            raise ValueError(f"Invalid backend: {backend}")
+        return backend
+    @model_validator(mode="after")
+    def create_config(self) -> "EmbedderConfigFactory":
+        config_class = self.backend_to_class[self.backend]
+        self.config = config_class(**self.config)
+        return self

MemoryOS 0.0.1__py3-none-any.whl → 0.1.13__py3-none-any.whl

Potentially problematic release.

MemoryOS 0.0.1py3-none-any.whl → 0.1.13py3-none-any.whl