PyPI - letta-nightly - Versions diffs - 0.8.13.dev20250713104250__py3-none-any.whl → 0.8.14.dev20250714180504__py3-none-any.whl - Mend

letta-nightly 0.8.13.dev20250713104250py3-none-any.whl → 0.8.14.dev20250714180504py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of letta-nightly might be problematic. Click here for more details.

Files changed (31) hide show

letta/__init__.py +1 -1
letta/constants.py +6 -0
letta/functions/function_sets/base.py +2 -2
letta/helpers/pinecone_utils.py +164 -11
letta/orm/file.py +2 -17
letta/orm/files_agents.py +9 -10
letta/orm/organization.py +0 -4
letta/orm/passage.py +0 -10
letta/orm/source.py +3 -20
letta/schemas/file.py +1 -0
letta/schemas/memory.py +2 -2
letta/server/rest_api/routers/v1/agents.py +4 -4
letta/server/rest_api/routers/v1/messages.py +2 -6
letta/server/rest_api/routers/v1/sources.py +3 -3
letta/server/server.py +0 -3
letta/services/agent_manager.py +194 -147
letta/services/block_manager.py +18 -18
letta/services/context_window_calculator/context_window_calculator.py +15 -10
letta/services/context_window_calculator/token_counter.py +40 -0
letta/services/file_processor/chunker/line_chunker.py +17 -0
letta/services/file_processor/embedder/openai_embedder.py +50 -5
letta/services/files_agents_manager.py +12 -2
letta/services/group_manager.py +11 -11
letta/services/source_manager.py +19 -3
letta/services/tool_executor/core_tool_executor.py +2 -2
letta/services/tool_executor/files_tool_executor.py +6 -1
{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/METADATA +1 -1
{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/RECORD +31 -31
{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/LICENSE +0 -0
{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/WHEEL +0 -0
{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/entry_points.txt +0 -0

letta/services/block_manager.py CHANGED Viewed

@@ -23,8 +23,8 @@ logger = get_logger(__name__)
 class BlockManager:
     """Manager class to handle business logic related to Blocks."""
-    @trace_method
     @enforce_types
+    @trace_method
     def create_or_update_block(self, block: PydanticBlock, actor: PydanticUser) -> PydanticBlock:
         """Create a new block based on the Block schema."""
         db_block = self.get_block_by_id(block.id, actor)
@@ -38,8 +38,8 @@ class BlockManager:
                 block.create(session, actor=actor)
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def create_or_update_block_async(self, block: PydanticBlock, actor: PydanticUser) -> PydanticBlock:
         """Create a new block based on the Block schema."""
         db_block = await self.get_block_by_id_async(block.id, actor)
@@ -53,8 +53,8 @@ class BlockManager:
                 await block.create_async(session, actor=actor)
                 return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     def batch_create_blocks(self, blocks: List[PydanticBlock], actor: PydanticUser) -> List[PydanticBlock]:
         """
         Batch-create multiple Blocks in one transaction for better performance.
@@ -77,8 +77,8 @@ class BlockManager:
             # Convert back to Pydantic
             return [m.to_pydantic() for m in created_models]
-    @trace_method
     @enforce_types
+    @trace_method
     async def batch_create_blocks_async(self, blocks: List[PydanticBlock], actor: PydanticUser) -> List[PydanticBlock]:
         """
         Batch-create multiple Blocks in one transaction for better performance.
@@ -101,8 +101,8 @@ class BlockManager:
             # Convert back to Pydantic
             return [m.to_pydantic() for m in created_models]
-    @trace_method
     @enforce_types
+    @trace_method
     def update_block(self, block_id: str, block_update: BlockUpdate, actor: PydanticUser) -> PydanticBlock:
         """Update a block by its ID with the given BlockUpdate object."""
         # Safety check for block
@@ -117,8 +117,8 @@ class BlockManager:
             block.update(db_session=session, actor=actor)
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def update_block_async(self, block_id: str, block_update: BlockUpdate, actor: PydanticUser) -> PydanticBlock:
         """Update a block by its ID with the given BlockUpdate object."""
         # Safety check for block
@@ -133,8 +133,8 @@ class BlockManager:
             await block.update_async(db_session=session, actor=actor)
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     def delete_block(self, block_id: str, actor: PydanticUser) -> PydanticBlock:
         """Delete a block by its ID."""
         with db_registry.session() as session:
@@ -142,8 +142,8 @@ class BlockManager:
             block.hard_delete(db_session=session, actor=actor)
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def delete_block_async(self, block_id: str, actor: PydanticUser) -> PydanticBlock:
         """Delete a block by its ID."""
         async with db_registry.async_session() as session:
@@ -151,8 +151,8 @@ class BlockManager:
             await block.hard_delete_async(db_session=session, actor=actor)
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def get_blocks_async(
         self,
         actor: PydanticUser,
@@ -214,8 +214,8 @@ class BlockManager:
             return [block.to_pydantic() for block in blocks]
-    @trace_method
     @enforce_types
+    @trace_method
     def get_block_by_id(self, block_id: str, actor: Optional[PydanticUser] = None) -> Optional[PydanticBlock]:
         """Retrieve a block by its name."""
         with db_registry.session() as session:
@@ -225,8 +225,8 @@ class BlockManager:
             except NoResultFound:
                 return None
-    @trace_method
     @enforce_types
+    @trace_method
     async def get_block_by_id_async(self, block_id: str, actor: Optional[PydanticUser] = None) -> Optional[PydanticBlock]:
         """Retrieve a block by its name."""
         async with db_registry.async_session() as session:
@@ -236,8 +236,8 @@ class BlockManager:
             except NoResultFound:
                 return None
-    @trace_method
     @enforce_types
+    @trace_method
     async def get_all_blocks_by_ids_async(self, block_ids: List[str], actor: Optional[PydanticUser] = None) -> List[PydanticBlock]:
         """Retrieve blocks by their ids without loading unnecessary relationships. Async implementation."""
         from sqlalchemy import select
@@ -284,8 +284,8 @@ class BlockManager:
             return pydantic_blocks
-    @trace_method
     @enforce_types
+    @trace_method
     async def get_agents_for_block_async(
         self,
         block_id: str,
@@ -301,8 +301,8 @@ class BlockManager:
             agents = await asyncio.gather(*[agent.to_pydantic_async(include_relationships=include_relationships) for agent in agents_orm])
             return agents
-    @trace_method
     @enforce_types
+    @trace_method
     async def size_async(self, actor: PydanticUser) -> int:
         """
         Get the total count of blocks for the given user.
@@ -312,8 +312,8 @@ class BlockManager:
     # Block History Functions
-    @trace_method
     @enforce_types
+    @trace_method
     def checkpoint_block(
         self,
         block_id: str,
@@ -416,8 +416,8 @@ class BlockManager:
         updated_block = block.update(db_session=session, actor=actor, no_commit=True)
         return updated_block
-    @trace_method
     @enforce_types
+    @trace_method
     def undo_checkpoint_block(self, block_id: str, actor: PydanticUser, use_preloaded_block: Optional[BlockModel] = None) -> PydanticBlock:
         """
         Move the block to the immediately previous checkpoint in BlockHistory.
@@ -459,8 +459,8 @@ class BlockManager:
             session.commit()
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     def redo_checkpoint_block(self, block_id: str, actor: PydanticUser, use_preloaded_block: Optional[BlockModel] = None) -> PydanticBlock:
         """
         Move the block to the next checkpoint if it exists.
@@ -498,8 +498,8 @@ class BlockManager:
             session.commit()
             return block.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def bulk_update_block_values_async(
         self, updates: Dict[str, str], actor: PydanticUser, return_hydrated: bool = False
     ) -> Optional[List[PydanticBlock]]:

letta/services/context_window_calculator/context_window_calculator.py CHANGED Viewed

@@ -4,11 +4,14 @@ from typing import Any, List, Optional, Tuple
 from openai.types.beta.function_tool import FunctionTool as OpenAITool
 from letta.log import get_logger
+from letta.schemas.agent import AgentState
 from letta.schemas.enums import MessageRole
 from letta.schemas.letta_message_content import TextContent
 from letta.schemas.memory import ContextWindowOverview
+from letta.schemas.message import Message
 from letta.schemas.user import User as PydanticUser
 from letta.services.context_window_calculator.token_counter import TokenCounter
+from letta.services.message_manager import MessageManager
 logger = get_logger(__name__)
@@ -56,16 +59,18 @@ class ContextWindowCalculator:
         return None, 1
     async def calculate_context_window(
-        self, agent_state: Any, actor: PydanticUser, token_counter: TokenCounter, message_manager: Any, passage_manager: Any
+        self,
+        agent_state: AgentState,
+        actor: PydanticUser,
+        token_counter: TokenCounter,
+        message_manager: MessageManager,
+        system_message_compiled: Message,
+        num_archival_memories: int,
+        num_messages: int,
     ) -> ContextWindowOverview:
         """Calculate context window information using the provided token counter"""
-        # Fetch data concurrently
-        (in_context_messages, passage_manager_size, message_manager_size) = await asyncio.gather(
-            message_manager.get_messages_by_ids_async(message_ids=agent_state.message_ids, actor=actor),
-            passage_manager.agent_passage_size_async(actor=actor, agent_id=agent_state.id),
-            message_manager.size_async(actor=actor, agent_id=agent_state.id),
-        )
+        messages = await message_manager.get_messages_by_ids_async(message_ids=agent_state.message_ids[1:], actor=actor)
+        in_context_messages = [system_message_compiled] + messages
         # Convert messages to appropriate format
         converted_messages = token_counter.convert_messages(in_context_messages)
@@ -128,8 +133,8 @@ class ContextWindowCalculator:
         return ContextWindowOverview(
             # context window breakdown (in messages)
             num_messages=len(in_context_messages),
-            num_archival_memory=passage_manager_size,
-            num_recall_memory=message_manager_size,
+            num_archival_memory=num_archival_memories,
+            num_recall_memory=num_messages,
             num_tokens_external_memory_summary=num_tokens_external_memory_summary,
             external_memory_summary=external_memory_summary,
             # top-level information

letta/services/context_window_calculator/token_counter.py CHANGED Viewed

@@ -1,7 +1,11 @@
+import hashlib
+import json
 from abc import ABC, abstractmethod
 from typing import Any, Dict, List
+from letta.helpers.decorators import async_redis_cache
 from letta.llm_api.anthropic_client import AnthropicClient
+from letta.otel.tracing import trace_method
 from letta.schemas.openai.chat_completion_request import Tool as OpenAITool
 from letta.utils import count_tokens
@@ -33,16 +37,34 @@ class AnthropicTokenCounter(TokenCounter):
         self.client = anthropic_client
         self.model = model
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, text: f"anthropic_text_tokens:{self.model}:{hashlib.sha256(text.encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_text_tokens(self, text: str) -> int:
         if not text:
             return 0
         return await self.client.count_tokens(model=self.model, messages=[{"role": "user", "content": text}])
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, messages: f"anthropic_message_tokens:{self.model}:{hashlib.sha256(json.dumps(messages, sort_keys=True).encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_message_tokens(self, messages: List[Dict[str, Any]]) -> int:
         if not messages:
             return 0
         return await self.client.count_tokens(model=self.model, messages=messages)
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, tools: f"anthropic_tool_tokens:{self.model}:{hashlib.sha256(json.dumps([t.model_dump() for t in tools], sort_keys=True).encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_tool_tokens(self, tools: List[OpenAITool]) -> int:
         if not tools:
             return 0
@@ -58,11 +80,23 @@ class TiktokenCounter(TokenCounter):
     def __init__(self, model: str):
         self.model = model
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, text: f"tiktoken_text_tokens:{self.model}:{hashlib.sha256(text.encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_text_tokens(self, text: str) -> int:
         if not text:
             return 0
         return count_tokens(text)
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, messages: f"tiktoken_message_tokens:{self.model}:{hashlib.sha256(json.dumps(messages, sort_keys=True).encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_message_tokens(self, messages: List[Dict[str, Any]]) -> int:
         if not messages:
             return 0
@@ -70,6 +104,12 @@ class TiktokenCounter(TokenCounter):
         return num_tokens_from_messages(messages=messages, model=self.model)
+    @trace_method
+    @async_redis_cache(
+        key_func=lambda self, tools: f"tiktoken_tool_tokens:{self.model}:{hashlib.sha256(json.dumps([t.model_dump() for t in tools], sort_keys=True).encode()).hexdigest()[:16]}",
+        prefix="token_counter",
+        ttl_s=3600,  # cache for 1 hour
+    )
     async def count_tool_tokens(self, tools: List[OpenAITool]) -> int:
         if not tools:
             return 0

letta/services/file_processor/chunker/line_chunker.py CHANGED Viewed

@@ -40,6 +40,10 @@ class LineChunker:
     def _chunk_by_lines(self, text: str, preserve_indentation: bool = False) -> List[str]:
         """Traditional line-based chunking for code and structured data"""
+        # early stop, can happen if the there's nothing on a specific file
+        if not text:
+            return []
         lines = []
         for line in text.splitlines():
             if preserve_indentation:
@@ -57,6 +61,10 @@ class LineChunker:
     def _chunk_by_sentences(self, text: str) -> List[str]:
         """Sentence-based chunking for documentation and markup"""
+        # early stop, can happen if the there's nothing on a specific file
+        if not text:
+            return []
         # Simple sentence splitting on periods, exclamation marks, and question marks
         # followed by whitespace or end of string
         sentence_pattern = r"(?<=[.!?])\s+(?=[A-Z])"
@@ -75,6 +83,10 @@ class LineChunker:
     def _chunk_by_characters(self, text: str, target_line_length: int = 100) -> List[str]:
         """Character-based wrapping for prose text"""
+        # early stop, can happen if the there's nothing on a specific file
+        if not text:
+            return []
         words = text.split()
         lines = []
         current_line = []
@@ -110,6 +122,11 @@ class LineChunker:
         strategy = self._determine_chunking_strategy(file_metadata)
         text = file_metadata.content
+        # early stop, can happen if the there's nothing on a specific file
+        if not text:
+            logger.warning(f"File ({file_metadata}) has no content")
+            return []
         # Apply the appropriate chunking strategy
         if strategy == ChunkingStrategy.DOCUMENTATION:
             content_lines = self._chunk_by_sentences(text)

letta/services/file_processor/embedder/openai_embedder.py CHANGED Viewed

@@ -25,7 +25,6 @@ class OpenAIEmbedder(BaseEmbedder):
             else EmbeddingConfig.default_config(model_name="letta")
         )
         self.embedding_config = embedding_config or self.default_embedding_config
-        self.max_concurrent_requests = 20
         # TODO: Unify to global OpenAI client
         self.client: OpenAIClient = cast(
@@ -48,9 +47,55 @@ class OpenAIEmbedder(BaseEmbedder):
                 "embedding_endpoint_type": self.embedding_config.embedding_endpoint_type,
             },
         )
-        embeddings = await self.client.request_embeddings(inputs=batch, embedding_config=self.embedding_config)
-        log_event("embedder.batch_completed", {"batch_size": len(batch), "embeddings_generated": len(embeddings)})
-        return [(idx, e) for idx, e in zip(batch_indices, embeddings)]
+        try:
+            embeddings = await self.client.request_embeddings(inputs=batch, embedding_config=self.embedding_config)
+            log_event("embedder.batch_completed", {"batch_size": len(batch), "embeddings_generated": len(embeddings)})
+            return [(idx, e) for idx, e in zip(batch_indices, embeddings)]
+        except Exception as e:
+            # if it's a token limit error and we can split, do it
+            if self._is_token_limit_error(e) and len(batch) > 1:
+                logger.warning(f"Token limit exceeded for batch of size {len(batch)}, splitting in half and retrying")
+                log_event(
+                    "embedder.batch_split_retry",
+                    {
+                        "original_batch_size": len(batch),
+                        "error": str(e),
+                        "split_size": len(batch) // 2,
+                    },
+                )
+                # split batch in half
+                mid = len(batch) // 2
+                batch1 = batch[:mid]
+                batch1_indices = batch_indices[:mid]
+                batch2 = batch[mid:]
+                batch2_indices = batch_indices[mid:]
+                # retry with smaller batches
+                result1 = await self._embed_batch(batch1, batch1_indices)
+                result2 = await self._embed_batch(batch2, batch2_indices)
+                return result1 + result2
+            else:
+                # re-raise for other errors or if batch size is already 1
+                raise
+    def _is_token_limit_error(self, error: Exception) -> bool:
+        """Check if the error is due to token limit exceeded"""
+        # convert to string and check for token limit patterns
+        error_str = str(error).lower()
+        # TODO: This is quite brittle, works for now
+        # check for the specific patterns we see in token limit errors
+        is_token_limit = (
+            "max_tokens_per_request" in error_str
+            or ("requested" in error_str and "tokens" in error_str and "max" in error_str and "per request" in error_str)
+            or "token limit" in error_str
+            or ("bad request to openai" in error_str and "tokens" in error_str and "max" in error_str)
+        )
+        return is_token_limit
     @trace_method
     async def generate_embedded_passages(self, file_id: str, source_id: str, chunks: List[str], actor: User) -> List[Passage]:
@@ -100,7 +145,7 @@ class OpenAIEmbedder(BaseEmbedder):
         log_event(
             "embedder.concurrent_processing_started",
-            {"concurrent_tasks": len(tasks), "max_concurrent_requests": self.max_concurrent_requests},
+            {"concurrent_tasks": len(tasks)},
         )
         results = await asyncio.gather(*tasks)
         log_event("embedder.concurrent_processing_completed", {"batches_processed": len(results)})

letta/services/files_agents_manager.py CHANGED Viewed

@@ -29,6 +29,7 @@ class FileAgentManager:
         agent_id: str,
         file_id: str,
         file_name: str,
+        source_id: str,
         actor: PydanticUser,
         is_open: bool = True,
         visible_content: Optional[str] = None,
@@ -47,7 +48,12 @@ class FileAgentManager:
         if is_open:
             # Use the efficient LRU + open method
             closed_files, was_already_open = await self.enforce_max_open_files_and_open(
-                agent_id=agent_id, file_id=file_id, file_name=file_name, actor=actor, visible_content=visible_content or ""
+                agent_id=agent_id,
+                file_id=file_id,
+                file_name=file_name,
+                source_id=source_id,
+                actor=actor,
+                visible_content=visible_content or "",
             )
             # Get the updated file agent to return
@@ -85,6 +91,7 @@ class FileAgentManager:
                     agent_id=agent_id,
                     file_id=file_id,
                     file_name=file_name,
+                    source_id=source_id,
                     organization_id=actor.organization_id,
                     is_open=is_open,
                     visible_content=visible_content,
@@ -327,7 +334,7 @@ class FileAgentManager:
     @enforce_types
     @trace_method
     async def enforce_max_open_files_and_open(
-        self, *, agent_id: str, file_id: str, file_name: str, actor: PydanticUser, visible_content: str
+        self, *, agent_id: str, file_id: str, file_name: str, source_id: str, actor: PydanticUser, visible_content: str
     ) -> tuple[List[str], bool]:
         """
         Efficiently handle LRU eviction and file opening in a single transaction.
@@ -336,6 +343,7 @@ class FileAgentManager:
             agent_id: ID of the agent
             file_id: ID of the file to open
             file_name: Name of the file to open
+            source_id: ID of the source (denormalized from files.source_id)
             actor: User performing the action
             visible_content: Content to set for the opened file
@@ -418,6 +426,7 @@ class FileAgentManager:
                     agent_id=agent_id,
                     file_id=file_id,
                     file_name=file_name,
+                    source_id=source_id,
                     organization_id=actor.organization_id,
                     is_open=True,
                     visible_content=visible_content,
@@ -516,6 +525,7 @@ class FileAgentManager:
                             agent_id=agent_id,
                             file_id=meta.id,
                             file_name=meta.file_name,
+                            source_id=meta.source_id,
                             organization_id=actor.organization_id,
                             is_open=is_now_open,
                             visible_content=vc,

letta/services/group_manager.py CHANGED Viewed

@@ -19,8 +19,8 @@ from letta.utils import enforce_types
 class GroupManager:
-    @trace_method
     @enforce_types
+    @trace_method
     def list_groups(
         self,
         actor: PydanticUser,
@@ -45,22 +45,22 @@ class GroupManager:
             )
             return [group.to_pydantic() for group in groups]
-    @trace_method
     @enforce_types
+    @trace_method
     def retrieve_group(self, group_id: str, actor: PydanticUser) -> PydanticGroup:
         with db_registry.session() as session:
             group = GroupModel.read(db_session=session, identifier=group_id, actor=actor)
             return group.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def retrieve_group_async(self, group_id: str, actor: PydanticUser) -> PydanticGroup:
         async with db_registry.async_session() as session:
             group = await GroupModel.read_async(db_session=session, identifier=group_id, actor=actor)
             return group.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     def create_group(self, group: GroupCreate, actor: PydanticUser) -> PydanticGroup:
         with db_registry.session() as session:
             new_group = GroupModel()
@@ -150,8 +150,8 @@ class GroupManager:
             await new_group.create_async(session, actor=actor)
             return new_group.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     async def modify_group_async(self, group_id: str, group_update: GroupUpdate, actor: PydanticUser) -> PydanticGroup:
         async with db_registry.async_session() as session:
             group = await GroupModel.read_async(db_session=session, identifier=group_id, actor=actor)
@@ -213,16 +213,16 @@ class GroupManager:
             await group.update_async(session, actor=actor)
             return group.to_pydantic()
-    @trace_method
     @enforce_types
+    @trace_method
     def delete_group(self, group_id: str, actor: PydanticUser) -> None:
         with db_registry.session() as session:
             # Retrieve the agent
             group = GroupModel.read(db_session=session, identifier=group_id, actor=actor)
             group.hard_delete(session)
-    @trace_method
     @enforce_types
+    @trace_method
     def list_group_messages(
         self,
         actor: PydanticUser,
@@ -258,8 +258,8 @@ class GroupManager:
             return messages
-    @trace_method
     @enforce_types
+    @trace_method
     def reset_messages(self, group_id: str, actor: PydanticUser) -> None:
         with db_registry.session() as session:
             # Ensure group is loadable by user
@@ -272,8 +272,8 @@ class GroupManager:
             session.commit()
-    @trace_method
     @enforce_types
+    @trace_method
     def bump_turns_counter(self, group_id: str, actor: PydanticUser) -> int:
         with db_registry.session() as session:
             # Ensure group is loadable by user
@@ -284,8 +284,8 @@ class GroupManager:
             group.update(session, actor=actor)
             return group.turns_counter
-    @trace_method
     @enforce_types
+    @trace_method
     async def bump_turns_counter_async(self, group_id: str, actor: PydanticUser) -> int:
         async with db_registry.async_session() as session:
             # Ensure group is loadable by user
@@ -309,8 +309,8 @@ class GroupManager:
             return prev_last_processed_message_id
-    @trace_method
     @enforce_types
+    @trace_method
     async def get_last_processed_message_id_and_update_async(
         self, group_id: str, last_processed_message_id: str, actor: PydanticUser
     ) -> str:

letta/services/source_manager.py CHANGED Viewed

@@ -1,8 +1,12 @@
 import asyncio
 from typing import List, Optional
+from sqlalchemy import select
+from letta.orm import Agent as AgentModel
 from letta.orm.errors import NoResultFound
 from letta.orm.source import Source as SourceModel
+from letta.orm.sources_agents import SourcesAgents
 from letta.otel.tracing import trace_method
 from letta.schemas.agent import AgentState as PydanticAgentState
 from letta.schemas.source import Source as PydanticSource
@@ -104,9 +108,21 @@ class SourceManager:
             # Verify source exists and user has permission to access it
             source = await SourceModel.read_async(db_session=session, identifier=source_id, actor=actor)
-            # The agents relationship is already loaded due to lazy="selectin" in the Source model
-            # and will be properly filtered by organization_id due to the OrganizationMixin
-            agents_orm = source.agents
+            # Use junction table query instead of relationship to avoid performance issues
+            query = (
+                select(AgentModel)
+                .join(SourcesAgents, AgentModel.id == SourcesAgents.agent_id)
+                .where(
+                    SourcesAgents.source_id == source_id,
+                    AgentModel.organization_id == actor.organization_id if actor else True,
+                    AgentModel.is_deleted == False,
+                )
+                .order_by(AgentModel.created_at.desc(), AgentModel.id)
+            )
+            result = await session.execute(query)
+            agents_orm = result.scalars().all()
             return await asyncio.gather(*[agent.to_pydantic_async() for agent in agents_orm])
     # TODO: We make actor optional for now, but should most likely be enforced due to security reasons

letta/services/tool_executor/core_tool_executor.py CHANGED Viewed

@@ -188,7 +188,7 @@ class LettaCoreToolExecutor(ToolExecutor):
         Append to the contents of core memory.
         Args:
-            label (str): Section of the memory to be edited (persona or human).
+            label (str): Section of the memory to be edited.
             content (str): Content to write to the memory. All unicode (including emojis) are supported.
         Returns:
@@ -214,7 +214,7 @@ class LettaCoreToolExecutor(ToolExecutor):
         Replace the contents of core memory. To delete memories, use an empty string for new_content.
         Args:
-            label (str): Section of the memory to be edited (persona or human).
+            label (str): Section of the memory to be edited.
             old_content (str): String to replace. Must be an exact match.
             new_content (str): Content to write to the memory. All unicode (including emojis) are supported.

letta/services/tool_executor/files_tool_executor.py CHANGED Viewed

@@ -180,7 +180,12 @@ class LettaFileToolExecutor(ToolExecutor):
             # Handle LRU eviction and file opening
             closed_files, was_already_open = await self.files_agents_manager.enforce_max_open_files_and_open(
-                agent_id=agent_state.id, file_id=file_id, file_name=file_name, actor=self.actor, visible_content=visible_content
+                agent_id=agent_state.id,
+                file_id=file_id,
+                file_name=file_name,
+                source_id=file.source_id,
+                actor=self.actor,
+                visible_content=visible_content,
             )
             opened_files.append(file_name)

{letta_nightly-0.8.13.dev20250713104250.dist-info → letta_nightly-0.8.14.dev20250714180504.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: letta-nightly
-Version: 0.8.13.dev20250713104250
+Version: 0.8.14.dev20250714180504
 Summary: Create LLM agents with long-term memory and custom tools
 License: Apache License
 Author: Letta Team

letta-nightly 0.8.13.dev20250713104250__py3-none-any.whl → 0.8.14.dev20250714180504__py3-none-any.whl

Potentially problematic release.

letta-nightly 0.8.13.dev20250713104250py3-none-any.whl → 0.8.14.dev20250714180504py3-none-any.whl